| AI时代 | 场景 | 模型 | 数据 | 价值和机会 |
|---|---|---|---|---|
| 自动驾驶 | 场景单一, 道路驾驶 |
技术路线收敛 | 来源:主机厂主导,数据垄断 内容:视觉、点云等少量模态 规模:等效约百万小时 |
数据公司沦为低端外包标注 市值百亿人民币级 代表公司数据堂、奥鹏、曼孚等 |
| 大语言模型 | 场景较多, LLM、代码 及各种垂类 |
技术路线基本收敛 | 来源:来自互联网,数据开放 内容:文本、图像、视频多模态 规模:超过万亿tokens |
通过深挖垂类场景提供价值 市值数百亿美金 代表公司Scale AI、Surge AI等 |
| 具身智能 | 场景众多, 极度分散, 千行百业 |
技术路线还未收敛 | 来源:从无到有,数据多样,需采集人类和世界交互的数据 内容:视觉、语言、触觉、力觉等复杂多模态 规模:预计上亿小时,是自动驾驶数据量的100倍以上 |
需求和供给失衡,数据价值极高 有独立三方数据公司机会 市值预计数千亿人民币级 当前正是切入赛道的绝佳时机 |
| 分类 | 代表玩家 | 特点 | 主要客户 | 劣势 |
|---|---|---|---|---|
| 独立数据 公司 |
光轮智能 | 合成数据投入早,规模较大 国际客户关系,有订单基础 |
NVIDIA、Generalsit等 | 在场景打通和人力组织存在困难,数据难以快速scaling |
| 鹿明机器人 | 从硬件切入(UMI背景) 卖设备+服务 |
数采公司(卖硬件为主) | ||
| 简智机器人 | 数据治理能力(智驾背景) 工程化落地较快 |
蚂蚁灵波、小米等 | ||
| 模型切入 | 觅蜂科技 | 和模型绑定,快速闭环验证 早期获取支持较多 |
智元、字节、海外大厂 | 站队客户,不中立 |
| 场景切入 | 京东云 | 场景-数据-模型-本体全链路布局,全栈自研 有自有场景,线下能力强 |
众擎、智元、千寻等 (主要是被投公司) |
求大求全,不聚焦 |
| 区域/ 分类 |
国内 | 海外 | ||
|---|---|---|---|---|
| 2B | 2G | 2A | 2B/2A | |
| 销售端 |
数据交易:销售数据使用权,可重复销售;主打标品,接受大客户定制
硬件售卖:买断式,类似消费电子产品;可选签订数据回购协议
方案集成:帮场景方落地全套机器人服务;场景数采,联合模型后训练
|
方案总包:项目制,接数采总包订单,项目产出数据集,所有权归政府;项目竞标,中标后交付项目获得收入
硬件销售:同2B模式;一般不回购数据
|
硬件销售:类似2B硬件销售;价格策略更灵活
数据交易:同2B;按需,预估规模较小
|
数据交易:考虑全球各国家在数据隐私和安全合规的限制,面向海外交易的数据生产和销售均发生在海外,采用自产自销的模式
定价策略:采用和国内类似的数据集定价策略,但整体产品定价高于国内,主要考虑海外人力成本更高且客户支付能力更强
|
| 供应端 |
自有场景:人员提供数采补贴,配备硬件;补贴和费用由数据公司承担
合作场景:主动挑选,签订长期框架协议;按照采集数据量做价采购
|
数据采购:向政府采购数据集,或者帮助政府分销数据集获得分成;看数据质量情况,可选进行采购
|
联合实验室:共同开展课题研究,论文成果共有;公司提供预算支持
|
硬件:复用一套采集硬件;国内生产,运输海外使用
技术:复用国内数据技术平台;支持海外独立部署和运营
|
| 分类 | 销售端 | 供应端 |
|---|---|---|
| 国内 2B |
数据交易:销售数据使用权,可重复销售;主打标品,接受大客户定制
硬件售卖:买断式,类似消费电子产品;可选签订数据回购协议
方案集成:帮场景方落地全套机器人服务;场景数采,联合模型后训练
|
自有场景:人员提供数采补贴,配备硬件;补贴和费用由数据公司承担
合作场景:主动挑选,签订长期框架协议;按照采集数据量做价采购
|
| 国内 2G |
方案总包:项目制,接数采总包订单,项目产出数据集,所有权归政府;项目竞标,中标后交付项目获得收入
硬件销售:同2B模式;一般不回购数据
|
数据采购:向政府采购数据集,或者帮助政府分销数据集获得分成;看数据质量情况,可选进行采购
|
| 国内 2A |
硬件销售:类似2B硬件销售;价格策略更灵活
数据交易:同2B;按需,预估规模较小
|
联合实验室:共同开展课题研究,论文成果共有;公司提供预算支持
|
| 海外 2B/2A |
数据交易:考虑全球各国家在数据隐私和安全合规的限制,面向海外交易的数据生产和销售均发生在海外,采用自产自销的模式
定价策略:采用和国内类似的数据集定价策略,但整体产品定价高于国内,主要考虑海外人力成本更高且客户支付能力更强
|
硬件:复用一套采集硬件;国内生产,运输海外使用
技术:复用国内数据技术平台;支持海外独立部署和运营
|
| 里程碑 | 验证PMF | 客户拓展 | 规模收入 | 规模盈利 |
|---|---|---|---|---|
| 产品 | 基于X硬件数采与交付 数据集50-100万小时 聚焦家庭场景(/w X) 发布开源数据集及论文 |
发布自研数采硬件 数据集200-300万小时 拓展场景(客户驱动) 持续发表顶会论文10+篇 |
发布换代数采硬件 数据集400-600万小时 覆盖多场景(主动规划) 持续发表顶会论文20+篇 |
产品市场份额第一 数据集2500-5000万小时 覆盖全场景 持续发表顶会论文30+篇 |
| 客户 | 标杆客户:X,1家 订单:1亿 |
客户:8-10家 订单:20亿 |
客户:15-20家 订单:50亿 |
客户:30家+ 订单:100亿+ |
| 财务 预测 |
收入:1亿 毛利率:74% 总费用:0.6亿 净利润:0.2亿 净利率:16% |
收入:6亿 毛利率:73% 总费用:3亿 净利润:1.3亿 净利率:22% |
收入:15亿 毛利率:72% 总费用:7亿 净利润:3.8亿 净利率:26% |
收入:100亿 毛利率:82% 总费用:39亿 净利润:43亿 净利率:43% |
| 年份 | 预研 | 算法 | 工程 | 硬件 | 产品 | BD | GR | 总计 |
|---|---|---|---|---|---|---|---|---|
| 7月 | 2 史** 翟** | 2 马** 徐* | 2 吕** 吴** | 1 雷** | 2 杨** 田** | 1 廖* | 1 鄂** | 10+ |
| 2026 | 5 | 12 | 10 | 10 | 5 | 5 | 3 | 50 |
| 2027 | 10 | 30 | 30 | 30 | 20 | 15 | 10 | 145 |
| 2028 | 20 | 60 | 60 | 35 | 30 | 30 | 15 | 250 |
| 2029 | 20 | 80 | 80 | 40 | 40 | 35 | 15 | 310 |
| 2030 | 20 | 100 | 100 | 40 | 50 | 40 | 15 | 365 |