中美人工智能产业逻辑不同,中国需要充分发挥自身比较优势。中美AI产业发展逻辑存在显著差异。人工智能的技术路径没有收敛,因此我们需要发挥我们的比较优势。
(1)数据优势:我国超80%数据来自政府,尚处于未被开发的状态,具有极大经济潜力。同时国内高质量数据集提到了一个新的维度,伴随着人工智能技术的发展,能够实现“数据不出域、可用不可见”;
(2)产业链优势:中国具有全世界最完整的产业链。2024年我国制造业增加值为3.6万亿美元,占全球制造业比重28.9%。制造业+人工智能=机器人,而机器人的核心在于智力。
(3)市场优势:我国具有超大规模市场的需求优势,有14亿多人口和4亿多中等收入群体的超大规模内需市场,拥有丰富的应用场景。
(4)应用场景优势:“人工智能+”正深度融入人们生产生活等具体环境,在推动制造业、办公、家庭、消费等场景的智能化升级方面表现尤为突出。人工智能+应用场景的核心在于AIAgent,AIAgent是一种广义上的AI应用,最终都要落地到实际生产场景。
二、大模型正在变得更高效且更容易普及得益于越来越强大的模型,一套性能达到GPT-3.5水平的系统,其推理成本在2022年11月至2024年10月期间下降了超过280倍。在硬件层面,成本每年降低约30%,而能源效率则每年提升40%。此外,开放权重模型与封闭模型之间的差距也在不断缩小,在部分基准测试中,性能差异已从8%降至仅1.7%(仅用了一年时间)。这些趋势共同推动了先进AI应用门槛的迅速降低。
三、大模型的不断成熟,用户数量与月活均呈加速上升趋势GPT自2022年11月发布后,5日内用户数量突破100万,至2023年11月WAU达1亿,2024年8月WAU达2亿,2025年2月WAU达4亿,第二轮翻倍时间较第一轮缩短3个月;DeepSeek上线20天即斩获1000万用户,上线2个月MAU达2亿。
以GPT与DeepSeek两大最热门大模型来看,用户数量与使用数量均呈现加速上升的态势。
四、中国:下游应用是我国核心优势与AI产业的关键突破口中国AI产业优势体现在下游。中国AI产业上游云服务与芯片被美国卡脖子,尽管中国本土厂商持续实现技术突围,但由于行业网络效应显著,中国想在上游实现完全胜利难度极高。中国需要发挥自己的比较优势。
(1)数据优势:2016年5月9日,时任总理李克强表示“目前我国信息数据资源80%以上掌握在各级政府部门手里,‘深藏闺中’是极大浪费”。
过去的十年里数据开放情况依然没有明显进展,且数据总量持续累计;大量数据仍处于未被开发的状态,仅市级融媒体中心每年就可以产生超50TB文化数据,且超80%未开发,反观社会数据总量,具有极大经济潜力。
而美国大部分数据来自头部大厂,在大模型训练过程中已经被相当程度转化为经济效应。
全球最大的数据标注公司SurgeAI创始人EdwinChen提到:“在当前AI发展的瓶颈中,数据质量绝对排在第一位,其次是计算能力,然后才是算法。仅仅通过投入更多计算能力不可能解决问题,因为如果没有高质量的数据来训练,或者没有正确的目标和评估指标,你就会陷入一种看到虚假进步的陷阱。”
2025年6月12日,数据标注独角兽企业ScaleAI正式宣布一项来自Meta公司的143亿美元战略投资,Meta将获得该公司49%的非投票权股份,此项投资使ScaleAI的估值飙升至290亿美元。ScaleAI在2024年收入达8.7亿美元,6月12日收购完成后,对应估值的PS倍数达到了33倍。
一方面,这次战略投资让人们重新审视了数据作为基石对于AI行业的重要作用;另一方面,这一事件也为我们提供了观察全球数据标注产业发展的窗口。
国内高质量数据集的重要性被提高到新的维度。2025年之前,中国的数据要素产业发展非常低于预期,主要问题在于从技术上很难低成本地实现“数据不出域,可用不可见”,大大降低了各地方开放数据的意愿。而伴随着人工智能技术的发展,完美的解决了这个难题:
只要把数据封装进垂直模型,让下游来蒸馏模型,下游可以获得我的知识,但无法获取数据,形成“数据不动模型动”的局面,真正实现了数据不出域、可用不可见。
报告全文可搜索“韦伯产业智库”
原创文章,作者:郭峰,如若转载,请注明出处:http://m.gaochengzhenxuan.com/yule/2390.html