超30个国产大模型混战：华为百度阿里腾讯，谁能成为“中国的OpenAI”？

出品 | 搜狐科技

作者 | 梁昌均

(资料图)

编辑 | 杨锦

在高调呼吁暂停开发高级别人工智能后，近日，马斯克被爆出斥资数千万美元购买上万张GPU训练算力，并成立对标OpenAI的X.AI公司以开发大模型。

ChatGPT引爆的AI大模型，正在成为全球科技巨头竞相追逐的新战场。

国外有微软、谷歌、亚马逊，国内更是遍地开花。“大模型发布月”名不虚传，刚刚过去的一周基本以“天”为计不断更新。继百度之后，华为、阿里、腾讯、360、商汤、知乎、毫末智行、昆仑万维等纷纷公布大模型进展，可能成为中国AI发展史上最“内卷”的一周。

同时，创业市场依然不断有大佬进入，搜狗创始人王小川，美团联合创始人王慧文和元老级高管陈亮纷纷投身AI大模型。王小川和百度李彦宏阵营围绕技术差距等问题打起口水战，为AI大模型添了一把火。

国内诸神混战，热闹非凡，热度甚至完全超过美国。但狂飙之下，形形色色的入局者也需想清楚这背后的挑战——除数据、算力和算法外，更关键的是如何跑通技术和商业的闭环。

大模型混战，大佬隔空互怼

刚刚过去的四月第二周，国内AI大模型浪潮迎来巅峰。先是华为公布了盘古大模型的进展，360宣布将基于360GPT大模型开发的360智脑落地搜索场景。

随后商汤公布日日新大模型，开启内测的阿里通义千问正式亮相，毫末智行发布全球首个自动驾驶大模型DriveGPT雪湖·海若，再到腾讯推出性能提升3倍的新一代高性能计算集群，知乎推出中文大模型知海图AI，让人目不暇接。

AI创业圈也不断有大佬进入，美团前高级副总裁、最高决策机构S-team成员陈亮近日已入局大模型创业，这是继王慧文之后第二位投身大模型创业的美团元老。

此前被寄予厚望的王小川也正式官宣，和前搜狗COO茹立云联合创立百川智能，并放话年底做出中国最好的大模型，还因和李彦宏阵营的隔空互怼引发圈内关注。

接下来，预计还会有更多的大模型发布。京东称将在今年发布千亿级参数的言犀大模型，昆仑万维的天工3.5在今日开启内测，科大讯飞将在5月发布大模型产品。

字节跳动、网易等国内有头有脸的公司都在研发大模型。雷军也表示，对大模型会全力以赴，坚决拥抱，并称正在研发一些有趣的技术和产品。

据民生证券不完全统计，目前国内已发布超过30个大模型。此前宣布大模型创业的出门问问创始人、CEO李志飞则预计，中国未来1-2年会看到50家以上公司做大模型。

国内目前布局AI大模型的企业和机构资料来源：民生证券

这场混战也引发了很多争论，王小川就不认同李彦宏称文心一言与OpenAI仅相差两个月的言论。关于国内与OpenAI的差距，目前并没有统一的对比标准。最“自信”的李彦宏认为仅差两个月，周鸿祎、王小川等认为相差2到3年，也有“中间派”认为差距是1到2年。

此外，关于巨头和创业公司在大模型时代的机会，各方立场也不同。不少观点认为，大模型是烧钱窟窿，只有巨头能玩得起，创业公司机会不大。李彦宏就表示，中国创业公司基本不会出现下一个OpenAI，重新做一个ChatGPT没有多大意义，也没有必要重复去造轮子。

李志飞曾在国内率先声称要做“中国的OpenAI”，但经过一个月后逐渐变得冷静，认为国内大概率不会出现OpenAI，而通用大模型不一定适合所有人，包括大佬们。

今年以来入局AI大模型创业的大佬

但也有很多观点认为，创业公司在技术和商业层面也有很大机会。王小川认为，大厂更注重业务目标，自身惯性使其很难做0到1的创新，创业公司更适合去做通用人工智能，这与李彦宏的立场截然不同。

如此种种，孰是孰非，难有定论。而类似的争议也将延续，如近日因马斯克等人呼吁暂停研发更高级别人工智能引发的AI监管问题，全球也并没有形成一致的共识。

不得不的警惕是，在人潮汹涌之际，需要防止大模型出现类似元宇宙的短命现象。当年元宇宙的火爆程度并不比大模型弱，但最终潮水褪去，微软、Meta等大厂灰头灰脸进行收缩，元宇宙终究是触不到的海市蜃楼。

从目前来看，国内在大模型上还是有些浮躁，不少企业在技术或产品没有打磨好之前便匆忙推向市场，借助概念蹭热点的公司更是不在少数。国内要想赶超OpenAI，做好大模型，可能还需要的是冷静，以及长期深耕的准备。

从大炼模型到炼大模型

国内开启对大模型的研发，时间并不算太晚。就在OpenAI推出GPT-2并接受微软10亿美元投资的一个月后，即2019年3月，百度就发布了上亿规模参数的ERNIE1.0（文心大模型），这是中国第一个正式开放的预训练大模型。

目前，百度的文心大模型已迭代到ERNIE3.0版本，参数规模超越GPT-3达到2600亿，是全球首个知识增强的千亿AI大模型，文心一言、文心一格等即是基于ERNIE3.0打造。

但百度抢下国内首发并未带来大模型的升温，而是直到两年后才受到更多关注。2021年3月，科研机构智源研究院推出悟道1.0大模型，三个月后迭代至悟道2.0，参数规模高达1.75万亿，是GPT-3的10倍，刷新之前谷歌创下的1.6万亿参数纪录，是彼时中国首个和全球最大的万亿级模型。

国产大模型逐渐成为巨头的游戏，人工智能从大炼模型迈向炼大模型时代。华为在2021年推出盘古大模型，腾讯和阿里也先后推出混元大模型和通义大模型，其中阿里的多模态大模型M6的参数在不到两年内从3亿暴增到10万亿，目前仍是全球最大预训练模型。

从百度、华为、阿里、腾讯等巨头的布局来看，其更注重打造通用的基础大模型，因此规模也往往更大。不过，巨头的玩法并不适合所有公司。

一般来说，模型越大，对算力要求越高，成本也就越高。据浙江大学人工智能研究所所长吴飞介绍，ChatGPT的训练门槛是1万张英伟达V100芯片，约人民币10亿元，模型训练算力开销是每秒运算一千万亿次，需运行3640天。

而从创业公司来看，李志飞认为5000万美元是基本门槛，王慧文和王小川首轮融资都是这个规模。因此，并不是所有的企业都有能力，或者说有必要去做通用模型，专注于垂直领域依然有很大的机会。

目前，也有不少公司专注打造面向具体行业和场景的垂直大模型，如毫末智行面向自动驾驶领域的DriveGPT雪湖·海若，创新奇智推出的工业大模型产品奇智孔明，云从科技也计划募资超36亿元研发行业大模型。

达观数据董事长兼CEO陈运文认为，与通用大模型相比，垂直大模型参数少，训练成本和使用成本将更具有竞争力。目前，该公司也正在研发名为“曹植”的垂直领域模型。

值得注意的是，巨头在打造通用模型外，也面向不同技术领域进行布局。百度以文心大模型为底座，面向自然语言理解、计算机视觉、多模态、生物计算等领域都推出大模型，华为、腾讯和阿里也是类似。百度则更快人一步，目前已在能源、金融、制造、教育等领域推出36个行业大模型。

百度副总裁吴甜曾对搜狐科技解释称，通用模型对行业特有的数据和知识的把握能力依然有不足之处，因此有必要打造行业大模型。她认为，这是通用模型未来能够广泛应用最有效的方式。如今这也得到更多认可，华为也不断推出面向具体行业的大模型，阿里也将在今天发布行业大模型。

对于大模型的发展，过去都在追求规模，短短两三年参数就从亿级别达到10万亿级别。但越来越多的观点认为，大模型并不是越大越好，或者说在参数继续增加的同时要更加关注如何提升模型的能力。

OpenAI首席执行官山姆·奥特曼近日就提到，OpenAI正接近语言大模型规模的极限，规模不再是衡量模型质量的重要指标，而规模越大并不一定意味着模型越好，未来需要有更多方式来提升模型的能力和效用。

他认为，未来模型参数应该向更小的方向发展，或者以多个小模型协作的方式工作。实际上，大小模型协同也越发成为国内产业界共识，达摩院曾就将此视为未来趋势之一。吴甜也表示，大模型在产业应用上非常重要，但不是唯一方向，大小模型并非互斥，而是相互协同。

C端哑声，普遍押注B端应用

选择做大模型仅仅是第一步，更为关键的是如何打通技术和商业的闭环。正如李志飞所说，做出通用人工智能又能怎么样，更重要的还需要make AGI accessible。

过去人工智能的商业模式主要是针对特定任务、场景开发专用小模型，难以标准化，导致成本高企，这也是为何几乎所有AI公司难以盈利的根本所在。通用模型则可以将下游碎片化任务和场景一网打尽，推动人工智能从作坊式完成工业级的标准化生产和商业应用。

目前，OpenAI的GPT模型在商业化方面走在前列。C端实现会员收费，上亿用户将为其提供一定的变现潜力；B端通过API和插件方式服务客户，同时还借助微软实现在搜索、办公等领域落地，并通过云对外提供更为泛化的能力，这也成为国内模仿的打法。

不过，国内基于大模型C端产品或面临更为严格的限制和监管。百度文心一言和阿里的通义千问仍在内测阶段，国内目前还没有一款C端产品如ChatGPT般向公众开放。

生成式人工智能在监管上也正在受到更多关注。近日我国发布了《生成式人工智能服务管理办法（征求意见稿）》，明确要求不得出现歧视，生成内容应当真实准确、防止生成虚假信息等，如果出现，除内容过滤外，还要通过模型优化等进行优化。作为生成式人工智能的固有缺陷，这在从技术上难以保证和彻底解决。

可以预见，在未来一段时间内，基于大模型的C端产品或难以突破，这也在很大程度上使得国内大厂普遍都在押注B端落地。

从头部大厂布局来看，其推出的大模型不仅是自身业务的支撑，如百度将文心一言落地在自家搜索、小度和智能驾驶等业务上，阿里所有业务也都将接入通义千问；更为重要的是，这些企业还将大模型的能力对外输出，助推行业数字化和智能化的进一步升级。

业界也已逐渐达成共识，比尔·盖茨、阿里CEO张勇等人都认为，所有行业或产品都会被AI大模型重塑，从而带来新一轮的升级。

目前，大厂都在计划通过云的方式对外输出大模型的能力，云计算成为AI大模型落地的最佳方式，模型即服务（MaaS）越发受到关注，而这也将带来大模型成本的降低。据阿里云透露，未来在云上训练一个模型的成本将有可能降低到现在的十分之一，甚至是百分之一。

这使得企业不需要再从“零”起步去训练出一个“好用”的大模型，而是可以直接调用大厂的通用大模型，再结合自身的行业知识积累和应用场景，就能以较低成本“一键”生成适合自己的专属大模型。

不过，关于C端和B端谁更有前景，目前并无定论。普遍的观点认为，B端将是大模型应用富矿。但在王小川看来，C端服务才是未来更大的机会。

以大模型为代表的AI 2.0狂潮时代，将是一场持久战。打口水战没有意义，只有打通技术和商业的闭环，最后才有可能在混战中取胜。返回搜狐，查看更多

责任编辑：

推荐内容

超30个国产大模型混战：华为百度阿里腾讯，谁能成为“中国的OpenAI”？

天天消息！马斯克证实自建 AI 新项目TruthGPT，一个关心理解宇宙的AI｜钛媒体焦点

全球短讯！仁宝 Mobile Office 笔记本电脑发布，配有可折叠掌托

最新消息：芯驰发布第二代中央计算架构SCCA2.0

每日简讯：满洲里市人民医院联合中华救助基金会开展筛查活动

当值华为轮值董事长后首次亮相，孟晚舟在分析师大会说了什么？（附演讲全文）

世界最资讯丨李彦宏不想垂帘 百度没有二号人物

法国财长勒梅尔：到2027年，法国的目标是将公共赤字减少到GDP的2.7%，公共债务减少到GDP的108.3%

心理咨询师《操作技能》知识点：明尼苏达多项人格测验(MMPI)

传感器生态：佳明为何稳居霸主地位

全球视点！10680元的4090你会买吗？AMD大降价，NVIDIA也绷不住了

【天天聚看点】书房图片正面效果图_书房图片

【全球报资讯】福建文旅经济发展大会举办 厦门三区上榜全域旅游示范区

天天百事通！年内套现1.5亿，拟继续减持2%，华谊的“解药”是什么？

2023香港创科展杭州三大企业首发新品

全球即时看！ChatGPT教程，用ChatGPT轻松创建一个网站！

打造网红城市、街区不能盲目

国家能源局负责人出席中国与国际可再生能源署合作研讨会暨中国—IRENA合作办公室揭牌仪式

环球视点！北京海淀万柳华府房产6963万元法拍成交 单价约14.9万元/平米

环球观察：林俊杰认栽，第一波元宇宙炒房团“覆灭”

京蒙协作 内蒙古苏尼特右旗光储项目发电破亿千瓦时

韶音旗舰运动耳机大秀适耳自由

华为 nova 11真机图赏：全新11号色+素皮压花工艺 颜值和质感拉满

天天热文：意外险理赔报案最长多久 是怎么规定的

业绩下滑超六成！美凯龙控股股东减持、有意受让29.95%股份耐人寻味

为什么鼠标三巨头集体摆烂？

全球今日报丨小米13Ultra扶持国产供应链，打破三星屏幕垄断地位

探求国产商用飞机“潮汕新解”

全球时讯：腾讯游戏五一劳动节假期未成年人限玩通知 最多10小时

每日一卡

今日热议：迎来反转，iPhone 15 Pro系列将取消固态按键设计！

全球最新：为什么有的人说 Intel 大小核技术不好？

世界球精选！剑桥科技4月20日打开涨停

我国6G通信技术研发取得重大突破 由中国航天科工完成

世界速讯：苹果升级iphone15pro系列手机action按钮将替代

热点评！爱国者64G U盘11.9元

华为MateBook新品带来大屏生产力新体验

【全球热闻】通讯：中巴技术合作助力巴西企业拓展市场

子悬・肝气犯脾证

一季度跨境人民币收支创近八年来新高

自主品牌打响“插混战”丨2023上海车展总结之奇瑞、长城、吉利、传祺等

魅族20 Pro热度空前，官方开启每日抢购！

miui11私密文件怎么查看？miui11私密文件夹怎么打开?

苹果11promax刘海怎么去掉?苹果11promax的屏幕分辨率是多少？

苹果11pro超广角怎么用?苹果11pro超广角支持夜间模式吗？

荣耀v30屏占比是多少？荣耀v30的录音功能在哪里？

苹果11双卡双待怎么插卡?苹果11双卡为什么信号这么差？

oppoace屏幕显示效果怎么样？oppoace的游戏空间怎么恢？

oppoace屏幕是三星的吗？oppoace屏幕显示效果怎么样？

iPhone11屏幕偏黄怎么调白?iphone11的运行内存多大？

全球短讯！仁宝 Mobile Office 笔记本电脑发布，配有可折叠掌托

天天消息！马斯克证实自建 AI 新项目TruthGPT，一个关心理解宇宙的AI｜钛媒体焦点

全球热点评！SE《最终幻想1~6》像素复刻版合集上线 PS4、任天堂 Switch 平台

环球头条：倍杰特: 倍杰特薪酬与考核委员会工作细则

超30个国产大模型混战：华为百度阿里腾讯，谁能成为“中国的OpenAI”？

环球快讯:工信部：我国建成 5G 基站超 264 万个，全国建成千兆城市 110 个

【全球新要闻】经济商称若美元复苏，美油恐继续下跌！

动态焦点:TechInsights：2023 年全球翻新手机销量将同比下降 8%

当值华为轮值董事长后首次亮相，孟晚舟在分析师大会说了什么？（附演讲全文）

今年开亚运会杭州哪些地方停工

每日简讯：满洲里市人民医院联合中华救助基金会开展筛查活动

最新消息：芯驰发布第二代中央计算架构SCCA2.0

世界最资讯丨李彦宏不想垂帘 百度没有二号人物

当前要闻：法国财长勒梅尔：预计到2025年，年通胀率将从2023年的4.9%降至2%

世界热文：满洲里市各草原书屋开展全民阅读活动

《死亡搁浅》PC新补丁：支持PS5手柄 英特尔显卡更新

天天视讯！满洲里市举办“4·15全民国家安全教育日”宣传活动

法国财长勒梅尔：到2027年，法国的目标是将公共赤字减少到GDP的2.7%，公共债务减少到GDP的108.3%

每日速递：Mysteel解读：出新！白羽肉鸡种禽端数据分析报告

重点聚焦!日本首相岸田文雄：没有计划调整销售税税率，当被问及政府计划如何资助儿童保育支出时

当前热讯：心理咨询师《操作技能》知识点：卡氏16种人格因素测验( 16PF )

全球实时：李宁咖啡要来了？李宁申请注册咖啡logo商标，网友：果然是一切皆有可能

当前观察：第五人格肯德基联动2023价格表一览|第五人格肯德基联动2023套餐一览

天天精选！科大讯飞：2022年营收188亿，根据地业务同比增长23%

心理咨询师《操作技能》知识点：明尼苏达多项人格测验(MMPI)

世界焦点！心理咨询师《操作技能》知识点：咨询效果评估

传感器生态：佳明为何稳居霸主地位

全球微速讯：三维化学投资成立新能源科技公司 注册资本5000万

全球视点！10680元的4090你会买吗？AMD大降价，NVIDIA也绷不住了

世界最资讯丨李彦宏不想垂帘百度没有二号人物

【全球报资讯】福建文旅经济发展大会举办厦门三区上榜全域旅游示范区

环球视点！北京海淀万柳华府房产6963万元法拍成交单价约14.9万元/平米

京蒙协作内蒙古苏尼特右旗光储项目发电破亿千瓦时

华为 nova 11真机图赏：全新11号色+素皮压花工艺颜值和质感拉满

天天热文：意外险理赔报案最长多久是怎么规定的

全球时讯：腾讯游戏五一劳动节假期未成年人限玩通知最多10小时

我国6G通信技术研发取得重大突破由中国航天科工完成

世界最资讯丨李彦宏不想垂帘百度没有二号人物

《死亡搁浅》PC新补丁：支持PS5手柄英特尔显卡更新

全球微速讯：三维化学投资成立新能源科技公司注册资本5000万

【世界播资讯】中科曙光涨停三个交易日机构净卖出3.83亿元

每日快报!公司为监测员工申请多项专利公司申请监测员工状态专利

世界最资讯丨形成大中小企业协同创新合力工信部启动大企业“发榜”中小企业“揭榜”工作

精选！央行：房地产市场出现积极变化交易活跃性有所上升

全球讯息：蓝色光标涨停机构净买入1.02亿元

每日热文：厦门建筑业加速数字化转型明确未来三年目标

【全球报资讯】福建文旅经济发展大会举办厦门三区上榜全域旅游示范区

百事通！内蒙古今年一季度GDP达5344亿元同比增长5.6%

环球视点！北京海淀万柳华府房产6963万元法拍成交单价约14.9万元/平米

同心同行协力共赢，天猫好房邯郸独家合作伙伴启动发布会圆满收官

天猫AR美妆软著权获批天猫登记AR美妆软著权

重点聚焦!港股内房股走低融创中国、碧桂园跌幅超3%

进军固态电池技术领域优美科投资Blue Current

京蒙协作内蒙古苏尼特右旗光储项目发电破亿千瓦时

热点！【大国基理】礼数天下衢通未来一座“最有礼”的城市

【天天热闻】昆仑万维版ChatGPT来了国产大模型“天工”通过程序员面试

华为 nova 11真机图赏：全新11号色+素皮压花工艺颜值和质感拉满

保险和投资有什么区别区别有这几点

大单中单小单怎么区分区分的方法如下

“聚焦2023年一季度经济数据”系列报道唱好农业生产“开年大戏” 一季度农业农村经济运行总体平稳

要闻：一季度金融运行总体平稳实体经济融资成本稳中有降

天天热文：意外险理赔报案最长多久是怎么规定的

苹果专利可在XR中显示虚拟显示器苹果显示虚拟显示器专利公布

word怎么从第三页开始编页码？原来还能这样设置页码！论文不用愁了

环球即时看！国内罕见！银基动物王国喜迎“白虎六胞胎”