阿里又在AI上大出血了

邮箱网 0条评论 2223次浏览 2024年03月13日星期三 09:52

分享到：更多

文 | 金角财经，作者 | 颖宝

阿里在AI上下足了血本。

近日，中国AI大模型初创公司MiniMax正在进行新一轮大规模融资，阿里是其中的核心领投方，融资金额尚未披露。MiniMax成立于2021年，同时拥有文本、语音、视觉三模态融合的通用大模型引擎能力，并打通了产品全链路。

这已是阿里在2024年的第二笔AI大模型项目领投投资。2月，阿里给中国AI初创公司“月之暗面”(Moonshot AI)投资了8亿美元。红杉中国、小红书、美团等均参与了本轮融资。

此前，阿里还投资了百川智能、零一万物等国产大模型公司。

阿里频密投资AI大模型产业，且每笔交易动辄数亿元，结合其在2023年底提出的“AI驱动、公共云优先”战略，不难看出其渗透AI大模型产业并追求反哺的野心。

但AI大模型毕竟是新兴产业，去年才真正进入大众文化圈层，产业发展前景尚未被摸清，阿里就迫切入局，除了为迎合市场趋势，还因其核心业务与AI大模型紧密相关。

想靠MiniMax重振云业务

MiniMax的开发目标与ChatGPT的AI解决方案相似。

2023年3月，MiniMax推出基于端到端的自研多模态大语言模型“MiniMax开放平台”，拥有逻辑推理、文本续写、文案生成、音频交互等功能，能够为使用者提供应用程序编程接口能力和专区方案，以最大限度降低使用复杂性。

MiniMax还基于MoE（“专家混合”，一种深度学习技术）发布了另一个大模型。MoE已在一篇由谷歌、MIT等机构联合发表的论文中，被证实能够大幅提升语言模型的性能。

技术的突破，让MiniMax成为国产明星。2023年6月，MiniMax已完成2.5亿美元融资，公司估值飙升至12亿美元。

在MiniMax之前，阿里就“试水”过AI大模型产业。2023年4月，阿里揭晓超大规模的语言模型“通义千问”，阿里前CEO张勇表示，包含天猫、钉钉、淘宝、高德地图在内的所有阿里产品未来都会接入此大模型。“通义千问”拥有与人类进行多轮交互、续写小说与邮件等功能。目前，其在全球最大模型社区Hugging Face的开源大模型排行榜中名列前矛。

这场试水对阿里的云业务有提振作用。据财报显示，2024财年第三季度，阿里云在该季度营收增长3%至280.66亿元人民币，经调整EBITA利润增长86%至23.64亿元人民币，创财年新高。

阿里还凭借AI大模型拿到了更多政企客户资源，比如参与京能国际北京人工智能公共算力平台、江苏医保云平台（三期）等等项目。

尝到甜头的阿里，坚定了发力AI大模型的决心，并希望依赖新成员MiniMax的助力，重振其核心业务“云服务”。据悉，阿里正在寻找刺激从云计算到物流的独立业务线的方法，将AI大模型整合到一个横跨娱乐产业的业务中。

分一杯AI大模型的羹

阿里将注意力转向AI大模型，有多方原因。

2022年末，ChatGPT的问世，宣告着AI大模型产业强势入场、成为全球话题度最高的科技新秀。

当国内媒体还在讨论这个新奇玩意时，海外已有投资方赚得盆满钵满。

2019年起，微软前后共3次投资ChatGPT。而微软接入ChatGPT后的首份成绩单显示，2023年第一季度，营收同比增长7%至528.5亿美元、归母净利润同比增长9%至183亿美元，一改前几季度的下跌态势。财报指出，微软智能云业务已挑起大梁、营收占总收入的42%，旗下Azure OpenAI服务的客户数将较第二财季增长10倍。

如此强势表现，直接撩动了一众国内资本。

2023年3月，百度旗下知识增强大语言模型“文心一言”发布邀测。在短短一小时内，排队申请测试的企业超3万家；4月，搜狗创始人王小川官宣入局大模型产业，将和前搜狗COO茹立云联合创立人工智能公司——百川智能；5月，科大讯飞发布星火认知大模型，宣称对标ChatGPT；腾讯、字节跳动等互联网大厂也相继推出了AI大模型产品。

《2023中国新一代人工智能科技产业发展报告》显示，截至2023年10月，国内大模型总数已达238个，产品数量随即使市场膨胀。

通过试错，各路大模型发布会的强调重点也悄然转变为赋能产业、场景结合、行业垂直，" 落地 " 成为了此次 AI 创业浪潮的最大目标。

比如，阅文集团的作家助手妙笔版定位为“行业首个网文大模型”，提供辅助创造、内容诊断、答疑解惑等功能；百度从训大模型、用大模型和做应用三个层次服务客户，探索政务、金融、交通等领域的大模型落地；华为云“5+N+X”的思路构建华为盘古大模型，形成了政务、金融、矿山、智能驾驶等行业解决方案，并放出了“不作诗只做事”的豪言。

截至2023年8月底，百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等8 家企业/机构的大模型，已首批正式上线开始面向公众提供服务。

对于阿里而言，在强调行业场景落地的背景之下，需要对AI业务进行重新梳理，聚焦在云计算和电商等领域。

2023年底，阿里云成立公共云业务事业部、政企事业部和海外业务事业部，提出“其他非核心资产要逐渐剥离”，整合资源以聚焦核心业务“电商+云”。在2024财年的前9个月，阿里已完成17亿美元的非核心资产出售。

阿里国际站率先开启AI技术的实践。2023年，其面向全球发布首个包含“生意助手”、OKKI AI两大服务的AI外贸工具，并在2024年提出“帮助新商家快速上手外贸生意”的AI极简出海计划。

有投资人认为，阿里其实是通过投资的方式，实现了项目方对算力集群需求和阿里云的长期绑定。因为阿里在投资这些大模型公司时，有一部分就是使用的算力支付。而大模型在运营过程中，非常依赖云服务，甚至大部分融资都用于向云厂商购买算力。

但阿里云的成绩与气势并不匹配。IDC发布的中国公有云报告显示，2022年下半年，阿里云的市场份额虽仍凭31.9%排名第一，但相比2021年同期的36.7%，缩减了4.8个百分点；2023年上半年，其市场份额继续缩减至29.9%——值得注意的是，这一时期的公有云市场集中度同比下降了3%。

阿里在此节点重金投资MiniMax，很可能是为抢回市场主导权，为构建云服务蓝图再加一注筹码。

烧钱的困局

跑得太快，砂石便扑面而来。国产AI大模型蓬勃发展的另一端，是一个个尚未解决的问题。

其中，烧钱是最大的问题。

据浙商证券研报估算，国内若想做出与ChatGPT同等性能的大模型，需要投入56亿元人民币的开发资金，以及每年1.7亿元人民币的电费——AI大模型是以“年”为训练期限的，比如从2018年开始训练的ChatGPT，到2022年仍处于亏损5.4亿美元的状态。

产品开发出来后，也需要钱去运行维护。据悉，AI大模型每跑一遍就要调动数个A100 GPU，后者每个价值1万美元（约合人民币7.2万元），即便是市面上最便宜的GPT-3.5，一天处理1000万条500字节的问题，每年也需要支出1095万美元（约合人民币7872万元）。

此外，美国限制高端芯片出口后，国内部分云服务供应商顺势提高了价格。据创投日报，这一价格涨幅最高去到60%。月之暗面创始人杨植麟曾在采访中表示，有一段时间机器价格每天都在变。

怎么提高AI大模型的效率，也是需要思考的问题。2022年中国信通院公布的数据显示，中国与美国的服务器存量不相上下，但对比公共云的算力输出率，中国仅28%，美国为60%、欧洲为50%。

这些难题，让国内投资者按下交易暂停键，态度转为观望。截至2023年 11月20日，这一年中国AI赛道在一级市场的总融资件数同比减少26%至530 起，总融资额估值同比下降38%至631亿元人民币。

相比之下，在海外市场，Google、亚马逊、微软等企业均在考虑自研芯片，以降低AI大模型的运行成本。这给了海外投资者更多信心，美国斯坦佛大学统计的数据显示，2020年，美国对AI领域的投资额是中国的2.7倍，2021年这一数据升至3.1倍。

海外AI大模型产业在资金扶持下也得以研发出更多精良产品，发展进入良性循环。就在国产大模型的产业化落地有条不紊地进行时，OpenAI再度进化拉开身位。

2023年11月，OpenAI再次取得突破性成就。北京时间11月7日凌晨，OpenAI在开发者大会上公布了最新成果GPT-4 Turbo，不仅更快、有更长的上下文、更好的控制，API的价格也下调至原来的1/3，降到了1000输入/美分。

同时OpenAI推出了GPTs，每一个GPT像是ChatGPT的一个为了特殊目的而做出的定制版本，用户可以用自然语言构建定制化GPT，然后上传到GPT Store。

来到今年2月，全球话题度极高的视频大模型Sora正式发布，国产大模型似乎再次被甩开了一个版本的代差。

包括阿里在内的所有国产AI而言，目前都面临着在未能解决资金和效率问题的时刻，再度落后版本代差，是安于现状地进行具体场景落地的应用性开发，或大举追加巨额投资去缩短版本差距，都将是一个困难的抉择。

参考资料：

创投日报《阿里再投大模型》

经济参考报《AI大模型加速迭代产业链公司获机构重点布局》

澎湃新闻《科技巨头争相入局！AI大模型有何魅力？》

晚点LatePost《ChatGPT元年：野心，战略，以及绕不开的困难》

金角财经《国产AI，逃过一劫》

新智元《微软杀疯了！接入ChatGPT后首次交卷，一季度营收528亿美元》

海亮观世界《阿里巴巴6亿美元领投AI独角兽MiniMax，开启人工智能新纪元》

青橙财经《阿里云再次降价，云计算竞争进入深水区》

极客公园《史上最大幅度降价，能不能解决阿里云的增长烦恼》

阿里又在AI上大出血了

热门文章

推荐阅读