华为 7 月 7 日将发布直接对标 ChatGPT 的「盘古 Chat」多模态千亿级大模型

 邮箱网  0条评论  1143次浏览  2023年06月05日 星期一 10:30

分享到: 更多
继百度的「文心一言」、商汤的「日日新 SenseNova」大模型体系,以及阿里巴巴的「通义千问」等之后,华为也加入 AI 大模型的行列。


据钛媒体从华为内部获悉,华为公司将发布一款直接对标 ChatGPT 的多模态千亿级大模型产品,名为「盘古 Chat」。预计华为盘古 Chat 将于今年 7 月 7 日举行的华为云开发者大会(HDC.Cloud 2023)上对外发布以及内测,产品主要面向 To B/G 政企端客户。

在 2020 年 11 月,盘古大模型在华为云内部立项成功,也完成了与合作伙伴、高校的合作搭建。在开始打造盘古大模型的时候,团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。

根据华为公布的一份论文数据显示,华为盘古 PanGu-Σ大模型参数最多为 1.085 万亿,基于华为自研 AI 计算框架 MindSpore 开发。消息指出整体而言,PanGu-Σ大模型在对话方面可能已接近 GPT-3.5 的水平。

华为云官网显示,盘古大模型由自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、科学计算大模型等多项构成,通过模型泛化,解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。

标签:华为盘古大模型

我的评论:

请  后发表评论。