华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。其中,盘古Pro MoE 720亿参数的混合专家模型权重、基础推理代码,基于昇腾的超大规模混合专家模型推理代码已正式上线亿参数相关模型权重与推理代码也将于近期上线开源平台
盘古是华为开发的人工智能模型,2020年11月立项、2021年4月正式对外发布。
,实现自然语言理解、计算机视觉、预测、多模态、科学计算基础模型的全面升级。其中在自然语言大模型方面,华为推出完全由国产算力训练而成的7180亿参数深度思考模型,标志着我国已具备用国产算力训练世界一流大模型的能力。
华为公司相关负责人表示,此次开源部分盘古模型,是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。华为诚邀全球开发者、企业伙伴及研究人员下载使用,反馈使用意见,共同完善。
今年以来,人工智能行业不断上演“神仙打架”,新模型层出不穷。在日前召开的2025上海世界移动通信大会开幕式上,国家互联网信息办公室副主任王京涛介绍,截至目前,中国已经有433款大模型完成备案,上线提供服务。专家认为,大模型备案数量激增印证了我国大模型研发能力的跃升,为我国数据要素与产业场景深度融合打下了坚实基础,推动我国人工智能产业迈入规模化应用新阶段。
“我国人工智能大模型发展形成了比较完整的大模型产业体系,创新能力不断增强。”北京市社会科学院经济研究所副所长、研究员邓丽姝称,我国形成了涵盖基础层、模型层、应用层的大模型产业布局,贯通基础研究、技术创新、商业应用的大模型创新链,创新链产业链实现融合发展。在通用大模型和行业大模型方面,形成了丰富完备的产品矩阵,在金融、政务、医疗等领域广泛应用。
与此同时,人工智能大模型也初步形成了差异化竞争优势,自主创新生态不断完善。我国大模型低成本高效能的特质叠加开源战略,推动大模型向普惠性融合创新基础设施转化,畅通了人工智能技术应用落地的“最后一公里”,有力促进大模型向生产端、服务端、消费端应用渗透,提升了中小企业的应用率。
“在人工智能、大数据等新一轮科技变革中,数量众多的互联网平台企业推动科技创新走向前沿,展现了强劲的竞争力。”中央党校(国家行政学院)经济学教研部政府经济管理教研室副主任、教授汪彬说。
“人工智能大模型让数据使用能力大幅提升。”北京市科学技术研究院创新发展战略所研究员王凯介绍,“此前很多领域都面临大量的数据集合在眼前,却很难切入分析的问题。人工智能技术切入后,不仅是数据分析,更是一种新知识的产生。因为这种分析是系统的、深入的、全面的、交叉的、关联的。”
开源成为我国人工智能大模型发展的重要模式。邓丽姝表示,越来越多的我国人工智能头部企业选择开源模式,一方面,极大推动了基座大模型的创新生态培育,促进形成“技术—数据—场景”的循环迭代创新路径;另一方面,打破了技术垄断,汇聚了越来越多的创新主体,共同开展创新迭代。中小企业和开发者能够便捷运用优质模型进行定制和微调,加速了大模型创新应用与扩散。
汪彬认为,我国凭借多年来的技术积累,已经从应用端逐步向底层技术进行突破,尤其是各种外部环境压力,倒逼加快实现科技自立自强,这在人工智能大模型领域体现得特别充分。今后,企业将越来越注重底层技术开发和基础研究,为人工智能的进一步发展打下坚实基础。