摩尔线程阿里云中移动都来了!中国AI算力大会演讲嘉宾更新智算集群异构混训技术研讨会议程也已出炉

  九游新闻     |      2025-06-19 00:12

  协办的首届AI算力大会,本次大会计划邀请近30位重量级嘉宾与会带来致辞、报告、演讲和对话,全方位解构

  引爆的AI算力变局。同时,大会也是“智领未来”北京人工智能系列活动之一。

  目前,大会演讲嘉宾阵容有所更新,智算集群异构混训技术研讨会的议程也已出炉。此外,大会的日程也有所调整。接下来将为大家一一阐述。

  《中昊芯英创始人、行云集成电路CTO领衔!中国AI算力大会嘉宾进展公布,移动研究院阿里云也来了》

  技术总监张增金。其中,趋境科技研发负责人陈祥麟将以《大模型推理优化的创新实践——千亿大模型私有化门槛降低10倍》为主题进行分享,安谋科技产品总监鲍敏祺将带来以《端侧AI应用“芯”机遇,NPU驱动终端算力跃迁》为主题的演讲,趋动科技技术总监张增金则将分享如何构建软件定义AI算力的智算中心。

  也将进行主题演讲。其中,摩尔线程副总裁王华将分享基于FP8的国产万卡集群训练。

  则将在随后进行的智算中心专题论坛上,围绕基于Token生成能力的智算集群效能评价进行分享。

  栗蔚,中国信息通信研究院云大所副所长,中国通信标准化协会TC1 WG5云计算标准化组组长,中国通信标准化协会TC608云计算标准和开源推进委员会主席,中国互联网协会算网云协同工委会秘书长,负责云计算、开源、数字化转型、算力互联网和算力服务等工作,编写相关国际和行业标准50余项。

  王华,摩尔线程副总裁,负责AI与云计算相关业务,工作内容涵盖智算集群的软硬件栈,包括计算、存储、网络、集群管理、AI软件等方面,孵化了基于MTT GPU的智算集群产品,支持大规模分布式模型训练和推理。

  随着计算量的不断攀升,大模型训练需要一个“大且通用”的加速计算平台来缩短训练时间,实现模型能力的快速迭代。

  当前,国际科技巨头都在积极部署万卡乃至超万卡规模的计算集群,以确保其大模型产品的竞争力。随着模型参数量从千亿迈向万亿,模型能力更加泛化,大模型对底层算力的需求也在不断升级,万卡甚至超万卡集群成为这一轮大模型竞赛的基本要求。

  顺应趋势,摩尔线程宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案实现了重大升级,从当前的千卡级别大幅扩展至万卡规模。作为国内首家支持全计算精度的全功能GPU企业,摩尔线精度计算,其全功能GPU可高效满足DeepSeek V3/R1等大模型的FP8原生预训练计算需求。

  本次演讲将分享摩尔线程万卡集群实践经验,讲述国产GPU在实际部署中的挑战与难点,以及阐述摩尔线程软硬一体的集群解决方案的优势与关键特性。

  徐凌杰,魔形智能科技创始人、CEO。魔形智能(Magik Compute)成立于2024年,专注于为全球客户提供AI基础设施产品和服务,面向新一代数据中心打造端到端的超节点加速优化解决方案。

  徐凌杰有着丰富的GPU芯片和云产品的开发管理商业化经验,先后在美国硅谷任职于NVIDIA、AMD和三星北美研究院等国际著名芯片公司。他曾任阿里云AI基础架构总监,负责包括GPU和AI芯片在内的异构云计算基础设施平台。2019年,他参与创办壁仞科技,任总裁。

  他本科毕业于上海交通大学信息工程专业,后赴美获得德州大学奥斯汀分校计算机体系结构硕士学位与加州大学伯克利分校MBA学位。

  欧阳小刚,实在智能合伙人、核心算法负责人,清华大学工学本硕、36氪 X-36 Under 36 S级青年创业者;原阿里巴巴资深算法工程师,在OCR和NLP领域有多年深入研究和丰富项目经验,尤其在光学字符识别、对话机器人构建、文本信息抽取等方向有深入的研究,并拥有多项授权发明专利及国内外核心期刊论文;曾负责云上贵州、珀莱雅、中国电信、中国烟草等客户项目的服务落地。

  洪锐先生,图灵新智算副总裁兼投研院执行院长。曾在IBM、蚂蚁金服、平安集团、联想集团等知名企业担任要职。国家信息中心特邀人工智能政策顾问,中国影视技术学会数字视觉专委会专家委员,IBM全球认证大数据专家,以及PMI认证项目管理专家。擅长新一代人工智能智算中心规划设计、智慧城市顶层设计、人工智能中台体系搭建、端边云协同解决方案设计以及人工智能算力平台建设工作。

  作为本次大会的两场技术研讨会之一,智算集群异构混训技术研讨会的议程率先出炉。

  上海人工智能实验室编译计算与国产化团队负责人裴芝林,商汤大装置技术产品总监刘叶枫

  中国移动为解决我国异构智算生态互不兼容,异构芯片存在的“资源墙”问题,在2023年提出了异构混训的技术理念并开展系统性攻关,构建了异构混训技术和标准体系,研发了“芯合”异构混训系统,并实现百亿大模型在多厂商的百卡集群上的交叉混合训练,混合加速比达到95%以上,验证了异构混训技术的可行性。本次演讲将重点介绍中国移动在异构混训关键技术和系统研发方面的主要进展和成果。

  AIGC促进了多元算力的蓬勃发展,也带来了不同芯片之间的“算力墙”挑战,制约了大模型的训练与部署效率。为应对这一挑战,智源研究院联合多家生态伙伴共建开源统一的AI系统软件栈FlagOS。本报告将介绍如何基于FlagOS的核心组件——大模型训推一体化框架FlagScale与多芯片统一通信库FlagCX,实现跨芯片的高效异构混合训练,加速多元算力的融合应用。

  大模型飞速发展的当下,算力需求指数级增长,但国产芯片成熟度仍有待提高。AI系统软件突破卡点、建强软硬件协同生态迫在眉睫。为应对这些挑战和难题,上海人工智能实验室推出自研的DeepLink人工智能开放计算体系,旨在搭建硬件芯片与深度学习软件框架之间的适配桥梁,上下游厂商通过一次适配即可深度接入算法生态,从根本上打破生态壁垒,助力国家算力突围。本次分享,将针对DeepLink高效灵活的核心互联方案(DiTrain)展开设计思路和方案原理的介绍。并向各位分享DeepLink针对大模型训练、推理、微调场景、标准和评测等方面的工作进展。

  卢晓伟,阿里云基础设施异构硬件和系统及解决方案资深总监。目前负责阿里云服务器异构部件和AI Infra服务器系统架构规划以及软硬件结合解决方案业务交付。10多年软硬件结合优化及数据中心领域的技术及架构设计经验。

  王鹏,中国移动研究院网络与IT技术研究所技术经理,长期从事服务器硬件系统架构、异构加速等领域的研究,致力于推动NFV网络基础设施及新型智算基础设施的持续创新与发展。

  叶栋,奇异摩尔首席网络架构专家,2002年北邮博士毕业,B-ISDN宽带通信专业,拥有超过20年的网络互联系统架构设计经验,在AI网络协议、RDMA、虚拟化、软件协议栈等方面拥有丰富的专业知识。在英特尔(中国)工作多年,曾任英特尔网络互联产品事业部技术总监,负责英特尔以太网,P4可编程交换芯片,FPGA智能网卡,Google IPU相关系统架构产品的本地化研发和部署。启动和主导了基于FPGA的智能网卡方案在国内的设计开发和推广,构建了多家大型云厂商和服务商等大规模部署的技术方案的底座。

  孟怀宇博士为曦智科技联合创始人兼首席技术官。他拥有麻省理工学院(MIT)电子工程学博士学位,主要研究方向为集成光子学在人工智能、电子通信、生物传感等方向的应用,在顶级期刊发表论文10余篇,申请全球专利超200项,已获授权专利40余项。博士期间,他参与研发了全球首个片上光互联技术,其成果发表于《自然》杂志上。

  孟怀宇博士于2018年作为联合创始人加入了全球光电混合计算领军企业曦智科技,现任公司首席技术官,全面负责公司技术路线制定、产品定义及知识产权保护。他于2022年荣获“世界人工智能大会云帆奖·璀璨明星”称号。