首家以研发主权级大模型为目标的AI公司成立

2024-03-22 12:27

近日,首家以建立主权级大模型为目标的通用人工智能(AGI)企业元神进化在北京成立,该公司采用自研的新一代多模态MoE架构。

作为项目发起单位,中国智能计算产业联盟联合曙光智算、算力互联、并行科技、九方世纪、澎峰科技和华恒盛世等智算企业和元神进化签约,来自多所国内知名院校的专家团队提供技术支持。算力互联为主权级大模型项目的启动提供了算力支持。

全国政协委员张云泉首倡

多位院士支持

在2024年两会上,AI(人工智能)大模型成为不少代表委员的关注点。

其中,全国政协委员、长期从事超算研发与建设工作的中科院计算所研究员张云泉聚焦如何解决大模型算力瓶颈问题,首次提出要发展中国的主权级大模型。在他看来,当前国内面临大模型训练用国产高端AI芯片供应不足等问题,应该整合优质科研和产业资源,尽快训练出我国的“主权级”大模型,发展主权级大模型需要两弹(智算+大模型)结合。

对于“统一协调国内优质科研产业资源‘集中力量办大事’,以取得快速突破,避免低水平使用国外开源大模型的重复与‘内卷’,延误‘主权级大模型’研发”的看法,生物信息学专家、中国科学院院士陈润生表示赞同。

超算领域专家、中国工程院院士郑纬民对利用我国在超算研发建设中的丰富积累,设立能够支持“主权级”大模型训练的专用超算攻关专项,快速缓解国产“主权级大模型”训练的算力瓶颈等想法表示支持。

计算机科学家、中国科学院院士钱德沛对发展主权级大模型的想法表示赞成,认为发展中国智算产业,研制出能够满足主权级大模型训练需要的十万卡甚至百万卡并行算力需求的AI芯片和系统尤为关键。

大模型领域专家、复旦大学自然语言理解实验室张奇教授表示,将和其他教授一起,为‘主权级大模型’项目提供技术支持,“我们国家支撑大模型的智算技术和人才积累相当丰富,得到智能计算产业的支持,对于尽快缩小我国在‘主权级大模型’训练领域与美国的差距十分重要。目前中国院校全力投入大模型领域研究的顶尖人才众多,研发积极性非常高,但是受限于极高的算力门槛,很难单独开展通用大模型研发实践。通过‘主权级大模型’的共建形式和智能算力结合,有志于研发通用大模型的专家们完全能够参与进来为主权大模型事业的进步发挥出技术贡献。”

打造主权级大模型研发主体

美国OpenAI的ChatGPT横空出世以后,国内涌现有Moss等几百个大模型,智谱、百川智能、零一万物、minimax和月之暗面等5家头部大模型公司各自获得数十亿投资,知名投资人和机构纷纷点评大模型发展和商业化趋势,大模型市场竞争激烈。

对于主权级大模型和之前的大模型的区别,元神进化创始人表示:

首先,智算智能是一体的产业,从美国市值超过1万亿美元的几家公司看,现在已经进入“智算智能”时代。主权级大模型首先要服务于智算产业,让智算用的好,更好用。

其次,大模型技术发展日新月异,只有让在技术创新中最广泛的活跃群体加入进来,一起参与,才有可能创造最好的大模型。然而目前真正能参与通用大模型研发的教授团队少之又少,这种不平衡现象需要解决。“人工智能女王”李飞飞教授近日提出堪比登月计划的‘建立“美国国家级算力与数据集仓库”构想’——即使是算力供给充沛的美国也面临类似的问题,Meta可以为模型训练采购高达35万个GPU,而斯坦福大学的自然语言处理小组,总共却只拥有68个GPU。

其三,大模型技术是遵循互联网模式发展成一个超级APP,还是作为一个核心技术催生一个全新产业?这需要时间检验。

目前国内单个大模型投入普遍只有数亿元级别,大模型产业投入上至少要追平芯片产业的投入才能看到完整的反馈。元神进化主权级大模型项目采用开放的生态合作方式,让全社会参与进来投入足够资源,顶层设计下边干边看,让投资人做判断题,企业家做选择题,科学家做证明题。

多家智算企业协同

作为项目发起单位,曙光智算、算力互联、并行科技、九方世纪、澎峰科技、华恒盛世等智算企业联合中国智能计算产业联盟,和元神进化签约。

算力互联总经理唐德兵表示,未来将依托算力互联ACLink+ACNet算力互联网体系,和元神进化共同开展1Eops级算力资源规模合作,构建有竞争力的通用人工智能算力基础设施。

曙光智算未来将在国家级、地市级智算中心合作部署元神进化主权级大模型,形成通用AGI模型基础设施,帮助各智算中心对各类用户提供大模型技术服务和产品。

并行科技总经理陈健表示,作为国内领先的超算云服务和运营服务提供商和北交所上市公司,并行科技提供超算云、行业云、智算云、设计仿真云和计算资源建设及运营服务。未来将在元神进化主权级模型研发、赋能智能计算中心AGI服务商业化上开展合作。

九方世纪副总经理白洋表示,九方世纪在全国一体化算力网络内蒙古枢纽节点和林格尔数据中心集群建设九州智算中心,具备20E FLOPS FP16人工智能算力资源,将支持元神进化的主权级大模型项目研发和推广。

澎峰科技总经理张先轶表示,公司致力于打造国际领先的计算软件栈,从PerfMPL数学计算库,PerfXAPI异构计算框架,大模型推理框架PerfXLM,直至助力高级算力的PerfXCloud解决方案。正在积极参与到元神进化主权级大模型的软件基础建设当中去,持续赋能芯片、服务器、算力中心的AGI基础建设和应用生态发展。

华恒盛世总经理郑敏表示,公司未来将围绕元神进化主权级大模型研发合作,通过智能算力调度、运维和优化等技术赋能通用AGI模型基础设施服务和模型商业化部署。

相关推荐
打开APP看全部推荐