人工智能大模型应用落地 算力需求该如何满足?

发布时间:2024-04-28 02:17:54 来源: sp20240428

原标题:人工智能大模型应用落地 算力需求该如何满足?

在算力基础设施高质量发展2025年目标时间表的大政策背景下,我国生成式人工智能(AIGC)服务和大模型产业生态发展现状如何?通用大模型和行业大模型产业发展的核心竞争力到底是什么?在产业数字化进程中,国产大模型的“千模大战”状态会持续多久?

想要回答上述问题,我们可以从刚刚在辽宁沈阳闭幕的中国计算机大会(CNCC2023)上寻找答案。作为中国计算机学会主办的计算机领域级别高、规模大的高端学术会议,CNCC今年以“发展数字基础设施,支撑数字中国建设”为主题,在130个技术论坛和20余场专题活动中,有近30场活动都对近来火热的人工智能与大模型做了深层次解析。记者在同期举办的“超智融合AI大模型应用落地发展,高效计算新范式”专题论坛中,找到了一些可以回答这些问题的观点和建议。

算力、算法、数据——AIGC技术发展与安全并重

“无算力、不模型”。自生成式人工智能服务(AIGC)和GPT大模型训练爆火后,围绕算力、算法和数据相关的讨论此起彼伏,中文语境下的国产大模型应用更是呈现出“千模大战”的状态。

今年,我国先后出台了《生成式人工智能服务管理暂行办法》和《算力基础设施高质量发展行动计划》,对AIGC技术与产业发展背后的算力基础设施做了详细规划。其中,《行动计划》从计算力、运载力、存储力以及应用赋能四个方面提出了到2025年算力基础设施发展的量化指标,计算力方面,算力规模超过300EFLOPS,智能算力占比达到35%;存储力方面,存储总量超过1800EB,先进存储容量占比达到30%以上。

智能算力是上述专题活动探讨的主题。围绕人工智能大模型算法优化以及应用落地过程中面临的现实问题,来自中国科学院、中国信息通信研究院、中国人民大学、北京超级云计算中心等产学研用机构的嘉宾共同讨论了技术应用、人才培养、行业创新、内容安全等焦点话题。

“人工智能大模型在业务训练过程中从推理、问答、检测到描述,重点在于解决连续性问题。”中国人民大学高瓴人工智能学院教授、博导卢志武表示,通用大模型在文本、图片、音视频等多模态内容生成能力上还存在许多需要解决的问题,“从多图理解、物体定位、OCR等业务功能上,多模态大模型对于任务预训练和数据指令微调等都需要完善升级,在应用场景落地时,如何通过大模型训练去解决用户的多元化复杂需求非常重要。”

“数据对于大模型的训练和应用来说是至关重要的,现在大模型需要的数据是用哪些数据和指令集类型来让大模型具备什么样的能力。本质上它是一个多样性和覆盖面的研究性问题,这与记忆学习和深度学习的数据有所区别。”中国科学院自动化所副研究员孔庆超认为,人工智能大模型在国内的发展仍需要投入研发力量,行业大模型在不同行业的应用探索是否一定会产生成果,这就需要通过大量的算法去做逻辑推理,例如,金融行业大模型是否有更多算法来支持生成投资决策参考意见,这样的大模型是否具备迭代和学习等能力,都需要做充足的预训练和技术研发。

专家指出,数据、算法和算力是新型信息基础设施的重要组成部分,算力基础设施呈现多元泛在、智能敏捷、安全可靠、绿色低碳等特征,对于助推产业转型升级、赋能科技创新进步等具有重要意义。在生成式人工智能技术方面,打造并完善算力、数据和算法三位一体的协同应用生态,通用大模型和行业大模型都在做应用“减法”,让大模型从“玩具”到“工具”转变。让技术落地、让成果产生价值、让服务匹配业务,这或许就是人们正在讨论的大模型未来生态。

中国科学院计算机网络信息中心人工智能部副主任王珏认为,国产大模型在应用落地和业务适配方面,关键在于数据清洗。“我们也在尝试各种模型,无论是准确度还是计算效率,面临的挑战就是国产开源大模型的稳定性,这方面我们做了很多工作,通过文献数据促进各学科科研发展。同时,让国产大模型好用也是我们的研究方向。”

“人工智能、大数据、云计算等新一代信息技术加速了大模型的发展。通用或行业大模型研究训练离不开大量的算力支撑。”并行科技董事长陈健博士认为,从产业发展的角度来看,算力是工业产品,行业大模型训练对于算力的需求需要找准方向才好发力。

技术、应用、生态——提升大模型准确率与效率

大模型应用对于高频次的算力资源需求,往往与大模型升级迭代的多元场景应用能力建设息息相关。当前、中文语境下的大模型生态还面临哪些问题,交叉学科人才培养合作机制和产业链上下游能为大模型带来哪些深层次变革?在接受记者提问时,多位嘉宾也谈到了目前大模型所提供服务过程中亟待解决的一些行业性问题。

早期AIGC技术的发展,从各个链条和语义理解上产生了大量的大模型内容生成的“幻觉”问题,即“一本正经的胡说八道”。在中国信息通信研究院融创中心主任田辉看来,新兴技术的行业应用一定是需要产学研用结合才能健康的状态,“AIGC技术的分工角色更细,产业应用的开发、部署和应用都是需要产业链共同合作。如大模型的二次开发,迭代升级、运维服务等领域的人才培养机制,都需要细分与合作。”

AIGC技术产业进入“千模大战”状态后,最终我们所依靠的核心竞争力是什么?业内人士认为,AIGC技术产业的发展方向或路径是从人工智能技术升级方面,提升大模型的理解、生成、逻辑推理和记忆等核心基础能力;在场景应用落地方面,强化大模型的学习能力,提升生成服务准确率和效率;在行业生态建设方面,提升大模型的智能化水平和生态应用空间,打造成为辅助决策的实操性工具。

“北京超级云计算中心采用超算架构模式构建智能算力资源,将分布在国内的各大算力中心资源进行整合,可以最大限度地利用现有资源,降低因空闲资源浪费而产生的损失。同时也可以有效满足人工智能大模型训练对算力的高频次需求。”北京超级云计算中心吴迪介绍说,以超级计算机为代表的超算架构能够提供更加全面高效的并行计算能力,为大模型训练处理提供算力服务支持,实现更高效的模型训练以及更好的预测准确度。

王珏表示,行业大模型的发展离开算力就会拉大行业差距。“让算力资源能更好地去跑这些大模型,保持其精度或者泛化能力不变,提升大模型训练的速度和效率,能够真正并尽快在大模型训练上实现全栈国产化,这是研究的热点。”

“希望大模型的行业应用发展看到有百花齐放的生态,但需要关注的是低水平重复工作的问题。无论是数量还是类型,大模型的产品或商业形态还有很多探索空间。”田辉认为,AIGC技术的发展最终的落地在于内容服务。“如何提升准确率和效率,谁的平台投入的力量足够,大模型训练的速度和效率,以及应用适配更强,谁就能突破成功。”

(责编:崔元苑、吕骞)