郑纬民:做好系统设计和软件优化,持续提升自主创新AI生态系统
来源:I云咨询 发布日期:2024-12-15
如今,人工智能正进入一个前所未有的新时代,以大模型为代表的人工智能技术,正在各行各业加速落地,各种应用场景层出不穷。但与此同时,人工智能技术的持续进化和深度应用,以及大模型的遍地开花,也激发出对智能算力的强劲要求。
今年9月发布的《中国综合算力指数报告(2024)》显示,中国算力规模位居世界第二;其中,智能算力快速增长,同比增速超过65%。从2003年到2023年,智能算力需求的增长超过百亿倍,构成了算力增长的最主要驱动力。在这一趋势下,如何设计支持大模型训练的计算系统,如何构建自主创新的软件生态,已经成为推动人工智能大模型创新发展的“必答题”。
在日前召开的华为数字中国行2024·安徽新质生产力创新峰会上,中国工程院院士、清华大学计算机科学与技术系教授郑纬民在“支持人工智能大模型的系统软件”的主题演讲中表示,算力是大模型产业的主要开销,在构建支持大模型训练的计算系统过程中,想要持续提升自主创新AI生态系统,就需要做好系统设计和相关软件优化。
其中,设计大模型计算系统需要考虑5个问题,包括多种精度运算性能的平衡、网络平衡设计、内存平衡设计、IO子系统平衡设计、自主创新AI计算系统;而构建自主创新软件生态则需要做好10件事情,包括编程框架、并行加速、通信库、算子库、AI编译器,编程语言,以及调度器、内存分配、容错系统、存储系统等。