“创新落地,生态共赢”2024澜舟科技大模型技术和产品发布会圆满举办
来源:原创-IT数码-媒体平台 发布日期:2024-03-19
随着科技的不断进步与发展,澜舟科技始终站在创新的前沿,致力于将最新的科技成果赋能企业数智化转型。2024年3月18日,澜舟科技在中关村国家自主创新示范区展示中心隆重举行了“创新落地,生态共赢”大模型技术和产品发布会。此次发布会取得了圆满成功,不仅展示了澜舟科技的大模型的最新进展和大模型技术的实际应用落地、生态构建的成果,更体现了其对未来发展的深度思考和战略布局。
北京市海淀区副区长徐振涛发表致辞
发布会伊始,北京市海淀区副区长徐振涛发表致辞。首先对澜舟科技大模型取得的突破和进展表示了祝贺。当前,全球人工智能技术高速演进,大模型创新成果层出不穷,面对人工智能发展机遇,海淀区时刻保持对于产业发展趋势和演进的敏锐性,始终站在国家战略高度,持续扩大已有发展基础和优势,全力打造人工智能产业高地。
一是科研力量持续引领创新。集聚了北大、清华、中科院等顶尖高校院所,启源、中关村两个国家实验室,智源、通研院、科学智能研究院等新型研发机构和七家全国重点实验室。
二是顶尖人才汇聚。区内拥有众多人工智能领域顶尖科学家和产业领军人才,聚集了人工智能学者1.23万人,占全市的82%。AI2000全球顶尖学者89人,占全市73%。
三是产业链企业高度集聚。围绕重点环节,已基本形成芯片、框架、大模型等全产业链部署,集聚企业近千家,占全市的2/3,全国的1/6。大模型企业、机构超90家,并且数量持续增长。通过备案的大模型36家,占全市的72%以上,初步围绕中关村、知春路、学院路等周边地区在全国率先形成了人工智能大模型产业集聚区。
四是产业创新生态较为完善。截止到目前已经培育20家独角兽企业,占全市的60%,企业在人工智能领域,授权发明专利数量8.1万件,占全市的62%。去年,国家发改委公布第一批66个国家级产业集群评审结果,海淀区人工智能产业集群获评优秀,也是全市唯一获评优秀的产业集群。同时海淀区紧抓通用人工智能发展机遇,印发了《关于加快中关村科学城人工智能大模型创新发展的若干措施》,围绕大模型研发所需创新资源和共性需求,从算法、算力、数据、全流程加强要素供给,从场景应用、资本、评测体系、人才与国际合作、孵化培育、监管、伦理等方面完善生态,加快推动人工智能产业有序健康发展。
2023年是生成式人工智能大模型发展元年,行业应用出现井喷式增长,澜舟科技作为北京市大模型合作伙伴计划成员单位,是驻区代表性大模型企业,在预训练技术、规模化技术、工具链技术、推理部署技术等方面均有深厚的积累,成立两周年以来,也在产业应用方面做了大量的工作。大模型产品已经在金融、文娱、翻译等领域落地应用,为产业智能化发展提供了坚实的支撑。
下一步,海淀区将深入贯彻国家北京市关于加快新一代人工智能发展的战略部署,发挥中关村科学城在人工智能领域产业资源密集、体系完备的发展优势,持续支持大模型前沿研究及应用发展,加快打造具有国际影响力的通用人工智能创新生态。
最后,希望澜舟大模型持续取得重大突破进展,进一步促进与繁荣我国通用人工智能大模型生态!
AI2.0平台变革进行式
随后,创新工场董事长、零一万物CEO李开复博士进行了《AI 2.0 平台变革进行式》主题演讲。
创新工场董事长、零一万物CEO李开复博士正在演讲
李开复博士指出, AI 2.0 模型能力突飞猛进,通识理解已经超越人类专家。AI 2.0 通过图灵测试并趋于成熟,揭示下一个平台级变革 。新一代创新应用需要新的技术平台,基于强大的底层技术搭建出高效的开发工具, 从而节约开发生态做创新产品的成本,促进包括新产品、新业态、新的商业模式的全新应用生态。
随后,李开复博士展望了AI 2.0未来的四大趋势:
最革命性的 AI 2.0 应用应该是 AI-First / AI-Native:最终脱颖而出的应用属于那些敢于全力投入新技术的先驱者。大语言模型的引入为 AI-First 应用带来了巨大的推动力。
大模型始于文本,未来将拓展至“全模态”:跨模态生成技术是实现认知和决策智能的转折点。现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需要将各种模态能力打通,例如文本-图像、文本-视频等跨模态甚至全模态的综合能力。
AI 2.0 将超越对话,从聊天工具到智能生产力工具:用户体验以及未来交互界面和商业模式都会发生大的变革。
AI 2.0 将走向实体,大幅提振社会生产力:具身智能可以让机器人制造机器人, 进一步实现AI 2.0 + 生产线智能规划。
最后,李开复博士表示AI2.0趋势要能落地,需要最优秀的、能专注场景实践的合作伙伴。澜舟在基于大模型面向企业市场落地方面已经有了非常好的基础,零一万物在千亿级大模型、多模态方面会投入更多力量,此次大会澜舟科技和零一万物进行了战略合作签约,双方优势互补,强强联手,预期一定会取得更大的突破。李开复博士作为零一万物的创始人兼CEO和澜舟科技创始人兼CEO周明博士在台上握手致意,现场来宾共同见证了这一激动人心的时刻!
周明博士与李开复博士握手达成战略合作
在议程中间环节,本次发布会也很荣幸播放了众多知名专家、学者和企业家们录制的视频寄语,他们分别是:中国科学院院士张钹、中国中文信息学会名誉理事长李生、中国工程院外籍院士张亚勤、美国国家工程院外籍院士沈向洋、北京航空航天大学机器人研究所名誉所长王田苗、微软全球资深副总裁周礼栋、阿里云智能集团CTO周靖人、同花顺创始人易铮、中文在线创始人童之磊、传神语联网CEO何恩培、创新奇智CEO徐辉、创业黑马董事长牛文文等。这些寄语不仅是对澜舟科技的鼓励与支持,更是对人工智能产业发展前景的肯定与期待。
“一横N纵”孟子大模型系列及产品发布
在澜舟科技最新技术和产品发布环节,澜舟科技创始人&CEO周明博士发表了《大模型技术和应用双轮驱动加速创新》主题演讲。他回顾了澜舟科技的发展历程,并展望了未来的发展方向。他强调在数字化浪潮中,以大模型为代表的人工智能正在重塑人类的未来。2024年将是大模型落地元年,如何利用大模型技术助力企业成长已成为业界关注的焦点。
澜舟科技科技创始人&CEO周明博士在演讲
2021年6月,澜舟科技正式成立, 致力于自主研发大模型技术和行业应用,在去年3月发布了孟子GPT V1(MChat),今年1月孟子大模型GPT V2(含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码)对公众开放。
周明博士强调,澜舟科技注重技术和应用双轮驱动。在积极研究和掌握前沿技术的同时,公司也致力于确保这些技术的有效应用。在每一个关键技术发展的时期,澜舟科技都会携手客户及合作伙伴,如传神、数说故事、华为云、华夏基金、同花顺、中金公司等,共同开展深入合作。通过深入应用场景、精准把握用户需求,澜舟科技不断推动技术和产品的迭代升级,力求在激烈的市场竞争中保持领先地位。
周明博士回顾了过去一年来大模型的迅速发展:
大模型的能力得到快速提升:在更长的上下文处理能力、数学能力和推理能力、安全对齐等方面得到大幅度增强。
RAG(检索增强生成):通过结合搜索相关数据库的结果与用户指令进行生成,可有效改善模型幻象、实时性、数据安全等问题。
GPTs:用户基于大模型的超强能力方便地搭建自定义的GPT。
多模态大模型:SORA突破了4秒钟限制,可以生成60秒的视频,而且生成的视频质量大幅度提升。
大模型原生应用方面略现端倪:譬如,利用大模型构建AI搜索、角色扮演聊天、数字人等。
大模型开源:LLaMA等开源模型有力地推动大模型的普及和发展,也显著地改变了大模型的竞争格局。
2024年将是大模型落地元年, 各界热切期盼大模型能结合不同行业的场景应用,实现规模化效用。政府工作报告新鲜出炉,特别强调以人工智能+,驱动各行各业的转型升级。周明认为要把握好这个历史契机,通过落地,创造价值,拉动创新。要做好大模型落地,周明表示,互联网的七字法则仍然适用:专注、极致、口碑和快,还要再加上成本,形成大模型落地九字法则。
周明强调,大模型ToB应用要解决四个大问题:训练和部署成本、行业适配性、幻象、数据安全,并解释了澜舟科技在这四个方面所作的努力。
此次发布会的核心为”一横N纵"体系,其中的“一横”即为孟子大模型技术,而“N纵”是基于孟子大模型的面向ToB应用最重要的技术和产品。希望通过“一横N纵”,彻底贯彻大模型落地九字法则:专注、极致、口碑、快、成本。
周明博士首先介绍了从预训练,到SFT,到强化学习,安全,降低幻觉的完备的孟子大模型训练体系。孟子大模型离不开背后的高质量的数据集—Mengzi-3数据集,总规模为3T tokens,包含了网页、代码、书籍、论文等高质量数据来源。
最后,在Mengzi-3语料数据的加持下,澜舟团队在近期完成了Mengzi3-13B的大模型训练,在常见公开数据集,如MMLU,Chinese-MMLU,GSM8K,HUMAN-EVAL等评估模型效果来看,该模型在各项基准测试中与相仿参数量大模型相比,中英文语言能力成绩领先。
针对大模型训练和部署的成本高的问题,澜舟科技专注把ToB场景使用最多的LLM模型(参数量7B、13B、40B最高到100B)做到最佳并大幅度提升大模型的推理效率。
3月30日Mengzi3-13B的模型将在GitHub、HuggingFace、魔搭和始智AI社区开源,届时也期待社区更多的反馈。
针对大模型的行业落地适配问题,周明博士再次重申了L1-L2-L3-L4的层次化分级服务体系, 基于L1-通用大模型,在此基础上加入行业数据训练出L2-行业/垂直大模型,如金融、编程大模型。针对重要场景,在L1或者L2模型基础上finetune,实现L3大模型。最后Agents可以调用L1-L2-L3任何一层的模型形成完整的一个特定任务。
针对大模型的幻象问题和用户数据安全问题,孟子大模型提出了改进的RAG能力。通过孟子大模型理解用户意图,可分别经过大模型自身,或者通过RAG查找用户知识库,甚至通过Web搜索,最后多路召回搜索结果,经过排序输出最可信结果。
在总结阶段,周明博士强调大模型创业所需要的生态环境非常重要,澜舟一方面聚焦自己擅长的能力和场景,另外一方面会注重与开源社区、与客户和合作伙伴携手共进,共同拓展更广阔的市场空间,实现互惠共赢的局面。
在孟子通用大模型这“一横”之上,澜舟科技合伙人、首席产品官李京梅向与会观众详细介绍和发布了“一横N纵”的应用能力型产品,包括AI文档理解、文档问答、文档辅助写作、机器翻译、澜舟智会、AI搜索。
澜舟科技合伙人&首席产品官李京梅在演讲
在值得关注的行业/垂直大模型中,澜舟科技目前重点投入到了金融行业,辅助编程等领域,旨在通过更加全面、专业、优质的领域数据,打造更加贴近行业场景的垂直大模型。
AI文档理解– 基于孟子文档理解大模型提供专业的文档解析和信息提取能力。该产品涵盖专业的PDF文档解析能力和信息抽取能力。它为RAG方案中的文档理解提供了更优的基础能力。在与新华智云共建文化大模型,以及其他众多AI文档理解,信息提取类客户场景中均已使用。
AI文档问答– 助力构建企业智能知识库。该应用产品服务提供了文本、表格内容处理的高效、准确解析能力、基于AI搜索赋能的基于文档的知识库问答、生成摘要和观点,以及可信的