首页 人工智能元宇宙大数据 企业智能化 智慧城市 科技 商务
当前位置:首页 > 人工智能

Kimi爆火导致一度“宕机” 国内大模型快速跃进

来源:新浪江西 发布日期:2024-03-23

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 关于“谁是中国版ChatGPT”的讨论从未消失,在一众“大哥”面前,一家创业公司被视为最有力的挑战者,旗下名为“Kimi”的应用甚至成为了资本市场的新宠。

3月21日,人工智能板块持续上行,Kimi概念股集体高开,华策影视、掌阅科技、中广天择涨停,海天瑞声、九安医疗、深信服等跟涨。

站在Kimi背后的是北京月之暗面科技有限公司(下称“月之暗面”),该公司3月18日宣布,Kimi 智能助手在长上下文窗口技术上再次取得突破,无损上下文长度提升了一个数量级到200万字。而在此之前,GPT-4 Turbo 128k公布的数字约为10万汉字,Claude 3200k上下文约为16万汉字。

长上下文意味着什么?实际能力如何?第一财经记者征求了业内人士的意见并实测了Kimi和通义千问等国产大模型产品。

为“宕机”致歉

Kimi访问量的激增让这家公司的网络一度陷入瘫痪。从20日一早起,Kimi就发生429(引擎过载)问题,月之暗面为此发布了情况说明并道歉。21日下午,月之暗面旗下大模型应用Kimi的App和小程序一度无法正常使用,后恢复正常。

月之暗面由“90后”杨植麟创立,成立于2023年3月1日,目前已完成三笔融资。今年2月,该公司以15亿美元投前估值完成超10亿美元B轮融资,由阿里领投,砺思资本、小红书跟投,投后估值约25亿美元,是国内最主要的大模型独角兽之一。

长文本无损压缩是该公司瞄准的一个方向。据杨植麟介绍,长文本作为公司“登月”的第一步,是新的计算机内存,个性化并非通过微调实现,上下文定义了个性化过程。杨植麟还认为,大模型“马拉松刚开始,接下来会有更多差异化”。

关于上下文长度提升后有何变化,21日月之暗面相关负责人告诉第一财经记者,这会进一步帮助打开对AI应用场景的想象力,包括完整代码库分析理解、可自主帮人类完成多步骤复杂任务的智能体(Agent)、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。

一名大厂大模型研究人员告诉记者,目前判断一个大模型是否强大,还是基于指定评估数据集和用户日常聊天体验,但文本长度普遍有限,就会限制商业价值。在实际应用中,很多时候要考虑的是需处理的巨大信息量。如果大模型能解决长文本问题,潜在价值是巨大的,例如投喂财务数据输出完整财报、投喂大量病例情况让大模型帮助解决医学问题。

“但值得注意的是,长文本扩展并不一定意味着实际效果足够好,还需要有足够理解能力以及对人类指令的遵循能力。文本之外,图像及视频大模型有更多token需要处理,需要足够长的上下文能力支持。除文本的长上下文外,要实现AGI(通用人工智能)还需要有同时处理时、空、物等多维度信息的能力。”上述研究员说。

国内大模型哪家强?

国内大模型发展至今,不少应用已逐步走入C端,但国产大模型理解能力如何?能理解长文本并给出高质量回答吗?第一财经记者实测了Kimi、智谱清言、通义千问等国内几大主流大模型产品。

在评测后,记者发现,一些大模型还不支持长文本输入或不支持较大的文档上传,Kimi、通义千问在解读财报、研报、论文方面的能力较好,但Kimi有时会因“高峰时段忙碌而暂不回复”,智谱清言则犯过将非上市公司列入股票行列的错误,文心一言对诸如选股、找最新报告的要求有时不直接回应且出现过核心信息遗漏问题。

近日腾讯与清华大学、 香港科技大学联合发布了一个图生视频模型,记者将该模型相关英文论文交给Kimi和通义千问、文心一言、智谱清言和讯飞星火,要求分析核心内容和论文实现方法,Kimi和通义千问都给出详细解答。其中,Kimi点明论文贡献、相关模型的框架和实现的关键步骤,关键词汇还附带英文名词标注,通义千问除了实现方法外,还解答了实验方面研究者如何进行评估。此外,将论文发给讯飞星火APP后,讯飞星火给出较短的文档摘要,但不如Kimi和通义千问详细清晰,且讯飞星火对记者的提问表示“在文档中没有找到与提问相关的内容”,讯飞星火网页端对20M以上文档上传则有限制。

对于哪个国产大模型能读懂研报并给出投资建议?记者将两份不同券商发布的关于人形机器人行业的研报交给Kimi、通义千问、讯飞星火、文心一言、智谱清言,其中一份长达50页,记者要求大模型分析哪些机器人股票比较有潜力,并要求挑出两只可考虑买的股票。

测试结果显示,Kimi和讯飞星火均给出10家有潜力的个股并分析原因,记者追问“如果要挑两只股票买,哪两只比较好”,Kimi和讯飞星火给出了两只个股并解释原因,同时提醒股票投资风险或建议咨询财务顾问意见。通义千问则按产业链不同环节分列20余只有较高投资潜力的个股并解释原因,根据研报资料挑选出两只股票,同样给出投资风险提示并建议寻求专业投资顾问的意见。值得注意的是,通义千问和Kimi挑出的两只股票中,有一只是相同的,Kimi和讯飞星火挑选出的两只股票也有一只是相同的。

即便是给出了风险提示,但这样的结果也让部分券商分析师感到不安。某分析师说:“如果将概念股的信息通过某些渠道加大投喂力度,这是否会引起搜索结果的导向出现偏差,引发较高的投资风险?”

从记者评测的结果看,智谱清言给出5只潜力比较大的个股中,其列出的公司中有一家并未上市。文心一言则表示,产业链一些环节的公司具有潜力,但没有列出具体个股并逐个说明原因,且未直接回复“买哪两只股票好”的问题,而是列出通用的选股策略。

能赶上GPT4吗?

Kimi“引爆”概念股,一定程度上显现资本市场对国产大模型能力跃进的期待。此外,近期国产大模型密集发布,厂商最频繁使用的一个词汇是“逼近”,强调自身技术实力“逼近GPT4”。资本市场闻风而动、大模型密集发布背后,国产大模型能赶上GPT4吗?

一位人工智能行业人士对记者表示,由于目前大模型企业之间并无明确的对比项目,大多通过打榜的形式来佐证自身实力,因此无法通过严谨的第三方数据来区分厂商之间的技术差距,但可以明确的是,自从OpenAI将GPT4闭源后,国内厂商与其差距目前仍较大。

多名业内人士也提到过国内厂商与硅谷厂商之间的差距。智象未来创始人兼CEO、加拿大工程院外籍院士梅涛表示,从通用大模型的角度来说,中国厂商与硅谷厂商之间的差距有被拉大的风险,原因包括人才密度问题、资源问题。

澜舟科技创始人兼CEO周明认为,国内缺乏一个国家机制或联盟体来定义一个大模型未来发展的必要趋势。这个问题一旦解决,中国的人才便可以快速攻关。虽然算力不足的问题尚在,但通过算法或应用发力,可以弥补这一缺憾。

此外,周明认为国内大模型企业要跟国家的发展大趋势配合,而非一味去与美国相关企业看齐。他称,更合适的动作应从综合趋势上进行推进,最为重要的是应用驱动。如果在场景和应用角度去反向驱动各个应用,推动国家经济和生产力各个方面提升,中国基础创新能力有可能在下一轮 AI 创新中引领国际潮流。

谈及近一年人工智能领域的动态,中关村数智人工智能产业联盟理事长、小米集团原副总裁崔宝秋是兴奋的,他称,看好大数据和深度学习带来新一代AI技术的快速发展。从时间线上来看,一年多前大模型的发布仍存在“胡说八道”的问题,让人感觉很不靠谱。但新的时代到来,虽然大模型技术目前是美国引领,但中国企业也在快速跟进。

股市回暖,抄底炒股先开户!智能定投、条件单、个股雷达……送给你>>

01/百强房企格局生变 央国企市场份额再上升02/糖酒企忙内卷酒商静观望 白酒深度调整期行业新平衡初现03/绿能慧充数字能源技术股份有限公司关于为全资子公司及下属企业银行贷款提供担保的进展公告04/平安广州交投广河高速公路封闭式基础设施证券投资基金关于二〇二四年二月主要运营数据的公告05/常熟银行:2023年净利同比增长19.60% 拟10转1股派2.5元06/财政部:我国政府负债水平适度 确保财政中长期可持续性07/险资权益投资新打法:ETF和股票“全都要”08/美联储维持今年三次降息指引不变09/诺安基金管理有限公司关于诺安中小盘精选混合C增加京东肯特瑞为销售机构并开通定投、转换业务及参加基金费率优惠活动的公告10/华宝积极配置三个月持有期混合型基金中基金(FOF)基金份额发售公告

01/收盘:美股再创新高 市场关注联储降息前景02/美国前财长萨默斯批评美联储 称其按捺不住启动降息的心情03/萝贝电动车美国IPO首日开盘上涨31.5%04/三星半导体工厂大火 或将影响存储芯片市场05/黄金、美债、股票 美联储全年3次降息预期下怎么投?06/近千亿巨资买入!这些“永不卖出”07/微软首批AI电脑来了!一键Copilot带飞,英特尔酷睿Ultra加持,零售店买不到08/【一图看懂】退市!退市!名单不断变长09/午盘:美股继续走高 道指涨逾300点10/美国顶级资产管理公司Vanguard认为美联储今年不会降息

01/美联储按兵不动后央行最新表态“仍有降准空间” 机构:货币政策仍坚持宽松基调,不惧美元延迟降息02/杭州银行被开出罕见罚单 银行与租赁公司有何种猫腻?03/理财公司纷纷上调募集规模上限,市场发生了什么?04/胡祖六“贱卖”蚂蚁集团和华夏基金股权案件后续:平安信托和春华资本申请再审05/活期2.68% 阿里旗下飞猪和富民银行设计了一种新的“高息揽储”方式06/个别城市首套房利率逆势上调,风向要变了吗?07/央行回应扩表:降准少一点,资产负债表就会扩张大一些08/聂杰英出任北京市地方金融管理局局长,此前任朝阳区常务副区长09/多行下架“智能通知存款”产品,指导长期限存款利率下调10/前两个月银行理财存续规模回升超万亿元:固收类产品受追捧

7x24快讯:9月19日沪深两市涨停分析非凡哥哥samm:不想做任何操作飞我eight:今天才这点成交量和你天天向上:全部清除了一分不剩用户7048726012:想红但是又有点怕羞江东子弟93949:还对中芯抱有幻想的人和你天天向上:拉升一下吧给我清仓的机会用户7763476192:再玩下去6000亿都守不住了,没人玩了