首页 人工智能元宇宙大数据 企业智能化 智慧城市 科技 商务
当前位置:首页 > 人工智能

澳大利亚政府研究发现 AI 在概述上的表现比人类差

来源:安全-Solidot 发布日期:2024-12-11

大模型能比人类更快的概述一篇长文,因此很多用户和企业尝试用它去概述冗长的文档以方便阅读。澳大利亚证券和投资委员会(ASIC)对此展开了研究,他们测试了开源大模型 Llama2-70B,发现它提供的概述相比人类提供的差很多。Llama2-70B 不是目前最先进的大模型,这一结果不太能够推广到最先进大模型的概述能力。尽管如此,研究表明,大型组织在将大模型的输出集成到现有工作流前需要三思。ASIC 发现,大模型生成的概述太笼统,还常常包含不正确的信息,语法正确,但幻觉无法避免。对比测试发现,AI 的平均得分为 7/15,而人类是 12.2/15。

https://arstechnica.com/ai/2024/09/australian-government-trial-finds-ai-is-much-worse-than-humans-at-summarizing/

NVIDIA AI 课程免费学,还有机会获得NVIDIA培训证书

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号:11010802021500

举报电话:010-62641205 涉未成年人举报专线:010-62641208 举报邮箱:jubao@zhiding.cn 网上有害信息举报专区:https://www.12377.cn

美团外卖 NIKE官网 FragranceNet Cambridge Satchel中文网 万表网 花小猪 史泰博 诺心lecake移动 vivo官方商城 趣网商城 诺心lecake 澳洲PO药房中文网 趣网商城移动 中免日上 Febee中文网 Freshly Cosmetics UK NIC+ZOE Charlotte Tilbury (UK) 拼多多 优购移动 阿迪达斯中国 Wiggle Agent Provocateur EsteelauderHK 优购网 星巴克 滴滴出行 邦购 奈雪的茶 京东