媲美GPT4的开源模型Llama 3怎么用?亚马逊云科技官方教程已上线
来源:原创报道-TechWeb 发布日期:2024-04-19
【TechWeb】4月19日消息,Meta发布了其最新的开源大模型Llama 3 ,引发全网关注。Meta表示,Llama 3模型利用数据和规模将性能提升到新的高度。此次,Meta发布了Llama 3 80亿和700亿参数两款模型,分别有预训练和指令微调两个版本。Meta介绍,Llama 3在两个定制24K GPU集群上接受了训练,使用的数据量超过15万亿个token,这个训练数据集是Llama 2使用的数据量的7倍,其中包括了4倍数量的代码。这使得Llama 3成为迄今为止最强大的Llama模型,支持8000个上下文长度,是Llama 2容量的两倍。比肩GPT4的开源模型在Meta公布的AI基准测试中,Llama 3 8B、70B模型在语言(MMLU)、知识(GPQA)、编程(HumanEval)、数学(GSM-8K、MATH)等能力上,几乎全面领先于同等规模的其他模型。Llama 3 8B模型在MMLU、GPQA、HumanEval等多项基准上均胜过Gemma 7B和Mistral 7B Instruct。在Meta公布的AI基准测试中,Llama 3 70B的表现甚至超越了谷歌的Gemini Pro1.5以及Anthropic的Claude 3 Sonnet。Meta还披露了Llama 3 4000亿参数版本模型的性能,在多语言推理任务、代码能力,可与GPT-4、Claude 3相匹敌。Llama 3的优良表现被誉为“媲美GPT4的开源模型”!它将改变许多研究工作和草根创业公司的计算方式。本月刚刚加入亚马逊董会的传奇研究员,AI开源倡导者吴恩达在X上发文表示:Llama 3的发布是自己收到过的最好的生日礼物!Llama 3上手教程已抢先出炉亚马逊云科技也在Llama 3发布的第一时间火速官宣,称其客户已可以通过Amazon SageMaker JumpStart使用这两款Llama 3模型,并发布了如何通过SageMaker JumpStart发现和部署Llama 3模型的官方教程博文。Amazon SageMaker JumpStart是亚马逊云科技专门构建的一个机器学习中心,提供预训练的模型、内置算法和预构建的解决方案,帮助客户快速开始机器学习项目。Amazon SageMaker JumpStart能够帮助客户从广泛的公开可用基础模型中进行选择,并将基础模型部署到专用的SageMaker实例中,这些实例置于网络隔离的环境,并可以使用SageMaker进行模型训练和部署。现在亚马逊云科技的用户可以在Amazon SageMaker Studio中通过几次点击或通过SageMaker Python SDK编程方式发现并部署Llama 3模型,还可以利用SageMaker Pipelines、SageMaker Debugger或容器日志等功能,提升模型性能并实施MLOps控制。教程博文节选:通过SageMaker Studio UI和SageMaker Python SDK中的SageMaker JumpStart访问基础模型。从SageMaker JumpStart登录页,用户可以通过浏览以模型提供商命名的不同集线器来轻松发现各种模型,可以在Meta hub中找到Llama 3型号。 用户可以通过在左上角的搜索框中搜索“Meta-Llama-3”来找到Llama 3型号。点击Meta hub,用户可以在SageMaker JumpStart中发现所有可用的Meta模型。目前,SageMaker JumpStart 中可用的所有 Llama 3 模型,以及每个模型支持的默认实例类型和最大总token数如下:单击模型卡打开相应的模型详细信息页面,用户就可以从中轻松部署模型。 接着,当用户选择部署并确认EULA条款时,部署将开始。您可以在单击“部署”按钮后显示的页面上监视部署进度。用户也可以选择“打开笔记本”通过示例笔记本进行部署。随着Meta Llama 3的加入,亚马逊云科技目前提供的“大模型豪华套餐”已包括:通过Amazon Bedrock提供的来自AI21 Labs, Amazon, Anthropic, Cohere, Meta, Mistral AI和Stability AI的领先大模型,以及通过Amazon SageMaker JumpStart提供的包括Meta Llama 3在内的各种模型。
Meta发布Llama 3,高管:最智能开源大模型,最强版还在路上
360发布安全大模型3.0 安全领域效果超越GPT4
英伟达Blackwell GPU平台即将登陆亚马逊云科技
谷歌云后,亚马逊云科技也宣布迁出数据传输免费,就等微软了
↑扫描二维码
想在手机上看科技资讯和科技八卦吗?想第一时间看独家爆料和深度报道吗?请关注TechWeb官方微信公众帐号:1.用手机扫左侧二维码;2.在添加朋友里,搜索关注TechWeb。
“AI换脸”骗走2亿港元 专家支招如何防范
媲美GPT4的开源模型Llama 3怎么用?亚马逊云科技官方教程已上线
谷雨“龙井”奶茶外卖量涨5倍,茉莉奶白等多品牌联合饿了么上线“春日收官”新品
《热辣滚烫》获北影节“春节档特别荣誉” 出品人侯晓楠:海外票房已破700万美元
Qorvo 谈 Wi-Fi 7、BMS 及 Sensor Fusion 的技术革新之力
三年霸榜 亚马逊云科技为何成为中国AI开发平台顶流?
英特尔发布大型神经拟态系统Hala Point
SHARP MultiSync王牌系列工程投影机发布
消息称特斯拉下周将宣布在印度投资 最多30亿美元
特斯拉全球裁员不会影响墨西哥超级工厂建设 当地称正按计划推进
Meta推出Llama 3大模型 在集成近25000块英伟达H100计算集群上训练
消息称苹果12.9英寸版iPad Air将采用mini-LED显示屏 在5月初推出
从5nm制程工艺来看 台积电3nm工艺或要明年才能成为最大营收来源
台积电一季度营收188.7亿美元 预计二季度会更高
分析师称iPhone 17 Plus屏幕将略小于iPhone 15 Plus和iPhone 16 Plus
苹果有意代工商在印尼建厂 CEO库克称将评估可行性
SK海力士Q1营收有望超过12万亿韩元 营业利润重回万亿韩元之上
消息称苹果有意在印度生产iPhone摄像头部件 同当地厂商有过接触
西谷云田凤宾:算力体系在标准路线、体系架构方面仍然处于起步阶段
微软AI暴露主观意识:会示爱、会PUA甚至威胁人类
青云QingCloud EHPC 打造即买即用的全流程SaaS化超算服务
沙利文报告:中国AI平台开发应用市场综合竞争表现 亚马逊云科技居首
要数据还是要环境?数据中心能耗未来将突破全球电力近10%!
蚂蚁链发布BTN:可将区块链网络吞吐量提升186% 带宽成本降低80%
蚂蚁自研数据库OceanBase宣布开源 300万行核心代码向社区开放
法院正式判决,小米移出军事清单:正式撤销了对小米公司的全部限制
iPhone16Plus细节曝光:屏幕可能比iPhone15Plus小
五座SUV全新理想L6正式发布 售价24.98万元起
台积电:AI处理器需求快速增长 到2028年贡献20%营收
比亚迪秦L内饰座舱首次曝光 将于北京车展正式亮相
交个朋友直播间回应”佰儒新会陈皮”造假质疑
消息称苹果12.9英寸版iPad Air将采用Mini-LED屏
淘宝将推无限次退货包邮:单笔运费不得超25元
媲美GPT4的开源模型Llama 3咋用 亚马逊教程已上线
特斯拉全球裁员不会影响墨西哥超级工厂建设
北京联通FTTR宽带体验再升级:星光F50有何新变化