首页 人工智能元宇宙大数据 企业智能化 智慧城市 科技 商务
当前位置:首页 > 人工智能

OpenAI发布GPT-4o:可免费开放使用 语音对话媲美真人

来源:新闻科技-驱动中国 发布日期:2024-12-11

快科技5月14日消息,在今天凌晨的OpenAI发布会上,最新升级的大模型GPT-4o正式发布。

GPT-4o的“o”代表“omni”。该词意为“全能”,源自拉丁语“omnis”,在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。

GPT-4o可以实时对音频、视觉和文本进行推理,能处理超过50种不同的语言,并且速度和质量大大提升。

此前GPT-3.5语音对话的平均延迟为2.8秒、GPT-4为5.4秒,音频在输入时还会由于处理方式丢失大量信息,无法识别笑声、歌唱声和情感表达等。

而GPT-4o可以在232毫秒内对音频输入做出反应,甚至还能随意打断,与人类在对话中的反应时间相近,彻底颠覆了以往的“语音助手”。

GPT-4o在现场充当实时翻译也是相当的丝滑,意大利语和英语即听即翻。

最重要的是,GPT-4o还可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,人机交互更加自然、全面了。

GPT-4o的能力还会向免费用户开放,不过会限制数量,免费用户达到数量之后,会自动跳回GPT-3.5。

GPT-4o还将开放相应API给GPT的开发者,价格是GPT-4-turbo的一半,速度却是GPT-4-turbo的两倍,速率限制也高5倍。

官方表示,GPT-4o将会在未来几周内陆续开放。

此外,OpenAI还推出了ChatGPT的桌面版应用,不过目前只有MacOS版本,Windows版要稍晚一些亮相。

GPT-4o图像识别功能上线,人工智能交互进入新纪元

OpenAI发布GPT-4o:可免费开放使用 语音对话媲美真人

OpenAI即将发布新功能,GPT4-Lite引擎及语音识别技术引关注

苹果将与OpenAI达成协议,ChatGPT或登陆iPhone

OpenAI推出全新GPT-4 Turbo模型,引领人工智能领域新进步

OpenAI正式公布文字生成视频大模型“Sora” 画面可以假乱真

OpenAI正式推出GPT商店

OpenAI CEO重申暂未开始训练GPT-5大模型,正在研究新想法

OpenAI月活用户数量超8亿,跻身全球前20

OpenAI回应“GPT-4回答质量下降”:稳定性不足,但外部数据没有污染模型

奈雪的茶 Steve Madden 科沃斯 拼多多 小米有品 arti-shopping中文网 Bonpont国际特卖商城ROI SkinCareRX 诺心lecake移动 滴滴有车 当当移动联盟 星巴克 苏宁易购 荣耀商城 瑞幸咖啡 东方购物 Freshly Cosmetics UK 万表网 华为商城移动 End Clothing Febee中文网 滴滴出行 1688平价精选移动 FragranceNet Nike HK GoDaddy.com 京东易购 Air France(US) Jomashop Agent Provocateur