首页 人工智能元宇宙大数据 企业智能化 智慧城市 科技 商务
当前位置:首页 > 人工智能

OpenAI向用户开放AI视频生成模型 Sora如何演绎?

来源:新浪科技 发布日期:2024-12-12

本报记者 张晓玉

12月10日,OpenAI(美国人工智能研究公司)宣布正式向用户开放人工智能AI视频生成模型Sora,该系统可以根据文本提示生成逼真的视频。截至当日,距离OpenAI首次公开预览这款产品已过去了10个月时间。

OpenAI相关负责人表示,Sora将于当天晚些时候向美国及其他市场的ChatGPT付费用户开放。新版工具SoraTurbo可以生成最长达20秒的视频,并且可以提供这些视频的多种变体。

据悉,Sora的发布是OpenAI为期12天的产品直播活动的一部分。作为视频生成领域龙头,Sora发挥着“鲇鱼效应”。据《证券日报》记者不完全统计,自Sora发布以来,国内外已有近20家公司发布或更新了视频生成模型。

美股视频巨头遭冲击

据了解,Sora能够根据用户输入的描述性提示快速生成视频,并及时向前或向后扩展现有视频。

Sora引发了全球科技产业的震动,尤其是在视频生成领域。Sora以其极高的生成质量、快速的响应时间和低成本的生成方式,一度让一些传统视频公司面临巨大压力。

以Adobe Systems Incorporated(以下简称“Adobe”)为例,其股价曾在Sora首次发布的次日(2月16日)大跌了7.41%,创去年11月1日以来的新低,市值在短短一个交易日蒸发了近198亿美元。

Adobe长期以来在图像处理、视频编辑软件等领域占据领先地位,而OpenAI此次发布的Sora技术,将视频生成的门槛大大降低。市场普遍认为,Sora的发布可能会改变视频创作的格局,Adobe的市场份额受到威胁。

不过,市场上也有另一种观点,认为像Sora这样的开放式模型,无法为专业人士提供同等的安全保障,Sora的主要使用场景可能仅限于社交媒体平台。在专业用户市场上,Adobe的领导地位依然无法撼动。

面对Sora的冲击,国外企业加速布局AI视频生成领域。2024年Runway AI,Inc.发布Gen-2模型,在视频生成领域迅速重回第一梯队阵营。用户只需输入文字描述,即可生成一段4秒的视频,并且可以根据需求调整分辨率和帧率。

而就在Sora正式向用户开放的几天前,当地时间12月4日,谷歌旗下人工智能研究机构DeepMind Technologies Limited发布了一款名为Genie2的新型模型,可通过单张图片和文字描述生成“无限”种类的可玩3D世界。

贝恩咨询公司商品战略顾问总监潘俊在接受《证券日报》记者采访时表示,Sora的发布将对现有的视频生成模型生态产生重大影响。它将打破传统视频制作的技术壁垒,为视频生成领域带来新的竞争格局。其他视频生成模型公司可能会面临来自Sora的竞争压力,需要调整其产品和服务以适应新的市场需求和技术趋势。未来,视频生成领域的竞争格局可能会更加激烈,创新和差异化将成为关键。

国内企业积极布局

Sora的发布也促使国内科技巨头纷纷加紧文生视频大模型的研发。

中国电信集团有限公司在2024数字科技生态大会上发布及更新了昆仑云网能力开放平台、“息壤”算力服务、视觉大模型及文生视频大模型等方面的进展;12月3日,深圳市腾讯计算机系统有限公司旗下腾讯混元大模型(以下简称“腾讯混元大模型”)官微发布消息称,腾讯混元大模型正式上线视频生成能力,参数量130亿,是当前最大的视频开源模型;北京快手科技有限公司推出可灵AI,这款AI视频生成模型可以生成长达两分钟的1080p视频,还支持多种视频输出比例,并可以模拟现实世界的物理特性。

清华大学战略新兴产业研究中心副主任胡麒牧在接受《证券日报》记者采访时表示,虽然目前这些国内公司推出的视频生成技术在部分功能上与Sora尚有差距,但它们的迅速跟进显示出国内企业对AI视频生成技术的重视。自Sora发布以来,国内视频大模型的生成效果显著提升,与Sora的差距在不断缩小,部分功能甚至已实现赶超。

例如,北京智谱领航科技有限公司全新迭代的AI视频模型“新清影”,在文生视频性能上实现了进一步提升,支持10秒时长及4K、60帧超高清画质,以及任意尺寸的视频输出,并自带音效和更好的人体动作及物理世界模拟。

北京火山引擎科技有限公司总裁谭待表示,视频大模型的技术突破十分困难,需要大模型能理解复杂指令,包括对多镜头语言的运用,实现多个主题的交互视频,保持风格的一致性等。当前视频生成功能仍有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。

推动多模态大模型创新

在文生视频算法领域,国内也取得了显著进展。中国国家互联网信息办公室公开信息显示,今年以来国内共有2277个深度合成服务算法通过备案。其中,主要用途描述中带有可实现文生视频能力的算法共34个,备案名称中明确界定为“文生视频算法”的仅有6个。

例如,商汤集团有限公司通过备案的商汤V-ME视频合成算法支持已有人物视频、动画、声音、文字等多种元素进行驱动。天娱数字科技(大连)集团股份有限公司子公司北京智境云创科技有限公司在今年6月份一次性通过了“智境云创人脸融合算法”“智境云创文本生成视频算法”“智者千问大语言模型算法”三项算法备案。

德邦证券股份有限公司分析师陈涵泊表示,Sora的正式开放,有望成为全球视频生成领域的新标杆,加速多模态大模型的迭代与应用。

在潘俊看来,Sora的推出有望加速AI在视频生成领域的商业化进程。由于Sora具有高度的创新性和广泛的应用潜力,预计将吸引许多企业投资和合作,包括内容创作者、广告公司、电影制作公司等。随着商业化的推进,Sora可能会为视频生成领域带来新的商业模式。

“不过,Sora远未达到替代人类内容创作的程度,其发展水平仅相当于GPT-1,尚处于起步阶段。对于其他视频生成模型公司而言,真正的竞争才刚刚开始。它们将在算力、数据和算法这三个关键领域展开角逐。”工业和信息化部信息通信经济专家委员会委员盘和林向《证券日报》记者表示。

此外,胡麒牧表示:“技术创新与安全伦理之间的平衡是AI技术发展中的重要问题。在推动技术发展的同时,我们必须充分关注其可能带来的社会影响,如隐私保护、版权争议以及滥用风险等问题,确保技术在符合伦理和社会责任的基础上得到合理应用。”

01/内塔尼亚胡:如果叙利亚新政权允许伊朗重建势力 以色列将强力回应02/快追“傻瓜钱”:对冲基金瞄准迷你百万富豪03/加州滨海城市马里布火势迅速蔓延 上万居民被紧急疏散04/波音重启737飞机生产线 11月交付量创四年新低05/重大突破!史上最强芯片,来了!06/高盛CEO:特朗普的经济牌将给高盛带来好日子07/欧洲股市下跌 市场乐观情绪减退 欧央行会议受关注08/谷歌股价逆市暴涨,量子芯片进展获两大美国科技领袖点赞09/马克龙希望2027年总统任期结束前避免举行新的法国议会选举10/欧洲债市:德债持稳 收益率曲线趋陡

01/欧盟与南美达成大规模贸易协议 锂矿似乎是关键02/著名“反疫苗”人士被特朗普提名当部长,77名诺奖得主联名反对:他上马将危及公众健康,破坏美国领导地位!03/什么时候该抛售美元?摩根士丹利认为是现在!04/午盘:美股小幅上扬 纳指创盘中新高05/特朗普提名的SEC主席曾将FTX倒台事件归咎于美国政府06/桥水基金创始人达利欧:投资黄金和比特币,远离债务类资产07/11连板,这只暴涨股,今日突遭减持08/以军方否认部队逼近叙首都 内塔尼亚胡称将彻底吞并戈兰高地09/A股连续50天成交破万亿!资金都流向了哪儿?10/美国大学学位“浪费率”40%?本科学历岗位需求持续缩水

01/0.2折甩卖不良资产 消金公司为何“骨折价”出清个贷不良资产?02/银联报告:我国人均持有信用卡数量为1.9张 用户消费观念愈发“人间清醒”03/“稳住楼市”还需要什么政策?一线:提前还贷有所减少但仍处高位,业内:还需降利率04/密集上新 银行大额存单“又香了”05/跌破1.3% 余额宝收益创新低06/政治局会议深读|14年来首次!货币政策定调“适度宽松”意味着什么?07/银行年底花式“揽储”:“2”字头存款利率再现,利率下行趋势未改08/解读中央政治局会议——加强超常规逆周期调节 明年经济工作看点足09/货币政策适度宽松 多位券商首席积极解读“超常规逆周期调节”10/老牌奥迪4S店爆雷后 车主与银行在门店前日夜看守

7x24快讯:9月19日沪深两市涨停分析非凡哥哥samm:不想做任何操作飞我eight:今天才这点成交量和你天天向上:全部清除了一分不剩用户7048726012:想红但是又有点怕羞江东子弟93949:还对中芯抱有幻想的人和你天天向上:拉升一下吧给我清仓的机会用户7763476192:再玩下去6000亿都守不住了,没人玩了

荣耀商城移动 FragranceNet End Clothing GoDaddy.com Freshly Cosmetics UK 美团酒店 Luxury Escapes SEA 史泰博 Wiggle Feelunique中文网 Nike HK 一嗨租车移动 滴滴有车 诺心lecake移动 苏宁易购移动 趣网商城 Jomashop 诺心lecake Bonpont国际特卖商城ROI 酒仙网 Charlotte Tilbury (UK) 当当 澳洲PO药房中文网 Bonpont国际特卖商城 Air France(US) 全球购骑士卡移动 联想商城 e.l.f.cosmetics 万表网 Steve Madden