OpenAI发布Sora 2:AI视频的“ChatGPT时刻”已然到来

从纯文本描述到带音频的高清视频,只需几分钟,你还能走进自己创造的虚拟世界。

当地时间9月30日,人工智能公司OpenAI正式发布了其新一代视频生成模型Sora 2及同名社交应用,这标志着AI视频生成领域迈入一个新阶段。

OpenAI Sora2

与去年底发布的初代Sora相比,Sora 2在模拟物理规律、提示一致性方面均有显著改进,并能够同步生成音频。

OpenAI将此次发布称为“视频领域的GPT-3.5时刻”。

01 模拟现实世界:Sora 2的技术突破

Sora 2展现出了前所未有的世界模拟能力,它不再仅仅为了满足文本提示而扭曲物理规律,而是试图真实地模拟现实世界中的各种物理互动。

OpenAI在公告中指出,“之前的视频模型过于乐观——它们会扭曲物体和变形现实以成功执行文本提示”,而Sora 2在遵循物理法则方面比之前的系统更好。

在官方演示中,Sora 2能够生成如奥林匹克体操动作、在划水板上的后空翻,以及角色执行三周跳而没有明显扭曲或变形的复杂画面。

特别引人注目的是,Sora 2开始学会“承认失败”

例如,当生成篮球运动员投篮的视频时,如果球没投进,球会从篮板上弹开,而不是像早期系统那样让球“瞬移”到篮筐里。

02 多模态生成:从无声到有声的飞跃

Sora 2的另一个重大突破是首次能够直接生成与视频内容完美同步的音频,包括背景音景、语音和音效。

这一能力使得生成的视频更具沉浸感和真实感。

到目前为止,具备该能力的模型只有谷歌的Veo 3。

Sora 2还能够处理多镜头序列,同时在场景变化中保持连续性,这需要对角色和环境有深刻的理解,是技术上的又一重要进步。

OpenAI视频团队负责人比尔·皮布尔斯表示,这可能是视频生成领域的重大突破。

他举例称,新软件能够生成如“人在水面板上完成后空翻,并展现符合流体动力学的真实效果”这样的复杂画面。

03 社交应用创新:从工具到平台的蜕变

与仅作为技术工具存在的初代Sora不同,Sora 2伴随着一款同名社交应用“Sora”一起亮相,这标志着OpenAI从技术提供商向平台运营商的战略转变。

这款应用采用类似TikTok和Instagram Reels的滑动浏览方式,显示了OpenAI在AI视频生成与社交领域结合上的野心。

该应用的核心功能是名为“客串”(Cameo)的创新特性。

用户只需录制一段十几秒的短视频,系统就会抓取你的样子、声音和习惯动作,让你能够将自己或朋友的形象嵌入任何Sora生成的场景中。

Sora产品团队领导Rohan在发布会现场展示了几个真实例子:他和OpenAI CEO Sam Altman一起出现在同一支广告片段里,说着话,唇形对得上,动作自然切换。

他还演示了如何让狗狗以动漫风格出现在雪地视频里。

04 开发者机遇:API接入与生态构建

对于开发者而言,Sora 2将带来一系列新机遇。

OpenAI计划通过其API发布Sora 2,让开发者能够将这一强大的视频生成能力集成到自己的应用中。

同时,早期的Sora 1 Turbo模型将继续可用,为不同需求的开发者提供多样化选择。

OpenAI将Sora 2定位为“可交互的世界模拟器”,这不仅为创意产业提供了新工具,也为AI在现实场景中的深度应用提供了基础技术支持。

这一理念展示了OpenAI对视频生成技术未来的深远布局——不仅仅是生成内容,更是模拟世界

05 安全与责任:AI生成的伦理考量

面对AI生成内容可能带来的滥用风险,尤其是虚假信息和未经同意的深度伪造问题,OpenAI强调已采取一系列安全措施。

新应用生成的视频将统一加上水印,并禁止利用公众人物形象或单张照片制作视频,以应对市场对虚假内容泛滥的担忧。

在隐私保护方面,Sora应用设计了细致的权限控制机制。

用户可以完全控制谁可以使用自己的形象,包括“只有我自己”、“我允许的人”、“我关注的人+互相关注的人”或“所有人”等不同级别。

每个使用用户肖像的视频都会向其发送提醒,即使那条视频只是草稿、尚未发布。

用户可以随时撤回某段视频的授权,甚至永久删除一切有关自己形象的生成内容。

06 市场布局:与巨头的竞争与挑战

Sora 2及其社交应用的发布,意味着OpenAI将在用户注意力和广告市场上与TikTok、Meta等平台展开更直接的竞争。

业内认为,这不仅是推动AI技术大众化的一步,也可能成为OpenAI探索广告变现的重要路径

当前,ChatGPT的成功已使OpenAI在对话式AI领域占据先机,而在视频生成领域,OpenAI则面临来自谷歌、Runway等竞争对手的激烈角逐

Sora 2将在美国和加拿大通过邀请制系统推出,并计划迅速扩展到其他国家。

该服务将是免费的,OpenAI称之为“慷慨的限制”,尽管这些仍然受到计算资源的限制。

ChatGPT Pro订阅者可以访问一个名为Sora 2 Pro的实验性高质量版本。

OpenAI首席执行官Sam Altman在社交平台上发文表示:“对我们许多人来说,这感觉像是‘创意领域的ChatGPT时刻’,新奇而有趣……创意领域可能即将经历一次‘寒武纪大爆发’,随之而来的是艺术和娱乐质量的急剧提升。”

在AI视频生成的战场上,OpenAI不再满足于只做工具提供者。

通过将Sora 2与社交应用结合,它正试图在TikTok和Meta主导的领域开辟一条新路径——一条让AI不只是工具,而是人与人之间表达和连接媒介的道路从纯文本描述到带音频的高清视频,只需几分钟,你还能走进自己创造的虚拟世界。

以上是 OpenAI发布Sora 2:AI视频的“ChatGPT时刻”已然到来 的全部内容, 来源链接: yudiai.com/news/10001.html

回到顶部