OpenAI 首席技术官 Mira Murati 透露,Sora 正处于开发的最后阶段
人工智能 (AI) 创新的领导者 OpenAI 公布了其下一个大型企业的新细节:Sora,一种能够将文本转换为视频的 AI。
这一突破有望彻底改变我们与内容创作的互动方式,为超现实视频的生成提供以前无法想象的可能性。
Sora 的开发并非没有挑战,主要是因为它的超现实性质以及 OpenAI 打算整合视频编辑和音频添加等高级功能。这些功能旨在使体验更加身临其境和引人入胜,为用户扩展创意可能性。
Sora OpenAI:什么时候可以向公众开放?
OpenAI 首席技术官 Mira Murati 在最近接受《华尔街日报》采访时透露,Sora 正处于开发的最后阶段,将从今年起“几个月内”推出。
这个预期的发布窗口引发了人们对 Sora 将对市场和数字内容创作产生的影响的预期。
人工智能与道德发展
另一个亮点是 OpenAI 在开发 Sora 时采取的合乎道德和负责任的方法。该公司确保在使用免费和许可数据来训练这种人工智能方面是透明的。
这试图解决以前对仅使用开放获取数据训练高级 AI 模型的可行性的担忧。这种混合方法不仅确保了数据使用的合法性和道德性,而且还提出了一种可能比 ChatGPT 等其他 AI 更昂贵的运营模式。
Sora、OpenAI 和 2024 年选举
面对围绕美国DX等关键事件的错误信息环境,OpenAI 已宣布采取措施限制 Sora 生成著名角色表示的能力,从而寻求减轻创建虚假或误导性内容的可能性。
什么是 Sora OpenAI?
Sora 是一种多模态语言模型,可以从文本描述中生成逼真的视频。用户只需要写下他们想看到的场景的描述,Sora 就会让它栩栩如生。该模型可以创建长达 60 秒的视频,其质量可与专业团队制作的视频相媲美。
该模型代表了 OpenAI 首次涉足通过人工智能生成视频,扩展了其技术工具库,包括文本生成器 ChatGPT 和图像生成器 DALL-E。
这种先进的模型不仅可以生成图像;它更进一步,计算其环境中物体的物理特性,并根据这些详细计算渲染视频。
Sora是如何工作的?
它使用扩散模型来生成视频。这意味着它从一个似乎充满静态噪声的视频开始,然后逐渐将其平滑,以获得一个精美和连贯的版本。
用户只需写几句话,在逼真的风格或动画风格之间进行选择,就可以指示 Sora 生成视频,并在几分钟内获得惊人的效果。
该模型在 Midjourney 和 Stable Diffusion 等竞争对手中脱颖而出,因为它能够创建更长、更动态和更流畅的视频。与竞争模型不同,竞争模型看起来像是一系列人工智能生成的定格图像,而 Sora 设法制作出感觉完全真实和有凝聚力的视频。
然而,OpenAI 承认 Sora 仍有需要改进的领域,包括对因果关系的理解以及空间意识。这些挑战,以及与创建欺骗性深度伪造的可能性相关的安全问题,是 OpenAI 继续努力的关键方面。
总之,Sora有望成为内容生成领域的革命性工具,有望开启超现实主义和高度可定制的视听创作的新时代。科技界和创意界满怀期待地等待着Sora的推出,期待无数的应用以及这种先进的人工智能将对各行各业产生的影响。凭借其对创新和道德责任的承诺,OpenAI 继续引领人工智能的未来。
OpenAI Sora官网入口 Sora官网入口 Sora正式发布 Sora怎么用 Sora使用教程