OpenAI Sora – 文字转视频模型：输入描述性文字，获得，生成长达一分钟的视频

Home

OpenAI 今日在 X 发布了最新的文字转视频模型 Sora，只需要简单的描述性文字，就可以生成长达 60 秒的视频，其中包含高度详细的场景、正在运动的镜头，以及充满活力的多个角色。@Appinn

从生成文字、图片、声音，到生成视频，这是一条必然的路，虽然之前也有一些模型可以实现文字转视频，但 OpenAI Sora 生成的视频，可以直接拿来就用。

比如，你是一位美食视频创作者，想要拍摄翻山越岭去寻找食材的镜头，真的可以不用去现场了 😂

先坐火车去目的地：

提示词：穿过东京郊区的火车车窗上的倒影。

再开越野车进山：

只需要使用以下提示词（Prompt）:

镜头跟在一辆带黑色车顶行李架的白色复古越野车后面，越野车在陡峭的山坡上沿着松树环绕的陡峭土路上飞驰，轮胎上的尘土飞扬，阳光照在越野车上，越野车在土路上飞驰，给整个场景投下了温暖的光辉。
土路缓缓弯向远方，看不到其他车辆。道路两旁的树木都是红杉，还有零星的绿色植物。

从后方看，汽车轻松地沿着弯道行驶，仿佛在崎岖的地形上行驶。土路本身被陡峭的丘陵和山脉环绕，头顶是晴朗的蓝天和飘渺的白云。

对于像青小蛙这样的业余视频制作者来说，可以实现很多想象中的转场镜头了，不需要复杂的剪辑技术 😂

而对于 OpenAI 的一系列模型，青小蛙总有一种感觉：OpenAI 可能会淘汰掉一批普通的创作者，留下来善于利用 AI，结合自身想象力的创造者，带来一波升级。

Sora 的缺陷

OpenAI 自己也描述了现在的缺陷：

它可能难以准确模拟复杂场景的物理原理。例如，一个人可能咬了一口饼干，但之后饼干可能没有咬痕。该模型还可能会混淆左右，例如一个人在跑步机上跑步，但是跑向反方向。

Sora 的安全

对于想用 Sora 生成敏感小视频的同学大可放心，它会自动检查很多敏感内容，例如要求极端暴力、性内容、仇恨图像、名人肖像等。

提示词：相机正对意大利布拉诺色彩缤纷的建筑。一只可爱的斑点狗透过一楼建筑的窗户向外张望。许多人沿着建筑物前的运河街道步行和骑自行车。

获取

https://openai.com/sora

需要注意的是，目前公众还无法使用 Sora，只有部分人可以使用（安全评估人员、少数视觉艺术家、设计师和电影制片人访问）需要等待技术下放。

从 ChatGPT 诞生至今，也不过短短 14 个月，我们不止在见证历史，还在经历历史。

原文：https://www.appinn.com/openai-sora-introducing/