OpenAI 今日在 X 发布了最新的文字转视频模型 Sora,只需要简单的描述性文字,就可以生成长达 60 秒的视频,其中包含高度详细的场景、正在运动的镜头,以及充满活力的多个角色。@Appinn
从生成文字、图片、声音,到生成视频,这是一条必然的路,虽然之前也有一些模型可以实现文字转视频,但 OpenAI Sora 生成的视频,可以直接拿来就用。
比如,你是一位美食视频创作者,想要拍摄翻山越岭去寻找食材的镜头,真的可以不用去现场了 😂
先坐火车去目的地:
再开越野车进山:
只需要使用以下提示词(Prompt):
镜头跟在一辆带黑色车顶行李架的白色复古越野车后面,越野车在陡峭的山坡上沿着松树环绕的陡峭土路上飞驰,轮胎上的尘土飞扬,阳光照在越野车上,越野车在土路上飞驰,给整个场景投下了温暖的光辉。
土路缓缓弯向远方,看不到其他车辆。道路两旁的树木都是红杉,还有零星的绿色植物。从后方看,汽车轻松地沿着弯道行驶,仿佛在崎岖的地形上行驶。土路本身被陡峭的丘陵和山脉环绕,头顶是晴朗的蓝天和飘渺的白云。
对于像青小蛙这样的业余视频制作者来说,可以实现很多想象中的转场镜头了,不需要复杂的剪辑技术 😂
而对于 OpenAI 的一系列模型,青小蛙总有一种感觉:OpenAI 可能会淘汰掉一批普通的创作者,留下来善于利用 AI,结合自身想象力的创造者,带来一波升级。
Sora 的缺陷
OpenAI 自己也描述了现在的缺陷:
它可能难以准确模拟复杂场景的物理原理。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。该模型还可能会混淆左右,例如一个人在跑步机上跑步,但是跑向反方向。
Sora 的安全
对于想用 Sora 生成敏感小视频的同学大可放心,它会自动检查很多敏感内容,例如要求极端暴力、性内容、仇恨图像、名人肖像等。
获取
需要注意的是,目前公众还无法使用 Sora,只有部分人可以使用(安全评估人员、少数视觉艺术家、设计师和电影制片人访问)需要等待技术下放。
从 ChatGPT 诞生至今,也不过短短 14 个月,我们不止在见证历史,还在经历历史。
原文:https://www.appinn.com/openai-sora-introducing/