
OpenAI Sora 2 完整提示词指南:技巧、方法与模板
一份全面、实用的 OpenAI Sora 2 视频生成模型提示词编写指南。包含可直接复制的电影场景、对话、图片输入、混音迭代等提示词模板。
OpenAI Sora 2 是一款顶尖的 AI 视频生成模型,能将文字——以及图片——转化为高保真视频片段。本指南将全面讲解如何有效地为 Sora 2 编写提示词,涵盖 API 参数、电影式提示词结构,并提供可直接复制使用的模板。
什么是 Sora 2?
Sora 2 是 OpenAI 新一代文本转视频模型,可通过 API 和 Sora.com 访问。它支持 sora-2 和更强大的 sora-2-pro 两个版本。核心亮点包括:
- 高保真视频:从文字描述生成逼真、具有电影质感的视频。
- 图片输入:使用参考图作为第一帧,实现更精细的构图控制。
- 对话与音频:在提示词中直接描述台词和音景。
- 混音(Remix)功能:对已有生成结果进行迭代微调,实现受控优化。
- 多种分辨率与时长:生成 4 至 12 秒的 HD 分辨率视频片段。
API 参数
在编写提示词之前,请了解:某些视频属性只能通过 API 参数设置——无法在提示词文字中请求:
| 参数 | 选项 |
|---|---|
model | sora-2 或 sora-2-pro |
size | 1280x720、720x1280(sora-2);另有 1024x1792、1792x1024(sora-2-pro) |
seconds | "4"(默认)、"8"、"12" |
技巧: 为获得最佳效果,建议优先生成 4 秒的短视频。如果需要更长时长,在剪辑中拼接两个 4 秒片段,往往比直接生成一个较长片段质量更高。
Sora 2 提示词的核心理念
把提示词当作向从未见过你脚本的摄影师下达的指令。如果遗漏细节,他们会自由发挥——你可能得不到预期的结果。
与此同时,留白同样是一种力量。给模型更多创作自由,往往会产生令人惊喜的精彩变化。详细的提示词带来可控性和一致性;而简洁的提示词则为创意结果提供空间。
核心原则:
- 反复迭代:对摄像、光线或动作的细微调整都可能使结果产生显著变化。
- 拥抱多样性:同一提示词多次生成会得到不同结果——这是特性,而非缺陷。
- 协作创作:你提供方向,模型提供创意变化。
提示词的核心要素
一个清晰的提示词就像在故事板上描绘一个镜头。应包含:
| 要素 | 控制什么 | 示例 |
|---|---|---|
| 视觉风格 | 整体美学、类型、媒介 | "1970年代爱情剧,35mm胶片拍摄"、"定格动画" |
| 摄像/构图 | 景别、角度、景深 | "中近景,缓缓推进"、"宽景建立镜头,平视角度" |
| 光线与色彩 | 氛围、情绪、色调 | "温暖的钨丝灯主光,窗口冷色轮廓光"、"黄金时段逆光" |
| 角色 | 外貌、服装、表情 | "一位穿着海军蓝大衣的三十多岁旅客" |
| 环境 | 场景、布景、道具 | "凌乱的工作室,架子上摆满齿轮和发黄的蓝图" |
| 动作 | 场景事件、节拍、手势 | "演员走四步到窗边,停顿,在最后一秒拉开窗帘" |
| 对话 | 台词 | 侦探:"你在撒谎,我能从你的沉默中听出来。" |
| 声音 | 环境音、音乐、效果音 | "雨声、钟表滴答声、轻柔的机械嗡鸣" |
提示词技巧
1. 从视觉风格开始
在提示词开头确立美学基调,模型会将其贯穿始终。同样的场景主体,在"好莱坞精品剧情片"、"手持手机随拍"和"颗粒感复古广告"的不同设定下,看起来会截然不同。
❌ 模糊:
镜头风格:电影感✅ 精确:
镜头:宽景,低角度
景深:浅景深(主体清晰,背景虚化)
光线 + 色调:温暖逆光,柔和轮廓光2. 精准控制动作
动作往往是最难控制的部分。保持简单:每个镜头只有一个明确的摄像机运动和一个明确的主体动作。用节拍来描述动作——小步骤、手势或停顿——让动作感觉有时间感。
❌ 模糊:
演员走过房间。✅ 精确:
演员走四步到窗边,停顿,然后在最后一秒拉开窗帘。一些好的摄像指令示例:
宽景建立镜头,平视角度宽景,从左向右跟踪拍摄空中俯视宽景,略微向下倾斜中近景,缓慢推进,带有悬挂工具的视差效果
3. 精确描述光线与色彩
光线对情绪的塑造,不亚于动作或场景。多个片段剪辑在一起时,一致的光线逻辑是使剪辑流畅的关键。
❌ 模糊:
光线 + 色调:明亮的房间✅ 精确:
光线 + 色调:柔和的窗光,暖色台灯补光,走廊透来的冷色轮廓光
色调锚点:琥珀色、奶油色、胡桃木棕命名三到五个色调锚点,有助于在不同镜头中保持调色稳定。
4. 自然地写对话
将对话单独放在场景描述下方的专属区块,帮助模型清楚地区分视觉内容与台词。保持台词简洁自然:
- 4 秒片段可容纳一两段简短对话。
- 8 秒片段可容纳更多台词。
在多角色场景中,为每个角色统一标注名字,帮助模型将台词与对应角色的表情和手势相匹配。
一个狭窄、没有窗户、墙壁如旧灰色的密室。天花板上一盏裸露的灯泡垂下,将光圈甩在中央那张伤痕累累的金属桌上。两把椅子隔桌相对。侦探端坐在椅上,风衣搭在椅背,眼神锐利而专注。对面,嫌疑人懒散地靠着,烟雾懒洋洋地卷向天花板。
对话:
- 侦探:"你在撒谎,我能从你的沉默中听出来。"
- 嫌疑人:"或者,我只是不想再开口。"
- 侦探:"不管怎样,今晚结束之前你会开口的。"5. 使用图片输入实现构图控制
要获得更精细的画面控制,可以通过 API 的 input_reference 参数附上一张参考图片。模型会将图片作为第一帧的锚点,而你的文本提示词定义接下来发生的事。
要求:
- 图片分辨率必须与目标视频的
size参数匹配。 - 支持格式:
image/jpeg、image/png、image/webp。
图片输入示例提示词:
"她转过身微笑,然后缓缓走出画面。""冰箱门打开了,一只胖乎乎的紫色小怪物从里面爬了出来。"实验技巧: 没有参考图片?用 OpenAI 图片生成模型快速创建环境和场景设计,再将其作为参考输入 Sora。
6. 善用混音(Remix)功能进行迭代
混音是用来精细微调的,而不是用来碰运气的。每次只做一处可控的修改,并明确说明你在改什么:
"相同镜头,换成 85mm 镜头""相同光线,新调色板:青色、沙色、锈红色"
如果一个镜头反复失败,请退一步:锁定摄像机,简化动作,清空背景。等它能正常运行后,再逐步叠加复杂元素。
7. 超详细描述,打造电影级镜头
对于复杂的专业级镜头,你可以用影视制作术语描述画面风格、摄像设置、调色方案、音景,甚至分镜意图——就像导演向摄影组下达指令一样。
格式 & 画面
时长 4 秒;180° 快门;数字拍摄模拟 65mm 胶片对比度;细腻颗粒感;高光处微妙光晕。
镜头 & 滤镜
32mm / 50mm 球面定焦镜;Black Pro-Mist 1/4 柔光镜;略微旋转 CPL 以管理车窗玻璃反光。
调色 / 色调
高光:清晨阳光,琥珀色提亮。中间调:平衡中性,阴影略带青调。黑位:柔和中性,略微提升黑电平以保留雾气质感。
光线 & 氛围
自然光从摄像机左侧低角度射入(07:30)。轻薄雾气;列车尾气在光束中漂移。
场景 & 构图
城市通勤站台,黎明。前景:黄色安全线,长椅上一杯咖啡。中景:乘客轮廓隐没在雾气中。背景:列车减速驶入站台。
声音
仅场景声:微弱的钢轨摩擦声,列车制动气声,远处广播声(轻度压缩,-20 LUFS),低沉的环境嗡鸣。无配乐或后期拟音。
分镜列表(4 秒)
0.00–2.40 — "列车抵达"(32mm,肩扛缓慢向左推轨):镜头滑过站台标牌边缘,浅景深对焦旅客,旅客凝视轨道方向。晨光在镜头处晕开。
2.40–4.00 — "转身停顿"(50mm,缓慢弧形推进):旅客略向镜头转身,阳光轮廓光扫过脸颊。提示词结构模板
以此框架作为起点。不是每个部分都必须填写——对镜头来说无关紧要的内容可以省略:
[散文场景描述:人物、服装、布景、天气及其他细节]
摄影:
镜头:[景别和角度,例如:宽景建立镜头,平视角度]
氛围:[整体基调,例如:电影感紧张、俏皮悬疑、奢华期待]
动作:
- [动作 1:一个清晰、具体的节拍或手势]
- [动作 2:片段内另一个明确的节拍]
- [动作 3:另一个动作或对话台词]
对话:
[简短自然的台词。保持简洁,以匹配片段时长。]
背景声音:
[环境音、音乐或音效]可直接复制的提示词示例
🤖 动画短片(童话 / 定格动画感)
风格:手绘 2D/3D 混合动画,柔软笔触质感,温暖的钨丝灯光,触感十足的定格动画风格。美学上唤起 2000 年代中期童话绘本动画——温馨、不完美、充满机械魅力。
在一个凌乱的工作室里,架子上堆满齿轮、螺栓和泛黄的蓝图。中央,一个小圆形机器人坐在木凳上,它那坑坑洼洼的身体被各色拼接板块覆盖。它那巨大的发光眼睛闪烁着浅蓝色,紧张地摆弄着一只嗡嗡作响的灯泡。
摄影:
摄像机:中近景,缓慢推进,悬挂工具营造视差
镜头:35mm 虚拟镜头;浅景深,背景杂物虚化
光线:温暖的顶部实景灯主光;窗口冷光补光
氛围:温柔、古灵精怪、带一丝悬念
动作:
- 机器人敲击灯泡,火花四溅。
- 它猛地缩手,灯泡脱手而出,眼睛睁大。
- 灯泡以慢动作坠落,它在最后一刻接住了。
- 胸口一阵蒸汽喷出——如释重负,带着一丝自豪。
- 机器人轻声说:"差点没接住……但我接住了!"
背景声音:雨声、钟表滴答声、柔和的机械嗡鸣、微弱的灯泡嗞嗞声。💃 1970 年代爱情剧(屋顶舞蹈)
风格:1970 年代爱情剧,35mm 胶片拍摄,带有自然耀光、柔焦和温暖光晕。轻微的片门颤动和手持微抖动唤起复古亲密感。柯达风暖色调;胶片颗粒和柔和晕影,还原时代质感。
黄金时段,一栋砖砌公寓楼的屋顶化身为小小舞台。晾晒白布的晾衣绳在风中摇曳,接住了最后几缕阳光。一串杂色灯泡在头顶轻声嗡鸣。一位身着流动红色丝绸长裙的年轻女性赤脚起舞,卷发在余晖中闪闪发光。她的舞伴——卷起衬衫袖子,背带松松垮垮——随着节拍鼓掌,笑容灿烂而毫无防备。
摄影:
摄像机:中宽景,从平视角度缓慢推轨拉近
镜头:40mm 球面镜;浅景深,将两人从天际线中隔离出来
光线:黄金阳光自然主光,钨丝灯反射补光;灯泡边缘光
氛围:怀旧、温情、电影感
动作:
- 她旋转;裙摆飞扬,接住阳光。
- 女(笑着):"看你!就连城市今晚都在和我们一起跳舞。"
- 他迈步上前,握住她的手,将她引入阴影中轻轻下腰。
- 男(微笑):"那只是因为你带领得好。"
- 白布漂过画面,短暂遮住天际线,然后再次分开。
背景声音:仅自然环境声:微风、布料摩擦声、街道噪音、隐约的音乐。无添加配乐。🕵️ 犯罪审讯场景
一个狭窄、没有窗户、墙壁如旧灰色的密室。天花板上一盏裸露的灯泡垂下,将光圈甩在中央那张伤痕累累的金属桌上。两把椅子隔桌相对。侦探端坐在椅上,风衣搭在椅背,眼神锐利而专注。对面,嫌疑人懒散地靠着,烟雾懒洋洋地卷向天花板。
对话:
- 侦探:"你在撒谎,我能从你的沉默中听出来。"
- 嫌疑人:"或者,我只是不想再开口。"
- 侦探:"不管怎样,今晚结束之前你会开口的。"🚉 城市站台(超详细电影级)
格式 & 画面:时长 4 秒;180° 快门;数字拍摄模拟 65mm 胶片对比度;细腻颗粒感;高光处微妙光晕;无片门颤动。
镜头 & 滤镜:32mm / 50mm 球面定焦镜;Black Pro-Mist 1/4;略微旋转 CPL 以管理车窗玻璃反光。
调色 / 色调:高光:清晨阳光,琥珀色提亮。中间调:平衡中性,阴影略带青调。黑位:柔和中性,轻微提升黑电平以保留雾气。
光线 & 氛围:自然光从摄像机左侧低角度射入(07:30)。轻薄雾气;列车尾气在光束中漂移。
场景 & 构图:城市通勤站台,黎明。前景:黄色安全线,长椅上一杯咖啡。中景:乘客轮廓隐没在雾气中。背景:列车减速驶入站台。请避免显示标牌或企业品牌。
声音:仅场景声:微弱的钢轨摩擦声,列车制动气声,远处广播声(-20 LUFS),低沉的环境嗡鸣。无配乐或后期拟音。
0.00–2.40 — "列车抵达"(32mm,肩扛缓慢向左推轨):镜头滑过站台标牌边缘,浅景深对焦旅客,旅客凝视轨道方向。晨光在镜头处柔和晕开。
2.40–4.00 — "转身停顿"(50mm,缓慢弧形推近):旅客略向镜头转身,阳光轮廓光扫过脸颊。🌿 短而简练(开放式创作)
In a 90s documentary-style interview, an old Swedish man sits in a study and says, "I still remember when I was young."这类简洁提示词给模型留足了创作空间——人物外貌、场景设计、摄像角度和光线都由模型自由发挥。非常适合探索意外的诠释方式。
进阶技巧
- 先定风格:以视觉媒介或胶片美学开篇,这会为所有其他选择奠定基调。
- 每个镜头只有一个动作、一个运镜:保持简单;复杂性叠加会带来不可预测的结果。
- 使用电影术语:
"中近景"、"推轨"、"手持"、"焦点拉伸"能给模型提供精准的方向。 - 命名色调锚点:三到五个颜色名称有助于在不同镜头中保持调色稳定。
- 对话要简短:对话量要匹配片段时长——不要把 8 行台词塞进 4 秒片段。
- 有意识地混音:每次只改变一个变量,并明确描述你在改什么。
- 善用参考图片:先生成一张参考图,再将其作为输入送进 Sora,实现锁定构图。
- 拥抱多样性:重复使用相同提示词会得到不同结果,把每次生成都当作一次全新的创作尝试。
总结
Sora 2 对精准和实验的重视程度是相当的。获得出色结果的关键,在于编写结构化、电影化的提示词——明确风格、摄像、角色、动作、对话和声音——同时保留空间让模型自由呼吸,带来意想不到的惊喜。
无论你是电影制作人、内容创作者还是开发者,掌握 Sora 2 的提示词技巧将为你打开强大的全新创作可能性。从上面的现成示例开始,探索图片输入和混音功能,在迭代中找到你心目中的完美画面。
准备好开始了吗? 立即在 sora.com 或通过 OpenAI API 体验 Sora 2。
更多文章

Runway Gen-4 提示词指南:如何获得最佳生成效果
学习如何为 Runway Gen-4 视频生成模型编写高效提示词。本指南涵盖主体运动、镜头运动、场景运动、风格描述符及最佳实践,助你生成高质量 AI 视频。


Seedance 2.0 提示词指南:技巧、方法与提示词模板
关于 Seedance AI 的全面指南——字节跳动视频生成模型。涵盖 Seedance 1.0 与 2.0 对比、bytedance/seedance-v1-pro-i2v-480p API 使用方法,以及附带可复制模板的专业提示词技巧。


Google Veo 3.1 提示词指南:技巧、方法与提示词模板
Google Veo 3.1 全面指南:提示词技巧、真实皮肤生成、去字幕方法、费用价格详解,以及 Veo 3.1 时长限制说明。含可直接复制的提示词模板。

等待列表
抢先体验
成为第一批体验 AcceptPrompt 的用户。注册以获取早期访问和独家更新。
成为第一批体验用户。免费抢先体验,订阅即享五折优惠,绝不发送垃圾邮件。