LogoAcceptPrompt
  • 功能
  • FAQ
  • 博客
  • 文档
OpenAI Sora 2 完整提示词指南:技巧、方法与模板

Photo by lilartsy on Unsplash

2026/03/12

OpenAI Sora 2 完整提示词指南:技巧、方法与模板

一份全面、实用的 OpenAI Sora 2 视频生成模型提示词编写指南。包含可直接复制的电影场景、对话、图片输入、混音迭代等提示词模板。

OpenAI Sora 2 是一款顶尖的 AI 视频生成模型,能将文字——以及图片——转化为高保真视频片段。本指南将全面讲解如何有效地为 Sora 2 编写提示词,涵盖 API 参数、电影式提示词结构,并提供可直接复制使用的模板。

什么是 Sora 2?

Sora 2 是 OpenAI 新一代文本转视频模型,可通过 API 和 Sora.com 访问。它支持 sora-2 和更强大的 sora-2-pro 两个版本。核心亮点包括:

  • 高保真视频:从文字描述生成逼真、具有电影质感的视频。
  • 图片输入:使用参考图作为第一帧,实现更精细的构图控制。
  • 对话与音频:在提示词中直接描述台词和音景。
  • 混音(Remix)功能:对已有生成结果进行迭代微调,实现受控优化。
  • 多种分辨率与时长:生成 4 至 12 秒的 HD 分辨率视频片段。

API 参数

在编写提示词之前,请了解:某些视频属性只能通过 API 参数设置——无法在提示词文字中请求:

参数选项
modelsora-2 或 sora-2-pro
size1280x720、720x1280(sora-2);另有 1024x1792、1792x1024(sora-2-pro)
seconds"4"(默认)、"8"、"12"

技巧: 为获得最佳效果,建议优先生成 4 秒的短视频。如果需要更长时长,在剪辑中拼接两个 4 秒片段,往往比直接生成一个较长片段质量更高。


Sora 2 提示词的核心理念

把提示词当作向从未见过你脚本的摄影师下达的指令。如果遗漏细节,他们会自由发挥——你可能得不到预期的结果。

与此同时,留白同样是一种力量。给模型更多创作自由,往往会产生令人惊喜的精彩变化。详细的提示词带来可控性和一致性;而简洁的提示词则为创意结果提供空间。

核心原则:

  • 反复迭代:对摄像、光线或动作的细微调整都可能使结果产生显著变化。
  • 拥抱多样性:同一提示词多次生成会得到不同结果——这是特性,而非缺陷。
  • 协作创作:你提供方向,模型提供创意变化。

提示词的核心要素

一个清晰的提示词就像在故事板上描绘一个镜头。应包含:

要素控制什么示例
视觉风格整体美学、类型、媒介"1970年代爱情剧,35mm胶片拍摄"、"定格动画"
摄像/构图景别、角度、景深"中近景,缓缓推进"、"宽景建立镜头,平视角度"
光线与色彩氛围、情绪、色调"温暖的钨丝灯主光,窗口冷色轮廓光"、"黄金时段逆光"
角色外貌、服装、表情"一位穿着海军蓝大衣的三十多岁旅客"
环境场景、布景、道具"凌乱的工作室,架子上摆满齿轮和发黄的蓝图"
动作场景事件、节拍、手势"演员走四步到窗边,停顿,在最后一秒拉开窗帘"
对话台词侦探:"你在撒谎,我能从你的沉默中听出来。"
声音环境音、音乐、效果音"雨声、钟表滴答声、轻柔的机械嗡鸣"

提示词技巧

1. 从视觉风格开始

在提示词开头确立美学基调,模型会将其贯穿始终。同样的场景主体,在"好莱坞精品剧情片"、"手持手机随拍"和"颗粒感复古广告"的不同设定下,看起来会截然不同。

❌ 模糊:

镜头风格:电影感

✅ 精确:

镜头:宽景,低角度
景深:浅景深(主体清晰,背景虚化)
光线 + 色调:温暖逆光,柔和轮廓光

2. 精准控制动作

动作往往是最难控制的部分。保持简单:每个镜头只有一个明确的摄像机运动和一个明确的主体动作。用节拍来描述动作——小步骤、手势或停顿——让动作感觉有时间感。

❌ 模糊:

演员走过房间。

✅ 精确:

演员走四步到窗边,停顿,然后在最后一秒拉开窗帘。

一些好的摄像指令示例:

  • 宽景建立镜头,平视角度
  • 宽景,从左向右跟踪拍摄
  • 空中俯视宽景,略微向下倾斜
  • 中近景,缓慢推进,带有悬挂工具的视差效果

3. 精确描述光线与色彩

光线对情绪的塑造,不亚于动作或场景。多个片段剪辑在一起时,一致的光线逻辑是使剪辑流畅的关键。

❌ 模糊:

光线 + 色调:明亮的房间

✅ 精确:

光线 + 色调:柔和的窗光,暖色台灯补光,走廊透来的冷色轮廓光
色调锚点:琥珀色、奶油色、胡桃木棕

命名三到五个色调锚点,有助于在不同镜头中保持调色稳定。


4. 自然地写对话

将对话单独放在场景描述下方的专属区块,帮助模型清楚地区分视觉内容与台词。保持台词简洁自然:

  • 4 秒片段可容纳一两段简短对话。
  • 8 秒片段可容纳更多台词。

在多角色场景中,为每个角色统一标注名字,帮助模型将台词与对应角色的表情和手势相匹配。

一个狭窄、没有窗户、墙壁如旧灰色的密室。天花板上一盏裸露的灯泡垂下,将光圈甩在中央那张伤痕累累的金属桌上。两把椅子隔桌相对。侦探端坐在椅上,风衣搭在椅背,眼神锐利而专注。对面,嫌疑人懒散地靠着,烟雾懒洋洋地卷向天花板。

对话:
- 侦探:"你在撒谎,我能从你的沉默中听出来。"
- 嫌疑人:"或者,我只是不想再开口。"
- 侦探:"不管怎样,今晚结束之前你会开口的。"

5. 使用图片输入实现构图控制

要获得更精细的画面控制,可以通过 API 的 input_reference 参数附上一张参考图片。模型会将图片作为第一帧的锚点,而你的文本提示词定义接下来发生的事。

要求:

  • 图片分辨率必须与目标视频的 size 参数匹配。
  • 支持格式:image/jpeg、image/png、image/webp。

图片输入示例提示词:

"她转过身微笑,然后缓缓走出画面。"
"冰箱门打开了,一只胖乎乎的紫色小怪物从里面爬了出来。"

实验技巧: 没有参考图片?用 OpenAI 图片生成模型快速创建环境和场景设计,再将其作为参考输入 Sora。


6. 善用混音(Remix)功能进行迭代

混音是用来精细微调的,而不是用来碰运气的。每次只做一处可控的修改,并明确说明你在改什么:

  • "相同镜头,换成 85mm 镜头"
  • "相同光线,新调色板:青色、沙色、锈红色"

如果一个镜头反复失败,请退一步:锁定摄像机,简化动作,清空背景。等它能正常运行后,再逐步叠加复杂元素。


7. 超详细描述,打造电影级镜头

对于复杂的专业级镜头,你可以用影视制作术语描述画面风格、摄像设置、调色方案、音景,甚至分镜意图——就像导演向摄影组下达指令一样。

格式 & 画面
时长 4 秒;180° 快门;数字拍摄模拟 65mm 胶片对比度;细腻颗粒感;高光处微妙光晕。

镜头 & 滤镜
32mm / 50mm 球面定焦镜;Black Pro-Mist 1/4 柔光镜;略微旋转 CPL 以管理车窗玻璃反光。

调色 / 色调
高光:清晨阳光,琥珀色提亮。中间调:平衡中性,阴影略带青调。黑位:柔和中性,略微提升黑电平以保留雾气质感。

光线 & 氛围
自然光从摄像机左侧低角度射入(07:30)。轻薄雾气;列车尾气在光束中漂移。

场景 & 构图
城市通勤站台,黎明。前景:黄色安全线,长椅上一杯咖啡。中景:乘客轮廓隐没在雾气中。背景:列车减速驶入站台。

声音
仅场景声:微弱的钢轨摩擦声,列车制动气声,远处广播声(轻度压缩,-20 LUFS),低沉的环境嗡鸣。无配乐或后期拟音。

分镜列表(4 秒)
0.00–2.40 — "列车抵达"(32mm,肩扛缓慢向左推轨):镜头滑过站台标牌边缘,浅景深对焦旅客,旅客凝视轨道方向。晨光在镜头处晕开。
2.40–4.00 — "转身停顿"(50mm,缓慢弧形推进):旅客略向镜头转身,阳光轮廓光扫过脸颊。

提示词结构模板

以此框架作为起点。不是每个部分都必须填写——对镜头来说无关紧要的内容可以省略:

[散文场景描述:人物、服装、布景、天气及其他细节]

摄影:
镜头:[景别和角度,例如:宽景建立镜头,平视角度]
氛围:[整体基调,例如:电影感紧张、俏皮悬疑、奢华期待]

动作:
- [动作 1:一个清晰、具体的节拍或手势]
- [动作 2:片段内另一个明确的节拍]
- [动作 3:另一个动作或对话台词]

对话:
[简短自然的台词。保持简洁,以匹配片段时长。]

背景声音:
[环境音、音乐或音效]

可直接复制的提示词示例

🤖 动画短片(童话 / 定格动画感)

风格:手绘 2D/3D 混合动画,柔软笔触质感,温暖的钨丝灯光,触感十足的定格动画风格。美学上唤起 2000 年代中期童话绘本动画——温馨、不完美、充满机械魅力。

在一个凌乱的工作室里,架子上堆满齿轮、螺栓和泛黄的蓝图。中央,一个小圆形机器人坐在木凳上,它那坑坑洼洼的身体被各色拼接板块覆盖。它那巨大的发光眼睛闪烁着浅蓝色,紧张地摆弄着一只嗡嗡作响的灯泡。

摄影:
摄像机:中近景,缓慢推进,悬挂工具营造视差
镜头:35mm 虚拟镜头;浅景深,背景杂物虚化
光线:温暖的顶部实景灯主光;窗口冷光补光
氛围:温柔、古灵精怪、带一丝悬念

动作:
- 机器人敲击灯泡,火花四溅。
- 它猛地缩手,灯泡脱手而出,眼睛睁大。
- 灯泡以慢动作坠落,它在最后一刻接住了。
- 胸口一阵蒸汽喷出——如释重负,带着一丝自豪。
- 机器人轻声说:"差点没接住……但我接住了!"

背景声音:雨声、钟表滴答声、柔和的机械嗡鸣、微弱的灯泡嗞嗞声。

💃 1970 年代爱情剧(屋顶舞蹈)

风格:1970 年代爱情剧,35mm 胶片拍摄,带有自然耀光、柔焦和温暖光晕。轻微的片门颤动和手持微抖动唤起复古亲密感。柯达风暖色调;胶片颗粒和柔和晕影,还原时代质感。

黄金时段,一栋砖砌公寓楼的屋顶化身为小小舞台。晾晒白布的晾衣绳在风中摇曳,接住了最后几缕阳光。一串杂色灯泡在头顶轻声嗡鸣。一位身着流动红色丝绸长裙的年轻女性赤脚起舞,卷发在余晖中闪闪发光。她的舞伴——卷起衬衫袖子,背带松松垮垮——随着节拍鼓掌,笑容灿烂而毫无防备。

摄影:
摄像机:中宽景,从平视角度缓慢推轨拉近
镜头:40mm 球面镜;浅景深,将两人从天际线中隔离出来
光线:黄金阳光自然主光,钨丝灯反射补光;灯泡边缘光
氛围:怀旧、温情、电影感

动作:
- 她旋转;裙摆飞扬,接住阳光。
- 女(笑着):"看你!就连城市今晚都在和我们一起跳舞。"
- 他迈步上前,握住她的手,将她引入阴影中轻轻下腰。
- 男(微笑):"那只是因为你带领得好。"
- 白布漂过画面,短暂遮住天际线,然后再次分开。

背景声音:仅自然环境声:微风、布料摩擦声、街道噪音、隐约的音乐。无添加配乐。

🕵️ 犯罪审讯场景

一个狭窄、没有窗户、墙壁如旧灰色的密室。天花板上一盏裸露的灯泡垂下,将光圈甩在中央那张伤痕累累的金属桌上。两把椅子隔桌相对。侦探端坐在椅上,风衣搭在椅背,眼神锐利而专注。对面,嫌疑人懒散地靠着,烟雾懒洋洋地卷向天花板。

对话:
- 侦探:"你在撒谎,我能从你的沉默中听出来。"
- 嫌疑人:"或者,我只是不想再开口。"
- 侦探:"不管怎样,今晚结束之前你会开口的。"

🚉 城市站台(超详细电影级)

格式 & 画面:时长 4 秒;180° 快门;数字拍摄模拟 65mm 胶片对比度;细腻颗粒感;高光处微妙光晕;无片门颤动。
镜头 & 滤镜:32mm / 50mm 球面定焦镜;Black Pro-Mist 1/4;略微旋转 CPL 以管理车窗玻璃反光。
调色 / 色调:高光:清晨阳光,琥珀色提亮。中间调:平衡中性,阴影略带青调。黑位:柔和中性,轻微提升黑电平以保留雾气。
光线 & 氛围:自然光从摄像机左侧低角度射入(07:30)。轻薄雾气;列车尾气在光束中漂移。
场景 & 构图:城市通勤站台,黎明。前景:黄色安全线,长椅上一杯咖啡。中景:乘客轮廓隐没在雾气中。背景:列车减速驶入站台。请避免显示标牌或企业品牌。
声音:仅场景声:微弱的钢轨摩擦声,列车制动气声,远处广播声(-20 LUFS),低沉的环境嗡鸣。无配乐或后期拟音。
0.00–2.40 — "列车抵达"(32mm,肩扛缓慢向左推轨):镜头滑过站台标牌边缘,浅景深对焦旅客,旅客凝视轨道方向。晨光在镜头处柔和晕开。
2.40–4.00 — "转身停顿"(50mm,缓慢弧形推近):旅客略向镜头转身,阳光轮廓光扫过脸颊。

🌿 短而简练(开放式创作)

In a 90s documentary-style interview, an old Swedish man sits in a study and says, "I still remember when I was young."

这类简洁提示词给模型留足了创作空间——人物外貌、场景设计、摄像角度和光线都由模型自由发挥。非常适合探索意外的诠释方式。


进阶技巧

  1. 先定风格:以视觉媒介或胶片美学开篇,这会为所有其他选择奠定基调。
  2. 每个镜头只有一个动作、一个运镜:保持简单;复杂性叠加会带来不可预测的结果。
  3. 使用电影术语:"中近景"、"推轨"、"手持"、"焦点拉伸" 能给模型提供精准的方向。
  4. 命名色调锚点:三到五个颜色名称有助于在不同镜头中保持调色稳定。
  5. 对话要简短:对话量要匹配片段时长——不要把 8 行台词塞进 4 秒片段。
  6. 有意识地混音:每次只改变一个变量,并明确描述你在改什么。
  7. 善用参考图片:先生成一张参考图,再将其作为输入送进 Sora,实现锁定构图。
  8. 拥抱多样性:重复使用相同提示词会得到不同结果,把每次生成都当作一次全新的创作尝试。

总结

Sora 2 对精准和实验的重视程度是相当的。获得出色结果的关键,在于编写结构化、电影化的提示词——明确风格、摄像、角色、动作、对话和声音——同时保留空间让模型自由呼吸,带来意想不到的惊喜。

无论你是电影制作人、内容创作者还是开发者,掌握 Sora 2 的提示词技巧将为你打开强大的全新创作可能性。从上面的现成示例开始,探索图片输入和混音功能,在迭代中找到你心目中的完美画面。

准备好开始了吗? 立即在 sora.com 或通过 OpenAI API 体验 Sora 2。

全部文章

作者

avatar for Accept Prompt
Accept Prompt

分类

  • 产品
什么是 Sora 2?API 参数Sora 2 提示词的核心理念提示词的核心要素提示词技巧1. 从视觉风格开始2. 精准控制动作3. 精确描述光线与色彩4. 自然地写对话5. 使用图片输入实现构图控制6. 善用混音(Remix)功能进行迭代7. 超详细描述,打造电影级镜头提示词结构模板可直接复制的提示词示例🤖 动画短片(童话 / 定格动画感)💃 1970 年代爱情剧(屋顶舞蹈)🕵️ 犯罪审讯场景🚉 城市站台(超详细电影级)🌿 短而简练(开放式创作)进阶技巧总结

更多文章

Runway Gen-4 提示词指南:如何获得最佳生成效果
产品

Runway Gen-4 提示词指南:如何获得最佳生成效果

学习如何为 Runway Gen-4 视频生成模型编写高效提示词。本指南涵盖主体运动、镜头运动、场景运动、风格描述符及最佳实践,助你生成高质量 AI 视频。

avatar for Accept Prompt
Accept Prompt
2026/03/26
Seedance 2.0 提示词指南:技巧、方法与提示词模板
产品

Seedance 2.0 提示词指南:技巧、方法与提示词模板

关于 Seedance AI 的全面指南——字节跳动视频生成模型。涵盖 Seedance 1.0 与 2.0 对比、bytedance/seedance-v1-pro-i2v-480p API 使用方法,以及附带可复制模板的专业提示词技巧。

avatar for Accept Prompt
Accept Prompt
2026/03/09
Google Veo 3.1 提示词指南:技巧、方法与提示词模板
产品

Google Veo 3.1 提示词指南:技巧、方法与提示词模板

Google Veo 3.1 全面指南:提示词技巧、真实皮肤生成、去字幕方法、费用价格详解,以及 Veo 3.1 时长限制说明。含可直接复制的提示词模板。

avatar for Accept Prompt
Accept Prompt
2026/03/09

等待列表

抢先体验

成为第一批体验 AcceptPrompt 的用户。注册以获取早期访问和独家更新。

成为第一批体验用户。免费抢先体验,订阅即享五折优惠,绝不发送垃圾邮件。

LogoAcceptPrompt

AcceptPrompt 助你一次生成惊艳的 AI 视频。

Built withAUAI Company
产品
  • 功能
  • 价格
  • 常见问题
资源
  • 博客
  • 文档
  • 更新日志
公司
  • 关于我们
  • 联系我们
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
© 2026 AcceptPrompt All Rights Reserved.