Runway Gen-3 限时视频广告创意实战:哪些能用、哪些会翻车
目录
上周我在帮一个 D2C(Direct-to-Consumer,直接面向消费者)护肤品牌准备一个 48 小时的"双十一"限时闪购。他们需要 12 条视频广告。代理报价 14000 美元、5 个工作日。我用 Runway Gen-3 Alpha 跑了 6 小时实验,9 条可用素材落地,消耗 137 美元的积分。客户把代理换掉了。这是这篇文章的引子。
但说点实话:9 条里 4 条完全不能用,2 条做了大量局部重绘(inpainting,AI 视频修补技术),能跑出可观转化规模的只有 1 条。Runway Gen-3 拿来做限时视频广告创意,是个强但不稳的工具。下面我会讲清楚:哪些场景好用,哪些场景会翻车,以及决定你属于哪一边的具体生产决策。
为什么限时广告要专门挑 Gen-3
传统视频制作是个串行瓶颈:脚本→分镜→拍摄→剪辑→调色→声音→导出。放在 72 小时的促销窗口里,这条流水线根本不存在。AI 视频生成把这一条链压成:写提示词→生成→粗剪→上线。这笔账能不能算过来,取决于输出能不能过平台的审核、能不能抓住观众 1.5 秒的注意力。
Runway Gen-3 Alpha 是目前最适合营销场景的甜点位,因为三个特性:
- 原生 10 秒片段——足够讲完一个迷你叙事,又短到一条 prompt 就能完成
- 支持图生视频和视频生视频——可以从产品图或现有素材的某一帧开始
- 高级镜头控制(2024 年底上线)——推拉、环绕、摇臂、定向运动
Standard 套餐 35 美元/月 含积分,大概能跑 40-60 次 5 秒生成(具体看分辨率)。要做真正的广告批量生产,95 美元/月 的 Unlimited 是唯一现实的选择。还有一个 Turbo 版本,速度约 7 倍、积分成本一半——批量迭代时很实用,但画面保真度比标准版略低。
值得提醒一下:Runway 的定价从发布以来调过多次,也有过单分钟价格突然上涨的报道。基于本文做 campaign 预算前,务必先核实当前积分换算。
好用的四种模式
我给闪购、应用安装推广、Black Friday 大促做过广告之后,发现四种生成模式稳定出片。
1. "产品主角环绕"——图生视频,干净产品图起步。 拿一张高分辨率、光线统一的产品图喂给 Gen-3,提示词写"缓慢环绕"或"推近"。这是我个人命中率最高的模式。模型把你的产品图当成固定参考,品牌识别度不会丢,你拿到的是动效。上一批命中率:10 条里 8 条零编辑可用。
能跑通的提示词骨架:
"缓慢环绕镜头围绕产品,电影级浅景深,柔和棚拍光,场景不切换,连续平滑运动"
关键是"连续平滑运动"和"场景不切换"。少了这两条,模型会自己脑补上下文——产品突然漂起来、突然出现一只手、突然进了房间——你的品牌一致性全毁。我曾经一次跑 12 条,结果我的精华瓶出现在三个不同的房间里,还有一个和品牌完全无关的未来感厨房。
2. "生活方式定帧推动"——先用 AI 摆好定帧,再做动效。 用 Midjourney 或 Flux 生成一张完美的 hero 静态图,再用 Gen-3 把它激活:头发飘起来、面料动一动、灯光微微闪。这是时尚美妆广告的苦力活。两步走的好处是:先管构图,再管动效。
图生成和视频生成之间的分工是合理的:静态图模型的构图控制和一致性更强,视频模型对运动语义的理解更深。各用所长。工作流时间分配大致 30% 给静态图、70% 给动效。
3. "动态图形背景"——生成抽象循环。 做电商 banner 和 Story,Gen-3 能出 5 秒的品牌色抽象动态图形——流动的布料、液体倾倒、光轨、柔光粒子。这些直接当广告背景,前景在剪辑软件里叠加标题和 CTA。纯 B-roll,没有真人入镜,不存在一致性问题。
一个简单技巧:提示词写"循环运动"和具体色板,然后在剪辑软件里把头尾剪接成无缝循环。这是唯一一种可以稳定做到一小时产出 20 条以上素材的模式。
4. "证言画面修补"——用 regenerate 救一条差素材。 这是被低估的场景。你拍了一条真人证言视频,但打光平、背景乱。用 Gen-3 的 video-to-video 换掉整个场景背景,同时保留人物动作。命中率低一些(约 30%),QC 也要多做几遍,但成功了一次就是真的成了。
最近一个酒店客户,证言视频在真实场地拍的,但打光不统一。用 video-to-video 配"明亮现代咖啡馆内景,柔和自然窗光"提示词,8 条里救回了 5 条。原片在 6 秒广告切片里太暗,重生成的版本直接达到播出标准。
不好用的五种失败模式
1. 画面里出现任何文字。 在主流视频模型里,Gen-3 的文字渲染能力最差。如果你需要"50% OFF"这种标题在生成的画面里清晰可读,你会失望。先用 Gen-3 出视频,再到剪映或 Premiere 里合成文字。别让 Gen-3 拼单词。
一个反直觉的细节:短而常见的词(比如"SALE"或"NEW")有时在前 2 秒看起来还行,中段就变形了。所以即使首帧文字"看着没问题",动起来就崩。每次出片前必须从头到尾 scrub 完整条素材。
2. 两个以上的人物主体。 两个人的互动已经不稳。三个人以上同框——肢体互换、人脸融合、诡异 artifact。社媒证言广告需要多个"客户"出现,就老老实实拍真人,或者用单人镜头后期合成。
一个反复出现的失败:一个小孩和一个成人同框。模型经常在中途互换他们的脸,最后 3 秒会出现一个顶着成人五官的小孩。让人不适且无法使用。家庭类广告基本必须实拍。
3. 需要精确产品互动的场景。 一只手拿起你的产品、一根手指点开你的 App UI、模特拆你的包装。Gen-3 在这种近距离会幻觉生理解剖和物理。我亲眼见过六指手掌、融化的口红管、中途微微变形的手机。App UI 类广告,直接录屏你的真实 UI,再叠加动态图形。
4. 有特定文化指向的手势、道具或场景。 需要做春节场景里的具体传统元素?Gen-3 会给你一些"亚洲风"美学,但和你目标市场实际用的大概率对不上。所有文化主题内容,必须有本地 reviewer 把关。
我在一次中东 campaign 上踩过坑:模型生成的手势在某些国家是祝福,在另一些国家是冒犯。本地团队 30 秒内就标出来了。少了这一步就直接上线了。
5. 镜头和主体同时运动。 Gen-3 能处理"镜头动+主体静",或"镜头静+主体动",两者叠加就是模型的崩溃区。需要两者都动的话,提示词里锁住镜头,让主体动;或者分别拍摄后合成。
那次闪购救了我的生产工作流
下面是双十一那次"9 条素材、6 小时"的具体流程:
第 1 小时:定概念。 写了 4 个 brief 创意概念,每个聚焦一个产品 hero 镜头。绝不脑暴过度。
第 2-3 小时:备图。 用 Midjourney v7 把产品实拍图作为风格参考,生成 12 张 hero 静态图。挑出最好的 8 张,放大到 4K。
第 3-5 小时:Gen-3 批量生成。 每张静态图配 4 种不同镜头运动提示词变体。32 次生成,每次 5 秒、5 个积分。
第 5 小时:筛选和 QC。 抽出通过审核的 9 条(无文字 artifact、产品外观一致、无诡异形变)。首轮可用率 28%,这是诚实数字。
第 6 小时:剪辑、文案和平台格式。 在剪映里加标题,按各平台规格改尺寸(Story 9:16、Feed 1:1、落地页 16:9),上传。
总成本:Runway 积分 137 美元 + Midjourney 24 美元。总时间:6 小时,一个人。
上线后的结果:9 条素材在 48 小时窗口内做到 3.2 倍 ROAS(Return on Ad Spend,广告投资回报率),其中一条(维生素 C 精华的产品主角环绕)一条就贡献了 60% 的转化。这条素材生成花了 4 分钟,成本 0.83 美元。整个 9 条 campaign 在付费流量的前 90 分钟就回本了。
我会告诉初级营销人的判断准则
如果你的 deadline 在 7 天以内,并且概念是产品导向、画面里不需要嵌入文字——用 Runway Gen-3 做限时视频广告。如果 campaign 需要 30 秒叙事、多人主体,或必须画面内带文字,那修 Gen-3 输出的工时成本会超过实拍。
我内部用的判断框架是:Gen-3 是动效工具,不是视频生产工具。它让你的静态图动起来,但它替代不了你的摄影师。做闪购、社媒动态广告、B-roll 背景,它是 10 倍效率杠杆;做品牌大片,它不是。
Runway 未来大概率会补齐这块——Gen-4 据传会推长片段、强化文字——但当下,能用 Gen-3 跑出成绩的营销人,都是清楚地知道自己在哪条车道上的人。如果你的 brief 能浓缩成"让这张产品图动 5 秒、别坏掉",你就跑在正确的车道上。如果 brief 开头是"拍一个 30 秒的叙事讲一个女生的一天",那就不在。