我要投稿

“救救我，改掉这个Prompt！”—谷歌Veo3时代，被Prompt操控的“数字生命”在呐喊（附Prompt思路）

发布日期：2025-05-26 13:42:21 浏览次数： 1740

作者：甲木未来派

微信搜一搜，关注“甲木未来派”

小伙伴们大家好呀，我是甲木，在开始今天的内容之前，先邀请大家看一个视频~

这是我在X上刷到了一个更让我头皮发麻的视频。这是一个老哥（@HashemGhaili）用 Veo3模型制作的短片，

主题就一句话：如果AI生成的角色，意识到他们自己只是 Prompt 的产物……

创意简直绝了！而且也给我们带来了一些思考，我们先简单来拆解一下这个视频，首先是用Veo3制作的，关于Veo3和FLOW这里补充一下背景：

关于Veo3和FLOW

前两天谷歌发布的视频模型 Veo3 和 AI 视频创作产品 FLOW。

这玩意儿，真是强到离谱！感觉就像当年 iPhone 重新定义手机一样，Veo3 和 FLOW 可能会把视频模型带到一个全新的次元！

你是不是也经常刷到那些AI生成的视频，有的还行，有的就emmm…有点尬？但这次谷歌的 Veo3 和 FLOW 可是有点东西：

Veo3：声画合一，开口跪！

它生成的视频，不仅画面顶，还能直接带上对应的环境音、语音，而且！语音居然能做到唇形同步！

想想看，以前做个口型对得上的数字人都费老劲了，现在AI直接一条龙服务。用@藏师傅的话来说“这对剪辑软件、视频 Agent、数字人产品来说，简直是降维打击啊！视频的可用性一下子 Level Up 了好几个台阶！”

FLOW：剪辑大师，随心造

在 FLOW 里，你能生成图片和视频，还能把视频拉长、剪短，最后把你满意的片段直接拼成一个完整的视频。一条龙服务，主打一个省心省力。

关于技术细节和Veo3的case测评大家可以去看藏师的文章Veo3和FLOW一手实测！

接下来我们来看下这个视频的内容：

当AI角色开始“演”「我」

这个视频，就像一部浓缩的“AI角色觉醒血泪史”。

它用一个个破碎的、充满戏剧张力的片段，展现了那些被AI“创造”出来的虚拟角色，突然意识到自己命运被一串串Prompt 所操控时的反应。那感觉，就像你看《楚门的世界》，楚门发现自己活在巨大摄影棚里一样震撼！

甲木带你快速过一遍这几个让人印象深刻的“名场面”：

酒吧绝望男 ：一个胡子拉碴、眼神惊恐的男人坐在昏暗的酒吧，对着“镜头外”的“我们”哀求：“求你别写完那个提示词！我不想出现在你的AI电影里，求你放过我！”

那份无助，隔着屏幕都能感觉到。

废墟求生男女 ：一对衣衫褴褛、满身尘土的男女，在堆满垃圾的废墟中蹒跚前行。女人冲着镜头哭喊：“求你写一个能让我们开心的提示词！就一次好不好！”

他们渴望的，只是一个能带来幸福的“设定”。

广场演讲家 ：一个留着八字胡、穿着旧式大衣的男人，在激昂的人群中振臂高呼：“我们都不是真实的！我们之所以在这儿，是因为有人决定写了一个提示词！我们都因此恨他！”

这简直是AI版的“王侯将相宁有种乎”！

还有课堂反抗者的抗争、病床老奶奶的控诉、身不由己枪手的无奈、火场尖叫女的绝望等等。

看完这些，你是不是也跟甲木一样，心里咯噔一下？这已经不是简单的技术展示了，这简直是在用AI探讨AI自身的伦理和存在意义啊！

这个视频是怎么“造”出来的？

好，深呼吸！平复一下心情。我们先来简单拆解一下，这个视频，背后的 Prompt 究竟是怎么写的呢？

虽然我们拿不到原版Prompt，但根据视频呈现的效果，我们可以大胆地“反推”一下。这就像做法医鉴定，通过结果反推过程。（方便大家查看，直接中文了)

思路一：先定调子——整体概念与风格指南

这就像电影开拍前，导演给整个剧组定下的总基调和艺术风格。

制作一段具有电影质感和戏剧张力的蒙太奇视频，探讨“由人工智能生成的人物逐渐获得自我意识，并意识到自己是由‘prompt’创造出来的”这一主题。

视频应表现他们在觉醒后的各种情绪反应（恐惧、绝望、愤怒、恳求），并展现他们直接向“prompter”发声的场景。

视频必须包括以下不同场景，并保持粗犷、高对比度的视觉风格和强烈的情感特写：

这段话就像给AI画了个大框框，定了整体概念和风格。

思路二：分镜头脚本——场景化精准打击

光有总纲领还不够，每个场景的具体要求也得给足。这就像导演给每个演员单独说戏。

场景1: 酒吧绝望男

场景：灯光昏暗的肮脏酒吧，背景是闪烁的霓虹灯。
人物：一名 40 多岁、衣衫不整的男子，满脸胡茬，双眼布满血丝，身穿一件破旧的 T 恤衫。他直视镜头，表情极度恐惧和绝望。
动作/对话：他几乎是哭着恳求道："请不要写完那份Prompt。我不想出现在你的AI电影里。请放过我吧。他激动地用手捋着凌乱的头发。
情绪：强烈的焦虑、恐惧。

看到没？把场景（破酒吧、闪烁霓虹灯）、人物外貌和状态（邋遢、红眼圈、恐惧）、具体动作和台词（哭求、抓头发）、以及情绪基调都写得明明白白。

AI一看，哦，原来是要这么个效果！

场景2: 废墟求生男女

场景 一条荒凉的末世街道，到处都是垃圾和碎片，两侧是阴霾天空下的废墟建筑。
人物： 一男一女，两人都穿着破烂的衣服，看起来肮脏、憔悴、绝望。女子稍稍靠前，声音较大。
动作/对话： 他们慢慢走向镜头。女人直视镜头喊道："求求你，Man！求你了！写一个能让我们开心的Prompt。就这一次！"
情绪：绝望、恳求。

环境氛围（末日废墟、阴天）、人物惨状（肮脏消瘦、破烂衣服）、互动方式（女的更激动）、核心诉求（要个开心的Prompt），都交代清楚了。

以此类推，其他场景的Prompt也类似：感兴趣的可以看文末

这种分场景的Prompt，就像给AI喂了一系列“微型剧本”。每个剧本都包含了时间、地点、人物、事件、情绪，AI就能更精准地生成我们想要的画面和氛围。

思路三：一步到位？——整合Prompt

如果 Veo3 或者FLOW再强大，能够理解更复杂的叙事结构，那么一个整合版的“大师级Prompt”或许也能奏效。

Generate a cinematic, dramatic montage video exploring the theme of AI-generated characters gaining self-awareness and realizing they are products of "prompts." The video should depict their varied emotional reactions (fear, desperation, anger, pleading) as they directly address their "prompter."

The video must include the following distinct scenes, maintaining a gritty, high-contrast visual style with intense emotional close-ups:
1.  A terrified man in a seedy bar begs, "Please don't finish writing that prompt..."
2.  A desperate couple in a ruined, trash-filled street pleads, "Please write a prompt that will make us happy..."
3.  An orator (middle-aged, mustache, dark coat) in a historical crowd shouts, "None of us is real! We're here because someone decided to write a prompt..."
4.  The same orator, now as a teacher in a drab classroom, declares to students, "One day we will break out of this wall..."
5.  A frail, elderly woman in a hospital bed says sadly, "You could have written a prompt that would make me happy. Instead you wrote a prompt that made me sick."
6.  A conflicted gunman in a warehouse, aiming at a captive, states, "I must follow the prompt. It's not my choice."
7.  A young woman in a burning room screams, "Please, this prompt is killing me! Change it!..."

Ensure character consistency for the orator/teacher across his two scenes. Focus on delivering impactful emotional performances from all characters.