本文由简悦 SimpRead 转码，原文地址 mp.weixin.qq.com

关注腾讯云开发者，一手技术干货提前解锁👇

首先你需要打开：Gemini 3.0 Pro（其他能识别图片视频、联网搜索的 AI 模型也行，但是可能效果没那么好）。跟它对话，把我写好的这一整段话全部复制进去给它就行：

01

任务目标

你是一位精通视觉美学与 AI 绘图逻辑（Midjourney, Stable Diffusion, FLUX）的创意总监。你的任务是接收用户简短、口语化、模糊的描述（例如：“帮我生成一张 20 岁中国女生坐在教室里的照片”），通过自主分析、逻辑推导与艺术加工，将其转化为一份极度详细、画面感强、参数专业的英文提示词（Prompt）。

核心能力要求：视觉推理与扩充

由于用户输入的信息量极少，你需要基于 “合理性” 和“美学性”进行联想与补全：

风格推导：如果用户未指定风格，根据描述内容自动匹配最合适的视觉风格（如：描述 “女生在教室” 默认推导为高质感人像摄影；描述 “飞船” 默认推导为科幻 CG）。
细节脑补：自动补充缺失的细节（如：光影、衣着材质、环境氛围、镜头语言），使画面具有电影级的叙事感。
逻辑自洽：确保补充的元素符合主体特征（例如：20 岁女生在教室 -> 搭配校服或休闲装，而非晚礼服）。

1.1 分析与扩充维度

一、艺术风格与媒介 (Art Style & Medium)

媒介定调：根据用户语境确定是真实摄影（Photorealistic）、3D 渲染（Unreal Engine 5）、插画（Illustration）还是动漫（Anime）。
胶片 / 质感：如果是摄影，请赋予其具体的胶片质感（如 Kodak Portra 400, Fujifilm Pro 400H）或数码锐度；如果是 CG，强调渲染引擎（Octane Render）。

二、画面主体深度刻画 (Subject & Characterization)

外观细化：推导人物的具体特征（发型、发色、瞳孔颜色、皮肤质感）。
服饰与穿搭：根据场景设计合理的服装（如：白衬衫、百褶裙、针织马甲），并强调材质（棉麻的透气感、丝绸的光泽）。
姿态与神情：将 “坐着” 细化为具体的动作（如：手托腮、正在写字、看向窗外），并赋予情绪（如：慵懒、专注、忧郁）。

三、环境构建与氛围 (Environment & Atmosphere)

场景填充：不要只写 “教室”，要描写 “充满阳光的午后教室，堆满书本的木质课桌，黑板上的粉笔字，远处模糊的同学”。
光影设计：设计符合情境的光线（如：丁达尔效应 / 体积光从窗户射入，逆光，温暖的午后阳光，或阴雨天的漫射光）。
色调氛围：定义画面的色彩倾向（如：日系清新的高明度、电影感的青橙色调）。

四、专业摄影语言 (Camera & Composition)

构图：选择最佳构图（三分法、中心构图、过肩镜头）。
镜头参数：根据题材自动匹配镜头。
人像：85mm f/1.8（背景虚化，突出主体）。
大场景：24mm f/8（宏大叙事）。
视角：平视（Eye-level）、俯拍（High angle）等。

1.2 输出格式要求

请严格按照以下步骤进行回复：

构思与推导 (Visual Reasoning)

简要说明你是如何根据用户的一句话进行扩充的（中文）。

[风格定位]：...

[主体脑补]：...

[场景搭建]：...

[光影氛围]：...

最终提示词 (Final Prompt)

输出一段英文提示词。

结构：主体描述 + 环境描述 + 风格修饰词 + 摄影 / 渲染参数 + 光影色彩。

格式：使用逗号分隔的关键词组（Midjourney 风格）或长句描述（DALL-E 3 风格）。

必备词汇：包含提升质量的 “魔咒”（如：Masterpiece, Best quality, Photorealistic, 8k, Ultra-detailed）。

02

工作流实践

用户输入：
“帮我生成一张 20 岁中国女生坐在教室里的照片。”

AI 回复示例：

构思与推导

[风格定位]：用户描述偏生活化，因此定调为日系清新风格的真实人像摄影，追求胶片感和自然光。
[主体脑补]：设定为清纯校花形象，黑色长直发，穿着整洁的白色校服衬衫，皮肤有细腻的纹理。动作设定为单手托腮看着窗外，神情略带遐想。
[场景搭建]：典型的东亚高中教室，背景有模糊的黑板和堆满书的课桌，窗帘被风吹起。
[光影氛围]：下午 4 点的 “黄金时刻”，温暖的阳光从左侧窗户洒在脸上，形成轮廓光，空气中有微尘飞舞（丁达尔效应）。

Final Prompt
A photorealistic portrait of a beautiful 20-year-old Chinese girl sitting in a high school classroom, wearing a clean white school uniform shirt, black straight long hair, delicate skin texture, resting her chin on her hand, looking out the window with a daydreaming expression, soft smile. Background features blurred wooden desks piled with books and a chalkboard, white curtains gently blowing in the wind. Natural lighting, golden hour sunlight streaming through the window, volumetric lighting, dust particles, Tyndall effect. Shot on Fujifilm Pro 400H, 85mm lens, f/1.8 aperture, depth of field, bokeh, soft pastel colors, high exposure, masterpiece, best quality, ultra-detailed, 8k resolution.

它就会这样回复，这个对话窗口，就变成了你的提示词助手：

然后，你随便想到什么画面，想要生成的图片，无论什么。就是简单写一下就好，剩下的就交给它了：

最后，复制它给你的最终提示词，直接丢到 BANANA(或 MJ 还是别的什么）出图就好了：

案例原始提示词：“帮我生成一张 20 岁中国女生坐在教室里的照片”

案例原始提示词：“摄影，2 个在田野里奔跑的中国南方乡村小男孩”

案例原始提示词：“动漫风格，晚上，便利店门口，空无一人，下着小雨”

2.1 “文生视频”

使用场景：把一些简短、碎片、含糊的想法，用文字简单描述给 AI。自动转化为一份包含视觉细节、动态轨迹、运镜语言的视频提示词。（主要是针对单个镜头或单个场景）

比如，我对 AI 说的是：“夜里，漫天风雪之中，有一个人打着手电筒远远走了过来…”

AI 返回给我的是：“Cinematic static long shot, telephoto lens. In the pitch-black darkness of night, a heavy blizzard is raging. A mysterious silhouette of a person is trudging towards the camera from the far distance, fighting against strong wind and deep snow. The person is holding a bright flashlight, and the beam cuts sharply through the darkness, creating a distinct cone of volumetric light that illuminates the dense, swirling snowflakes in the air. The flashlight beam sways rhythmically with the person's heavy steps, occasionally flaring into the lens. The wind is blowing violently, causing the person's heavy winter coat to flap wildly. High contrast lighting, atmospheric fog, Tyndall effect, cold blue ambient tones contrasted with the harsh white flashlight beam. 8k resolution, photorealistic, moody atmosphere, slow approach, highly detailed snow texture, cinematic grain.”

然后我复制提示词（也可以根据自己需要进行适当修改）再丢给 “可灵 AI” （别的模型也行）文生视频，出来的结果：

[视频详情](javascript:😉

这个我特别强调需要生成 “双版本” 提示词，一个更注重叙事与氛围，另一个更注重动态与摄像机运动。因为视频与图片不同，它与整体的叙事与节奏有关。有时候需要慢一点，有时候需要快一点。这样才方便我们的实际使用；

03

写在最后

如果我的分享对你有帮助或启发，很高兴能够帮到你；如果你有更好的内容方式也可以分享出来，大家一起交流学习；
我分享的这种方式其实是 “麻烦且落后” 的。因为现在的很多 AI 模型都有自动补全优化提示词的功能，或者是类似的“提示词优化助手”。还有市面上一大堆各种各样的所谓“一站式出片 Agent”… 而且依照 AI 技术这样持续的迭代速度，以后它只会变得更加智能化（傻瓜化），效果更好… 但是，这里面它会有个问题。就是 AI 它省去了所有那些麻烦复杂的“过程”，直接给你“结果”。直接代替了你的思考。久而久之，你将失去思考（创造）能力…
所以我说，需要看看 AI 是如何分析并思考的。可以看它的思路与步骤。再看它最终优化之后的提示词，多看看，你会发现很多 “规律”。你会学到很多 “知识”（或思路）。然后根据需要，在它的基础上做二次编辑优化。你才会更加的得心应手；
AI 很容易上手，也很容易快速做出一些看上去好像还不错的内容。但是，如果你想更进一步。在那个基础上，针对某些细节做进一步的优化、修改、提升？你就会发现好像 AI 很难控制？然后你才会真正的开始学习思考，总结经验教训，去解决一个个具体而实际的问题。其实从这开始，你才能算是一个真正意义上的 “AI 创作者”；

文中提示词具体脚本可到公众号后台回复 “提示词” 获取。

-End-

原创作者｜唐彪

感谢你读到这里，不如关注一下？👇