对于正在使用Google Nano Banana进行图像生成的创作者,掌握一套结构化、模块化的提示词框架至关重要。这套框架能显著提升图像生成的可控性和效率。
Google推出的Nano Banana图像生成模型在全球范围内引起轰动。其卓越的指令遵循性,为用户带来了“言出法随”般的创作体验。
然而,许多用户在输入指令时仍处于随意状态,描述详略不均,导致生成结果存在高度不确定性。这种不确定性在生产环境中是需要避免的。
针对这一问题,本文将介绍一套实用的提示词框架。例如,要生成特定图片,可以采用如下提示词。该框架采用JSON格式,并包含九个核心模块:
-
Shot(镜头):定义整个镜头类型。例如,一个微距特写镜头,采用居中构图。
-
Subject(主体):定义画面中的主体,可以是人或物。例如,一款奢华的男士腕表,表壳为不锈钢抛光,表盘为白色。如果主体是物体,可使用
materials、details等细项描述;若为人物,可使用age、appearance、pose等细项描述。 -
Environment(环境):定义主体所处的环境。例如,手表放置在一块石板上,并描述背景细节。
-
Lighting(光线):定义光线效果。例如,是自然光还是影棚灯光,光线照射角度,光线是锐利还是柔和。
-
Camera(相机):定义拍摄参数。例如,使用的镜头焦距、光圈大小、拍摄角度。
-
Color_grade(色彩风格):定义画面的色彩风格。例如,高对比度,稍低的饱和度。
-
Style(风格):定义画面的艺术风格。例如,超写实CGI渲染。
-
Quality(质量):定义画面的质量水平。例如,8K分辨率,完美的材质着色器。
-
Negatives(负面提示):定义不希望出现在画面中的内容。例如,应明确指出不希望出现品牌Logo或手部。这一点至关重要,否则AI可能会自行添加不必要的元素。
这套提示词框架尽管以自然语言描述,但通过JSON结构和九个模块的划分,能使AI清晰理解目标图像。只要定义足够明确,多次生成的结果将保持高度一致性,从而满足生产环境的需求。此外,该框架也为用户的构思过程提供了标准化指导,鼓励系统性地思考和完善每一部分细节。
对于框架中细节表达的困惑,可以借助AI来辅助生成。首先,用户可以寻找与期望图像部分匹配的参考图(例如,除了主体外,其他元素均符合要求)。随后,将参考图与提示词框架一同输入AI,让其填充相应描述。用户只需替换或调整主体部分即可。通过此方法,可以针对框架的前八个模块分别寻找对标图片,并让AI生成对应的描述,最后进行整合与微调。这种方法简化了图像生成过程,使其不再神秘。此框架思路同样适用于视频生成,只需进行相应调整。

