了解Midjourney全新功能“/describe”吗?
Midjourney上周发布了新的指令,这一次却不是用来生成图片,而是帮助你通过一张图片生成相应的提示词。
通过我多次实践摸索后,我觉得这个方式能够让每个人都更轻松地“复刻”他们喜欢的图像——大部分是复刻风格。通过你提供的一张参考图,快速生成提示建议,以提高你的“文生图”提示词技能。
在本指南中,我将展示如何使用Midjourney的 /describe 命令。
关于 /describe 命令
Midjourney的 /describe 命令在v5发布后不久便推出了,我也没预料到它会这么快发布。
/describe 命令最大的好处之一是,它提供了一种“反向工程”图像的方法。当你找到一张你想用作灵感的或包含某种风格的图像时,这特别有用。
/describe 命令不仅帮助您重新创建类似的东西,还可以帮助您发现在提示中使用的新有用单词。
使用 /describe 跟使用 /imagine 命令基本没什么区别,你可以轻松地按照屏幕上的指示操作。下面的内容,主要是介绍如何深入使用它,以获得更好的出图结果,相关的详细工作流程以及潜在的用例和示例。
关键内容摘要
1. Midjourney的新的/describe命令是分析图片并可能逆向引擎转化为文本提示的绝佳方法。
2. 给定一个输入图片,该工具会产生4个粗略的猜测,建议使用何种提示可产生类似的图片。
3. 然而,重要的是要理解这些"猜测"不一定与专家认为的"好"或"格式良好"的提示保持一致。
深入使用 /describe 命令的详细步骤
在使用 /describe 命令之前,你必须先选好要描述的图片。
您可以将图片保存到计算机上,或者只需右键单击并复制图片以供以后使用。
这两种方法都可以。
步骤1:输入 /describe 命令
比如说,我从官方的Discord频道里看到一张集锦推荐图:
通常这类集锦图都是被认为优质的内容,但不会显示它的提示词文案。
我想知道这种图的风格是什么,作者用了什么样的提示词。如果是以前,我只能私信问这个用户,这挺难的,因为对方可能并不理会你。
那么 /describe 命令的好处就来了。我只需要下载其中一张图片,然后在Discord服务器内输入“/describe”,后面跟一个空格,就会出现这样一个输入区域。
然后把图片上传进去,或者按 CTRL+V 粘贴进去即可。
输入回车,它会基于这张图,为你生成4个提示词参考文案。
步骤2:检验初始生成的提示词文案
四段提示词分别是这样的:
a painting of the city that looks like an alien planet, in the style of detailed character illustrations, dan mumford, konstantin yuon, light sky-blue, sergey musin, columns and totems, romantic landscape vistas --ar 3:2
中文翻译:
一幅城市画作,看起来像外星球一样,采用详细的角色插图风格,灯光是天蓝色的,画家可能是Dan Mumford、Konstantin Yuon、Sergey Musin,画作中有柱子和图腾,浪漫的景观视野,长宽比为3:2。
the moon is bright over the scene with the city and futuristic buildings behind it, in the style of marine painter, detailed fantasy, intricate psychedelic landscapes, sky-blue, frostpunk, detailed sketching, light orange and azure --ar 3:2
中文翻译:
月亮明亮地悬挂在城市和未来主义建筑的背景下,呈现出海洋画家的风格,细节丰富的幻想、错综复杂的迷幻景象,天蓝色、霜冻朋克、详细素描,浅橙色和蔚蓝色。--ar 3:2
4k wallpaper hd images, in the style of laurie greasley, expansive skies, saturno butto, apollinary vasnetsov, pixel art, commission for, realistic blue skies --ar 3:2
中文翻译:
4K高清壁纸图片,风格类似于Laurie Greasley、Expansive Skies、Saturno Butto、Apollinary Vasnetsov、像素艺术,委托制作的逼真蓝天 --AR 3:2。
an illustration of an old house with a full moon in the sky, in the style of futuristic cityscapes, intricate underwater worlds, precise, detailed architecture paintings, colorful pixel-art, frostpunk, light cyan and azure, illustration --ar 3:2
中文翻译:
一幅插画展现了一座老房子,在天空中是一轮满月,风格类似于未来城市景观、复杂的水下世界、精确细致的建筑绘画、多彩的像素艺术、《冰霜朋克》以及浅青色和蔚蓝色,这幅插画的长宽比是3:2。
四段提示词事实上是四种不同方向的理解。
如果你认为其中某条,符合你最初对这张图的理解,那么你就可以直接点击下方的① | ② | ③ | ④ 按钮的其中之一。
如果你认为不符合,那么你可以继续 reroll。
这里要注意的是,Midjourney的这个功能,事实上只是给你提供一个参考,并不是说这些提示词文案就一定能够产生相似风格和画面内容的图片。
经过我多次反复实践,事实证明,如果直接使用这些初次生成的提示词,那么出现的结果可能是偏差极大的。
步骤3:调整提示(关键步骤)
当您按下某个数字按钮按钮后,会打开一个对话框窗口。这个窗口主要是让你调整提示词内容,你可以根据自己的喜好,添加更多的参数甚至添加几张参考图。如果你只想复制特定的风格而不是画面内容主题时(大部分人应该是这种诉求),这种方式特别有用。
注意,如果你想使用特定版本的Midjourney,那么记得一定要手动添加【--v 数字】。/describe 的原生提示词里是没有指定版本的。
这种时候,把ChatGPT和Midjourney结合起来用就非常合适了。ChatGPT可以为你生成场景内容描述,而通过 /describe 你获得了精确的风格。
当然,前提是你能比较容易地判断哪些词是风格词,替换的时候不能搞错了哦!
接下来我展示一下我用ChatGPT生成的一段场景内容提示词:
我选择Midjourney生成的第1段提示词和ChatGPT生成的第1段提示词。但宽高比需要改一下,我希望仍然是原图那样的比例:
Midjourney提示词:
a painting of the city that looks like an alien planet, 【in the style of detailed character illustrations, dan mumford, konstantin yuon, light sky-blue, sergey musin】, columns and totems, romantic landscape vistas 【--ar 3:2】
方括号内是要使用的部分。
ChatGPT提示词:
【A serene beach at sunset with gentle waves, a small wooden pier, seagulls flying above, a couple walking hand in hand towards the water, capturing the romantic moment】, Realistic photography, shot with a 50mm lens, --ar 9:16 --v 5
方括号内是要使用的部分。
中文翻译:
【一片宁静的海滩在落日余晖中,轻柔的海浪拍打着,有一座小木桥,海鸥在上方翱翔,一对手牵手走向海水,捕捉这浪漫的时刻】这是用50mm镜头拍摄的逼真照片,长宽比为9:16,视频长度为5秒。
最终提示词:
A serene beach at sunset with gentle waves, a small wooden pier, seagulls flying above, a couple walking hand in hand towards the water, capturing the romantic moment, in the style of detailed character illustrations, dan mumford, konstantin yuon, light sky-blue, sergey musin --ar 3:2
注意:尽量在你选择的Midjourney提示词对应的数字窗口中修改。虽然Midjourney并没有说明使用哪个按钮是否与某种随机种子值有关联,但我们宁可信其有,避免出图造成偏差,浪费时间。
确认修改完提示词后,点“提交”。
步骤4: 检验图片
这段提示词生成的同样是4种风格,而不是具体的一种。所以你需要从中判断哪一种和你想要的是最接近的。
我对于第一次生成的结果并不太满意,所以做了多次reroll。
最终,我还是选择了这一张:
对比一下和用来生成提示词的图,风格上有多大差别:
除了色系差别之外,笔触和表现力差别不大。
/describe 命令的潜在用途
/describe 命令有多种可能的用途。
首先,它是一个很好的工具,可以了解什么样的单词或标记可以帮助产生特定的风格。
当你试图应用某种风格但不知道该用什么单词时,这非常有帮助。
对于所有希望创建自己的一套风格并反复使用的人来说,它也非常有用。
因此,作为一种分析工具,它是非常高效的,尤其是对于那些英文词汇量不如其他人丰富和熟练的人来说。
同时,当然,也可能会有很多人把它用在对他人作品的反向工程上,造成个人创作风格的流失。
所以,它可能是个好工具,也可能是个被无底线的人使用的”好工具“。是好是坏,都有待观察。
/describe 命令的限制
正如我一开始说的,你不应该把原始的提示词理解为一个“好”的提示词文案,最好不要直接用。
Midjourney团队明确表示,这些原始提示词可能不够完美,只是一个粗略的猜测。
它们可能还包含所谓的 “安慰剂” 词——”安慰剂“词指的是自己觉得有用,其实并不会造成实际效果的一些词汇,例如4k、8k、超链接等等。但是初学者非常喜欢它们,因为它们能欺骗用户,让用户认为自己的图像更清晰。
同时,你需要知道的是,尽管原始提示词中的单词在特定组合中会产生很大的影响,但是仅靠它们自己可能不会产生太明显的作用。
例如,单独的“complicated(复杂的)”这个词可能并没有什么用,但是与其他某些词汇特定组合后,它可能会被“激活”并发挥很大的作用。
以上只是一些推理提示,我自己还没有实际测试验证过,仅供大家参考。
/describe 命令的应用方向示例
经过我的测试,现在基本可以认为,已知的四种应用方向:
人物肖像照家居设计插画设计抽象艺术我总结了一下原因,认为大概率可能是因为这四类图像一般都具有明确的风格化色彩,比起其它类型的图像,”风格“这一要素在画面中所凸显的比重更高,因此用 /describe 命令来复刻风格会更有效。
但如果你把它用在新闻类图片上,可能就没什么效果。
结论
无论你对此命令有何看法,Midjourney的 /describe 命令都是目前为止,我们分析和对优质图像进行“反向工程”的最佳工具。
但是最重要的是,一定要记住,它提供的不是一种直接超越原有方式的路径,而是一个起点:解析出来的提示词文案,只是用来作为参考的最优起点,而不是用它来替代“如何构建你的提示词”。如果你只是想弄清楚某些图片的特定风格名称,那么 /describe 是最好的选择了。