Skip to content

Latest commit

 

History

History
7327 lines (3664 loc) · 281 KB

File metadata and controls

7327 lines (3664 loc) · 281 KB

AI 绘画特训 202312

来源:remhu1p2pr.feishu.cn/docx/CsA4dVyDZoPuFqxuTEycZSJDnvg

12 月航海 | AI 绘画特训 | 实战手册

建议:如果需要快速定位到精确内容,可以使用快捷键 Ctrl + F/command + F 的形式,搜索「关键字/词」,查找你想要的内容。

写在前面

💡Hi,

欢迎大家来到 12 月航海 | AI 绘画特训 | 实战手册,相信在接下来的日子里,我们将在这里见面很多次。

为什么要学 AI 绘画?

理由很简单:

第一,AI 绘画目前的能力,能让一个没有专业绘画能力的人,也能挑战资深原画师,做出有设计感的图片。

第二,现在 AI 绘画在全球已经有了非常良好的开源生态。什么意思?良好的开源生态,也就意味着能让更多 AI 从业者能够自由地探索、创新,打造出成熟的应用和盈利模式。而且这个速度只会越来越快。一句话来说,AI 绘画,来路清晰,前路已通。所以,此时不下场,更待何时呢?

如何学习 AI 绘画?

AI 绘画的玩法迭代的非常快,我们这本航海手册,也跟着时代的步伐迭代了非常多新内容,希望大家可以通过以下几点了解,如何更好使用本手册:

1.本手册分为必修篇和选修篇两部分。

1.必修篇,我们会通过 14 个实操作业,让你掌握国内外两款主流工具“文心一格”、“MidJourney”的使用方法。并且学会写提示词,变成一名合格的 AI 提示词工程师。

2.选修篇,会为教你更多 AI 绘画工具,让你能更自由地表达创意。同时还会总结目前市场上存在的,各类 AI 绘画应用和变现案例。感兴趣的同学,一定不要错过了。

1.另外,检测自己是否已具备 AI 出图能力,最好的办法就是把图片发出来。所以在【复盘优化】检测 AI 绘图能力,我们为大家提供了「AI 绘画+小红书笔记」的模板,这是本次「AI 绘画+自媒体航海」的重点。

希望你在航海的过程中,多动手、多提问、多交流。AI 绘画是个“手艺活”,需要大量的训练才能变的专业。祝愿大家在这次航行里不仅收获成果,还能结识一群战友。

以下内容由生财有术联合圈友制作而成,仅供航海船员以及生财有术星球圈友学习使用。

同时也欢迎圈友们在实践过程中持续反馈,和我们共同完善,提供修改建议~

【更新提示】新手册使用方式

在开始前,我们来简单了解一下这个手册的正确打开方式,方便你根据自己的情况来灵活使用。

在这里,手册整体的步骤顺序是按照从 0 - 1 跑通一个 AI 绘画项目进行的,你可以参考航线图,按顺序开始实操。也可以根据自己的实际需求选择性阅读。

需要注意的是:本次手册相较于过往航海,进行了较大的改版。之前的手册尽可能的展示更多可能的玩法供大家自由选择,本次改版后的手册,分为【必修】和【选修】两个大的章节:

必修篇内容:为该项目从 0 到 1 掌握 AI 绘画的所有步骤,即航线图对应行动路径。如果你还在前期摸索中,想先完成一次整体的项目流程,那么建议从必修篇开始认真阅读和实操,不在玩法选择上做过多的纠结。

选修篇内容:则为该项目的更多玩法、案例和项目放大等相关内容。如果你已经掌握了 AI 绘画,想进一步了解该项目的更多可能,获得灵感,那么选修篇一定不要错过。

必修篇:学会 AI 绘画,并能简单应用

💡 必修篇概要

在必修部分,我们会学习“文心一格”和“Midjourney”这两款工具的使用方法,并学会通过“文生图”、“图生图”等方式,生成一些常见的图片,比如海报、艺术字、头像、表情包。

掌握了这两款工具之后,我们还会教大家如何提升出图的质量,即通过优化提示词的方式实现。

具体一共包括这几个章节:

一、【项目概述】了解 AI 绘画

二、【项目实操 1/3】学会用文心一格完成 AI 绘画

三、【项目实操 2/3】学会 MidJourney 完成 AI 绘画

四、【项目实操 3/3】提升 AI 绘图能力——描述词

五、【复盘优化】检测 AI 绘图能力

你可能已经想到了,这幅画就是出自 AI 之手。这意味着 AI 已经能画出符合大众审美的作品,也在一定程度上,通过了绘画的“图灵测试”。那这种用技术的原理是什么?

举个简单的例子。你想象一下,你有一个非常聪明的朋友,他看了成千上万本关于绘画的书,学习了各种画家的风格和技巧。现在,无论你要求他画什么风格的画,他都能够根据他所学到的知识来创作。

AI 绘画正是这样一个过程,其中的“朋友”就是高度发达的 AI 算法。这些算法通过深度学习和神经网络技术,分析和学习大量的艺术作品,从而能够自主地创造新的艺术作品。

写实

漫画

国泰君安最新的研究报告预测,接下来的五年里,AI 绘画在图像内容生成这块的市场份额能达到 10%到 30%之间,市场规模甚至可能超过 600 亿人民币。

在艺术创作上,AI 绘画也是功不可没。它能迅速制作出大量的艺术作品,无论是风格、构图还是色调,都能跟人类艺术家的作品媲美。它不仅给艺术家们带来了新的创作工具,还可能成为未来艺术表达的一种新方式。

另外啊,AI 绘画在广告制作、影视制作、游戏设计等领域也展现出了极大的潜力。有些游戏公司甚至开始用 AI 绘画来替换游戏里的美术内容,这样不仅效果好,成本还能大大降低。而这些,都只是 AI 绘画潜力的冰山一角。

正因为如此,掌握 AI 绘画技能变得越来越重要。那么,怎样才能快速的入门这一技术呢?大家认真参加完本次航海就可以。

本次航海你具体可以获得什么:熟练掌握各大 AI 绘画软件

熟练掌握各大 AI 绘画软件

本次航海,我们给大家准备了各类 AI 工具的操作方法,从简易到专业,从国内到国外。你可以在 21 天 的学习中,驾驭和精通主流的 AI 绘画软件。

提高职场竞争力

在必修部分,我们设置了文生图、图生图、AI 海报、AI 艺术字、AI 表情包、AI 头像、AI 梗图一共 7 类 AI 作品。大家可以通过这一部分的学习,掌握 AI 绘画最基础的实用操作,变成一个会用“ AI 绘画”的人。真真正正的掌握 AI 绘画的各种技能,让 AI 成为你寻求高薪工作,升职加薪的必备利器。

找到一些 AI 兼职机会,赚取时代红利

我们在选修部分,给大家准备了 22 种 AI 绘画的落地和变现项目,从 T 恤、帆布袋、马克杯的制作,到插画、包装、logo 的设计,都有涉及。学有余力的同学,可以在里面找到一些自己感兴趣的项目,结合自身的资源和优势,尝试变现。

总而言之,这次 AI 绘画航海,是一门为 AI 绘画祛魅的课程,我们的初衷就是为了让每一位对 AI 绘画感兴趣的朋友,轻松快速的实用起来,做出自己想要的图。

🔥对于新手来说,建议先用国内工具,比如国内小程序或网站,其次 MidJourney,其次 SD🔥

国内工具能够辅助大家理解 AI 绘画的出图逻辑,在你有了一定认知和经验后,再使用 MidJourney 或 SD,能获得更流畅的出图体验。如果上来直接尝试 MidJourney 或 SD,很有可能直接被吓退。

一、【项目概述】了解 AI 绘画 @来来 【新增】

1.1 什么是 AI 绘画?

2022 年 9 月,在被落基山脉环抱的科罗拉多州,一幅名叫“太空歌剧院”的作品,在一个艺术比赛中,获得了 1 等奖。

你可能已经想到了,这幅画就是出自 AI 之手。这意味着 AI 已经能画出符合大众审美的作品,也在一定程度上,通过了绘画的“图灵测试”。那这种用技术的原理是什么?

举个简单的例子。你想象一下,你有一个非常聪明的朋友,他看了成千上万本关于绘画的书,学习了各种画家的风格和技巧。现在,无论你要求他画什么风格的画,他都能够根据他所学到的知识来创作。

对于之前没有任何绘画基础的人来说,你现在不需要经过 1 万小时的刻意训练,就能画出自己的漫画头像,DIY 设计自己的马克杯、T 恤、手机壁纸。

对于有一定基础的从业者,比如设计师,也可以通过 AI 绘画,提升工作效率。在老板说出“五彩斑斓的黑”的需求的时候,你可以通过 AI ,提前给老板样稿,对齐思路,节省后续的沟通和修改。

总的来说,AI 绘画是一个非常先进且充满创意的领域,它通过人工智能技术,让计算机不仅能够理解艺术,还能创造艺术。随着技术的进步,我们可以期待看到更多令人惊叹的 AI 绘画作品。

下面这些图,都是 AI 绘画工具生成的。

漫画

1.2 AI 绘画为什么现在那么火?

AI 绘画的火热,很大的一个原因是它应用比较广泛。目前基本上各行各业都用的上它,以下三个行业的案例,图片均为 AI 生成。

国泰君安最新的研究报告预测,接下来的五年里,AI 绘画在图像内容生成这块的市场份额能达到 10%到 30%之间,市场规模甚至可能超过 600 亿人民币。

在艺术创作上,AI 绘画也是功不可没。它能迅速制作出大量的艺术作品,无论是风格、构图还是色调,都能跟人类艺术家的作品媲美。它不仅给艺术家们带来了新的创作工具,还可能成为未来艺术表达的一种新方式。

另外啊,AI 绘画在广告制作、影视制作、游戏设计等领域也展现出了极大的潜力。有些游戏公司甚至开始用 AI 绘画来替换游戏里的美术内容,这样不仅效果好,成本还能大大降低。而这些,都只是 AI 绘画潜力的冰山一角。

正因为如此,掌握 AI 绘画技能变得越来越重要。那么,怎样才能快速的入门这一技术呢?大家认真参加完本次航海就可以。

本次航海你具体可以获得什么:熟练掌握各大 AI 绘画软件

熟练掌握各大 AI 绘画软件

本次航海,我们给大家准备了各类 AI 工具的操作方法,从简易到专业,从国内到国外。你可以在 21 天 的学习中,驾驭和精通主流的 AI 绘画软件。

提高职场竞争力

在必修部分,我们设置了文生图、图生图、AI 海报、AI 艺术字、AI 表情包、AI 头像、AI 梗图一共 7 类 AI 作品。大家可以通过这一部分的学习,掌握 AI 绘画最基础的实用操作,变成一个会用“ AI 绘画”的人。真真正正的掌握 AI 绘画的各种技能,让 AI 成为你寻求高薪工作,升职加薪的必备利器。

找到一些 AI 兼职机会,赚取时代红利

我们在选修部分,给大家准备了 22 种 AI 绘画的落地和变现项目,从 T 恤、帆布袋、马克杯的制作,到插画、包装、logo 的设计,都有涉及。学有余力的同学,可以在里面找到一些自己感兴趣的项目,结合自身的资源和优势,尝试变现。

总而言之,这次 AI 绘画航海,是一门为 AI 绘画祛魅的课程,我们的初衷就是为了让每一位对 AI 绘画感兴趣的朋友,轻松快速的实用起来,做出自己想要的图。

1.3 如何选择 AI 绘画软件?

🔥对于新手来说,建议先用国内工具,比如国内小程序或网站,其次 MidJourney,其次 SD

国内工具能够辅助大家理解 AI 绘画的出图逻辑,在你有了一定认知和经验后,再使用 MidJourney 或 SD,能获得更流畅的出图体验。如果上来直接尝试 MidJourney 或 SD,很有可能直接被吓退。

1.3.1 常用海外 AI 绘画软件

市面上有三款最常用的海外 AI 绘画软件,分别是 DALL·E 3,Midjourney,Stable Diffusion。

💡

这三个软件的功能是所有 AI 绘画软件中最强大的,但是需要一个特殊的网络。必修篇我们以 Midjourney 来实操,选修篇可以选学 Stable Diffusion 作为技能提升。

下面我们就简单的介绍一下这三款软件,帮助你理解它们各自的优势和特点,从而更好地选择适合自己的工具。

1.3.1.1 DALL-E 3

使出图网站: www.ChatGPT.com

出图网站: www.ChatGPT.com

详细教程:与 chatgpt 使用方法一致,需要付费使用 GPT 4 版本才能使用 AI 绘画功能,GPT3.5 的免费版本没有 AI 绘画功能,需要进行引导才能做出你想要的内容。且 gpt 对自然语言理解能力比较强,对英文字母的识别效果也比较好。

1.3.1.2 MidJourney

使用门槛:付费订阅才能使用

出图网站:www.MidJourney.com

详细教程:三、【项目实操 2/3】学会用 MidJourney 完成 AI 绘画

MidJourney 是一个超强大模型(闭源)系统。除核心团队外,没有人知道这个系统的代码,不知道它是怎么训练出来的。

它极强,发展到现在,很简单的描述就可以有很不错的效果。操作界面简单,完成前置操作后,只需要聊天栏打字即可生成图像。

比如

就会出现如下的图片:

更多详细使用命令和参数,可以跳转后文三、【项目实操 2/3】学会用 MidJourney 完成 AI 绘画或阅读该精华帖:《行动起来,就会有好事发生(附 AI 绘画万字长文)》

1.3.1.3 Stable diffuison

使用门槛:界面复杂,新手上手较困难,如果是本地版,因为开源,所以免费,但是对电脑配置有要求(后文【Stable diffusion 安装使用细节】中会提到)

出图网站:需要下载安装到本地,或者使用其他人简化开发好的软件、小程序。

模型开源信息网址:https://github.com/AUTOMATIC1111/stable-diffusion-webui

详细教程:选修篇 6.6【国外工具】学会用 Stable Diffusion 完成 AI 绘画

MidJourney 和 Stable diffuison 我们一般简称 MJ 和 SD,它们是本次 AI 绘画航海中,我们主要会讲的两大工具。

1.3.1 常用海外 AI 绘画软件

市面上有三款最常用的海外 AI 绘画软件,分别是 DALL·E 3,Midjourney,Stable Diffusion。

💡

这三个软件的功能是所有 AI 绘画软件中最强大的,但是需要一个特殊的网络。必修篇我们以 Midjourney 来实操,选修篇可以选学 Stable Diffusion 作为技能提升。

下面我们就简单的介绍一下这三款软件,帮助你理解它们各自的优势和特点,从而更好地选择适合自己的工具。

1.3.1.1 DALL-E 3 使用门槛:付费订阅才能使用

使用门槛:付费订阅才能使用

出图网站: www.ChatGPT.com

详细教程:与 chatgpt 使用方法一致,需要付费使用 GPT 4 版本才能使用 AI 绘画功能,GPT3.5 的免费版本没有 AI 绘画功能,需要进行引导才能做出你想要的内容。且 gpt 对自然语言理解能力比较强,对英文字母的识别效果也比较好。

1.3.1.2 MidJourney

使用门槛:付费订阅才能使用

出图网站:www.MidJourney.com

详细教程:三、【项目实操 2/3】学会用 MidJourney 完成 AI 绘画

MidJourney 是一个超强大模型(闭源)系统。除核心团队外,没有人知道这个系统的代码,不知道它是怎么训练出来的。

它极强,发展到现在,很简单的描述就可以有很不错的效果。操作界面简单,完成前置操作后,只需要聊天栏打字即可生成图

就会出现如下的图片:

更多详细使用命令和参数,可以跳转后文三、【项目实操 2/3】学会用 MidJourney 完成 AI 绘画或阅读该精华帖:《行动起来,就会有好事发生(附 AI 绘画万字长文)》

1.3.1.3 Stable diffuison

使用门槛:界面复杂,新手上手较困难,如果是本地版,因为开源,所以免费,但是对电脑配置有要求(后文【Stable diffusion 安装使用细节】中会提到)

出图网站:需要下载安装到本地,或者使用其他人简化开发好的软件、小程序。

但相应地,Stable diffuison 对描述词有很高的要求。不同的描述词搭配不同的模型,图片的风格也会有天差地别。如【1girl+二次元模型】,就是一张二次元的女孩图片;【1girl+真人模型】,出来的就是 3D 真人图片。

Stable diffuison 的用户操作界面如下图,原页面是纯英文,此处已做汉化:

MidJourney 和 Stable diffuison 我们一般简称 MJ 和 SD,它们是本次 AI 绘画航海中,我们主要会讲的两大工具。

1.3.3 常用国内 AI 绘画软件

国内的 AI 绘画软件,主要有两种,一种是基于 MidJourney 设计的,另外一种是基于 SD 。它们几乎没有什么使用门槛,只是有些功能需要付费才能使用。

1.3.3.1 基于 MidJourney 的国内软件

百度文心

百度文心一格:https://yige.baidu.com/

百度的 ERNIE-ViLG 文生图体验(可以在微信端体验):https://wenxin.baidu.com/moduleApi/ernieVilg

微信小程序

如,MEWX AI、小狸猫

MEWX AI 教程👉《选修篇 6.1【国内工具】学会用 MEWX AI 完成 AI 绘画》

Vega AI

网页:https://rightbrain.art/

Vega AI 教程👉《6.2【国内工具】学会用 Vega AI 完成 AI 绘画》

无界 AI

网页:https://www.wujieai.com/

Tiamat

https://tiamat.world/ 微信小程序 Tiamat 暂时没有网页端盗梦师

盗梦师

西湖大学心辰科技 (网页端和小程序):https://www.printidea.art/

1.3.3.2 基于 SD 的软件

即时 AI

基于 SD 的图生图插件:https://js.design/

意间 AI

网页:http://yjAI.AI-galaxy.com/

造梦日记

https://zmrj.art/print

6pen

https://6pen.art/generate

如果你想尽快上手 AI 绘画,可以先尝试“文心一格”,作为国内小程序,他的出图操作更加简单;但如果你想要探索更多更广阔的 AI 绘画世界,MidJourney 与 Stable diffuison 是必须了解的两大工具,关于它们的使用方法,我们本次航海都有介绍。

二、【项目实操 1/3】学会用文心一格完成 AI 绘画 @来来(新增)

💡

章节概要

AI 绘画是今年最热门的话题之一,从最初受到人们讽刺和嘲笑,到引起众多数字插画家的抗议,再到人工智能绘画不断迭代升级,事实告诉我们,人类在人工智能面前有多么“不堪一击”。

相信很多圈友都在今年的“热潮”中尝试过 AI 绘画,但由于工具门槛高,或者操作复杂,没有坚持下去。所以我们航海的第一个工具,就选取了操作极其简单的“文心一格”,来帮你破除 AI 绘画很难的错误认知,快速驾驭 AI。

如果已经体验过文心一格的同学,想要挑战一下更高难度的 AI 绘画,不如直接跳过这部分,开始学习 MJ 的教学内容!

按软件照功能来分,我们具体有这几个部分:

文心一格(入门篇)

AI 创作(文生图)

AI 创作(图生图)AI 海报

AI 海报

AI 艺术字

文心一格(进阶篇)

涂抹消除

涂抹编辑

图片叠加

图片扩展

提升清晰度

人物动作识别再创作

线稿识别再创作自定义模型

自定义模型

文心一格(应用篇)

制作一套可爱表情包

制作专属卡通头像

相信学习完本章节,你就不再是 AI 绘画小白了,快开始学习吧。

💡

本章航线图

完成本章节的学习和实操,即可完成航线图的 第一阶段:掌握文心一格的使用方法,完成 6 组出图(约 3-5 天)

用文生图,用元旦主题,创作 4 种风格的图(约 30-60 分钟)

用图生图,用冬至主题,创作 4 种风格的图(约 30-60 分钟)

用 AI 海报,用元旦主题,创作 1 组海报(约 30-60 分钟)

用 AI 艺术字,用新年主题,创作 1 组海报(约 30-60 分钟)

5.给自己做一个卡通头像(约 1-1.5 小时)

给自己做一个卡通头像(约 1-1.5 小时)

制作一套表情包(约 1-1.5 小时)

那么现在,就请开始完成这几个步骤吧。

2.1 了解文心一格

“文心一格”是百度推出的 AI 作画产品。依托飞桨、文心大模型的技术创新,只需输入文字描述,就能快速生成各种风格的精美画作。

它既能为画师、设计师等视觉内容创作者启发灵感,辅助艺术创作,又能为媒体、作者等文字内容创作者提供高质量、高效率的配图,更能让每一个人都展现个性化格调,享受创作的乐趣。即使完全没有绘画经验,也可以在文心一格画出无限创意。

在文心一格,你只需输入自己的创想文字,并选择期望的画作风格,即可快速获取由一格生成的 AI 画作。它支持唯美二次元、艺术创想、国风、油画、水彩、水粉等多种不同风格高清画作的生成,支持不同画幅。你可以在电脑网页端,手机浏览器端,微信小程序端访问。

2.2 文心一格(入门篇)一文心一格共有三大类功能:

一文心一格共有三大类功能:

AI 创作:支持输入中英文描述词,可以实现“文生图”、“图生图”、海报、艺术字制作

AI 编辑:方便外扩图片,提升图片清晰度等功能

AI 实验室:支持人物姿势识别,线稿上色功能,自定义模型功能

我们下面就依次带大家学习这些功能。

2.2.1 AI 创作(文生图)

“文生图”这个概念其实很直观:就是你给 AI 一段文字,它就能根据这些文字帮你画出对应的图。

不管你要竖的、方的还是横的图,它都能搞定。这特别适用于那些需要配图的地方,像是小红书的封面啊,微信公众号的图啊,都可以轻松利用“文生图”来丰富和美化你的内容,为你的创意提供无限可能。

2.2.1.1 功能入口

💡

网址:https://yige.baidu.com/creation?mode=0

2.2.1.2 操作演示

下面以古风为主题出一张图,带着大家看下如何使用文生图来创作。

我这里输入的描述词是:

一个听摇滚带着炫酷耳机的嫦娥,面容唯美

第二步:调整参数,点击生成

我们可以调整画面的参数,主要有:画面类型、比例、数量。

画面类型:这是影响最终画面的主要因素。点击更多,有多种画面风格供选择,如果你是“选择困难症”可以首选“智能推荐”,用过的朋友都说好!

比例:选择期待生成的画作比例,竖图,方图,横图三选 1。

数量:选择生成的画作数量,单次最多可以生成 9 张哦。

参数设置好,我们点击最下方的“立即生成”,就能生成图片啦。

💡

对应航线图任务:请以元旦为主题,创作 4 种不同风格的图片

另外,想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

💡

网址:https://yige.baidu.com/creation?mode=1

2.2.2.2 操作演示

第一步:上传参考图

点击“AI 创作”-“自定义”。在左下方,有个区域可以上传我们的图片。

第四步:选择 AI 画师

这里的“AI 画师”,我们可以简单理解为图片的风格。

创艺:对真实照片效果不明显,就是做了柔光滤镜。

二次元:擅长真人变动漫。

具象:在保留画面的情况下添加细节。

💡

对应航线图任务:请在网上找到冬至主题的图片,以图片为参考图,创作 4 张不同风格的冬至主题图片。

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

2.2.3 AI 海报

这里的“排版布局”,代表的是主体的位置。

我们这里选择了“横版”-“左侧布局”,把狮子放在了左侧。

第二步:输入描述词(背景和主体,一共两段)

这里我输入的是:我给你整理了一些描述词和样图,你可以参考一下:

我给你整理了一些描述词和样图,你可以参考一下:

💡

对应航线图任务:请以元旦为主题创作 4 不同风格的海报,横版竖版均可

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

第一步:输入文字

我们可以输入中文或者英文(中文支持 1~5 个汉字,字母仅支持 1 个字母)。在这里,我们输入“生财”两个字。

第二步:选择字体布局

可以选择默认。自定义里面的功能也好理解,大家可以自己看着调整。

💡对应航线图任务:请以新年为主题汉字,创作 1 组艺术字海报,横版竖版均可

对应航线图任务:请以新年为主题汉字,创作 1 组艺术字海报,横版竖版均可

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

2.3 文心一格(进阶篇)

💡

小节概要

在之前的小节中,我们学习了使用“文心一格”来创建基本的 AI 图像,如“文生图”、“图生图”、“海报”和“艺术字”。通过这些学习,相信大家已经掌握了与 AI 交流的基础技巧。

下一小节,我们将深入探索 AI 绘画的进阶技能。例如,当我们想要对生成的图像进行局部调整时,应该怎么操作?或者,如何扩展已生成的图像,使其在前后左右方向上更大?这些进阶技巧,我们将在接下来的章节中详细讲解。这样,你就能更全面地了解和运用 AI 绘画技术。

除此之外,我们还会介绍一下“文心一格”独特的“一格实验室”。它里面有很多有趣的功能,比如说“识别人物的动作”,根据图像提取“线稿图”等等。

我们具体会分这么几个部分:

2.3.1 AI 编辑

涂抹消除

涂抹编辑

图片叠加

图片扩展

提升清晰度

2.3.2 一格实验室

人物动作识别再创作

2.3.1 AI 编辑

“AI 编辑”相当于一个在线的 PS 软件,它可以帮你实现很多改图需求。

无论是涂抹编辑修图去 BUG、一键改图换主体、还是利用图片叠加功能,实现图片风格和主体的快速融合,它都可以实现!

2.3.1.1 涂抹消除

我们先来看看“涂抹消除”。这个功能可以让我们对不满意的地方进行消除并重绘。

2.3.1.1.1 功能入口

💡

多余的尾巴被擦除了,原图没有一点损失,很好使。

第二步:用画笔涂抹你想编辑的地方

是不是感觉还不错?

2.3.1.3 图片叠加

除了擦除重绘,我们还能将两张图片进行融合,生成新的图片。这张图片,将同时具备两张图片的特征

2.3.1.3.1 功能入口

💡

网址:https://yige.baidu.com/creation?edit=3

2.3.1.3.2 操作演示

我们需要设置 3 个参数:

影响比例:这个值代表基础图和叠加图的影响权重(比例可参考:基础图 70%;叠加图 30%)

描述词:我们需要描述一下,融合后的内容是什么样的(这里我的描述词是:复杂的汽车,未来科技感,儿童绘本风格,卡通,绘本,明亮)

尺寸:选择画作尺寸和对应数量,点击立即生成即可。

2.3.1.4 图片扩展

另外,“文心一格”还提供了图片扩展功能,允许用户在上下左右四个方向扩展图像,扩展完以后,它能帮你智能填充背景,甚至补充人物。

下面我们来实际操作一下。

2.3.1.4.1 功能入口

💡

网址:https://yige.baidu.com/creation?edit=0

2.3.1.4.2 操作演示

我们一起来看看扩展之后的图片:

2.3.1.5 提升清晰度💡

💡

网址:https://yige.baidu.com/creation?edit=4

2.3.1.5.2 操作演示

和图片拓展一样,选择要编辑的图片,然后点击提升清晰度,选择清晰度标准,点击立即生成即可。

2.3.2 一格实验室

除了 AI 编辑可以对图片进行编辑,文心一格特有的“一格实验室”也提供了很多有用的好功能,我们来看看。

2.3.2.1 人物动作识别再创作

你可以上传一个人物动作的参考照片,然后它就能根据这张照片创造出同样动作的新图片。这对于那些想要模仿某个动作却不懂怎么画的朋友们来说,简直太方便了。

2.3.2.1.1 功能入口

💡

2.3.2.2 线稿识别再创作

用这个功能,你能通过参考图,生成一张线稿相近,但是风格不同的图片。比如你可以把一只素描的兔子,变成一只油画的兔子。

2.3.2.2.1 功能入口

💡

网址:https://yige.baidu.com/lab/common/lab_line

2.3.2.3 自定义模型

“自定义模型”简单理解,就是形成你自己的 AI 绘画风格。我们来一起看一下,具体怎么做。

2.3.2.3.1 功能入口

💡

网址:https://yige.baidu.com/lab/training

2.3.2.3.2 操作演示

我们用二次元人物训练来举个例子:

图片中的二次元人物需要确保为同一个人,画质清晰,最少 5 张。同时,建议为你的人物取个名字作为标记(比如:大福)。

注意:上传训练图片集,图片的画风需要色调、笔触、风格尽量一致,画质清晰。

第二步:设置迭代步数和学习率档位

设置迭代步数和学习率档位,配置用于验证的 prompt,一次可以配置 5-10 个哟;prompt 中带入之前给人物取名的标记词,强调该人物出现在画面中。

第三步:等待模型训练

您训练的模型一般需要 30-120 分钟完成,完成后您可以查看图片验证模型是否符合您的需求。以下为训练模型预览效果(Prompt 示例:大福,古风美人,精致细腻,皮肤白皙,透明纱裙,迷人眼神,漂亮精致五官,精美细节超高清细节)

💡

若训练出了满意的模型,则点击发布,发布成功就可以在发布有效期内(每次发布有效期 7 天)正常使用啦~PS:若发布到期后 3 个月内您可以继续发布,每次发布有效期 7 天;到期 3 个月后若无使用,我们将不再为您保留模型~

2.5 文心一格(应用篇)

💡

小节概要

通过前面对“文心一格”的深入学习之后,相信你们对这个强大的 AI 绘画工具已经有了清晰的认识。

接下来,我们将通过两个超接地气的项目,来提高我们的操作技巧:制作个性化表情包和专属卡通头像。

你可以点击下面的内容,跳转到对应章节:

2.5.1 制作一套可爱表情包

2.5.2 制作专属卡通头像本次以制作二次元 Q 版表情包为例。

本次以制作二次元 Q 版表情包为例。

第一步:输入描述词

我们需要简单的告诉 AI,我们的表情包是什么样的。这里我的描述词为:

卡其色头发熊耳朵女孩,校服,超级生气,棕色眼睛,握紧拳头,Q 版小人;

第二步:设置参数来看看这次我生成的内容:

来看看这次我生成的内容:

用这种方法,你可以做出各种类型的表情包。

第三步:图片调整 or 添加文字

关于图片调整:如果你遇到图片细节需要调整的话,可以用我们之前说到的的“涂抹消除”或“涂抹编辑”这些功能来帮助你优化作品。

欢迎大家按照上述步骤尝试制作自己喜欢的表情包哦~

2.5.1.3 变现思路

想要通过制作表情包来实现变现,这里有几个可行的方向。如果你感兴趣,可以深入了解这些方法然后尝试一下。不过有一点要告诉大家要记住,每个平台的规则经常在变,所以在开始之前,一定要做足功课。

微信开放表情包平台:通过创作表情包获得打赏。

广告分成:在抖音、快手等平台发布表情包相关的图文或视频。只需注册小程序作者,上传表情包,用户通过观看广告获取表情包,你则可以获得广告收入。

制作并销售文创产品:比如表情贴纸、定制真人/宠物表情包等。

4.教学服务:提供收费的表情包制作教学。

教学服务:提供收费的表情包制作教学。

表情包群:通过低价会员群引流,群内定期分享表情包,可实现收益转化,尤其是针对女性用户的转化效果更佳。

💡

对应航线图任务:做一套自己的原创表情包

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

2.5.2 制作专属卡通头像

除了表情包,你还可以用“文心一格”来制作自己的卡通头像。我们直接进入演示。

2.5.2.1 功能入口

💡

网址:https://yige.baidu.com/creation?mode=1

2.5.2.2 操作演示

相关的提示词(也就把你想生成的表情包样式,做个简单的文字描述)

我找了张二次元头像来做演示

针对这张图,我希望能生成的表情包描述是:

年轻男性,灰白头发,蓝西装,黑衬衣;

下面我们开始实操演示:

第一步:上传图片,填写描述词,并选择“画师”和“尺寸”

“画师”这里选择了更符合我调性的二次元;

尺寸我选了 1:1;

影响比重我设置为 6(数值越大越接近底图本身哦)

下面来看看我的成果:

比如该案例,在小红书上广受关注与喜欢,其定制的价格方案,大概是 129-189/张,笔记单图售卖 19.9 元。

具体的方式我们不在这里展开,大家可以查看后面章节👉头像壁纸变现

💡

对应航线图任务:给自己做一个卡通头像。

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

三、【项目实操 2/3】学会 MidJourney 完成 AI 绘画 @明月(新增)

三、【项目实操 2/3】学会 MidJourney 完成 AI 绘画 @明月(新增)

💡

章节概要

Midjourney 是一款比较著名的 AI 绘画软件,用户群体庞大,功能多样,而且技术发展也很快,生成的 AI 绘画作品也比较逼真自然。

我们本章节,会带大家一起来掌握这个工具 Midjourney。

从入门到进阶,我们一共分为这么几部分:

3.1 MidJourney 的介绍及前期准备

3.2 MidJourney(入门篇)

3.3 MidJourney(进阶篇)

3.4 MidJourney(应用篇)

第一部分,MidJourney 的介绍及前期准备。手册会带你认识一下这个软件的优缺点,以及带你搭建属于自己的 MidJourney 服务器,方便你后面的出图操作。

第二部分,MidJourney(入门篇)。我们会学“文生图”、“图生图”,这两种比较基础的操作。

第三部分,MidJourney(进阶篇)。会让你从一个“外行”,变成“内行”。我们会学习 MidJourney 的“扩图”、“局部修改”、“模型选择”、“参数”、“命令”等进阶知识。

第四部分,MidJourney(应用篇)。我们整理了一些比较贴近生活场景的内容,方便你实操落地。有壁纸制作、个人形象照换风格、表情包制作、反差梗图。

准备的好的话,开始进入 MidJourney 的学习吧!

💡

本章航线图

完成本章节的学习和实操,即可完成航线图的 第二阶段:掌握 MJ 的使用方法,完成 4 组出图(约 5-7 天)

用文生图,以元旦主题,创作 4 张图(约 30-60 分钟)

用图生图,以新年主题,创作 4 张图(约 30-60 分钟)

定制一张手机壁纸(约 1-1.5 小时)

制作一张有趣的梗图(约 1-1.5 小时)

那么现在,就请开始完成这几个步骤吧。

文本提示生成图像:用户可以通过输入描述性的文本提示(Prompt Text),指导 AI 创建图像。这是 MidJourney 最基础同时也是最重要的功能。

参数调整:MidJourney 允许用户通过各种参数来改变图像的生成方式,比如宽高比、使用的生成模型、放大器、步数等。

图片链接添加:用户可以将图像链接添加到文本提示中,以进一步指导图像的生成。这些链接的地址必须以.png、.gif 或.jpg 扩展名结尾。

高分辨率输出:MidJourney 能够将图片从模糊状态生成到高达 8K 级别的清晰度。

图像修改功能:如果用户对第一次生成的图像效果不满意,可以通过修改语言描述再次生成,从而达到理想的效果。

此外,MidJourney 还具备以下优点:

此外,MidJourney 还具备以下优点:

轻松上手,适合初学者;

基于 Discord 社区机器人,方便线上操作;

AI 模型生成质量高,尤其在自然语言理解方面表现优异。

但也存在一些缺点,如:

不是开源的,缺乏进一步自定义和修改工具的功能;

插件较少;

目前是完全收费的,价格从每月 10 美金到 60 美金不等。

3.1.2 如何使用 MidJourneyMidJourney 有两大使用门槛:

MidJourney 有两大使用门槛:

1.Discord 平台的使用门槛:MidJourney 主要通过 Discord 平台进行操作,这种操作方式,可能对于一些人来说会比较陌生。我们需要先在 Discord 上注册、登录、加入 MidJourney 服务器,然后才能使用 MidJourney 来生成图像。

2.网络访问问题:由于 Discord 在中国大陆地区存在访问限制,圈友需要使用特定的网络工具或方法才能顺畅地访问和使用 Discord 以及 MidJourney。

下面我会从 0 到一,带你解决这些使用门槛,搭建起自己的 MidJourney 。

具体有这么几个步骤:

第一步:准备一个谷歌账号

第二步:可以访问外网

第三步:注册与登录

第四步:创建服务器,搭建自己的频道

第五步:配置 MidJourney 出图机器人

前两步,大家可以通过搜索网站自行解决。我们从第三步“注册和登录”开始说起。

3.1.2.1 注册与登录

② 进入 discord 界面,注册 discord 账号

如果你之前没有注册过 discord 的账号,这里就会出现注册的界面,输入用户名,点继续,然后它会验证你是不是人类等,包括之后可能还会需要邮箱验证一下等等:

如果注册好,或者之前就有 discord 账号,就会出现接受邀请按钮,点击接受会进入 discord 界面:

③ 进入频道

进入 discord 界面后,最左侧有一个一排图标,你可以简单理解成一个又一个的群聊。“小帆船”这个图标,对应的就是

④ 尝试做第一张图

在聊天框打一个 “ / ” 字符,选择出现的 /imagine

接着就可以在这里输入描述词了:

② 设置服务器名字

点击加号,进行创建服务器操作,选择亲自创建,仅供我和我的朋友使用,然后设置服务器名称和图标,最后点击创建按钮,自己的服务器频道就搭建完成了。

② 添加 Midjourney Bot 到自己的服务器

点击机器人头像,会弹出机器人的个人信息,我们点击添加 APP 字样,会进入下一个页面来让我们选择添加到哪一个服务器。找到我们之前创建好的服务器选择它,即可进行下一步操作。

充值流程并不复杂,我们以 30 美金的月费充值举例:

点击 Subscribe 进入充值界面

点击 Subscribe 进入充值界面

点击 Subscribe 按钮,然后就可以进入充值页面。

选择支付宝付款,并填写相关信息

在充值的过程中一直存在一个误区,很多人潜意识里面都会觉得国外的软件必须使用国外的银行卡才能正常充值。实际上 MidJourney 可以直接使用支付宝进行充值,实时汇率没有中间商赚差价。选择支付宝支付之后,按照流程填写邮箱和个人信息即可完成充值。

相关注意事项

在充值过程中有个需要注意的点:为什么市面上会有一些账号一百多就能购买到?

这些大概率是黑卡充值,也就是采用了一些违法的方式进行的充值。市面上便宜的代充和个人独享账号 99%都是黑卡,这种账号非常容易被官方封禁。所以,还是建议大家找朋友一起拼账号,正规充值,更安全,使用体验最佳。

3.2 MidJourney(入门篇)你已经完成了出图前的所有准备,现在准备在 MidJourney 里面大展身手吧,做出一张你想要的图像!

你已经完成了出图前的所有准备,现在准备在 MidJourney 里面大展身手吧,做出一张你想要的图像!

3.2.1 MidJourney 文生图

我们还是从最基础的“文生图”开始,循序渐进的掌握这个工具。

3.2.1.1 网页入口

💡

网址:https://www.midjourney.com/home?callbackUrl=%2Fexplore

3.2.1.2 操作演示

第一步:自然语言描述画面

在体验文生图功能前,请你在脑海里面想象一幅画面。然后用自然语言去描述描述出来。自然语言是什么?自然语言就是我们能够说出来的大白话,正常人能够听明白的语言。

可以是一只小猫在草地上打滚,可以是一只小鱼在水里嬉戏,也可以是是一望无际大草原的风景照。

我们以一只小猫在草地上打滚这个画面来做演示。

第二步:把描述词翻译成英文接下来我们自己到的 discord 频道里面,输入/,然后找到 imagine 选项,或者直接输入/imagine 也是可以的。

接下来我们自己到的 discord 频道里面,输入/,然后找到 imagine 选项,或者直接输入/imagine 也是可以的。

在 prompt 描述词框中,我们把刚才翻译过来的自然语言粘贴进去,点击回车键,等待一分钟左右。

描述词末尾显示(Waiting to start)字样,说明出图任务还未开始,显示百分比数字,说明任务正在进行中。

稍微等待一会儿,第一组图像就这么生成完毕了。恭喜你,你已经学会了基本的 MidJourney 文生图操作了。

第四步:调整出图画面,直到自己满意为止。

U(优化)的效果:

我们点击 U4 ,代表对第 4 张图进行 U(优化)。下面多出了很多不同的选项,我们先从第一行来讲解。

第一行一共有三个功能,第一个带“星星”标志的,代表的是调整画面,“Vary(Strong)”是较大幅度调整,“Vary(Subtle)”是较小幅度调整。中间的🖌️是局部重绘,后面两个是扩图功能,这 2 个功能我们在后面的课程部分会详细讲解。“Upscale(2X)”是放大画面两倍像素,“Upscale(4X)”是放大四倍像素。

接着我们来看看选择 V4 的反应,选择 V4 以后,AI 给了我们一组与图像四相似的四张图像。

我们会发现,选择“V”以后,MidJourney 能帮我们保持原始图像的基本风格,但是又会帮我们探索一些不同的变体。比如对颜色、光线、纹理、形状等元素的轻微调整。

3.2.1.4 要点总结

1.想象一个画面,然后用自然语言描述出来。

2.把描述词翻译成英文。

3.调用 MidJourney 机器人,输入描述词出图。

4.调整出图画面,不断生成,直到自己满意为止。

5.文生图的描述词格式,如下图所示。

/imagine【prompt 】A little cat is rolling on the grass

💡

对应航线图任务:用文生图,以元旦主题,创作 4 张图

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

3.2.2 MidJourney 图生图

图生图顾名思义,就是给 Ai 一张参考图,让 Ai 根据参考图去做出相似的图像。

3.2.2.1 网页入口

💡

第一步:上传图片

我们可以在互联网的任意地方找到各种各样的图片,可以直接点击右键复制图片。

然后回到我们自己的个人服务器里面进行粘贴,只有我们自己的服务器里有图片之后,我们才能用这张图,来进行下一步的创作。

出现这个问题的原因很简单,前面少了一个步骤。需要先左键点击图片,再去右键获取图片地址。

这个效果看着还不错,但如果想要跟原图更像,我们还需要进一步调整。

第四步:调整图片,让图片更接近原图

然后按回车键,即可得到四条描述词,我们可以选择其中一条。

然后我们按照之前的图生图步骤,再次生图。这次感觉有好一点点,主要是画风会更接近我们的原图。

我们现在能看到的图片,已经是 MidJourney 最大程度上能模仿出来最相似的效果了。第一张效果还蛮不错,放大看看,效果是不是相当不错?

这下,你还能分得清,哪张是原图,哪张是 Ai 生成的吗?

其实上面两组的左边都是原图,而右边都是 Ai 生成的。图生图的最大作用还是去模仿参考图,而不是还原,看到有趣的风格,或者元素,我们可以自由搭配不同的描述词让 Ai 图生图去生成更多有趣的内容出来。

3.2.2.4 要点总结

1.需要给 Ai 一张参考图,记得最后点击回车键。

2.获取图片链接之前需要先点开图片。

3.输入“/describe”可以利用 MidJourney 帮我们优化描述词。

4.--iw 参数可以控制参考图权重,参数范围在 0-2 之间。

5.图生图的描述词格式如下。

图片地址:可以将图像 URL 添加到提示中,以影响最终结果的样式和内容。图像 URL 始终出现在提示的前面。

描述词:要生成的图像的文本描述。请参阅下面的提示信息和提示。精心编写的提示有助于生成令人惊叹的图像。

参数:参数改变图像的生成方式。参数可以改变纵横比、模型、放大器等等。参数位于提示符末尾。

💡

对应航线图任务:用图生图,以新年主题,创作 4 张图

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

3.3 MidJourney(进阶篇)

既然已经学习到了这里,想必你已经完全掌握了 Ai 绘画中最基本的操作——文生图和图生图功能。

接下来我们不如来学习一些略微高难度的操作吧,这些操作并不能让你发生质变。但是在学习和使用 Ai 绘画的过程中,你会慢

如果我们简单的把画面扩展一倍会发生什么效果呢?画面场景变得更加宏大了,补充了之前场景中看不全的内容。但是不够有趣。

那我们把扩充的场景换成其他的呢?拍摄现场?客厅?电影院?画面是不是一下子就变得不一样了。这个操作非常简单,接下来就一步教会你,怎么扩图。

3.3.1.1 网页入口

💡

网址:https://www.midjourney.com/home?callbackUrl=%2Fexplore

3.2.1.2 操作演示

第一步:生成图像。

首先,我们使用/imagine 命令和相关描述词生成一张初始的图片,然后选择一张图片来扩展(点击 U,就可以选择)。

扩图功能,只能用存在网页后台的图片操作。不能上传原图。

第二步:选择缩放功能

我拿我自己生成的”带珍珠耳环的少女“这一作品进行后面步骤的演示(你可以用你自己生成的来操作),我们看下图红框圈起来的范围,都是与扩图相关的选项。

红框部分第一行是“缩放 2 倍”,“缩放 1.5 倍”,“自由缩放”以及“扩展为正方形”这四个选项。

红框部分第二行是向左右上下四个方向扩展图像。

我们按照流程,先优化了第二张图(选择“U2”),然后选择继续缩放。但出来的画面,好像和我们想象的不太一样。我只是想要把画面补充完整罢了,为什么会又多了一个画框呢?

我们还可以继续扩图,这次我想让画面往下面扩展,那就很好做了我们点击向下的小箭头即可。

点击之后我们就能进入和自定义缩放一样的界面,同样的,我们也可以在这个界面里面填写自己想要生成的描述词内容,这里我没有做其他部分更改,只是想让图片的下半部分也正常生成出来。

这就是我们用扩图功能来制作出来的完整画面了,还记得原图长什么样子么?

3.2.1.3 要点总结

1.扩图只能使用 MidJourney 内生成的图像,在 MidJourney 中,上传自己的图片并使用它来进行扩图(即放大和细化)是不支持的

2.想要在自定义缩放和指定方向扩图时去调整描述词,请先开启 remix 模式,需要在输入框输入/setting,打开设置界面,启动 remix mode 这个功能即可。

3.扩图的内容会根据描述词的内容发生变化。

4.理论上是可以无限缩放扩图的,图片像素并不会发生变化。

5.朝着某个方向一直扩图时,理论上是没有限制的,每次出图都会让画面尺寸变得更大,之后的图片可能在 MidJourney 中无法预览,需要在浏览器中打开才能预览。

3.3.2 用 MidJourney 局部重绘

MidJourney 中,有一个“局部重绘”功能。它能让我们对已生成的图像,进行局部的修改和重绘。我们可以利用这个功能让图片变得更加符合我们的心意。

我们拿我们的老朋友来举例。

这是我们之前图生图做出来的图像,我想让这个卡通人物背个篮球,还想让他换上背带裤,这做不做得到?用局部重绘就可以,小小角色任你拿捏。

3.3.2.1 网页入口

💡

网址:https://www.midjourney.com/home?callbackUrl=%2Fexplore

3.2.2.2 操作演示

我们一步一步来操作,首先把衣服换成背带裤再说。

第一步:选择局部重绘区域

点击进去就可以对画面进行调整了,左下角有两个小按键,一个是框选,另一个是索套。

框选的选择范围会更大一点,索套的选择范围更精准一点。

因为要把衣服换成背带裤嘛,所以这里我们用索套圈一下这个卡通人物的衣服。

对了,在用索套工具选择自己想要更改的部分时,可以圈稍微大一点的范围,不用像我下图这样,圈的如此精准。Ai 会完美的识别图像风格,并合理的补充完整图像。

第二步:下达重绘的指令

接着,我们找到图像下方的一个对话框。在这里,你可以在里面填写你想让框选的范围发生怎么样的变化。

我在对话框中填写的描述是:White suspender pants paired with black shirt(白色背带裤搭配黑色衬衫),来我们看看效果。

怎么讲呢,确确实实发生了变化,但和我的描述是相反的白色背带裤变成了黑色背带裤,黑色衬衫变成了白色衬衫。

我觉得是我描述词的问题,但当我尝试换了好几组不同的白色背带裤和黑色衬衫描述后。

我发现,原来 Ai 理解不了我所描述的穿搭啊。那没事了,只要不是我的问题就行。

有时候不必强求 Ai 一定按照自己的想法去做内容,毕竟 Ai 也并不是万能的,它也会有理解不了的内容,特别是中文描述词。

一方面是因为训练 Ai 绘画时的图片标注基本上都采用的英文。它自然理解不了中文内容。

另一方面就是翻译,我们想让图片里面的人物微笑,那么就写 Smile,看似没有问题对吧。

但是英文中对于笑有几十种不同的描述,也就是为什么,我们常常想让图中的画面按照我们描述的那样去生成,却常常只是差强人意。

因为,翻译的过程中,描述发生了变形。

第三步:继续优化图片

好了,我觉得第三张图就不错,那么我就选择细化第三张图,然后继续按照之前的步骤继续调整画面里面的内容。

我觉得 1 和 3 都不错,那么……

我觉得 1 和 3 都不错,那么……

小孩才做选择!我选择全都要!

对于这张图如果还觉得不满意,当然也可以按照自己的想法去继续调整,调整到符合自己心意为止。

3.2.2.3 要点总结

1.局部重绘仅能作用在由 MidJourney 生成的图像中,自己上传的图像是没有办法用 MidJourney 进行修改的。

4.想要在局部重绘里面调整描述词前,请先开启 remix 模式,具体方法是在输入框中,输入“/prefer remix”命令并发送。

3.2.3 MidJourney 模型选择

什么是 MidJourney 的模型?你可以理解成 MidJourney 的大脑。但不同的是,Ai 绘画的模型有很多,可以根据不同场景进行更换,人类就没办法随意换脑子。

那么不同的模型,你可以把他们当作不同的画家,这个模型可以叫梵高,擅长画风景,那个模型可以叫达芬奇,擅长画人物,另外一个模型叫齐白石,擅长水墨画。既然作为画家,他们什么样的画作其实都能画的出来,只是擅长的方向不同罢了。

那我们之前无论是文生图还是图生图,都没有主动选择模型,为什么就能顺利出图?

到了第五代(V 5)模型,画风肉眼可见的变得更加多元,画面的真实感也变的更强了,质感有明显的提升。再往后的 5.1 和 5.2 模型,画风更加的多元,用简单的描述词出来的画面也更加丰富,质量也有所提升。相较前几代,提升并不是很明显,功能增加了。

Niji 系列的出图效果:

niji 模型只有两代,4 代(niji 4)和 5 代(niji 5)。能从画面中看出来,画风更加的艺术而且偏向动漫。这是因为 niji 模型就是根据大量优质插画和动漫为基底训练而成的。5 代(niji 5)的质量明显更高。

而且 niji 还有三种预设的不同风格,分别适合不同的场景。

--style expressive 更擅长做出表现力更强的作品,做人物时会有意想不到的效果。

--style cute 更擅长做出可爱的作品,比较偏向萌系卡通角色。

--style scenic 更擅长做一些场景的画面制作,画面整体内容更多,也更完整。

下面我们看一下,这 3 种风格生成的图片。

怎么样?是不是都感觉挺不错的。

3.2.3.2 怎么选择模型?

上面我们介绍了 MidJourney 不同模型出图风格,那么问题来了,我们该怎样选择和调用模型呢?MidJourney 默认的模型是 V5.2 ,如果你要切换其他模型,需要在描述词后输入对应的参数。

切换模型的参数是:

(空格)--(V 或者 niji)(空格)(模型版本)

这里的“--”,代表的就是调用参数,我们后面还会用到。

3.2.3.3 要点总结

V1-V3 模型已经落后,不建议使用。

V4、V5、V5.1、V5.2 各有千秋,可以根据不同的作图需求来更换模型。

niji4 和 niji5 用来做动画场景的效果更好。

niji5 有三个不同的预设风格,而 niji4 没有。

3.2.5 了解常用参数

上一节我们讲了,要选择不同的模型生成图片,需要在描述词后面加参数,比如“ --niji 4”,就是选择 niji 4 模型。

其实 MidJourney 里不仅仅有切换模型的参数,还有其他各种各样的参数。我们之前在文生图、图生图、局部重绘以及扩图这几个部分都用到了一些,现在详细的给大家具体介绍一下。

3.2.5.1 常用参数① --seed

--seed 代表了种子值,你可以把它理解成每张图片独一无二的编号。如果我们使用同样的描述词加上 --seed 值,就会得到相同

而如果我们采用相同描述词,但不设置相同--seed 值,就会生成两组随机的图片。

说到这里,相信大家应该理解这个参数的意义了。那它具体有什么用呢?它的作用就是复现图片。

如果我们能获取一张图片的描述词 和 --seed 值,那我们就能在 MidJourney 生成相同的内容。

比如我们用 MidJourney 生成了一张关于“未来城市夜景”的创意海报。这张特别吸引你的注意,你认为它非常接近你心目中的理想设计。但是你又担心下次输入一模一样的描述词,就做不出来这张图了。你就可以通过--seed 值来复现图片。

那么--seed 值该怎么获取呢?我们用之前生成的关于猫的图片,来演示一下。

我们把鼠标移到这组图片上方,可以看到右上角有四个小按钮,点击“···”标志,进入下一步。

这个种子值并不会发送到我们的服务器里面,需要到私信里面找到 MidJourney 机器人,机器人会给我们发送图片的种子信息。我们可以看到,机器人给我们发送了“seed 3291407012” 这段描述词。

3.2.5.2 常用参数② --iw

--iw 参数,我们前面图生图的部分已经介绍过了。它能决定参考图对你图像的影响力,--iw0 是完全不考虑参考图,--iw2 则是最大程度地模仿参考图。

接下来让我们来看这个例子吧。这里有六张图:一张是原图,其他五张是用不同的--iw 设置生成的。

你会发现,随着我们把权重数值调高,生成的图像就越接近原图,里面的原图元素也越多。

3.2.5.3 常用参数③ --ar

--ar 这个参数估计是大家在 Ai 绘画中,使用最多的参数了,它的作用很简单,就是帮我们调整画面比例。

要注意的是,使用 V4 模型的时候画面比例只能在 1:2-2:1 之间进行调整。而 V5 以上和 niji5 以上模型可以生成任意比例图像。

下图是使用 V5 模型制作的不同比例图片,从左到右是 1:2,1:1,2:3,3:4。

下图是使用 niji 5 模型制作的不同比例图片,从左到右是 1:2,1:1,2:3,3:4。

3.2.5.4 常用参数④ --r

--r 这个参数用的比较少,但一点都不妨碍它好用啊。

同一组图想要生成多组,按照传统的做法需要一遍又一遍生成。但现在可以在描述词后面加上这条 --r 这条参数,然后在参数后面加上指定的生成批次数量。

就能同一条描述词多批次出图了,非常好用~下面是我的演示截图,大家可以看一下。

第一步:输入--r 指令

第二步:在跳出的对话里,选择“Yes”

第三步:等待出图

3.2.5.5 参数大全下面给大家整理了一下 MidJourney 里所有可能用得上的参数,你先看看,做个了解。以后要用到的时候,直接翻出来看就行了。

下面给大家整理了一下 MidJourney 里所有可能用得上的参数,你先看看,做个了解。以后要用到的时候,直接翻出来看就行了。

💡

《MidJourney 参数大全》

纵横比 (--ar, --aspect): 调整生成图像的长宽比例。

变化程度 (--chaos): 0 到 100 的数值,决定生成图像的多样性。数值越高,结果越独特和意外。

快速模式 (--fast): 临时切换到快速模式运行当前的任务,加速图像生成过程。

图像权重 (--iw): 0 到 2 的数值,设置图像提示相对于文本描述的重要性。默认为 1,数值越高,图像对结果的影响越大。

排除元素 (--no): 例如“--no plants”会尝试在生成的图像中排除植物。

渲染质量 (--quality, --q): 选择.25, .5, 或 1,决定图像的渲染质量和用时。高值意味着更高质量但耗时更长。

随机风格 (--style random): 自动在提示中添加随机的风格代码,可以是 16、64 或 128 种风格之一,增加创意元素。

8.放松模式 (--relax): 临时切换到放松模式运行任务,生成过程较慢但资源消耗较少。

放松模式 (--relax): 临时切换到放松模式运行任务,生成过程较慢但资源消耗较少。

重复任务 (--repeat, --r): 1 到 40 的数值,用同一提示多次创建任务,适合快速尝试多种结果。

种子 (--seed): 0 到 4294967295 的数值,指定生成图像的起始随机因素。相同的种子数和提示会产生类似的图像。

提前终止 (--stop): 10 到 100 的数值,提前结束生成过程。数值越小,图像越模糊、细节越少。

风格 (--style): 切换不同版本的 MidJourney 模型,例如不同的 5.x 版本或 Niji 模型,来改变图像风格。

风格化 (--stylize, --s): 控制 MidJourney 默认美学风格对图像的影响程度。

图块 (--tile): 生成可以作为重复图案的图像,用于创建连续的图案效果。

Turbo 模式 (--turbo): 临时切换到 Turbo 模式运行任务,加快图像生成速度。

怪异 (--weird, --w): 0 到 3000 的数值,探索不同寻常和创新的美学风格。

视频 (--video): 生成图像生成过程的短视频。适用于某些特定模型版本。

18.提示变体:使用大括号 {} 来创建多个提示的不同变体,例如 {red, green, yellow} 会生成红色、绿色和黄色的不同图像。

提示变体:使用大括号 {} 来创建多个提示的不同变体,例如 {red, green, yellow} 会生成红色、绿色和黄色的不同图像。

3.2.4 了解常用命令

接下来我们来学习一下 MidJourney 的命令。前面我们说的参数,主要是帮助咱们调整图像的细节,而命令呢,就像是告诉 MidJourney 我们想要它做什么。

其实在之前的内容里,我们已经接触过一些命令的操作了,比如“/imagine”,就代表我们需要 MidJourney 来生成图片。“/describe”,是让 MidJourney 来帮我们优化描述词。

那么除了这两个,MidJourney 还有哪些常用的命令呢?

3.2.4.1 常用命令① /blend

/blend 可以将 2-5 张不同内容的图片进行融合。

在生成的图片中,MidJourney 把黄色圆形面包和用叉子挑起的意面融合在了一起,十分不错。

3.2.4.2 常用命令② /setting

setting 也就是设置,可以在里面调整默认模型和风格,出图速度等等。

我把每个按钮对应的功能列在下面了,大家感兴趣可以看一下:

我把每个按钮对应的功能列在下面了,大家感兴趣可以看一下:

Use the latest model (5.2): 这是一个下拉菜单,允许您选择使用 MidJourney 的最新模型版本进行图像生成。

RAW Mode: 原生模式,指的是使用最少的预设风格和处理,让生成的图像保持原始状态。

Stylize low/med/high/very high: 这些按钮用于调整图像的风格化程度。从低到非常高,数值越大,图像的风格化效果越明显。

Public mode: 公开模式,您的创作会在社区中公开展示。

Remix mode: 混合模式,允许您对已生成的图像进行局部修改和再创作。

High Variation Mode: 高变异模式,生成的图像会有更多的变化和创意。

Low Variation Mode: 低变异模式,生成的图像变化较少,更接近于您的初始提示。

Sticky Style: 粘滞风格,可能意味着一旦选择了一种风格,它会被保留下来并应用于后续的图像生成。

Reset Settings: 重置设置,将所有的选项恢复到默认状态。

当你点击一个按钮它变成绿色,这表示该选项已被激活或开启,再次点击就能关闭。

3.2.4.3 常用命令③ /info

info 命令可以查看自己的个人信息,什么时间充值,还有多长快速出图时长(快速出图时长用完之后,如果不购买的话,会自动使用慢速出图)。慢速出图是无限生成的,速度会比快速的慢三分之一左右,前提是服务器空闲时间,若服务器一直处于拥挤状态,可能一张图要等待十几分钟甚至更久。

User ID: 我的账号是 94bd3c62-3e04-41f2-a386-fbcd1080d203,这是 MidJourney 给我分配的唯一识别码。

Subscription: 我的订阅类型是“Standard”,现在是活跃状态,下次续订是在 2024 年 1 月 7 日。

Visibility Mode: 我设置的可见性是“Public”,这意味着我的作品能被社区里的所有人看到。

Fast Time Remaining: 我的快速模式还剩 13.59 小时,用掉了 90.62%,总共是 15 小时。

Lifetime Usage: 到目前为止,我在 MidJourney 上总共生成了 3816 张图像,一共用了 46.33 小时。

Relaxed Usage: 在放松模式下,我生成了 788 张图像,一共用了 11.22 小时。

Queued Jobs (fast): 我现在没有任何图像在快速模式下排队等待生成。

Queued Jobs (relax): 我现在也没有任何图像在放松模式下排队等待生成。

Running Jobs: 我目前没有任何图像生成作业在进行中。

上面这张图,是我的个人信息,你也可以查询一下你自己的。

3.2.4.4 命令大全除了上面提到的,MidJourney 还有其他命令,我帮你汇总好了。

除了上面提到的,MidJourney 还有其他命令,我帮你汇总好了。

💡

《MidJourney 命令大全》

获得答案 (--ask): 向 MidJourney 提出问题并获得答案。

混合图像 (--blend): 轻松将两张图像混合在一起。

每日主题 (--daily_theme): 开启或关闭#daily-theme 频道更新的通知。

用户指南 (--docs): 快速生成官方 Midjourney Discord 服务器用户指南主题的链接。

描述提示 (--describe): 根据您上传的图像编写四个示例提示。

常见问题 (--faq): 生成流行提示工艺频道常见问题解答的快速链接。

快速模式 (--fast): 切换到快速图像生成模式。

帮助 (--help): 显示关于 MidJourney 机器人的有用基本信息和提示。

图像生成 (--imagine): 使用文本提示生成图像。

账户信息 (--info): 查看有关您的账户和当前活动作业的信息。

自定义选项 (--prefer option): 创建或管理自定义设置选项。

查看选项 (--prefer option list): 查看当前的自定义选项。

后缀添加 (--prefer suffix): 指定添加到每个提示末尾的后缀。

变化切换 (--prefer variability): 在高和低变化模式之间切换。

公共模式 (--public): 对于专业计划订阅者,切换到公共模式。

放松模式 (--relax): 切换到放松模式,图像生成速度较慢。

混音模式 (--remix): 切换到混音模式,可进行局部图像编辑。

设置 (--settings): 查看和调整 MidJourney 机器人的设置。

简化提示 (--shorten): 提交长提示并获得简化建议。

显示作业 (--show): 使用图像作业 ID 在 Discord 中重新生成作业。

隐身模式 (--stealth): 对于专业计划订阅者,切换到隐身模式。(当你激活隐身模式时,你生成的图像不会在 MidJourney 的公共画廊或社区空间中显示,只有你能看到这些图像。)

订阅 (--subscribe): 生成指向用户账户页面的个人链接。

风格调整 (--tune): 根据提示生成风格调整器,自定义图像风格。

涡轮模式 (--turbo): 切换到涡轮模式,加速图像生成。

3.4 MidJourney(应用篇)

💡

章节概要

在本章节中,我们将深入学习如何使用 MidJourney 来创作个性化的手机和电脑壁纸,以及如何利用 AI 绘画进行人物幼年化图像制作和表情包的创造。此外,我们还会介绍如何运用时间、场景和人设反差来制作有趣的梗图。

化图像制作和表情包的创造。此外,我们还会介绍如何运用时间、场景和人设反差来制作有趣的梗图。

具体有 4 个小节:

定制手机电脑壁纸:这小节你可以学会如何使用 MidJourney,来将你的灵感转化为独一无二的壁纸。如何调整图像尺寸以适应不同设备的屏幕,并探索不同风格的图像生成方法。

个人形象换风格:手册会教你如何将现有的人物照片,通过 MidJourney 转换成幼年版,并给你展示具体的步骤和所需的命令和参数设置。

表情包制作:这部分将聚焦于如何运用 MidJourney 的 niji 模型和 cute 风格来制作富有表现力的动漫风格表情包,并教你如何进行图像的优化调整。

用各种反差来制作有趣的梗图:最后,我们将探索如何通过创造时间、场景和人物设定上的反差来制作吸引人的梗图,提供具体的实例和创作技巧。

通过本章节的学习,你将能够掌握 MidJourney 的高级应用技巧,将你的创意想法实现为视觉作品,准备好就开始学习吧!

3.4.1 定制手机电脑壁纸你是否曾经对自己的壁纸感到无聊?想要为你的壁纸增加一些个性风格,让它成为独一无二的存在?现在,我将带你进入定制壁纸的神奇世界!

你是否曾经对自己的壁纸感到无聊?想要为你的壁纸增加一些个性风格,让它成为独一无二的存在?现在,我将带你进入定制壁纸的神奇世界!

3.4.1.1 网页入口

💡

网址:https://www.midjourney.com/home?callbackUrl=%2Fexplore

3.4.1.2 操作演示

第一步:写壁纸提示词

在这里,我给大家总结了一个提示词公式: [主体] + [风格] + [特定要求] + [附加描述]

我们只需要在这个公式的对应部分,填上相应内容,AI 就可以帮我们完成壁纸制作了。那这些 “主体” 、“风格”、“附加描述”、“特定要求”具体都什么意思呢?我举个例子你就明白了。

比如说,现在我想要一幅美少女的油画。我直接把我想要的用人话说出来:“一幅美少女油画”。那这里的“美少女”就是 [主体] ,油画就是 [风格] 。

那我想让美少女变得更具体一点,我可以多加一些描述,猫耳,洛丽塔。

让美少女出现在指定场景,我可以加入森林,小河,树枝,石头等等元素。

猫耳、洛丽塔、森林、小河、树枝、石头,这些就是 [特定要求]

我还想让整幅画面更加有质感,我可以加入柔和的光线,耶稣光,这个就是 [附加描述] 。

最后完整的描述词就是:“这是一幅关于美少女的油画,美少女有着猫耳朵,身穿洛丽塔。身处在森林里面,森林里面有小河,树枝和石头。整幅画面有着柔和的光线和耶稣光”。

好像有点复杂?

那我们简单点,换一套描述词:“美少女,油画风格,猫耳装饰,洛丽塔服饰,森林,小河,树枝,石头,柔和光线,耶稣光”。这样是不是简单多了。

这两段描述词,我们都分别生成一遍看看效果如何。

能分辨的出来上面两组图分别是由哪组描述词生成的么?

嘿嘿,这就揭晓答案,前者是自然语言生成的,后者是由词汇组成的。通过这两幅图片的对比能看出,用词汇生成的图像会更加精准。而用自然语言生成的图像,Ai 对于内容的识别就稍差一点,像猫耳朵,河流,石头,树枝,柔和的光线等都没有出现

第二步:调整壁纸尺寸

回到我们的案例本体,我们要定制的是手机和电脑壁纸。我们就要保证壁纸的尺寸比例是适合手机或者电脑屏幕的。这个时候要使用一个 --ar 参数来更改出图的比例。

常见的屏幕比例,手机屏幕的比例是以 9:16 为主,平板电脑则以 4:3 为主,电脑显示器以 16:9 为主。那么对应的参数就是:

手机屏幕:--ar 9:16

平板电脑:--ar 4:3

电脑显示器:--ar 16:9

注意了,--ar 和具体数值(比如 9:16),中间有个空格。

好的,我们先在生图界面的右下角点击重新生成按键,然后将数值放在描述词的最后,我们以 9:16 举例,那么我们就需要将“--ar 9:16”放在描述词后面。

Muted landscape, light gray and dark beige, bronze and blue, 1800's era, farm field, tranquil colors, antique, vintage, oil paint, brush strokes, dull colors, biege colors, saturated, pressure strokes, attention to detail, award winning, Artemisia Gentileschi style

A contrast image split in half. One side shows Elon, confident and victorious, with the Zip2 logo and$ 300 million floating behind him. The other half: Elon, contemplative, almost on the edge, with the PayPal logo and question marks clouding the backdrop. The two sides are separated by a shimmering, uncertain veil representing the risk and unpredictability. Bright colors and sharp contrasts emphasize the gamble and stark choices. 对比度图像一分为二。一面显示埃隆,自信和胜利,与 Zip2 的标志和 3 亿美元漂浮在他身后。另一半: 埃隆,沉思,几乎在边缘,与贝宝的标志和问号云的背景。双方被一层闪闪发光、不确定的面纱隔开,这层面纱代表着风险和不可预测性。明亮的色彩和鲜明的对比强调了赌博和赤裸裸的选择。

A mysterious black and white pen and ink illustration of a beautiful woman with a large spectator hat, dynamic composition, low angle and exaggerated perspective, clean lines and elegant curves, stylized and simple, lovely

Close - up, Enigmatic, All - orange cheetah, poster - like, spotted backdrop Ethereal all - orange cheetah adorned with Moiré and Matelassé - patterned elements, manifesting a pulchritudinous presence by Hajime Sorayama

特写,神秘,全橙色猎豹,海报样,斑点背景空灵的全橙色猎豹装饰着莫尔和马特拉塞图案的元素,显示出一个由 Hajime Sorayama 美丽的存在

定制壁纸并不是一个标品,所以主流的变现路径是在自媒体平台发布高质量壁纸,然后进行售卖。或者引流私域进行知识付费变现,包月取图变现。这个变现路径门槛不高,长期(一个月以上)做下去一定可以出成绩。有兴趣的圈友可以试试。

《公众号写作流量主变现之美女图片方向》@叶华

《公众号流量主,ChatGPT + AI 绘画,3 天入池,5w+》@元彻

💡

对应航线图任务:用 MidJourney 定制一张手机壁纸

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

3.4.2 个人形象换风格

前一段时间,一张 AI 生成的马斯克婴儿照片在社交媒体上疯传,引发网友热议,并得到了特斯拉 CEO 马斯克本人的回应。

这张照片是由一个账户名为“Not Jerome Powel”的网友分享的,这位网友在照片的配文中幽默地暗示,马斯克对抗衰老秘方的追求可能有点过头了。他在推文中写道:“据报道,埃隆·马斯克正在研究一种抗衰老配方,但结果失控了。”这张照片很快获得了广泛关注,获得了数万个点赞。

不得不说这样的图片真的是太有趣了,不是么?这种图片用 MidJourney 也能做出来,下面我就教你怎么一步步做这样的人物幼年化图像。

3.4.2.1 网页入口

💡

网址:https://www.midjourney.com/home?callbackUrl=%2Fexplore

3.4.2.2 操作演示

第一步:将图片导入 MidJourney

首先我们导入一张想要幼年化的人物图片,可以是你,可以是我,可以是任何人。

把图片拖动到对话框里面,然后上传。上传成功的图片长这个样子。

3.4.3.1 网页入口

💡

网址:https://www.midjourney.com/home?callbackUrl=%2Fexplore

3.4.3.2 操作演示

表情包大部分都是动漫的,对于这种图像,MidJourney 里有个模型,就叫 niji,简直就是为动漫风格的表情包量身定做的!

下面是我生成的图片,怎么样?还不错吧!快去试试你自己的表情包吧。

万能魔法公式

💡

卡通风格:卡通风格是一种特殊的艺术风格,它以夸张的形象、明亮的色彩和简化的线条来表现人物或物体。卡通风格常常具有夸张的表情和动作,以及简化的形象和特征,使得画面更加有趣和可爱。卡通风格具有辨识度高、易于传达信息、轻松愉悦等特点,因此深受人们喜爱和接受。

公式 :Showing different expressions + 主题描述 + 各种表情

魔法词: various expressions and movements

辅助词:Emoji design(表情符号设计),multiple poses and expressions (多个表情和动作)exaggerated movements (动作夸张),Four cute poses and expressions(四种可爱的姿势和表情),white background(白色背景),cartoon style(卡通风格),Joy (喜悦),fear(害怕) anger(愤怒),disgust(厌恶),gratitude(感激),sadness(伤心),surprise(惊讶), shyness(害羞),f/64 group,

EMidJourneyi sheet (表情)

3.4.3.3 变现方向

用 Ai 来制作表情包非常高效且好用,用来发自媒体平台也会有很好的流量,然后引流私域或者开店铺进行表情包定制也是不错的选择。而且定制表情包算是非标品,里面可操作的空间很大,但这并不适合用来挣快钱。以下方向都是可以尝试的:

微信开放表情包平台:通过创作表情包获得打赏。

广告分成:在抖音、快手等平台发布表情包相关的图文或视频。只需注册小程序作者,上传表情包,用户通过观看广告获取表情包,你则可以获得广告收入。

制作并销售文创产品:比如表情贴纸、定制真人/宠物表情包等。

教学服务:提供收费的表情包制作教学。

表情包群:通过低价会员群引流,群内定期分享表情包,可实现收益转化,尤其是针对女性用户的转化效果更佳。

比如拟人动物:

这些案例的描述词是怎么写出来的呢?简单的总结了三个实用的小方法,方便大家轻松的利用各种反差来制作有趣的图像。

3.4.4.1 网页入口

💡

网址:https://www.midjourney.com/home?callbackUrl=%2Fexplore

3.4.4.2 操作演示

利用好人设反差,就能做出类似宠物拟人,佛祖上班之类的热门图片。

利用好人设反差,就能做出类似宠物拟人,佛祖上班之类的热门图片。

学会这三种反差描述词,轻轻松松做出热门爆款!

3.4.4.3 变现方向:

目前,AI 绘画在梗图领域尚未探索出体系化的变现方式,大家可以尝试做个先驱者,躬身探索。

💡

对应航线图任务:用 MidJourney 制作一张有趣的梗图

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

四、【项目实操 3/3】提升 AI 绘图能力——描述词 @天辉 @大刘 @瑾糖🔥

💡

章节概要

经过之前的教程,相信你已经能做出不同类型的图了。

但是,与那些网上的大神相比,自己做出的图总是显得逊色许多,该如何获得提升呢?

关键就是——描述词。

描述词,也叫提示词,它是学习 AI 绘画中关键的一环。

简单来说,描述词就是与 AI 沟通的语言。通过描述词让 AI 听懂你的需求,给出你想要的画面。想要学好 AI 绘画,学习描述词是必经之路。

我们可以通过以下两个步骤,由易到难逐渐优化描述词,提升自己的绘图能力。

第一步:简单了解描述词的逻辑,模仿优秀对标来写描述词(这里将会给到大量的描述词供大家模仿参考)。

第二步:学习描述词的构成方式,并借助描述词工具原创描述词。

准备好的话,我们就开始进修吧!

💡

本章航线图完成本章节的学习和实操,即可完成航线图的 第三阶段:掌握描述词的方法,提升出图质量(约 5-7 天)

完成本章节的学习和实操,即可完成航线图的 第三阶段:掌握描述词的方法,提升出图质量(约 5-7 天)

复制 3 个模版描述词,出图 3 张(约 15-30 分钟)

修改 3 个描述词,出图 3 张(约 30-60 分钟)

用描述词工具写 1 个描述词,出图 1 张(约 30-60 分钟)

用 ChatGPT 写 1 个描述词,出图 1 张(约 30-60 分钟)

那么现在,就请开始完成这几个步骤的筹备吧。

4.1 寻找对标,模仿优化描述词

早期阶段的提升只有四个字:对标模仿

具体可以按以下两种方式:

① 找好看图片的描述词,照搬出图(3 张)

② 换其中部分字词,体会修改创作的乐趣

前期快乐最重要,什么生涩难懂的术语和复杂参数的修改统统都不要,对标提质量,随机出奇迹。

我们先来看看,怎么找到好图片的描述词,并进行照搬出图。这里需要说明一下,你在手机或电脑上随便刷到的漂亮图片,并不是都带描述词的。我们得去专门的描述词网站上,才能找到。

很多描述词网站上,可以一键复制描述词进行使用。

我整理了一些网站给大家,包括 MidJourney 描述词网站、Stable Diffusion 描述词网站和付费网站,你都可以点进去瞧瞧。

MidJourney 描述词:

https://lib.kalos.art/

https://www.artkey.cool/

https://www.midlibrary.io/styles

Stable diffuision 描述词:

https://lexica.art/?continueFlag=7aff77349db15b85171d200cab31b8cb 一些付费的描述词库:

一些付费的描述词库:

https://www.MidJourney.com/app/feed/(MidJourney 付费用户可查看)

除此外,我还收集了一些 AI 绘画的热门关键词供大家参考。点击下面对应的链接,可以直接获取相关的描述词。

1)炫彩模型关键词(点击下述链接即可跳转)

炫彩关键词 1(图文)

炫彩关键词 2(图文)

炫彩关键词 3(图文)

炫彩关键词 4(图文)

炫彩关键词 5(图文)

炫彩关键词 6(图文)炫彩关键词 7(图文)

炫彩关键词 7(图文)

炫彩关键词 8(图文)

炫彩关键词 9(图文)

2)Disco Diffusion 模型关键词(点击下述链接即可跳转)

DD 关键词 1(图文)

DD 关键词 2(图文)

DD 关键词 3(图文)

DD 关键词 4(图文)

DD 关键词 5(图文)DD 关键词 6(图文)

DD 关键词 6(图文)

3)动物写实关键词(点击下述链接即可跳转)

动物写实 1(图文)

动物写实 2(图文)

动物写实 3(图文)

4)二次元类目关键词(点击下述链接即可跳转)

二次元词组分享

二次元(图文)

5)婚纱礼服关键词(点击下述链接即可跳转)

婚纱 1(图文)

婚纱 2(图文)婚纱 3(图文)

婚纱 3(图文)

婚纱 4(图文)

婚纱 5(图文)

婚纱 6(图文)

6)抖音爆款关键词(点击下述链接即可跳转)

抖音爆款 1(图文)

快手爆款 1(图文)

7)人物关键词(点击下述链接即可跳转)

人物关键词(图文)

8)祈福关键词(点击下述链接即可跳转)祈福关键词(图文)

祈福关键词(图文)

9)十二生肖关键词(点击下述链接即可跳转)

发财系列(图文)

功夫系列 (图文)

汉服系列(图文)

铠甲系列(图文)

唐装系列(图文)

10)AI 绘图热度关键词(点击下述链接即可跳转)

200 个热度关键词

如果你觉得打开网页去搜索和挑选描述词太费事,我给你直接罗列了一些,你可以直接复制使用。

描述词 4

Rustic interior of an alchemy shop

(质朴的炼金店内部)描述词 7

描述词 7

Cyberpunk city in the night seen from below,cityscape,mist,rAIn,artstation,Greg Rutkowski

(赛博朋克城市夜晚,下面视角,城市景观,雾,雨,艺术站风格,Greg Rutkowski 风格)

(一副好看的图画,中国地图)

(一副好看的图画,中国地图)

💡

对应航线图任务:复制 3 个模版描述词,用 MidJourney 出图 3 张

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

4.1.2 替换字词,生成图片照搬完优质描述词之后,你一定体会到了一个小规律:那就是优质的描述词,都很具体。

照搬完优质描述词之后,你一定体会到了一个小规律:那就是优质的描述词,都很具体。

那么,我们的改图能力修炼就可以从把描述词变具体开始,比如,

插画能不能改成素描、木版画、壁画、......

illustration → drawing, woodblock print, fresco, ......

城市能不能改成乡村、工厂、景区、......

city → country, factory, scenic area, ......

东京能不能改成北京、南京、上海、......

TOKYO → Beijing, Nanjing, ShanghAI, ......

蒸汽朋克能不能改成赛博朋克、原子朋克、冰朋克、......

steampunk → cyberpunk, atompunk, icepunk, ......

Greg Rutkowski 画师能不能改成梵高、齐白石、宫崎骏、.......

Greg Rutkowski → Vincent van Gogh, Qi bAIshi, Miyazaki Hayao, ......

......(思路还有很多)描述词中的 Greg Rutkowski,是一位来自波兰的大神级原画师,他曾经为《巫师 3》等超级大作担任过艺术指导,他的风格多以中世纪魔幻风格为主,画风十分细腻。我们来看看输入 MidJourney 后生成的图。

描述词中的 Greg Rutkowski,是一位来自波兰的大神级原画师,他曾经为《巫师 3》等超级大作担任过艺术指导,他的风格多以中世纪魔幻风格为主,画风十分细腻。我们来看看输入 MidJourney 后生成的图。

田野中的农业机械,和天上的未来飞行器形成了鲜明对比,很有未来科技感。

接下来我们就要做一波替换。在保持其他不变的情况下,将 by Greg Rutkowski 替换成 by XXX,比如,换成梵高。

不会的英文人名用翻译软件查:

替换后的提示词:by Qi bAIshi(齐白石)

by Qi bAIshi(齐白石)

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Qi bAIshi, concept art.

by Picasso(毕加索)

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Picasso, concept art.

by Akira Toriyama(鸟山明 - 七龙珠作者)

Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Akira Toriyama, concept art.

by Miyazaki Hayao(宫崎骏)不同的画师风格,会来带不一样的惊喜。

不同的画师风格,会来带不一样的惊喜。

4.1.2.2 实践:对标模仿替换

除了画师风格,还有其他元素也可以替换。比如:图像风格、构图风格、艺术风格、光线风格。下面我把每种风格对应的关键词列出来,大家可以对照着使用。

图像风格 (Artistic Styles)

古风 (Ancient Style)

二次元 (Anime Style)写实照片 (Photorealistic)

写实照片 (Photorealistic)

油画 (Oil Painting)

水彩画 (Watercolor Painting)

油墨画 (Oil Ink Painting)

水墨画 (Ink Wash Painting)

黑白雕版画 (Black and White Engraving)

雕塑 (Sculpture)

3D 模型 (3D Model)

手绘草图 (Hand-drawn Sketch)

炭笔画 (Charcoal Drawing)极简线条画 (Minimalist Line Drawing)

极简线条画 (Minimalist Line Drawing)

浮世绘 (Ukiyo-e)

电影质感 (Cinematic Texture)

机械感 (Mechanical)

构图风格 (Composition Styles)

中心构图 (Central Composition)

水平线构图 (Horizontal Line Composition)

辐射纵深 (Radiating Depth)

渐次式韵律 (Gradual Rhythm)

三分构图法 (Rule of Thirds)框架构图 (Framing Composition)

框架构图 (Framing Composition)

引导线构图 (Leading Lines Composition)

视点构图 (Point of View Composition)

散点式构图 (Scatter Composition)

超广角 (Ultra Wide Angle)

黄金分割构图 (Golden Ratio Composition)

错视构图 (Forced Perspective Composition)

抽象构图 (Abstract Composition)

艺术风格 (Art Movements)

现实主义 (Realism)印象派 (Impressionism)

印象派 (Impressionism)

野鲁派 (Fauvism)

新艺术 (Art Nouveau)

表现主义 (Expressionism)

立体主义 (Cubism)

抽象主义 (Abstract Art)

之上主义 (Suprematism)

超现实主义 (Surrealism)

行动画派 (Action Painting)

波普艺术 (Pop Art)极简主义 (Minimalism)

极简主义 (Minimalism)

光线风格 (Lighting Styles)

舞台灯光 (Stage Lighting)

环境光照 (Ambient Lighting)

镜化 (Reflections)

体积照明 (Volumetric Lighting)

电影效果 (Cinematic Effects)

围光 (Rim Lighting)

丁达尔效应 (Tyndall Effect)

暗色调 (Low-key)动态模糊 (Motion Blur)

动态模糊 (Motion Blur)

长曝光 (Long Exposure)

颗粒图像 (Grainy Image)

浅景深 (Shallow Depth of Field)

微距摄影 (Macro Photography)

逆光 (Backlighting)

抽象微距镜头 (Abstract Macro Lens)

仰拍 (Low Angle Shot)

软焦点 (Soft Focus)

基本上来说,我们的描述词优化方向就是这些。大家可以从上述你喜欢的 AI 图片中选择一个进行模仿,主要可以做这么两个动作。

动作 1:复制原文生成一下,看看有什么样的效果;

动作 2:改变其中部分字词,看看有什么样的效果。

如果你已经自行探索到这一步,那么恭喜你,已经在迈向进阶玩家的道路上了。

💡

对应航线图任务:修改 3 个描述词,用 MidJourney 出图 3 张

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

4.2 如何原创描述词

我们现在已经搞懂了单个词汇是怎么塑造画面的,那接下来让我们提升一下,学习怎么自创描述词吧。掌握了这个技能,才能真正自由自在的,把脑海里的点子变成独一无二的艺术品。

4.2.1 描述词的组成元素

一个描述词主要有这么几种元素组成:

【主体】+【风格】+【附加描述】+ 【特定要求】

主体,就是描述你想要 AI 绘制的主要对象或场景。

比如说你想画一棵树,那么“一棵大树”就是你的主体。

风格,指作品的艺术风格,比如模仿某个艺术家或特定的艺术流派。

如果你想要的画风是像梵高的画作,那么“梵高风格”就是你的风格选择。

附加描述,这部分是对主体的具体化描述,可以包括颜色、情绪、环境等细节。

比如,对于“一棵大树”的附加描述可以是“秋天的黄叶”或“夜晚下的神秘氛围”。

特定要求,这部分用于添加特别的要求或限制条件,比如特定的光线、角度或特效。

我们还是用前面的例子,对于“一棵大树”,你可能会要求“使用日落的暖色调”或“强烈的光影对比”。

通过将这些元素结合起来,你就可以创造出一个详细且具有个性的描述词,用于引导 AI 生成独特的艺术作品。

结合主体、风格、附加描述、特点要求以后的描述词:一棵大树,梵高风格,秋天的黄叶,使用日落的暖色调主体很容易写,比如之前我们用到的一些描述:

主体很容易写,比如之前我们用到的一些描述:

一个质朴的小屋子;

飞船落在玉米地上;

......

它也可以是:

一只戴着墨镜的猫;

特朗普与希拉里在拥抱;

乡间田野的小村庄;

五彩缤纷的花朵;

一个置物架;

穿梭的星际宇宙;

......

简而言之,你想要什么画面,这部分就是主体。它属于你的自由发挥区域,天马行空,无拘无束。也是我们普通人最能够进行发挥的地方。

但是对于风格、附加描述、特点要求,大家可能一开始脑海中会没有概念。下面我就给大家列举一些常用的内容,你可以直接复制使用。

常用的【风格】

赛博朋克

抽象表现主义

现实主义

超现实主义

极简主义

表现主义

印象派

立体主义

野兽派

新艺术

浪漫主义

巴洛克

饰品派

水彩风格

油画风格

扁平化设计

未来派

浮世绘

矢量艺术

20.低多边形

低多边形

手绘风格

3D 建模

漫画风格

照片写实

极光效果

漫画书风格

蒸汽波

童话风格

原始主义

新古典主义

奇幻艺术

摄影写实

宫崎骏风格

精密主义

朋克风格

美术写实

拟物风格

极致细节

后现代主义

40.电影截图风格

电影截图风格

常用【附加描述】

闪耀的反光

古董纹理

柔和的光晕

戏剧性的阴影

复古的棕褐色调

茂盛的绿意

乡村韵味

霓虹光泽

雾蒙蒙的氛围

闪光的金属质感

诙谐的图案

丰富的桃花心木色

风化的表面

空灵的光线

鹅卵石街道

水彩涂洗效果

彩色玻璃般的色彩

58.蜿蜒的藤蔓

蜿蜒的藤蔓

星空夜景

阳光下的亮点

水晶般的清晰

大理石般的旋涡

倾泻的瀑布

冰冷的霜

盛开的花朵

艺术装饰风格的优雅

巴洛克风格的细节

闪闪发光的雪

暖色的烛光

阳光下的风景

闪烁的城市灯光

明暗对比强烈的效果

柔和的粉彩

电光蓝

金色时刻的光辉

丝滑的质地

清晰的秋叶

78.闪亮的珠宝

闪亮的珠宝

平静的海浪

烟熏水晶色调

常用【特定要求】

高对比度

低饱和度

动态模糊

长曝光

浅景深

光影效果

暗色调

高饱和度

颗粒效果

丁达尔效应

色彩分离

光晕效果

体积光效

梦幻效果

CG 渲染

96.色调映射

色调映射

视觉失真

镜面反射

环境光渲染

倒影效果

折射效果

纹理增强

风格化渲染

颜色过滤

抽象化处理

虚拟现实效果

逆光效果

微距效果

软焦点效果

3D 效果

手绘效果

粉笔效果

水墨效果

灯光追踪

雕塑效果

光晕模糊

下面,我通再过一些具体的案例拆解,加深大家对于【主体】+【风格】+【附加描述】+ 【特定要求】的理解。

Prompt:绝美壁纸,古装少女,月亮夜晚,祥云,古典纹样,月光柔美,花瓣飘落,多彩炫光,镭射光,浪漫色调,浅粉色,几何构成,丰富细节,唯美二次元

【主体】: 古装少女

【风格】: 唯美二次元

【附加描述】: 月亮夜晚,祥云,古典纹样,花瓣飘落

【特定要求】: 多彩炫光,镭射光,浪漫色调,浅粉色,几何构成

prompt:炫酷机甲兔子戴着墨镜,在月球上周围是飞船残骸,炫酷,高清画质

【主体】: 机甲兔子

【风格】: 炫酷

【附加描述】: 戴着墨镜,在月球上周围是飞船残骸

prompt:玫瑰钻石戒指,简约朴素,水晶雕塑,3D 建模,三维模型,虚拟引擎,渲染,影棚打光,晶莹别透,红色透光,蓝色透光,紫色透光,亮色背景

【主体】: 玫瑰钻石戒指

【风格】: 3D 建模,虚拟引擎

【附加描述】: 水晶雕塑,影棚打光,晶莹剔透

【特定要求】: 红色透光,蓝色透光,紫色透光,亮色背景

Prompt: 创意客厅,高贵蓝色视觉体验,花草,金色的光线,超现实主义,获奖的杰作,令人难以置信的细节,令人惊叹

【主体】: 创意客厅【特定要求】: 潘通色经典绿色,高饱和度,创意广角构图

【特定要求】: 潘通色经典绿色,高饱和度,创意广角构图

Prompt: 中国秀场上,高定中式礼服,奇幻的白珍珠猫男,帅气可爱男主角,珠宝光泽,简约大气礼服,美丽动人,让人着迷的服装设计,高清 3D 渲染人物,背景简单梦幻

【主体】: 高定中式礼服,白珍珠猫男

【风格】: 奇幻,高清 3D 渲染

【附加描述】: 珠宝光泽,简约大气礼服

【特定要求】: 美丽动人,背景简单梦幻

4.3.2 借助描述词生成器,原创描述词

比起干燥的文字,我们其实还可以借助一个可视化程度非常高工具,来训练我们写描述词。这个工具就是:描述词生成器(点击跳转)

4.3.2.1 描述词生成器的使用步骤

第一步:填下主体词

我们在这里填写前文使用过的描述词:质朴小屋子(A rustic little house)

点进去以后,你会看到一排英文,会很懵。别担心,我给你翻译一下。

美术语言(Art Medium),就是绘画的笔触、应用场景、图画类型等选项;

摄影语言(Camera),就是想象你在拍摄它你是什么角度拍摄,怎么曝光,视角在何处等等;

色彩(Color),画面呈现的色彩,没有什么说的;

维度(Dimensionality),2D,3D,4D,5D 这些;

显示器(Display),一些像素语言,可以根据效果选;

几何形状(Geometry),顾名思义,就是其中某主体的形状;

感受(Intangibles),这个较为复杂,开心、快乐、郁闷等情感可以是,大、小、胖、瘦,也可以是,风水、矛盾等不可名状的词,都在这里;

光线(Lighting),光源的位置以及照射方式;

材质(Material),塑料、金属、大理石、等等;

② 我们选择 “ Print ”里面的 “ Logo ”

接着是调整维度(Dimensionality),这里面能决定我的图片,是 2D 还是 3D、4D、5D

选择 “ Dimensionality ” → “ 2D-5D ” → “ 2.5D ”

显示器(Display)我也调一下,里面的设置和像素和显色有关

选择 “ Display ” → “ Palettes ” → “ HDR ”

材质(Material),我们选择了橡子(也就是橡树的果实)

选择“ Material ” → “ Plants ” → “ Acorn ”:

最后来个后处理(Post-processing),也就是后期调整,和照片的后期处理差不多转化成了比较高级的的描述词:

转化成了比较高级的的描述词:

A rustic little house, Illustration, Logo, Time-Lapse, Polychromatic-Colors, 2.5D, HDR, Cupola, Happy, Refreshing, Soft Lighting, Acorn, Ray Traced, insanely detAIled and intricate, hypermaximalist, elegant, ornate, hyper realistic, super detAIled

我放到 MidJourney 里,生成的图片是这样子的。

或者,你直接在描述词中加一个 “ by XXX ” 也可以,这里有一个艺术家的参考文档,你可以看看:画了个画中的艺术家作品和艺术风格.docx

我最后是用了宫崎骏和新海诚两个画家的风格,因此,我的描述词最终是这样子的:

A rustic little house, Illustration, Logo, Time-Lapse, Polychromatic-Colors, 2.5D, HDR, Cupola, Happy, Refreshing, Soft Lighting, Acorn, Ray Traced, insanely detAIled and intricate, hypermaximalist, elegant, ornate, hyper realistic, super

对比一下最初的图:

哈哈,兜兜转转,还是最初的小房子更质朴,但改了之后的小房子变得更炫技和华丽了。

不过这也难怪,之前的词都是为了演示所以随机选的。像多色彩、华丽、等词语对质朴这个概念是有害的,可以删去之后再看看效果如何,有兴趣的伙伴可以尝试一下。

比如我们去除了 “ 多色彩(Polychromatic-Colors) ” 、“ 华丽(ornate) ” 两个词语。

把描述词变成了:

果然质朴多了,与最初的图相比,画质、精细度也有了很明显的提升。

前期,我们对标优质描述词作修改。

现在,我们可以自己生成高级的描述词,并在自己的基础上作修改了,多试试,多改改,你也可以达到进阶水平。

💡

对应航线图任务:用描述词工具写 1 个描述词,然后用 MidJourney 出图 1 张

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

4.3.3 用 ChatGPT 写描述词

提到 MidJourney 的描述词创作,那 chatgpt 绝对是不可或缺的工具。

ChatGPT 在 AI 绘画的领域表现的也不错,它拥有大量的数据和不受限制的想象力,特别适合在提供描述词方面提供帮助。

ChatGPT 和两个主流绘画工具 MidJourney 和 Stable Diffusion,都能很好的协作。我们之前的航海里有详细的步骤,这里我给大家贴一个链接,大家直接点进去看就可以。详情👉【5 月航海 | ChatGPT 自媒体提效 | 实战手册:7.2 图片创作】

💡

对应航线图任务:用 chatgpt 写 1 个描述词,然后用 MidJourney 出图 1 张

想要知道自己 AI 绘图学得怎么样,最快的办法就是将图片发出来,尤其是发在小红书、抖音等公域平台,看看大家的评价和总体数据表现。

我们鼓励大家从现在开始,就把自己的作业,直接发布到小红书平台。具体操作可以查看👉 检测 AI 绘图能力

五、【复盘优化】检测 AI 绘图能力 @二三 🔥要快速了解自己的 AI 绘图水平,最直接的方法就是把作品发到小红书、抖音这样的社交平台上。通过观察大家的反馈和作品的数据表现,你就能知道自己在哪些方面做得好,哪些方面还需要改进。

要快速了解自己的 AI 绘图水平,最直接的方法就是把作品发到小红书、抖音这样的社交平台上。通过观察大家的反馈和作品的数据表现,你就能知道自己在哪些方面做得好,哪些方面还需要改进。

这样一来,你不仅能得到真实的观众反馈,还能根据这些反馈来提升自己的创作技巧。

在这里,我们推荐大家选择小红书平台,它对比抖音会简单一些,更适合新手。

5.1 如何发布小红笔记?

那如果发小红书,我们该发什么样的内容呢?“记录型”笔记是个不错的选择。

什么是“记录型”笔记?你可以简单的理解成用小红书来写日记。比如说:“记录自己每天用 AI 画一幅画”、“记录自己每天写一个 AI 描述词”之类的。

不过呀,该类笔记数据随机性很大,有点赞数大几千的,也有浏览量低于 50 的。大家前期不要对数据抱有太高的期待,重在持续作图、发图。

下面,我们就来看看,怎么做一个关于 AI 绘画的“记录型”账号。

第一步:搭建小红书账号

发布笔记前的第一步,是要有一个能正常运行的小红书账号。具体教程你可参考👉「12 月航海|小红书运营|实战手册」:2.3 如何包装账号

第二步:生成图片

大家可以把本次航海的 12 个作业,都作为笔记发在小红书。

第三步:写笔记文案(包括标题和正文)

为了降低大家的行动门槛,我们也为大家整理了一些参考样式,选择自己喜欢的试试水吧~

标题模板参考:

每日一画画|主标题

AIGC|第 1 天出图练习

「每日练习」+主标题拒绝摆烂|AI 绘画练习打卡 Day1

拒绝摆烂|AI 绘画练习打卡 Day1

Midjourney 每日练习(一)

正文格式参考:

方法一:对画面的简单描述即可,或与画面有关的简单段子

方法二:给出图片的描述词,简单记录自己的创作思路

方法三:如果不知道写什么,不写都行

示例:

这里我用咱们的【航线图任务 1】举个例子。

标题:拒绝摆烂|AI 绘画练习打卡 Day1

正文:你敢相信这是 AI 画的圣诞树?

第四步:写笔记标签

写完笔记后,在发布前需要加上标签。标签实际上就是一个“#+文案”,一般会放在文案末尾。

它能帮小红书系统,更精准的识别我们的内容,然后推给感兴趣的人。下面我给大家推荐一些 AI 绘画常用的标签,你可以直接复制使用。

AI 绘画和技术:

#AI 绘画

#AI 教程

#MidJourney

#StableDiffusion

#描述词

#Prompt

#构图

#技巧

#AI 美术馆

#AIGC

#sd

主题和风格:

#国风

#古风插画#古风头像

#古风头像

#古风壁纸

#古风美女

#国风大赏

#中国风

#极简美学

#动漫

#节日海报

#厚涂

#立绘

创作分享和实践:

#创作灵感

#分享

#每日一画画

#每日练习

#我和 AI 有画说

作品类型:

#壁纸#插画

#插画

#插画海报

#设计

#角色设计

顺利做完前面 4 步,你就能发布自己的第一篇小红书笔记了。

🔥对了,本章节的动作可以视做本次航海的重点动作,希望大家勇敢迈出这一步,从自媒体渠道获取反馈。

5.2 先尝试,再优化

我们必修部分到这里就结束了。这部分我们一共介绍了两款 AI 绘画工具,分别是文心一言和 Midjourney。

围绕这两个工具呢,我们设置了一些具体的任务:

第一阶段,主要是先上手,弄明白基本操作。我们的具体任务是用文心一言完成 5 组图。包括做元旦和冬至主题的图、做 AI 海报、艺术字、卡通头像和整套的表情包。

第二阶段,重点在 MidJourney 上。这阶段我们还是围绕着元旦和冬至的主题,做了 Midjourney“文生图”和“图生图”的设计。不仅仅如此,还有手机壁纸、个人形象照、表情包和梗图。

第三阶段,就是提升我们用描述词的水平,让图更上一层楼了。我们通过复制改模板描述词循序渐进,最后自己原创了提示词,也学了怎么用 ChatGPT 来帮写。

大家可以把这些通过做航海任务生成的图,发在小红书笔记上。这样能验证自己的水平,并且可能获得一些正反馈。但是除此之外,大家也可以尝试更多可能。

比如本质上你的笔记内容是头像,也可以在文案中附上你的描述词,并在标题中写上“附 AI 咒语”等字样。

大家不必限制自己非要一直发某一类型的笔记,了解用户喜欢什么或许更重要。

对了,如果你的笔记数据没什么起色,一方面,大家需要优化自己的 AI 绘图,提升图片整体质量;

另一方面,大家也可以结合小红书运营思路进行调整,想了解更多小红书运营的具体思路与细节,可以查看👉12 月航海 | 小红书运营 | 实战手册。

如果发布一段时间的笔记后,平台给了你正向的数据反馈,你也对用户喜好有了一定了解,可以逐渐保留风格与特色,尝试将账号与笔记数据做的更好,以此探索更多变现可能。

关于变现的内容呢?我们会在本手册的选修篇中,给大家做更多的拓展。学有余力的圈友们,千万不要错过了。

选修篇:学会更多 AI 绘图工具,了解更多落地场景及变现

六、学会更多 AI 绘图工具

6.1 【国内工具】学会用 MEWX AI 完成 AI 绘画 @MEWX AI 官方教程

AI 绘画的爆火带动了一批国内出图平台的诞 生,MEWX AI 就是其中之一,我们可以通过以下流程跑通 AI 绘图,并快速产出你的第一张作品。

6.1.1 注册登录

扫如下码,注册小程序:

它目前最大的特色在于,与小红书极其适配,小红书上的热门 Stable diffusion 类型的图片,在这里都可以找得到。

6.1.2 了解 MEWX AI

MEWX AI 小程序主要页面只有 4 个:

画廊页面:画廊里的都是精选作品。如果写词没有灵感,可以来这里翻阅一下大家的创意和写词技巧,新手也可以来画廊里选择自己喜欢的一键画同款试试。

创作页面:为我们主要的创作地,在这里不仅可以写简单的词描述生成图片,还可以一键把你的照片转成各种漫画风,也可以使用高级功能如 ContrlNet 等。

画夹页面:你创作过的作品都可以在你的画夹页面找到。除非是个人主动投稿,否则个人作品都属于私人作品,不会被公开到画廊。

我的页面:我的页面里展示了关于你账号的一些信息,和一些额外的功能。

画廊页面一个模型,笼统来说代表了一种画风和一种表现手法。在合适的词下选择合适的模型,是很充分必要的。

一个模型,笼统来说代表了一种画风和一种表现手法。在合适的词下选择合适的模型,是很充分必要的。

目前 MEWX AI 提供了各类不同的模型供大家选择,其中古风 V3、流光女孩等,使用频率较高,深受喜欢。

具体模型的风格大家可以查看每个模型封面图效果:

第一步:在【绘画描述】输入你对画面的描述,如果不知道输入什么,也可以查看输入框下方的推荐词。如果想要有更多自己的风格,可以👉【六、学习描述词】查看关键词如何组合使用;

第一步:在【绘画描述】输入你对画面的描述,如果不知道输入什么,也可以查看输入框下方的推荐词。如果想要有更多自己的风格,可以👉【六、学习描述词】查看关键词如何组合使用;

第二步:选择自己喜欢风格的模型,主要有流光/国风/二次元/真人/通用几个大类型可供选择;

第三步:选择想要生成的图片比例、数量;

第四步:选择图片质量,越高清的图片,需要的消耗的点数越多;

第五步:生成图片

关键词:一个开心笑的小女孩,在滑雪场滑雪

可以看出,AI 会根据我们的描述词来生成图片。描述词描述的越清晰越详细,作图就会越准确。而我们没有描述到的画面内容,AI 可能会自由发挥。

MEWX AI 关键词小技巧

可以加一些修饰词来保证高质量,例如 Masterpiece, best quality, 8k 等。

对某些需要强调的词可以加()括号来加强权重,一个括号是 1.1 倍的权重,或者例如直接写 (word: 1.6),给这个

这种方式是你可以上传一张参考图作为生成图的基底,可以是一张照片也可以是一副草图等等。AI 会结合你的参考图与你的绘画描述和选择的模型风格,共同完成画作。

6.1.5 快捷技巧:手绘头像 / 古风头像

在创作页的手绘头像和古风头像页面,我们只需上传参考图,调整风格强度,即可得到一张你的专属定制头像。

风格强度一般为 30~80 之内会比较好。

手绘头像和古风头像的画风如下图所示:

你可以在高级设置里选择你想要的融合模型,以及调整其比例。

注意事项

具体参数比例的调试非常重要,可以先加低比例的融合模型先试试,然后逐渐调整比例;

有时候添加太多或者比例设置太高并不会让结果变好,反而可能会造成崩图。若效果不好,请多次调试,打造自己最满意的风格。

6.1.7 使用规则

该平台的步骤操作都是有消耗的:

每次出图操作会消耗 2-8 个点数,普通用户初始免费点数为 30 点;

每日任务可获赠 70 点数的免费额度(下图所示);

邀请好友,双方可以各得 30 点数;

如果后期出图熟练,按平台的免费点数,约能出 8~30+图片,对于普通的图文账号玩家来说完全够用。

如果想要获得更多操作点数,可以通过充值或升级会员来实现:

每日任务:免费获取点数

充值或开通会员,获取更多点数

6.2 【国内工具】学会用 Vega AI 完成 AI 绘画 @天辉

简单来说,所有国内的小程序或网站,本质上都是 MidJourney 或者 Stable diffusion 的衍生物

如果,你的预算不足,订阅费有困难,或者本地电脑配置不够强,或者对线上部署和训练操作看的云里雾里,那么,国内的小程序和网站,就是为省钱、简化界面、简化操作方式等而产生的。

在网站运行的初期,需要大量的用户和数据,为了储存大量的关键词数据,培养用户习惯,或者优化生态等。这个时候,一般是免费为主,很多网站都是如此,Vega AI 也不例外。目前,它处于免费使用的时期,只要注册了,就可以无限制地免费使用。

一句话介绍 Vega AI : Stable diffusion 的国内简版产品,方便操作。

尽管,它支持中文生成,但毫无疑问,英文的描述词是最准确和贴近原生态的,所以,尽可能地使用英文描述词,会更准确。同时,因为它是 Stable diffusion 的套壳网站,所以,Stable diffusion 的描述词语法,在这里一样是通用的。

我们将它放在这里,是给看到 Stable diffusion 就头大的伙伴,一个简版的缓冲区。

Vega AI 官网:

https://rightbrAIn.art/

Vega AI 的优势:

操作流程更加简化,能够更好更快地创作内容

几分钟内构思,快速生成高质量的画面

支持在线快速训练,自由定制

率先开放视频生成大模型,体验视频生成的功能

Vega AI 的功能:

文生图:输入文本生成图片,同时支持中英文

用户在线训练:自由上传图片,定制自己的风格模型风格模型仓库:多种基础大模型 + 风格广场

风格模型仓库:多种基础大模型 + 风格广场

图生图:一张图片,无限风格

图片超分:HD 一键高清

局部编辑:图片编辑,局部修改 【新】

条件控制:线稿上色,姿态动作,区域控制 【新】

其他:历史记录管理与删除,生成时间优化【新】

6.2.1 玩法一:文生图

进入官网(https://rightbrAIn.art/)后,基础操作步骤如下:

第一步:在右侧工作区选择【基础模型】第四步:在页面下方的输入框里,输入你的生成文案,即关键词

第四步:在页面下方的输入框里,输入你的生成文案,即关键词

第五步:点击【生成】,完成出图,即如下图所示

下面我们来说一下每个步骤中,涉及到的名词是什么?如何使用?

6.2.1.1 基础模型(核心)

「基础模型」作为文生图以及模型定制的基底大模型,可以按照以下场景进行选择。

Vega 提供的基础大模型适用案例如下:

基础模型:写真

适用场景:亚洲人、真人写真、coser、少年感、少女感

基础模型:3D 二次元

适用场景:偏 3D 的动画人物、游戏道具、游戏人物

基础模型:虚拟建模

适用场景:建模虚拟人、有光泽的场景和物体

基础模型:真实影像

适用场景:宠物、电影人物、工业设计、包装设计

基础模型:二次元

适用场景:偏平面的二次元人物、动画场景

6.2.1.2 定制风格

「定制风格」展示的是【仓库】-【风格模型】中「我的风格」

「我的风格」来源于:(1) 风格广场中收藏 (2)点击风格定制训练新的风格

「模型适配」默认勾选,勾选上会根据选择的风格自动匹配相对应的基础模型

比如 emoji 风格是基于虚拟建模基础模型训练的,点击 emoji 风格,基础模型自动会匹配到虚拟建模,当然也可以选择其他基础模型,但是整体效果会差一点,不过偶尔也会触发出惊艳的效果~

6.2.1.3 其他文生图参数

1)基础参数

风格强度:定制风格强度,强度越大(与训练数据越相似),强度越小(生成图片的操控性越大)

图片尺寸:提供常用分辨率(512x512、512x682、512x768)

张数:可选 1-4 张

2)高级参数:建议使用默认参数即可。

当然,你也可以按照自己的想法,不参考系统推荐,完全由自己撰写描述词,生成自己想要的图片。

如果想要有更多自己的风格,可以👉【六、学习描述词】查看关键词如何组合使用;

6.2.1.5 查看历史记录

文本输入描述目标内容,同时调高编辑强度可以增大修改的强度,一般 0.5 即可:

6.2.3 玩法三:风格定制

风格定制,即由你自己挑选同一类型的图片 10 张以上,在线训练出自己的专属风格。

第一步:准备图片

图片类型:如同一人物、同一画风、同一物体、同一纹理、同一材质、同一姿势等

图片数量:10-100 张之间,图片数量越多效果越好

图片大小:建议分辨率在 512x512 像素以上

图片的内容:建议保持主体一致,避免主体元素过小

第二步:上传图片

左侧菜单栏【训练】—>【风格定制】,点击「上传照片」或使用鼠标进行拖拽上传:

第三步:选择训练参数(很重要!!!)点击「开始训练」:耐心等待约 15 分钟,等待时间内可以进入其他页面进行操作,训练完成将会有弹窗提示。

点击「开始训练」:耐心等待约 15 分钟,等待时间内可以进入其他页面进行操作,训练完成将会有弹窗提示。

第五步:使用风格模型

1)「风格定制」—> 我的模型 可以查看到刚才训练的模型,点击去应用

2)「文生图」选取训练的风格,输入文案即可进行创作

条件输入有两种形式:条件图片(普通图片即可)、条件特征(线稿、姿态图或者色块图);

条件输入有两种形式:条件图片(普通图片即可)、条件特征(线稿、姿态图或者色块图);

使用“条件图片”,系统就根据选的“条件图片”生成“条件特征”去输入来生图

使用“条件特征”,系统直接使用用户上传的“条件特征”作为输入来生图

方便理解,举个例子,我们在右侧配置“条件控制”选择“线稿生成”

如果选择“条件图片”,上传普通图像以后,系统会自动提取它的线稿,指引生成新的图像,你可以在条件特征里看到对应的线稿

如果选择“条件特征”,那就需要自己上传线稿、姿态图或者色块图,系统直接根据条件特征生成新的图片

第一步:右侧设置区选择「线稿生成」, 选择需要的模型和风格👇

第一步:右侧设置区选择「线稿生成」, 选择需要的模型和风格👇

第二步:画布区我们选择「条件图片」,并上传一张图片👇

第三步:输入文本描述词(可以选择合适的推荐词)

第四步:点击生成,等待几秒就可以生成和原图线稿类似的新图了

类似于「线稿生成」,只不过我们的条件换成了动作。

类似于「线稿生成」,只不过我们的条件换成了动作。

第一步:右侧设置区选择「动作捕捉」, 选择需要的模型和风格 👇

第二步:画布区我们选择「条件图片」,并上传一张图片 👇

第三步:输入文本描述词(可以选择合适的推荐词)Tips:

Tips:

在线编辑骨骼动作网站:https://avatarposemaker.deezein.com/,可以在这儿里定义想要骨骼动作

6.24.3 区域构图

第一步:右侧设置区选择「区域构图」, 选择需要的模型和风格 👇

第二步:画布区我们选「条件图片」,并上传一张图片 👇

「风格广场」中的风格模型可点击“收藏”按钮添加至「我的风格」中注:为避免侵犯他人隐私/肖像权,暂不支持特定真人风格的分享与投稿。

注:为避免侵犯他人隐私/肖像权,暂不支持特定真人风格的分享与投稿。

分享风格功能支持用户选择风格生成链接和提取码,他人可通过链接和提取码获取到对应的风格模型。

进入我的风格界面,点击要分享的风格进入详情页面,选择分享风格:

7.1.5.3 投稿广场

投稿广场支持用户将自己训练的风格模型投稿至风格广场。

通过审核后即可投稿到风格广场展示:

6.3 【国外工具】学会用 Dreamlike 完成 AI 绘画② 可以访问外网

② 可以访问外网

初始有 100 点额度,默认尺寸下,生成一张图,消耗 1 点额度,当步数上升,尺寸上升时,额度消耗会加大

如果你消耗了额度,每隔 1 小时,给你恢复 1 额度,最多到 100。也就是说,默认尺寸下,可以免费生成 100 张图。

打开网站

https://dreamlike.art/create

界面(使用需要登录谷歌账号)

下面的「Generate 1 image」是生成按钮,「2.2 credits」则是指本次生成图片需要消耗 5 额度。

左边的 Kandinsky 2.1 代表选用的模型。

下面的小齿轮是设置,可以将 5 改为 1,这样每次只出一张图,消耗 2.2 个积分。

主要出图按钮就是这些,填入关键词后就能生成对应的图片。至于其他按钮代表什么意思,大家可以自行摸索,写进航海日志。

6.4 【国外工具】学会用 Playground 完成 AI 绘画

前期准备:

① 一个能使用的谷歌账号

② 可以访问外网这个网站目前每个用户每天可以生成 1000 张图,足够尝试出各种按钮和参数的功能,所以这里不再赘述,大家积极尝试即可。

这个网站目前每个用户每天可以生成 1000 张图,足够尝试出各种按钮和参数的功能,所以这里不再赘述,大家积极尝试即可。

尝试的过程,是自己体验的过程,也可以记下来成为日志,成为帮助别人的攻略,它对你只有好处没有坏处。

6.5 【国外工具】学会用 Dreamstudio 完成 AI 绘画

前期准备:界面:

界面:

同样一个对话框和生成按钮,右上角是每张图片的消耗额度,每个账户 1000 Credits 的额度,用完即止。

6.6 【国外工具】学会用 Stable Diffusion 完成 AI 绘画

💡

章节概要

这一章节很长,但是并不要求所有小伙伴学完。

Stable Diffusion 本身界面复杂,新手上手较困难,如果你在阅读过程中发现理解困难,这很正常。

如果实在啃不下这个工具,前文的几个工具已经能够支持你完成出图;

但如果你对自己有更高要求,想要探索 AI 绘画更深层次的玩法与应用,建议多提问、多检索,至少明白如何用 SD 完成文生图和图生图。

本章节主要从以下几个角度出发,为大家描绘 Stable Diffusion 的世界:

✅了解 Stable Diffusion,详见👉【章节 5.1】

✅Stable Diffusion 的简易玩法:使用他人简化开发的程序完成出图,详见👉【章节 5.2】

✅Stable Diffusion 进阶用法第一步:安装到本机,详见👉【章节 5.3】

✅Stable Diffusion 进阶玩法:完成文生图,详见👉【章节 5.4】

✅Stable Diffusion 进阶玩法:完成图生图,详见👉【章节 5.5】

✅Stable Diffusion 进阶玩法:识别图片参数,详见👉【章节 5.6】

✅Stable Diffusion 进阶玩法:模型介绍、使用与炼制,详解👉【章节 5.7】

✅Stable Diffusion 进阶玩法:插件安装与使用,详见👉【章节 5.8】

大部分小伙伴,学习【章节 5.1-5.5】的内容即可,如果仍有余力,可以探索后续章节的内容。

圈友@吴东子 也写过一篇非常详细的 SD 精华帖,大家可以点击查看原帖:

《耗时 80 小时!超详细的胎教级 Stable Diffusion 使用教程,看这一篇就够!》@吴东子

Stable diffusion 能做到通过文字描述生成一张图片(文生图),亦可以在一张图片上进行部分修改或重新生成一张类似的图片(图生图)。

Stable diffusion 能做到通过文字描述生成一张图片(文生图),亦可以在一张图片上进行部分修改或重新生成一张类似的图片(图生图)。

在 Stable diffusion 中,玩家们有个好听的称呼:魔法师,生成图片的描述词则被称为魔咒。

当你看到这句话的时候,恭喜你,发现了通往魔法世界的九又四分之三站台。

通过这个软件你可以,线稿提取再生成新图片、室内风格设计、训练模特、生成各种头像、商业设计等~

Stable diffusion 图片生成的原理是把一张全是噪点的图,通过去噪的方式还原成最终的图片,如下图:

看不太懂没关系,不需要前期去研究。只需要了解到:

看不太懂没关系,不需要前期去研究。只需要了解到:

AI 学习图片是从左到右,生成噪点来学习。

AI 生成图片时,初始一张都是噪点的纸,通过去噪来还原图片

Stable diffusion 由于其开源特性,发展极为迅猛,可以说很多效果超过了 MidJourney 也完全不过分,知识系统十分庞杂,这里引入门之后,推荐大家在各种平台搜索“Stable diffusion”相关消息,尤其关注“训练”、“模型”等词汇,Novel AI 是 Stable diffusion 的一个二次元特化分支,用相关关键词,搜索可得大量资料。

相对前文的 MidJourney 而言,Stable diffusion 的强大之处还在于集成了众多优秀的插件,可以让你对生成的图片有更好的控制。并且可以训练专属的模型,号称万物皆可炼。

6.6.1.1 丰富的插件

Stable Diffusion 有丰富的插件玩法。

比如 ControlNet,一款可以提取物体轮廓、人体姿势骨架、画面深度信息、进行语义分割的插件,可以控制人物的动作姿势,手势等等细节、重绘的功能可以实现只修改图片部分地方而其他地方没有任何变化。

模型图片太多了,光模型大大小小都上万了。随便两张经典模型封面镇楼:

上图左边的魔咒(关键词):

modelshoot style, (extremely detAIled CG unity 8k wallpaper), full shot body photo of the most beautiful artwork in the world, medieval armor, professional majestic oil pAInting by Ed Blinkey, Atey GhAIlan, Studio Ghibli, by Jeremy Mann, Greg Manchess, Antonio Moro, trending on ArtStation, trending on CGSociety, Intricate, High DetAIl, Sharp focus, dramatic, photorealistic pAInting art by MidJourney and greg rutkowskiNegative prompt: canvas frame, cartoon, 3d, ((disfigured)), ((bad art)), ((deformed)),((extra limbs)),((close up)),((b&w)), wierd colors, blurry, (((duplicate))), ((morbid)), ((mutilated)), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))), out of frame, ugly, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck))), Photoshop, video game, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, mutation, mutated, extra limbs, extra legs, extra arms, disfigured, deformed, cross-eye, body out of frame, blurry, bad art, bad anatomy, 3d render

Negative prompt: canvas frame, cartoon, 3d, ((disfigured)), ((bad art)), ((deformed)),((extra limbs)),((close up)),((b&w)), wierd colors, blurry, (((duplicate))), ((morbid)), ((mutilated)), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))), out of frame, ugly, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck))), Photoshop, video game, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, mutation, mutated, extra limbs, extra legs, extra arms, disfigured, deformed, cross-eye, body out of frame, blurry, bad art, bad anatomy, 3d render

Seed: 105259061, Steps: 30, Sampler: DPM++ SDE Karras, CFG scale: 10

上图右边的魔咒(关键词):

photorealistic, long_hAIr, realistic, solo, long_hAIr, (photorealistic:1.4), best quality, ultra high res, teeth, Long sleeve,Blue dress, Big mouth,full body, 3girls, Grin, graffiti (medium), ok sign,

smile, stand,

1girl,full body,

beautiful, masterpiece, best quality, extremely detAIled face, perfect lighting, 1girl, solo,

best quality, ultra high res, (photorealistic:1.4),

parted lips

Lipstick,

ultra detAIled,Peach buttock,

Peach buttock,

looking at viewer,

masterpiece, best quality,

Negative prompt: (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans,extra fingers,fewer fingers,strange fingers,bad hand

(low quality, worst quality:1.4), (bad_prompt:0.8), (monochrome), (greyscale)

Seed: 3662021034, Steps: 59, Sampler: Euler a, CFG scale: 9

6.6.2 Stable diffusion 安装使用细节 @大刘

Stable diffusion 是一个开源的模型,开源=公开=免费,意味着你可以把这个模型下载到你自己的电脑上或者服务器上面畅玩,没有审核人员卡你图片是否有问题,随意出图。

如果不想使用上述三个由开源的 Stable diffusion 简化后的软件、网页,可以根据如下教程,学习安装 Stable diffusion 到自己电脑上进行出图。但需要注意的是,这一玩法有一定难度和门槛,你需要有一台配置还算可以的电脑或者云服务器即可上车~

6.6.2.1 查看自己的电脑配置如何查看自己电脑的配置?

如何查看自己电脑的配置?

鼠标放到最下面的地址栏—>右击—>任务管理器,就会得到以下图片

6.6.2.2 Stable diffusion WebUi 的安装和启动(以秋叶的整合包为例)

Stable diffusion 是一个模型,webUI 是 GitHub 上一位大佬基于 Stable diffusion 模型研发的一个操作页面,可以让我们通过网页的方式操作使用 Stable diffusion,以下是从安装到使用的具体步骤。

6.6.2.2.1 下载整合包

新手推荐两位的整合包,秋叶和星空。

先下载这两个文件,

下载完成后把这个 zip 文件解压(注意:文件较大,请放在有空余的硬盘下)

如果是第一次使用,请把这个文件双击安装,直接全部下一步即可。

再点击 A 启动器启动

星空安装包下载地址:

百度:https://pan.baidu.com/s/1_J2vDta7JUa4358uykTYbQ?pwd=pctg 夸克:https://pan.quark.cn/s/91252d95a346

夸克:https://pan.quark.cn/s/91252d95a346

推荐理由:插件更新很勤,上述整合包的内容中包括 Controlnet1.1 和 SadTalker 插件。

星空 AMD/Intel 显卡整合包

夸克:https://pan.quark.cn/s/ee9553e37ad4

百度: https://pan.baidu.com/s/11dzn4SMQqjQmG1fyftyC0Q?pwd=ap5t

注意:请解压时,不要给文件夹取中文名或者加空格、奇奇怪怪的符号,不然有可能会报错,很难排查!!!

6.6.2.2.2 安装 Python

Python 安装有什么用呢?主要是方便启动 Stable diffusion webUI 这个软件使用

这个软件在上述两位的一键安装包中已集成,可以不用安装。安装包中的没有环境变量,新手可暂时无视。

如果要安装,请安装 3.10.6 版本的:

链接:https://pan.baidu.com/s/1E-f0jZFEnLN1_61dPCoI8A?pwd=9lik 提取码:9lik

6.6.2.2.3 安装 git

作用:在你通过启动器无法下载或更新插件的时候,可以使用手动下载或更新,git 就是手动下载或更新插件的工具。

同样在安装包有集成,新手也可以暂时不用安装,当你遇到无法下载和更新插件的时候再安装也不迟~

安装链接:https://pan.baidu.com/s/1qWdx1hsi06h_WQ4Ia8CgiA?pwd=82uq 提取码:82uq

6.6.2.2.4 秋叶启动器的介绍

好了,完成以上步骤后,我们就能启动 Stable diffusion webUI,开始 AI 绘图了。

以秋叶启动器的界面为例,我们来看看它包含多少模块:

首次打开这个页面时,请点击左边的版本管理,把主体和插件最好是更新到最新版本,避免兼容问题,如下图操作:

大家先简单了解即可,后文中,我们会对出图步骤做详细讲解。

6.6.3.1 写出描述词

6.6.3.1.1 了解正反描述词

Prompt:即你写的文字,通常也被叫做,,。

正描述词:你想让 AI 帮你生成图片的描述词,可以是单词,也可以是句子,中间用逗号隔开,用英文描述。如我们前文出现过的 1girl, long hAIr;

通用:masterpiece,the best quality 大致顺序(画面质量描述词), (画面主题内容)(风格), (相关艺术家), (其他细节)

大致顺序(画面质量描述词), (画面主题内容)(风格), (相关艺术家), (其他细节)

例如:(masterpiece),(best quality),(ultra-detAIled), (full body:1.2), 1girl,chibi,cute, smile, white Bob hAIrcut, red eyes, earring, white shirt,black skirt, lace legwear, (sitting on red sofa), seductive posture, smile, A sleek black coffee table sits in front of the sofa and a few decorative items are placed on the shelves, (beautiful detAIled face), (beautiful detAIled eyes),

负描述词:不想让 AI 在图片上出现的描述

通用:extra arms, disfigured, deformed, cross-eye, body out of frame,NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, (((extra arms and legs)))

6.6.3.1.2 如何写描述词

更多描述词相关的内容,可以跳转至【六、学习描述词】进行学习,这里先做个梳理,方便大家了解。

描述词的概念

一句话生成一张图,描述词是我们使用好 AI 绘图的核心

包括主题、风格、场景、细节、形象等一些具体包含的要素

最好用英文书写

正负描述词

新手怎么快速用好描述词

利用翻译工具

先描述好大的框架和场景描述

再慢慢补充细节的描述词

借助各种 tag 网站 tag 超市 https://tags.novelAI.dev/

tag 超市 https://tags.novelAI.dev/

魔咒百科 https://aitag.top/

AIGC 可视化编辑描述词等

学习参考:参考网上图片的描述词,多用几次就有心得了

6.6.3.2 生成第一张图

以下就是启动成功后的页面,也就是魔法师施展魔法的地方。

图片放置的位置,可以点击图片左下角那个文件夹,或者上面启动器中的:

模型选择与调整

新手推荐下面三个采样方法,理由是 DPM++ 2M 算法更好一些,Karras 在这基础上的算法更完善一些,Euler a 则是时常会有点小惊喜的效果:

新手推荐下面三个采样方法,理由是 DPM++ 2M 算法更好一些,Karras 在这基础上的算法更完善一些,Euler a 则是时常会有点小惊喜的效果:

其他按钮

① 迭代步数 Step

可以理解为 AI 是一个画家,在一张纸上画了多少笔,推荐 20-36,效果都还不错,不要太大。

觉得图片清晰度不高,比较模糊,可以点击勾选高清修复,生成大图(低显存就不开了哈~容易出不了图)

算法推荐:R-ESRGAN 4x+ Anime6B(二次元)R-ESRGAN 4x+ (真人)

重绘幅度,就是你在原来的图片上的改动,0.5-0.73 都还不错

高清修复和面部修复不要同时开,不要同时开,不要同时开

④ 宽度高度

就是生成图片的宽高度,想要大图不要拉大宽高,容易出奇奇怪怪吓人的图。

因为 AI 预想的描述词只能画 A4 纸的大小,你给了一张 A3 的纸,多余的地方 AI 只能重复画 AI 上的内容,所以出现多头多手的图时,请调整你的宽高。

常用尺寸 512512 768768 512*768 等

想要大图可以选高清修复。

⑤ 描述词相关性(CFG)

表示你输入的魔咒对画面的影响度,越小 AI 自由发挥的空间越大,值越大 AI 发挥的空间小,会出现锐化,线条不好的情况。

⑥ 种子 Seed

可以理解为生成每张画用的纸的编号,-1 表示随机抽一张纸和笔,所以不同的种子,哪怕描述词一样,图片也会有点差异。

如果你觉得某张图片非常不错,想在这基础上稍微调整或修改,请固定种子(骰子右边的绿色箭头组成的圆圈,点一下就是固批次:每次生成图片的组数,批次的图相对变化会大一点;

批次:每次生成图片的组数,批次的图相对变化会大一点;

数量:就是一次出几张图,相对变化会小一点(因为是同一批),但是如果显存不太行就还是每次 1 张吧。

6.6.4 如何实现图生图 @大刘

人物换衣、人物换背景、画风转换等等,都可以在图生图功能中实现。例如:

换脸换衣服:

6.6.4.1 基本介绍

图生图简述:就是文生图的升级版,如果说文生图全靠想象,图生图就是告诉 AI,你就参考这个模板+我的描述给我画。

按钮相对文生图没有新增太多,但是功能都很实用,如绘图,局部重绘,局部重绘(手绘版),上传蒙版等,具体详见下图:

6.6.4.2 如何绘图

在「绘图」区上传图片,加上描述词,就能成图。

6.6.4.3 进阶玩法

6.6.4.3.1 局部重绘

1)对图片进行部分区域的修改

拉伸:上传参考图和下面宽高不一致就会直接拉伸参考图的宽高,图片里面的图也会被挤压;

剪裁:以图片的中点为中心,把多余的部分直接裁掉;

填充:如果生的图片的尺寸比参考图大,多余的部分 AI 会自动帮助填充内容,常用于风景。

2)蒙版模糊:类似 PS 或美图软件里面的边缘羽化,越小越锐化,越大边缘越模糊到接近原图。

3)蒙版模式

重绘蒙版内容:只会重新生成蒙版蒙住的内容,其他地方没有变化;

重绘非蒙版内容:蒙住的部分不变,没有蒙住的地方重绘。

4)蒙版蒙住的内容

填充:预处理图片时,把蒙住的内容重新打散了,再去重组后填充到蒙版的位置;

原图:预处理图片时,参考原图修改;

潜空间噪声:预处理图片时,通过噪声去铺满蒙住的位置,再去噪得出图片;

潜空间数值零:预处理图片时,理解为那一块儿重回混沌了,然后再生成图片。

原始图

填充

原图

原图

潜空间噪声

潜空间数值零

6.6.4.3.2 手绘蒙版

跟重绘蒙版的按键差不多,就多了个蒙版透明度

蒙版透明度:数值越大,蒙住的位置颜色越淡

6.6.4.3.3 上传蒙版

上传蒙版的参数和局部重绘是一样的,区别在于:

局部重绘需要手动慢慢涂蒙版;注意,在上传蒙版中,白色代表重绘,黑色代表不处理。也不用细分,如果弄错了,在蒙版模式中选择重绘非蒙版就可以。

注意,在上传蒙版中,白色代表重绘,黑色代表不处理。也不用细分,如果弄错了,在蒙版模式中选择重绘非蒙版就可以。

📌

到这一步为止,你已经了解 SD 的基础功能,能够使用 SD 完成出图了。但如果你想要了解更多 SD 的神奇之处,可以继续探索后文内容。

需要预警大家的是,【章节 5.6-5.8】的内容难度较高,但细嚼慢咽,多问善思,你也能在实践中体会到乐趣。

6.6.5 识别图片参数,放大生成的图片 @大刘

如果我们看到一张 Stable diffusion 生成的图片,如何提取其信息?并获得高清大图呢?

6.6.5.1 图片信息

当我们看到一张觉得非常不错的图片时,如果知道是 Stable diffusion 生成的原图,可以通过图片信息这个功能还原出图片的原始重要信息。

使用方式:

使用方式:

把图片上传到上方图片的位置(拉进去也行),右边会自动出来图片的信息。

第一行就是图片的正描述词:描述词多的会有很多行,看到第二行中的 Negative prompt,就表示正 tag 结束;

第二行中的 Negative prompt:表示负描述词;

第三行很多参数:表示步数、采样方法,用的什么模型,种子,图片大小等等信息;

第四行方框中【>>文生图 >>图生图 >>局部重绘】等:表述一键把上方的图片信息带到这些功能中。

6.6.5.2 tag 反推

哎,有小伙伴就说了,那万一图片不是 SD 的原图怎么搞咧,别急,可以使用 tag 反推功能区识别图片上的内容

CLIP 反推

CLIP 反推是自然语言的形式,反推出来的描述词是由一句话一句话组成。

例:A girl with long hAIr wore a pale yellow dress

6.6.5.3 tagger 插件

这是一个关键词反推的插件,推荐使用,生成的描述词更加精准。

用前文整合包的魔法师,整合包中这个插件一般自带下载好了的:

6.6.5.4 提高分辨率

真人 3D:算法 1 推荐 R-ESRGAN 4x+

二次元动漫:算法 1 推荐 R-ESRGAN 4x+ Anime6B 具体如下图所示:

具体如下图所示:

6.6.6 模型介绍、使用与炼制 @大刘 @吴东子

6.6.6.1 模型介绍

简单来说,如果把 Stablediffusion 比喻成一本空白的画册,模型就可以看成不同的画师,每位画师的画风、擅长绘画的领域都有所不同,所以他们每个人分别画一本空白的画册,最后出来的内容也是有各种区别的。

而这些画师,在 Stable diffusion 里面称之为模型。

常见的模型主要分为两大类:用于固定整体画风的大模型和用于微调大模型的小模型。

大模型就是 latent-diffusion 模型,拥有完整的 TextEncoder、U-Net、VAE;

小模型分为:Embedding 模型、Hypernetwork 模型、LoRA 模型;还有一种就是 VAE(不是许嵩~)

还有一种就是 VAE(不是许嵩~)

VAE 中文名叫变分自编码器,主要作用是把潜空间的数据转换成最终的正常图片展示出来;

你可以简单理解成滤镜,增加图片的色彩和处理一点图片的细节;

有些大模型是自带有 VAE 的,这个时候就不需要我们额外添加使用;

但是有部分大模型是融合了多个模型出来的,VAE 已经融合坏了,就需要额外的 VAE 去帮助图片能更好的展现;

有些模型有时候出图时,画面会比较模糊、发灰、就是这个因为 VAE 坏了,又没有额外加载来帮忙。

哪里下载模型?

前面有提到,Stable diffusion 万物皆可炼,各种模型累积已经有上万的了,主要几种在两个地方

C 站:https://civitAI.com/

抱脸:https://huggingface.co/models

6.6.6.1.1 文件后缀问题

这是新手对于模型区分最容易糊的地方。

目前常见的模型文件后缀有:.ckpt .pt .pth .safetensors,但仅通过文件后缀来判断,是区分不了具体这些文件哪一种模型的。

区别:

前 3 种:是基于 pytorch 的标准模型保存格式;

第 4 种:是由于前三种会有反序列化攻击的风险,所以这个是后面出来的新型模型格式。

实际使用起来没什么区别,只是安全性的区别而已。

6.6.6.1.2 大模型

如标题,大模型也称为底模,是生成图片的整体风格的基础,就一个字,大。

文件大小通常是 GB 为单位,常见的有 2G、4G、7G

使用方法:打开你的绘图界面,点这个刷新圈圈,在这个红色框框中选择你需要的大模型名称即可

6.6.6.1.3 VAE

文件格式和区分

常用格式: .ckpt 和 .safetensors

文件大小:通常是几百 MB

区分:名称中大部分会带有 vae

6.6.6.1.4 嵌入式 Embedding(Textual inversion)

简介:一般是对大模型中某些特别细分的调整,比如一种画风,一个有标志的物品,光线调整等等

文件格式和大小:通常是 .pt .safetensors,大小是 KB 级别的,蛮小的文件

放置位置:Stable diffusion 根目录\embeddings 下即可

使用方式

使用方式

6.6.6.1.5 超网络 Hypernetwork

文件格式和大小:常见格式为 .pt,大小一般在几十兆到几百兆不等。

由于这种模型可以自定义的参数非常之多,一些离谱的 Hypernetwork 模型可以达到 GB 级别。

放置位置:Stable diffusion 根目录\models\hypernetwork 下即可

使用方法:同上 Embedding,这里选择 Hypernetwork 里面的就行。

6.6.6.1.6 LORA 模型 Lora 可以理解为是基础大模型下的又一个小模型,是对某种画风或者是人物,物品,风景等等训练的比较专一的小模型。来源一般是 C 站或者自己炼(俗称炼丹,这里不展开了,新手先不慌哈~先用别人练好的玩)。

Lora 可以理解为是基础大模型下的又一个小模型,是对某种画风或者是人物,物品,风景等等训练的比较专一的小模型。来源一般是 C 站或者自己炼(俗称炼丹,这里不展开了,新手先不慌哈~先用别人练好的玩)。

文件格式和大小:常用 .ckpt .safetensors 格式,大小一般在 8mb~144.14mb 区间,也有极少部分不在这个里面

放置位置:和其他小模型不同,lora 有两个位置,一个是通过插件的方式(先有这个),另一种自带的和上面小模型一样

插件 lora 放置的位置

WebUI 自带 lora 放置的位置

使用方法

插件 lora 的使用

WebUI 自带 lora 的使用

模型的筛选:

单独模型介绍:

总结一句话,把作者图片上的参数,包括种子,都放到你的出图参数里。大小模型都选择一样的,就会有比较高的还原,有些细节不同也是正常的,毕竟不是同一台电脑。

快捷使用作者或者其他人的参数方式:点击图片右下角的感叹号,点复制,再去你的 webUI 页面,生成按钮下第一个箭头,点击即可。

6.6.6.3 自己动手训练 LORA 模型

今年 7 月份时,生财有术邀请视频创作者@吴东子 制作了一期视频,详细讲解 Lora 的功能、炼丹方法和实操案例。如果觉得本章节的文字版内容不易消化,不妨尝试视频教程👇

《保姆级 Lora 炼丹教程,一站式整合包,让你实现真人模特定制》@吴东子视频里用到的工具也放在下面啦,需要的自取哈~

视频里用到的工具也放在下面啦,需要的自取哈~

链接:https://pan.baidu.com/s/1dzhkZc3Hdj9EFcwfeFg2Ag?pw... 提取码:wdz6

以下文字版内容来源于@大刘老师,enjoy~

6.6.6.3.1 准备工作

介绍就不用我赘述了哈,到这里都是中高阶魔法师们了,应该用过别人的模型,现在想自己炼模型,不管是服装、人物、风景、亦或是其他,都可以慢慢训练,AI 的牛逼在于你给它东西它是真的学啊!

LORA 模型的训练最低显存需要 8G,越多越稳,训练需要的时间越短,玩的花样就更多;

实在想用 6G 尝试一下,先说好,时间会有点长,需要足够的耐心;

为了方便可以直接下载安装包,已进阶为高级的魔法师们,请自由发挥;

准备工作:Stable diffusion webUI

Stable diffusion webUI

训练模型的软件包

流程:做好准备工作(装主体文件)—>选数据集—>打标(描述词)—>设置训练参数—>开始训练—>训练完成,测试使用模型

有没有感觉这个流程,把很多图片放一起训练,像是修仙小说的炼丹,最后模型训练成功就是丹成。

6.6.6.3.2 安装包下载

这个没有可视化 UI 页面,我个人觉得更简洁。

下载 LoRa 解压包,来源 B 站:秋葉 aaaki

训练包下载地址:

夸克:https://pan.quark.cn/s/d81b8754a484 下载完成后会有这三个文件:

下载完成后会有这三个文件:

解释下:

第一个压缩包是模型训练的主体,需要解压,解压位置你自己选,注意路径尽量不要有中文名;

第二个是一个文本编辑器,可以更好的帮你修改文本内容;

第三个是 Python 的安装包,lora 训练原作者是建议 3.10.8 版本。

① 安装环境

Python 3.10.8:刚下载好的安装包里面有安装包,双击即可开始安装。

左下方这个 addPython.exe to PATH 一定要勾上,这是环境变量;先点击数字 1 再点击 2 开始安装,最后点一下箭头指的位置,再点 close:

Set-ExecutionPolicy -ExecutionPolicy RemoteSigned

Set-ExecutionPolicy -ExecutionPolicy RemoteSigned

上方图片中输入 Python 回车后出现下面的字就算成功了。这个窗口可以关了。

④ Notepad(文本编辑器)

步骤如下:

⑤ 更新主体文件

⑤ 更新主体文件

⑥ 用 PowerShell 运行 install-cn.ps1(安装依赖文件)

6.6.6.3.3 挑选图片集

图片集就是你想训练模型,让 AI 学习的图片。模型训练的好坏,图片集和打标的重要性基本是排在首位;

如果是单一人物,请让画面中只出现这一位人物,脸部多个角度图片,手、腿、身体,局部图片都可以加上;

如果希望对角度有较多要求,请给一些多角度的图片让 AI 学习;

什么拟合性这种词我就不讲了,讲白话

白话:如果希望 AI 学的好,多给点图片让它充分的学习,以便模型出的图片有较高的还原度;也建议不要给太多图片,以免适配性不强,就是学太多了,想和其他模型一起用就有点为难;

也建议不要给太多图片,以免适配性不强,就是学太多了,想和其他模型一起用就有点为难;

题外话,见过一位豪狠人,用了 3000 张图片,训练步数 40000 步。结果是中途报错了(⊙o⊙)…

如果是摄像的图片,底图原图最好;

初级炼丹师建议:图片大小最好统一,推荐 512512 或 768768;

图片可以用各种工具裁剪,截图,或者在下文【5.7.3.4 处理训练图片】处理图片时处理也行(随意~)

如果训练风格,就尽量都是统一风格的图片

6.6.6.3.4 处理训练图片

打开 Stable Diffusion 的页面

点击下方图片标识 1 和 2;

源目录就是放自己手动截屏或者网上下载好的图片文件夹(尽量同一风格,同一分辨率大小,不要出现黑框);目标目录:等下预处理完成后图片和文件放置的位置(自己新建一个就好);

目标目录:等下预处理完成后图片和文件放置的位置(自己新建一个就好);

点击下方图片标识 3、4、5,等待完成后在目标目录中可查看到:

数字 3 的位置是图片如果大了,就会根据图片的中心点进行裁剪(我不太建议勾选);

数字 4 就是让 webUI 帮我们给图片打标签(生成描述词)。

6.6.6.3.5 图片打标

图片预处理后每张图片生成的 txt 文件中就是你这张图片的描述词(也叫标签,处理这些描述词也叫打标);

如果你想固定词语,请手动打标(用工具也可以);

打标就是处理这些图片对应文件的描述词,新增或者删掉一部分文本中的描述词;

AI 会根据文本的描述词去对应图片中的内容,有对应描述词的就会学到,这个描述词代表这个;

6.6.6.3.7 设置训练参数

拷贝 SD 底模到 lora 的 models 文件下面去,参考下图

设置训练数据集路径:把右边文本中的 aki 换成左边这个自己新建的文件夹名称(就是有那个文件夹的上一层文件夹名称)

其他参数如下:

标注 1: 填写上面图片预处理时的分辨率就好了,如 512512,768768;

标注 2: 推荐 15-20(因为上面文件夹的数字如果是 6,这里如果是 20,就是一张图片训练 6 次,循环

查看训练完成的模型:在 Lora 文件夹下的 output 文件夹下即可查看

6.6.6.3.9 测试训练的模型是否成功?关键词是否有效?

可以直接在 web_ui 文生图的描述框里面输入几个 tag,出图;

然后固定 seed 值,再加入刚才自己设置到 txt 文件中的关键词(触发词)和选择炼好的模型;

再生成一次图片,拿原图和这张图对比,看有没有效果,权重也可以微调测试;

如果对比原图基本一模一样,说明关键词没有触发成功:

调整 lora 模型的去权重

底模换成你训练模型时的底模

推荐使用脚本 xyz 轴测试(显卡不太行的还是手动吧)。

6.6.6.3.10 SDXL1.0 安装和使用步骤此模型对硬件要求较高~ 内存建议 32G 以上(虚拟内存可以设置高一些) 显存 12G 以上,效果更佳

此模型对硬件要求较高~ 内存建议 32G 以上(虚拟内存可以设置高一些) 显存 12G 以上,效果更佳

先更新 SD 主体到 1.5.0 或以上版本,参考:更新 SD 版本和插件版本

下载 SDXL 的两个主模型和 VAE

https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0/tree/main

https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/tree/main

注意事项:

SD 主体必须更新到 1.5.0 或以上才能使用 SDXL 的模型;

base 主模型主要用于文生图,和对应的 baseVAE 搭配使用;

refiner 主要用于图生图,和对应的 refinelVAE 搭配使用;图片生成大小建议 10241024;

图片生成大小建议 10241024;

内存的作用主要是用来加载主模型,小了主模型加载不了,更别说使用了;

6.6.7 插件安装与使用

6.6.7.1 插件安装(以 ControlNet 为例)

6.6.7.1.1 插件简介

因为 Stable diffusion 是开源的,所以有很多大神们在此基础上开发了许多实用的插件,来帮我们对生成的图片进行更好的控制,或者是更好的提高软件使用的效率

其中最具有代表性的就是 ControlNet(也还有其他例如 Tagger、C 站助手、3D openPose 等等插件),这里只拿一种举例,只要你懂了,后面就是一通百通~

6.6.7.1.2 下载方式点击后会出来黑色的窗口,按我的操作来

点击后会出来黑色的窗口,按我的操作来

输入 cd .. 回车

输入 cd extensions 回车

输入 git clone XXXXX.git 回车,等待下载完成

注 1:这个 xxxxx 表示你要下载插件地址

注 2:用 git 的好处是后期方便插件更新

示例:

zip 解压:不推荐,理由是不方便后期插件的更新 ControlNet 可以通过线稿、动作识别、深度信息、等对生成的图像进行控制。目前已经更新到 1.1 版本,有了更多更精准的控制~

ControlNet 可以通过线稿、动作识别、深度信息、等对生成的图像进行控制。目前已经更新到 1.1 版本,有了更多更精准的控制~

如:人物骨骼图中手部识别更加精准、识别面部表情等等~详见【5.8.2.4 ControlNet 的模型介绍】

6.6.7.2.2 页面简介

插件上一步已经下载完成啦,接下来就是模型的下载,对的,这个插件也有他自己专属的模型。

虽然看起来挺多,但是实际不复杂,我只是尽量写的详细好理解:

还有部分同学的页面长这样:可以直接参考中文翻译的意思或者对应上图:

还有部分同学的页面长这样:可以直接参考中文翻译的意思或者对应上图:

6.6.7.2.3 各个模型的介绍使用

以下是 ControlNet1.1 最新版本的配置介绍,不是之前的版本(以下来自官方文档)。

注:ControlNet 和 ControlNet1.1 暂时不是同一个插件(如果之前下过,需要把之前删掉,再下载新的),后期稳定后会合并到 ControlNet 中的。

ControlNet 1.1 与 ControlNet 1.0 具有完全相同的体系结构,ControlNet 1.1 包括所有以前的模型,具有改进的稳健性和结果质量,并添加了几个新模型;

ControlNet 1.1 包括 14 个模型(11 个生产就绪模型,2 个实验模型,1 个未完成模型),模型名称如下

control_v11p_sd15_cannycontrol_v11p_sd15_mlsdcontrol_v11f1p_sd15_depthcontrol_v11p_sd15_normalbaecontrol_v11p_sd15_segcontrol_v11p_sd15_inpAIntcontrol_v11p_sd15_lineartcontrol_v11p_sd15s2_lineart_animecontrol_v11p_sd15_openposecontrol_v11p_sd15_scribblecontrol_v11p_sd15_softedgecontrol_v11e_sd15_shufflecontrol_v11e_sd15_ip2pcontrol_v11u_sd15_tile

control_v11p_sd15_segcontrol_v11p_sd15_inpAIntcontrol_v11p_sd15_lineartcontrol_v11p_sd15s2_lineart_animecontrol_v11p_sd15_openposecontrol_v11p_sd15_scribblecontrol_v11p_sd15_softedgecontrol_v11e_sd15_shufflecontrol_v11e_sd15_ip2pcontrol_v11u_sd15_tile

模型下载地址:

https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main

放置位置:

在你的 Stable diffusion(根目录)\extensions\sd-webui-controlnet\models

Depth 深度图

Depth 深度图

用深度图控制稳定扩散出图。

模型文件:control_v11f1p_sd15_depth.pth

配置文件:control_v11f1p_sd15_depth.yaml

训练数据:Midas depth(分辨率 256/384/512)+ Leres Depth(分辨率 256/384/512)+ Zoe Depth(分辨率 256/384/512)。多分辨率的多深度图生成器作为数据增强。

可接受的预处理器:Depth_Midas、Depth_Leres、Depth_Zoe。该模型非常稳健,可以处理来自渲染引擎的真实深度图。

随机种子 12345(“a handsome man”)非 cherry-picked 批次测试:

Normal

使用法线贴图控制稳定扩散出图。

模型文件:control_v11p_sd15_normalbae.pth

配置文件:control_v11p_sd15_normalbae.yaml

训练数据:Bae 的法线图估计方法。

可接受的预处理器:普通 BAE。只要法线贴图遵循 ScanNet 的协议,该模型就可以接受来自渲染引擎的法线贴图。也就是说,您的法线贴图的颜色应该看起来像这张图片的第二列。

请注意,此方法比 ControlNet 1.1 中的 normal-from-midas 方法合理得多。以前的方法将被放弃。

随机种子 12345(“a man made of flowers”)

随机种子 12345(“room”)

Canny 边缘检测

使用 Canny 预处理器的图控制稳定扩散(人话:通过边缘检测预处理后的图处理成一张图片)。

模型文件:control_v11p_sd15_canny.pth

配置文件:control_v11p_sd15_canny.yaml

训练数据:具有随机阈值的 Canny。

可接受的预处理器:Canny。

随机种子 12345(“dog in a room”)

MLSD 线条图

用 M-LSD 直线控制稳定扩散出图。主要是直线,常用于室内设计

模型文件:control_v11p_sd15_mlsd.pth

配置文件:control_v11p_sd15_mlsd.yaml

训练数据:M-LSD 线。

可接受的预处理器:MLSD。

随机种子 12345(“room”)Scribble 涂鸦

Scribble 涂鸦

用涂鸦控制稳定扩散(下方能接受的预处理器或者自己手动画粗线条涂鸦生成图片)。

模型文件:control_v11p_sd15_scribble.pth

配置文件:control_v11p_sd15_scribble.yaml

训练数据:合成的涂鸦。

可接受的预处理器:合成涂鸦(Scribble_HED、Scribble_PIDI 等)或手绘涂鸦。

随机种子 12345(“man in library”)

随机种子 12345 +描述词 the beautiful landscape

Soft Edge 软边缘

使用软边(粗线条线稿)控制稳定扩散。

模型文件:control_v11p_sd15_softedge.pth

配置文件:control_v11p_sd15_softedge.yaml

训练数据:SoftEdge_PIDI、SoftEdge_PIDI_safe、SoftEdge_HED、SoftEdge_HED_safe。

可接受的预处理器:SoftEdge_PIDI、SoftEdge_PIDI_safe、SoftEdge_HED、SoftEdge_HED_safe。

与以前的模型相比,该模型有了显著改进。所有用户应尽快更新。

ControlNet 1.1 中的新功能:现在我们添加了一种名为“SoftEdge_safe”的新型软边缘。这是因为 HED 或 PIDI 倾向于在软估计中隐藏原始图像的损坏灰度版本,而这种隐藏模式会分散 ControlNet 的注意力,从而导致不良结果。解决方案是使用预处理将边缘图量化为多个级别,以便完全删除隐藏的模式。实现在 annotator/util.py 的第 78 行。

全删除隐藏的模式。实现在 annotator/util.py 的第 78 行。

性能可以大致记为:

鲁棒性:SoftEdge_PIDI_safe > SoftEdge_HED_safe >> SoftEdge_PIDI > SoftEdge_HED

最高结果质量:SoftEdge_HED > SoftEdge_PIDI > SoftEdge_HED_safe > SoftEdge_PIDI_safe

考虑到权衡,我们建议默认使用 SoftEdge_PIDI。在大多数情况下,它工作得很好。

随机种子 12345(“a handsome man”)

Segmentation 语义分割

用语义分割控制稳定扩散生成图片。不同的颜色表示不同的物品和场景,可以识别后再手绘对应物品的颜色上去

网上可搜语义分割的颜色物品对应图;

模型文件:control_v11p_sd15_seg.pth

配置文件:control_v11p_sd15_seg.yaml

训练数据:COCO + ADE20K。

可接受的预处理器:Seg_OFADE20K (Oneformer ADE20K)、Seg_OFCOCO (Oneformer COCO)、Seg_UFADE20K (Uniformer ADE20K) 或手动创建的掩码。

现在该模型可以接收 ADE20K 或 COCO 两种类型的注释。我们发现识别分段协议对于 ControlNet 编码器来说是微不足道的,并且训练多个分段协议的模型可以带来更好的性能

使用随机种子 12345(ADE20k 协议,“house”)

使用随机种子 12345 的非 cherry-picked 批次测试(COCO 协议,“house”)

Openpose 传说中的骨骼识别

就是通过骨骼图生成图片,用于固定人物姿态、动作,现在这个新增了一个可以识别面部表情。下面有组合方式

模特动作?模特表情?不方便多讲,可自行研究

使用 Openpose 控制稳定扩散。

模型文件:control_v11p_sd15_openpose.pth

配置文件:control_v11p_sd15_openpose.yaml

该模型经过训练,可以接受以下组合:

打开姿势身体

张开手

打开姿势脸

Openpose 身体 + Openpose 手

Openpose 身体 + Openpose 脸部

Openpose 手 + Openpose 脸 Openpose 身体 + Openpose 手 + Openpose 脸

Openpose 身体 + Openpose 手 + Openpose 脸

然而,提供所有这些组合太复杂了。我们建议只为用户提供两种选择:

“Openpose”= Openpose 身体

"Openpose Full" = Openpose 身体 + Openpose 手 + Openpose 脸

这个模型的改进主要是基于我们对 OpenPose 的改进实现。我们仔细回顾了 pytorch 的 OpenPose 和 CMU 的 c++ openpose 的区别。现在处理器应该更准确,尤其是手。处理器的改进导致了 Openpose 1.1 的改进。

支持更多输入(手和脸)。

之前 cnet 1.0 的训练数据集有几个问题,包括(1)一小部分灰度人像被复制了数千次(!!),导致之前的模型有点可能生成灰度人像;(2) 某些图像质量低下、非常模糊或有明显的 JPEG 伪影;(3) 由于我们数据处理脚本的错误导致一小部分图片出现配对提示错误。新模型修复了训练数据集的所有问题,在很多情况下应该更合理

随机种子 12345("man in suit")的非 cherry-picked 批次测试:

非 cherry-picked batch test with random seed 12345(multiple people in the wild, "handsome boys in the party"):

Lineart 线稿

用 Lineart 预处理器的线稿控制稳定扩散生成图片。可用于不改形状的情况下出同类产品。

模型文件:control_v11p_sd15_lineart.pth 配置文件:control_v11p_sd15_lineart.yaml

配置文件:control_v11p_sd15_lineart.yaml

该模型是在 awacke1/Image-to-Line-Drawings 上训练的。预处理器可以从图像(Lineart 和 Lineart_Coarse)生成详细或粗略的线稿。该模型经过足够的数据增强训练,可以接收手动绘制的线稿。

随机种子 12345 的非 cherry-picked 批次测试(详细的艺术线条提取器,“bag”)

随机种子 12345 的非 cherry-picked 批次测试(粗线条提取器(lineart),“Michael Jackson's concert”)

使用随机种子 12345 的非 cherry-picked 批次测试(使用手动绘制的线稿,“wolf”)

Anime Lineart 动漫线稿

用动漫提取线稿的预处理器或手绘上传的线稿生成图片,这个比之前版本处理的更加细节

用动漫艺术线条控制稳定扩散。

模型文件:control_v11p_sd15s2_lineart_anime.pth

配置文件:control_v11p_sd15s2_lineart_anime.yaml

培训数据和实施细节:(已删除说明)。

该模型可以将真实的动漫线条图或提取的线条图作为输入。

非 cherry-picked batch test with random seed 12345 ("1girl, in classroom, skirt, uniform, red hAIr, bag, green eyes"):

随机种子 12345 非 cherry-picked 批次测试(“1girl,saber,at night,sword,green eyes,golden hAIr,stocking”)

Non-cherry-picked batch test with random seed 12345(提取线图,“1girl, Castle, silver hAIr, dress, Gemstone, cinematic lighting, mechanical hand, 4k, 8k, extremely detAIled, Gothic, green eye”)

Non-cherry-picked batch test with random seed 12345(提取线图,“1girl, Castle, silver hAIr, dress, Gemstone, cinematic lighting, mechanical hand, 4k, 8k, extremely detAIled, Gothic, green eye”)

Shuffle 洗牌(风格重组)

简单理解为把图片上的颜色和内容打散,再用打散的东西重组成一张新的图片。

通过内容随机播放控制稳定的传播。

模型文件:control_v11e_sd15_shuffle.pth

配置文件:control_v11e_sd15_shuffle.yaml

该模型经过训练以重组图像。我们使用随机流来打乱图像并控制稳定扩散来重组图像。

随机种子 12345(“hong kong”)非 cherry-picked 的批次测试

在右侧的 6 张图像中,左上角的图像是“打乱”的图像。其他都是输出。

事实上,由于 ControlNet 被训练来重组图像,我们甚至不需要打乱输入——有时我们可以只使用原始图像作为输入。

这样,这个 ControlNet 可以通过提示或其他 ControlNet 的引导来改变图像风格。

请注意,此方法与 CLIP 视觉或其他一些模型无关。

这是一个纯 ControlNet。

随机种子 12345(“iron man”)的非 cherry-picked 批次测试

随机种子 12345(“spider man")的非 cherry-picked 批次测试:

Instruct Pix2Pix

Instruct Pix2Pix

可以理解为图生图,就是在原图的基础上添加描述词去修改图片。

使用 Instruct Pix2Pix 控制稳定扩散。

模型文件:control_v11e_sd15_ip2p.pth

配置文件:control_v11e_sd15_ip2p.yaml

这是一个在 Instruct Pix2Pix 数据集上训练的控制网络。

不同于官方的 Instruct Pix2Pix,这个模型是用 50%的指令提示和 50%的描述提示来训练的。例如,“一个可爱的男孩”是描述提示,而“让男孩变得可爱”是指令提示。

因为这是一个 ControlNet,所以你不需要为原来的 IP2P 的 double cfg tuning 而烦恼。并且,该模型可以应用于任何基础模型。

此外,似乎“将其变成 X”之类的指令比“将 Y 变成 X”更有效。

随机种子 12345 的非 cherry-picked 批次测试(“make it on fire”)

使用随机种子 12345(“make it winter”)非 cherry-picked 的批次测试

我们将此模型标记为“实验性”,因为它有时需要挑选。例如,这是使用随机种子 12345(“让他成为钢铁侠”)的非 cherry-picked 批次测试

InpAInt

ControlNet 的蒙版重绘(简单测试时感觉比自带的图生图重绘效果更好,在蒙版边缘的拼接更加自然)

使用 InpAInt 控制稳定扩散。

模型文件:control_v11p_sd15_inpAInt.pth

配置文件:control_v11p_sd15_inpAInt.yaml

一些注意事项:

这个修复 ControlNet 使用 50% 的随机掩码和 50% 的随机光流遮挡掩码进行训练。这意味着该模型不仅可以支持修复应用程序,还可以处理视频光流扭曲。也许我们将来会提供一些示例(取决于我们的工作量)。

此 gradio 演示不包括后期处理。理想情况下,您需要在每次扩散迭代中对潜像进行后处理,并对 vae 解码后的图像进行后处理,使未遮罩区域保持不变。然而,这实现起来很复杂,也许更好的想法是在 a1111 中实现。在这个 gradio 示例中,输出只是扩散的原始输出,图像中未遮罩的区域可能会因为 vae 或扩散过程而改变

随机种子 12345(“a handsome man”)非 cherry-picked 批次测试

Tile 拼接 (模型还未完成)

简单的说就是把一张图切割成多张小图片,再对小图片进行细节化的重绘。重绘完成后拼接回原图片

用 Tile 控制稳定扩散。

模型文件:control_v11u_sd15_tile.pth

配置文件:control_v11u_sd15_tile.yaml

越来越多的人开始考虑采用不同的方法在拼贴处进行漫射,以便图像可以非常大(4k 或 8k)。

问题是,在 Stable Diffusion 中,您的提示总是会影响每个板块。

比如你的提示是“a beautiful girl”,你把一张图片分成 4×4=16 个 block,每个 block 做 diffusion,那么你得到的是 16 个“beautiful girls”,而不是“a beautiful girl”。这是一个众所周知的问题。

现在人们的解决办法是使用一些无意义的提示,比如“清晰、清晰、超清晰”来扩散块。但是你可以预料,如果去污强度高,结果会很糟糕。而且由于提示很糟糕,所以内容非常随机。

由于提示很糟糕,所以内容非常随机。

ControlNet Tile 就是解决这个问题的模型。对于给定的图块,它识别图块内部的内容并增加识别语义的影响,如果内容不匹配,它还会减少全局提示的影响。

随机种子 12345(“a handsome man”)非 cherry-picked 批次测试(看左边上传的图片,有圈出来小框框,右边的 6 张图是重绘框中的图像)

你可以看到提示是“一个帅哥”,但是模型并没有在树叶或手部区域绘制“一个帅哥”。相反,它会识别树叶和手并相应地进行绘画。

通过这种方式,ControlNet 能够更改任何稳定扩散模型的行为以在分块中执行扩散。

请注意,这是一个未完成的模型,我们仍在寻找更好的方法来训练/使用这种想法。现在,该模型在 200k 4k 分辨率的图像上进行了训练。

6.6.7.2.5 ControlNet 组合技

组合技,即如何同时使用多个。

例如下图的两只狗狗,这里是使用了两张 Canny 提取的预处理图片,分别放在两个 ControlNet 里面

ControlNet0

ControlNet1

这样就会有多个了,组合拳打起来~ 闪电五连鞭~

恭喜你!当你能完成插件的安装使用和模型的炼制,就已经成为一名优秀的高阶魔法师啦~

6.6.8 常见问题答疑

问题一:电脑配置比较低,显存只有 6G 怎么办?

七、了解更多落地场景及变现

💡

篇章概要

AI 绘画发展到现在,已经诞生出许多应用方向与场景,根据了解,我们整理出 13 个讨论热度高、相对高频、实用的 AI 绘画应用方向,并已整理相关资料,或邀请已经在 AI 绘画领域深耕的老师们为大家描绘了玩法:

✅AI 绘画+动态视频

✅AI 绘画+包装领域

✅AI 绘画+插画设计

✅AI 绘画+电商领域

✅AI 绘画+IP 定制

✅AI 绘画+LOGO 设计

✅AI 绘画+产品定制

✅AI 绘画+头像壁纸

✅AI 绘画+室内装饰✅AI 绘画+美甲设计

✅AI 绘画+美甲设计

✅AI 绘画+摄影照片生成

✅AI 绘画+艺术二维码

✅AI 绘画+四维彩超

在【二十一、更多 AI 绘画应用思路】,我们给出了更多正在发展中但新颖有趣的 AI 绘画应用思路,你可以从中发现更多方向,或许某个玩法就能让你灵光一现。

本下篇的核心目的,是希望大家们看到对应场景下的内容后,能够了解 AI 如何在对应场景发挥作用,并逐渐开始自己尝试~比如 AI 绘画+包装,希望大家看完后,能知道如何用 AI 绘画进行包装相关的创作,辅助提高生产力或完成变现。

需要注意的是,受限于目前的发展,部分玩法已有成功案例,大家可以参考学习,但仍有许多玩法仍在探索期,如果愿意钻研,你可能就是第一匹跑出来的黑马。

期待能跟大家一起在新领域碰撞出新火花。

7.1 AI 绘画如何应用于动态视频 @蕃茄

主要玩法是,使用的是 AI 绘画工具绘制一个美女图,然后搭配腾讯智影等这类工具做成动态视频:

以 无界 AI 举例,进入广场后,随便翻一下,可以看到很多美女图:

以 无界 AI 举例,进入广场后,随便翻一下,可以看到很多美女图:

随便点一个美女进去,点击右下角一键同款,这样我们就可以得到和作者一样的图了:

步骤二:如何让纸片人老婆动起来?

ChatGPT 咒语 ②:以王婵娟 自己的口吻介绍自己,口语化,用可爱俏皮的口气

然后一个美女说话的动态视频就生成啦:

WeChat_20230531203704.mp4【在线播放】

知乎想法收益,每天发一个想法可以提高账号等级、之后也可以申请好物带货、付费问答以及接商单:

变现优缺点

优点:只要看的人多,收益没有上限,通过 AI 创作的成本也很低;缺点:同质化会严重、如果没有爆款收益非常低,可能只有几分钱。需要大家有好的网感和对平台用户的了解。

缺点:同质化会严重、如果没有爆款收益非常低,可能只有几分钱。需要大家有好的网感和对平台用户的了解。

这里只是给大家一个思路,大家可以举一反三,根据这些工具发挥自己的创造力去创作优质的内容,从而变现。

内容来源:《AI 绘画变现思路分享》

7.2 AI 绘画如何应用于包装领域

7.2.1 玩法介绍 @刘楚宾

AI 绘画+包装领域,即利用 AI 绘画辅助完成产品包装,不仅能提高创意性、进一步提高设计生产力,还能降低大家想要完成个性化包装定制的门槛。

该玩法目前主要在以下几个类型上发挥作用:

① 个性化定制包装。AI 可以根据消费者上传的照片或描述,自动生成带有个人特征的定制包装,如带有自己脸部或名字的蛋糕盒、香水瓶等。这满足消费者的个性化需求。

② 限量版包装。AI 可以快速生成一系列限量版包装设计样本,供设计师选择和创作者购买,产出的限量版包装更加新颖独特,满足爱好收藏的需求。

③ 情景广告包装。AI 可以根据品牌提供的商业场景描述,自动生成带有情景故事的广告包装,带来更强的情景感和视觉震撼,在促销中发挥重要作用。

④ 节日包装。AI 可以根据不同节日主题,生成带有节日元素如春节红色等的包装设计,满足节日销售的市场需求。设计师只需要提供简单的节日关键词,AI 可以快速生成相关设计样本。

⑤ 虚拟品牌包装。AI 可以通过学习分析大量真实品牌的包装设计,输出自己的创作品——全新的虚拟品牌的包装设计。这可以作为设计师构思全新品牌视觉设计的创意来源。

⑥ 梦幻风格包装。AI 可以根据描述生成色彩鲜明、形象离奇的梦幻包装设计,如星夜下的飞马等,这类包装更加突出视觉冲击感,在青少年市场备受欢迎。

当然,你也可以由此找到更多新奇、自我的玩法。

AI 绘画在包装领域的优势有:

提高创意性:AI 可以无限组合现有图像,生成全新的视觉效果,能够激发设计师的创意灵感,推动包装设计向更加新颖独特的方向发展。

加速设计速度:AI 可以在很短时间内根据设计师的描述生成大量样本图像,设计师可以从中选取最佳方案,大大加快设计迭代的速度。

Lower 设计成本:AI 可以自动生成包装设计样本,不需要人工绘制大量样稿,可以显著减少人工成本支出。

满足个性化需求:AI 可以根据消费者喜好与品牌定位定制个性化包装,生成具有个性特征的包装设计,满足消费者对个性产品的需求。

提高设计生产力:一位设计师使用 AI 辅助设计工具可以在同一时间内完成更多设计工作,产出更多更优质的创意方案,大幅提高团队的设计生产力。

更加环保:AI 绘画技术是数字化设计工具,不需要纸质或者其他材料消耗,设计过程更加环保地球。

吸引消费者眼球:AI 生成的新颖设计可以带来强烈的视觉冲击,吸引消费者的注意力,在营销及品牌推广中发挥重要作用。

AI 绘画为包装设计带来了诸多优势,相信在未来会与包装设计深度结合,推动包装设计朝着数字化、个性化与创新性的方向发展。但人工审美与操作也同样重要,AI 应作为设计师的创作助手与工具存在。

当然,与之相对的,AI 绘画仍存在一定局限性:

缺乏情感特质:AI 生成的图像天然缺乏人工设计那样丰富的情感与文化内涵,难以打动消费者情感或传达品牌精神。

缺乏品牌个性:AI 目前难以全面掌握品牌的特征与个性,生成的包装设计可能缺乏品牌特征,难以塑造品牌在消费者心中的印象。

的印象。

单一创意类型:AI 生成图像的分布往往过于集中在某些创意类型,会限制设计师的思维,导致包装设计流于同质化。人工设计则可以跳脱这种限制。

图片质量参差不齐:AI 生成图像的品质参差不齐,有的图片细节处理得很好,有的则显得过于冗长或荒谬,无法直接使用,需要设计师进一步加工与改进。这需要一定人工成本。

过于务实缺乏美感:目前 AI 图像生成更注重图像信息的组合与拼贴,但在审美与艺术感度上还略显不足,不能完全取代人工美术设计。

依赖大量数据:AI 图像生成需要海量的数据集进行模型训练,数据质量和数量对生成结果有很大影响。获取该数据也需要投入大量资源,这会对研发成本造成影响。

存在潜在的道德风险:如果 AI 模型训练的数据集存在偏见,AI 生成的图像也会继承并扩大这些偏见,这会造成潜在的道德风险,需要在开发过程中引入更多人工判断与控制。

以上 AI 绘画的优势与局限性,在下文的其他玩法中也都是大致相似的。

综上,AI 绘画在包装设计领域的应用还需要在模型与算法的进一步提高,以及与人工设计的有机结合中不断优化与发展。人工审美与设计也同样重要,需要在 AI 应用中得到很好的平衡。

审美与设计也同样重要,需要在 AI 应用中得到很好的平衡。

7.2.2 如何实操 @刘楚宾

该玩法中,我们推荐的工具为 MidJourney 画图+包小盒贴图。

如何使用 MidJourney,可参考章节【四、学会用 MidJourney 完成 AI 绘画】

包小盒网址:https://www.baoxiaohe.com

下面我们举个例子来看看实操过程:

第 1 步:MidJourney 画图

/imagine prompt:Avatar of a girl with mixed ponytAIls, black hAIr, Chinese girl, cute girl, highly detAIled 3d cg --niji 5 --style expressive

关键词:一个合马尾辫女孩的头像,黑发,中国女孩,可爱的女孩,高度详细的 3d cg --niji 5 风格的表现力

选择你需要的产品样机,然后点进去,我们就以瓶体为例:

比如我们选择纸杯:

然后上传刚才生成的 MidJourney 图片进行产品贴图:

换张图,换个样机,例如换成易拉罐,效果也不错:

换张图,换个样机,例如换成易拉罐,效果也不错:

操作说明:

杯子,瓶子类的图,可以在 MidJourney 里面设置生成的图片尺寸为 16:9 的比较好;

会 Adobe Illustrator(支持 2019-2022 版本)的可以直接下载包小盒的 AI 插件,直接软件操作效果更好;

会 PS 更好,可以根据尺寸,直接在 PS 排版好,打上字体和标签,然后在贴图。

7.2.3 常用关键词 @Sky🏹

在上篇学习关键词时,我们了解过它的写法与组成。但在不同领域,常见关键词与常用关键词公式往往能帮我们节省很大精力。

包装设计常用关键词:

这部分的关键词与分类非常多非常细致,上图仅为部分展示,光看小图就能看到密密麻麻的字符,具体详表见:

包装设计常用关键词

上表中的这些关键词,在其他不同领域也能加以应用,关键就看大家如何吸纳变通~

下面我们来看一些应用示例:

描述:设计一款纯色英文手写字体,简单文字排列的,香薰蜡烛包装设计

翻译:Design a solid color English handwritten font simple text arrangement of aromatherapy Candle packaging design hd 8k

描述:芳香疗法精油包装设计,玻璃瓶礼品盒,文字信息,莫兰迪颜色,环境照明确定

翻译:Aromatherapy essential oil packing design premium sense byredo glass bottle gift box text Message morandicolors ambient lighting ok

colors ambient lighting ok

描述:口红包装,高档感,高饱和度,精美礼盒,文字信息简约风格,哑光标志,舞台灯光背景,超广角

翻译:Lipstick packaging high-class feeling highly saturated exquisite gift box text message minimalist style Style matte logo stage lighting background bokeh ultra wide angle 8k

描述:自然插图,充满生命力,鸟和花矿泉水瓶包装,高清晰度

翻译:An illustration of nature full of life birds and flowers mineral waterbottle packaging hd

bottle packaging hd

描述:设计一款,中国白酒包装设计,文字布局

翻译:Design a text layout premium simple chinese liquor packing

描述:设计一款矿泉水的包装,背景在湖面

翻译:Design a water package design On the lake

描述:设计一个现代极简的透明包装,新鲜的文字,果汁包装设计,高清

计,高清

翻译:design a modern minimalist transparent packaging fresh text arrangement of juice packaging design hd

描述:CD 唱片包装设计,高品质,极简风格,白色背景,纯文字信息排列

翻译:cd record packing design high quality minimalist style kenya hara white background pure text message arrangement

描述:设计一个几何平面风格的水果味冰淇淋包装设计,美丽的文字安排

描述:设计一个几何平面风格的水果味冰淇淋包装设计,美丽的文字安排

翻译:design a geometric flat style fruit flavored ice cream packaging design with beautiful text arrangement hd 8k

描述:设计一个简单的米包装,纯色背景,文字信息,自然光,前视图高清

翻译:design a rice package simple solid color background text message natural light front view hd 4k

描述:牛奶包装,完美盒,孟菲斯配色方案,几何色块,简单质感,自然采光背景

描述:牛奶包装,完美盒,孟菲斯配色方案,几何色块,简单质感,自然采光背景

翻译:milk packing perfect box memphis color scheme geometric color block simple premium sense text message natural lighting background bokeh medium 8k ultra hd

描述:鸡蛋礼盒包装,纯色养鸡场,素描文字插图,农场场景,鸡超广角

翻译:egg gift box packaging solid color chicken farm sketch text arrangement illustration with farm scene and chicken super wide angle

描述:香水包装,高级感觉,玻璃瓶,淡色,精美礼盒,文字信息,岩石背景,自然光,深聚焦,超广角

翻译:perfume packaging premium feel glass bottle pale colors fine gift box text message rocky background natural lighting deep focus ultra wide angle

描述:设计一个彩色条纹图形,重复图形,文字排版,英文排版,色块装饰,精美和简单的冰淇淋包装

翻译:design a colorful striped graphics repetitive graphics texttypography label english typography color block accents decoration fine and simple ice cream packaging

typography label english typography color block accents decoration fine and simple ice cream packaging

描述:薯片包装,橙色垂直条纹袋,黄色背景,薯片开胃,文字排版,完美的灯光效果,超宽的角度

翻译:chips packaging orange vertical striped bag yellow background chips appetizing text message perfect lighting effect super wide angel

描述:中秋月饼礼盒套装设计,3 款产品,不同的盒型,出现月饼中秋和月亮,超广角视觉构图,背景星空夜景树枝,4k 超高清画质

景树枝,4k 超高清画质

翻译:Beautiful goddess elf with holographic glowing reflections, by loish,

目前,AI 绘画在包装领域尚未探索出体系化的变现方式,大家可以尝试做个先驱者,躬身探索。

7.3 AI 绘画如何应用于插画设计 @木木|终身成长践行者

不论是做什么设计图,首先要了解一个设计类型图片的概念、种类和风格,有了一个大概的框架,会有助于在接 AI 定制画的过程中,了解客户需求后,可以快速的提供设计思路,做出成品图。

而这一个框架的搭建,需要在实际应用的积累中完成,不要一次性的过多的输入各种关键词,对于非艺术专业来说,需要文字+图片的结合才会更直观的了解一个概念,这个是需要不断在「输入关键词→出图」的循环过程中实现的。

7.3.1 玩法介绍先来了解一下插画设计的概念、种类和风格。

先来了解一下插画设计的概念、种类和风格。

插画设计是指通过手绘或计算机绘图等方式制作的图像,通常用于书籍、广告、漫画、游戏、动画等领域。根据不同的制作方式和用途,插画设计可以分为以下几种类型:

手绘插画

数字插画

平面插画

三维插画

角色插画

商业插画

手绘插画,使用传统的绘画工具如铅笔、彩色铅笔、水彩、油画等手工制作完成的插画,可以分为以下几种具体类型:油画插画、水彩插画、铅笔插画、彩铅插画;

数字插画,具有高度的精确度和可编辑性,它的种类有很多,以下是一些常见的类型:平面数字插画、2D 动画数字插画、3D 数字插画:主要用于电影特效、游戏制作等领域,可以呈现出逼真的立体效果;

平面插画,用于印刷品或网络平面广告等场合,它的类型包括但不限于以下几种:平面设计、网络平面广告、商业插画、图标设计;

三维插画设计,可以呈现出立体的效果,用于游戏、动画等领域。它的种类包括但不限于以下几种:三维建模、三维渲染、三维动画;

角色插画设计,专门描绘人物形象的插画,可以根据不同的需求设计出不同的风格,如写实、卡通、漫画等。包括但不限于以下几种:写实风格角色插画、卡通风格角色插画、漫画风格角色插画;

下几种:写实风格角色插画、卡通风格角色插画、漫画风格角色插画;

商业插画,用于商业广告宣传等用途的插画设计,通常是根据客户要求制作的定制化作品。它的类型包括但不限于以下几种:广告插画、包装插画、儿童插画、漫画插画、科技插画。

AI 绘画在插画领域的优势,大致与包装领域相似:

快速批量生产:AI 绘画可以在短时间内生成大量的插画设计,节省了人工绘画的时间和费用。

提效,减少试错成本:AI 绘画可以根据用户需求可以快速生成设计方案,缩短设计周期,减少了人工设计的错误和不必要的工作。

多样性:AI 绘画可以生成多样的插画设计,包括风格、色彩、线条等方面的不同。

可定制:AI 绘画可以根据客户需求进行定制,生成适合客户需求的插画设计。

扩展创意:AI 绘画可以生成多样的设计风格,为设计师提供更多的创意灵感。

丰富内容提供多种选择:AI 绘画可以根据客户需求生成大量的设计内容,为客户提供更多的选择。

局限性上,AI 绘画做不到的内容也都差不多,难以应对复杂场景、依赖训练数据、缺乏创意和个性,但最主要的是,可能会存在版权问题。

在版权问题。

如果在接商单的创作中,用了知名艺术家的名字生成的画,需要注意版权问题的处理,避免侵权和纠纷。当然,最好是别触及版权问题。

那么该如何用 AI 绘画工具完成插画设计呢?我们在实操部分来具体解析。

7.3.2 如何实操

根据插画设计的种类,我们可以有一个快速出图的基础公式:【插画设计种类】+【你想要的画面】

为了更直观的让大家了解出图效果,我用 niji 出图,它可以直接用中文,我的关键词是:

手绘插画,一个可爱的小女孩和狐狸 --ar 2:3 --niji 5 --style scenic

素描插画,一个可爱的小女孩和一只狐狸,--ar 2:3 --niji 5 --style scenic

现代艺术插画,一个可爱的小女孩和一只狐狸,--ar 2:3 --niji 5 --style scenic

那么在基础公式上,我们还可以再继续添加:

【插画设计种类】+【插画风格】+【你想要的画面】+【by 艺术家姓名】+【其他】

当然这个公式不是固定的,你可以加入你想加入的任何元素,或者直接用【插画风格】+【你想要的画面】都是可以的。

铅笔插图手绘,穿着海军制服的中国可爱女孩,非常可爱,黑色的大眼睛,短发,

Pencil illustration hand drawn, cute Chinese girl wearing navy uniform, very cute, with big black eyes and short hAIr, --ar 2:3 --v 5

3D illustration: 3D modeling, 3D rendering, 3D animation

3D illustration: 3D modeling, 3D rendering, 3D animation

角色插画:写实风格、卡通风格、漫画风格

Character illustration: realistic style, cartoon style, comic style

商业插画:广告插画、包装插画、儿童插画、漫画插画、科技插画 Commercial illustration: advertising illustration, packaging illustration, children's illustration, comic illustration, technology illustration

Commercial illustration: advertising illustration, packaging illustration, children's illustration, comic illustration, technology illustration

7.3.4 变现方式

在经历过了实操后,相信大家对插画的成图效果有了一定的了解,那么我们就可以结合自己的自身技能+想要的粉丝画像来进行出图,发布小红书等平台啦。

变现方式包括但不限定于:小红书+公众号+神图君取图/网盘拉新+社群/教学+定制图+自有业务推广。当然,这个变现玩法,不局限于哪类账号,基本都适用,就看如何选择。

需要注意的是,在此之前,我们还需要先想清楚自己帐号的定位,确定自己想要吸引什么样的粉丝,就做哪一类型的图。比如,想要吸引宝妈类的人群,可以做儿童插画,以绘本类的方式去出图,发小红书,可以搭配免费赠送绘本的方式引流。

不同类型的插画适合什么样的领域,在上面的介绍中已经很清晰了,如果想要做海报类的,就考虑广告插画,如果想要做绘本类的,可以考虑儿童插画,漫画插画,卡通风格角色插画等等,依据自己想要涉及的领域进行做图。

7.3.4.1 原图变现

类型二:教学号(难度等级🌟或者🌟🌟🌟🌟🌟)

难度等级🌟的教学号:

仅需发布图片+关键词即可,可以复制 MidJourney 画廊热门关键词出图,发布图片+关键词

难度等级🌟🌟🌟🌟🌟的教学号,以课程/社群教学变现:

小红书群聊,引导粉丝进群后,可以在群聊公告里写出取图方式,粉丝直接去搜索取图小程序,通过粉丝取图看广告,我们赚取点击费。如:

方式二:建立小红书群聊,群公告改为自己的公众号

以公众号为媒介,公众号取图,涨粉速度快,且安全,不存在频繁被加风险,引流到公众号上,用户通过公众号获取图片。

那么到公众号取图,会有以下 3 种变现路径:

小程序取图收益:与方式一类似,在公众号上直接跳转到神图君等取图小程序,通过取图看广告,赚取点击费

这里要注意的是,某些取图小程序,比如神图君,要满 20,才能提现,变现不是即时的。当然,如果你神图君里的图片比较多,不排除用户会多点几个,让你收益多多。

网盘拉新:在公众号上回复设置好的引导词,如“取图 1”,会自动回复你设置好的网盘链接,用户点击网盘链接,下载 APP,转存获取图片,赚取拉新费用。

这里需要注意的一个点是:有可能你的用户已经有你要拉新的网盘,那么他就不属于一个新用户了,你可能就获取不了这部分收益,所以这个方式,是有几率赚不到钱的。

私域+网盘拉新:那么针对第 2 种,你可能赚不到钱的方式,我的建议是,回复关键词,跳转出你的微信二维码,让用户扫描

7.3.4.2 定制变现

AI 绘画可以通过以下方式进行定制变现:

① 设计定制化插画:可以根据客户需求进行定制化设计,提供更多的选择和服务。

7.4 AI 绘画如何应用于电商领域 @常常🔥

7.4.1 玩法介绍

AI 模特图/产品图,是通过 Stable Diffusion、MidJourney 等 AI 绘图软件,以文字生图、图生图、条件生图等形式,在无真人模特、无真实拍摄条件下直接创作图片,以达到商家使用目的的项目制作过程。

目前的 AI 绘图技术不仅可以实现“一句话出图”,而且随着技术的不断进步,AI 绘画的作品开始慢慢变得以假乱真,AI 绘画制作的模特图和产品图的效果,已经慢慢超越现在很多新入电商摄影的新手。

其优势主要有以下几点:

成本低:在一次性少量产品拍摄时,AI 绘画具有比较大的成本优势,而且随着 AI 绘画技术的不断发展,未来 AI 模特图的制作成本,将会变得更低,甚至可以在大规模的批量摄影上,与传统电商摄影抢占市场。

不受时间、空间场景的限制:AI 绘画可以根据客户指定的场景进行出图,不需要考虑拍摄场地,直接使用 AI 绘画技术进行场景的生成客户想要的效果图;相比于传统电商摄影,省去协调场地、准备拍摄环境等工作流程,帮助客户节省拍摄的时间和可以快速满足个性化、定制化需求:AI 绘画可以通过快速改换模特,生成符合产品特色的模特图/产品图,满足客户对于产品模特的个性化、定制化需求,保持整个店铺模特风格的统一性。

可以快速满足个性化、定制化需求:AI 绘画可以通过快速改换模特,生成符合产品特色的模特图/产品图,满足客户对于产品模特的个性化、定制化需求,保持整个店铺模特风格的统一性。

但 AI 绘画在实际电商图出图中仍有局限,比如我们来看下图:

(客户提出需求将模特进行替换,并进行合适的穿搭)

现在我给大家布置一道思考题:上图是否能够满足商家的商用需求?

答案是不能满足商家要求,不能满足商家要求的原因是:AI 生产的模特过于幼态,没有成熟女性(中老年)的气质。

目前达成 AI 模特有两大思路,各有局限性。

第一个思路是让 AI 根据投喂的图片重塑整张照片,优点是更智能,图片可能也会更容易协调,美观;

缺点是在这种条件下稳定性(生成对应的模特和服装)和细节准确性(服装的细节把控,比如衣领,扣子)会弱。

在这种技术下 AI 绘画“挑活”

AI 绘画“挑活”

AI 模特服装图复杂的款式目前技术达不到,能做简单款的产品,不能满足较高要求的拍摄,特别是带有繁杂花纹的衣服,很难保证 AI 模特的衣服与实物完全一致,需要借助后期处理技术;

但传统电商摄影不存在这个问题,传统电商的线下拍摄,有相机、有模特、有场景就可以拍,没有拍不出来的照片,而且可以保证照片即实物。

成品概率低,效率低

使用 AI 技术进行 AI 模特图/产品图创作,受限于机器性能、模型训练时间,在实际操作过程中,需要测试、训练多次才能达到满意的效果,适合产品的个性定制化,不适合大规模;

一次进行上百款大规模产品拍摄,在使用同一位模特的情况下,使用传统摄影成本低、时间短,更为划算。

但是如果 AI 技术进一步进步,准确性进一步增强,会很有前景。

第二个思路是让 AI 根据投喂的图片,不改变衣服,只对模特,背景做出更换,这种情况下,实物容易保持一致,缺点是还不够那么的”智能“,图片可能协调度,美观度的上限不如第一种高。

让模特做一些简单的动作可以,但是复杂难以识别的不行,比较适合团队作战。

关于 AI 绘画在电商模特摄影领域的应用,更多的详细信息,可以参考生财有术圈友的精华帖:《失业危机自救:AI 模特项目

7 天跑通变现闭环的复盘实录》

7.4.2 如何实操

使用 AI 绘画技术,进行电商模特图/产品图的制作,目前能够实现的主要是三种技术:

7.4.2.1 初阶技术

方法一:使用 MidJourney 软件的以图生图功能

适用于纯色简单款衣服:如卫衣、T 恤、衬衫不适用于复杂花色、花纹类衣服,生成符合要求的模特模特

具体操作步骤:

① 写一个符合你要求的文案,例如

“一张亚洲美女模特的全身照片,穿着舒适的运动衫,站在白色背景板前。这是一张人像照片,采用低角度拍摄,使用佳能 EOS R5 相机和标准镜头,拍摄模特整套服装,并展示她 165 厘米的身高。”

② 将这句话放入 ChatGPT 或者其他翻译软件中,翻译成适合 AI 绘画的英文描述词

⑤ 将符合要求的图片下载下来,与我们准备好的衣服照片,通过 Photoshop 等修图软件,简单的叠加放在一起:

⑥ 将经过 Photoshop 处理后的图片,按住 shift 键,上传至 MidJourney 的 Discord 机器人栏中,获取上传成功的图片链接。

注:使用 MidJourney 绘图软件,在实际生成 AI 模特图时,会因为 AI 绘图的随机性,存在颜色和衣服上 logo 的变化,可以通过后期的修图进行处理,完成自己想要的作品。

方法二:使用 Vega AI 创作平台的软件的局部重绘功能

考虑到部分圈友受限于电脑设备的硬件限制,不能流畅使用 Stable Diffusion 模型源代码安装包,所以,采取一种更为稳定、简单、可靠的方式,使用 Vega AI 创作平台进行快速进行 AI 模特局部更换。

Vega AI 教程👉【三、简易方法:学会用 Vega AI 完成 AI 绘画】

Stable Diffusion 教程👉【五、学会用 Stable Diffusion 完成 AI 绘画】

① 我们以一张不是很满意的商品模特实拍图为例,对模特图进行局部调整,将模特图绘制成我们想要的样子:

现在,我们根据上文的过程,进行对其他图片换脸,商家要求:将下图的欧美模特换成亚洲模特。

现在,我们根据上文的过程,进行对其他图片换脸,商家要求:将下图的欧美模特换成亚洲模特。

如上图,我们完成 AI 模特的局部重绘。

但大家可以思考下:这样的图片可以完全满足商家需求吗?

答案是不能满足。

这个不能满足商家要求的原因是:模特脸部和身体的协调度低(可以理解为美洲豹身上长了一张兔子脸),有违和感,衔接不够自然,并且这张脸没有模特的张力感。

① 根据 Vega AI 平台训练定制专属模型要求,准备图片:

图片类型:如同一人物、同一画风、同一物体、同一纹理、同一材质、同一姿势等

图片数量:10-100 张之间,图片数量越多效果越好

图片大小:建议分辨率在 512x512 像素以上

图片的内容:建议保持主体一致,避免主体元素过小

② 输入风格名称,根据下方五种基础模型的展示图,选择适合自己需要的模型,在右侧菜单栏的基础模型中选择基础模型,基础模型是 Vega AI 平台的内置模型,不同的模型之间差异非常大,会直接影响出图效果,需要进行慎重选择:

7.4.3 变现方式

如果你本就在电商领域,你可以直接将 AI+电商领域的玩法学以致用;

如果你非电商领域玩家,那么以下两种方式也可以变现。

方式一:出售教程在小红书、淘宝、闲鱼店铺,通过给商家发送私信,寻找合适的商家店铺,进行商家合作。

在小红书、淘宝、闲鱼店铺,通过给商家发送私信,寻找合适的商家店铺,进行商家合作。

通过为商家提供不同的 AI 模特服务,按照实际出图张数进行收取费用。

方式三:成为 AI 模特商业链上面的任意一环

比如,能够获取流量,能够获得很多商家资源,可以为 AI 摄影师提供商单资源,获得收入。同理,AI 摄影师也可以为这样的渠道提供人力资源。

所有生意都会有多个环节,供应链,流量,产品交付,在每个环节上都有着可以进行提供个人价值的变现机会。

方式四:资源组合,形成团队赚钱

在上文已经提及,AI 模特绘图单个个人进行产出,效率和收益都很低,难以接下大单,比如商家一次要 500 张图,要求一周内出图。

出图。

这种情况下,必须团队作战,比如有 10 个人,1 个负责推市场,1 人负责商家沟通和交付,剩下 8 人,负责出图,那么每人一周的工作量就是 60 张+,这就是可以做到的。

方式五:直接成为商家

这个建议听起来大胆,但是对于生财的小伙伴,可行性非常高。

相信很多人已经从生财上学习了如何选品,如何运营的知识。

那么,现在正好有 AI 可以帮我们搞定图片,我们开店的成本进一步降低,图片也不再是能够阻挡我们的门槛。

当然,上述变现方法都还在探索初期,规则都并不完善,如果有兴趣,你可以亲自尝试一下。

7.5 AI 绘画如何应用于 IP 定制 @饼公子

7.5.1 玩法介绍 IP 定制是指将知名的影视、漫画、游戏等 IP 进行二次开发,将其应用于其他领域,如文化创意、广告、游戏等,从而创造新的商业价值。

IP 定制是指将知名的影视、漫画、游戏等 IP 进行二次开发,将其应用于其他领域,如文化创意、广告、游戏等,从而创造新的商业价值。

IP 定制的流程通常包括以下几个步骤:

IP 评估:评估目标 IP 的品牌价值、市场影响力、知名度等,确定是否适合进行定制。

品牌授权:与 IP 持有方进行谈判,获得品牌授权,并确定授权方式和费用等。

形象设计:根据 IP 特点和定制需求,进行形象设计,包括角色形象、场景设计、配色方案等。

周边产品开发:根据形象设计和定制需求,开发周边产品,如文化衫、手机壳、玩具等。

推广营销:根据定制需求和推广目标,制定推广方案,包括线上推广、线下活动、广告投放等。

迭代优化:根据市场反馈和用户需求,对定制方案进行优化和迭代。

举例 10 个知名的 IP 定制角色:Hello Kitty、Pikachu、Doraemon、Snoopy、Mario、Mickey Mouse、Minions、SpongeBob SquarePants、KAWS 的 Companion、BT21 的角色。

AI 绘画在 IP 定制领域的优势与前几种玩法类似,这里不再展开赘述,主要有以下几点:

风格多变且新颖

支持高效定制

降低成本

创意无限

支持更个性化的定制

特别是在追求个性化和新颖的年轻群体中,AI 定制 IP 的潜力和吸引力是巨大的。

与之相对的,AI 绘画在 IP 定制领域也存在如下局限性:

缺乏人文关怀:AI 生成的作品可能缺乏人文精神和情感体验,无法达到人工绘画的情感影响力;

风格相近且重复:如果 AI 模型的训练和学习不够丰富,其生成的作品风格可能比较单一和重复,无法持续输出新颖的效果,这会降低客户的新鲜感和购买欲望。

这会降低客户的新鲜感和购买欲望。

要素失真和不协调:AI 在生成复杂的绘画作品时,对图像中的要素可能处理不当,造成局部失真或不同要素间的不协调感,影响视觉体验。

个性化体验差:与人工定制相比,AI 定制的个性化体验可能相对差一点,无法达到人工定制的精细和贴身。这也是一大挑战,需要通过更强的客户参与和人工精修来改善。

7.5.2 如何实操

推荐工具:MidJourney

如何使用 MidJourney,可参考章节【四、学会用 MidJourney 完成 AI 绘画】

关键词公式:【核心风格】,【主体】,【主体设定】,【风格设定】,【渲染工具/引擎】,【质量词】

目前较为流行的是 IP 是盲盒系列,那么就来做一个盲盒的举例。

7.5.4 变现方式

目前,IP 定制的变现方法还不是很明确,大部分账号会发布自己创作的 IP 作品,一边积累流量,一边探索变现:

部分账号可能会接到一些定制商单,或者授权变现,但是都未成体系,感兴趣的小伙伴可以尝试做个先驱者。

7.6 AI 绘画如何应用于 LOGO 设计 @木木|终身成长践行者

7.6.1 玩法介绍

LOGO 指的是企业、组织、品牌等在商业活动中使用的标志和标识,是品牌身份的重要组成部分。LOGO 设计需要考虑到品牌的特点和定位,通过图形、文字、色彩等元素的组合和运用,表达品牌的理念、特点和形象,从而达到品牌宣传和市场推广的目的。

LOGO 设计的类型有:

字形 LOGO:仅使用文字或字母来表达品牌形象和价值;图形 LOGO:使用图形或图案来表达品牌形象和价值;

图形 LOGO:使用图形或图案来表达品牌形象和价值;

组合 LOGO:将文字和图形组合在一起,形成更加复杂和丰富的品牌形象;

徽标 LOGO:类似于图章或徽章。

风格主要有:

扁平化风格:简化图形和色彩,强调简洁和现代感;

立体化风格:使用阴影和渐变等效果,增强图形的立体感和质感;

手绘风格:手绘的方式表现图形和文字,增强品牌形象的个性和亲和力,适用于比较轻松和有趣的品牌形象;

经典风格:使用传统的设计元素和技巧,强调品牌的历史和传统,适用于具有丰富历史和传统的品牌;

未来主义风格:使用未来感十足的图形和色彩,强调品牌的科技感和先进性,适用于科技和创新型品牌。

AI 绘画在 LOGO 设计领域的优势,与插画设计基本相似,这里不重复赘述。

并且,AI 缺乏情感意识,设计出来的 logo 不够有趣,没有灵魂。对于商单来说,AI 绘画只能提供一个灵感,一个基础图形,对于 LOGO 来说,需要矢量图形,或者分层图层等等,这些都需要设计师进行二次创作。

7.6.2 如何实操

7.6.2.1 快速上手

并且,AI 缺乏情感意识,设计出来的 logo 不够有趣,没有灵魂。对于商单来说,AI 绘画只能提供一个灵感,一个基础图形,对于 LOGO 来说,需要矢量图形,或者分层图层等等,这些都需要设计师进行二次创作。

7.6.2 如何实操 7.6.2.1 快速上手

并且,AI 缺乏情感意识,设计出来的 logo 不够有趣,没有灵魂。对于商单来说,AI 绘画只能提供一个灵感,一个基础图形,对于 LOGO 来说,需要矢量图形,或者分层图层等等,这些都需要设计师进行二次创作。

7.6.2 如何实操 7.6.2.1 快速上手

当今世界上有许多才华横溢的 LOGO 设计大师,他们设计的标志已经成为了很多知名品牌的象征。以下是 Notion AI 列出的顶级的 10 位 LOGO 设计大师及其代表作,供大家参考:

级的 10 位 LOGO 设计大师及其代表作,供大家参考:

Paul Rand - Paul Rand 是美国现代图形设计的奠基人之一。他设计的标志包括 IBM、ABC 和 UPS 等,这些标志已经成为了标志设计的经典案例。其中,IBM 的标志是一条条带组成的网格,代表着信息科技的复杂性和精准性。

Milton Glaser - Milton Glaser 是美国最伟大的平面设计师之一,他设计的标志包括 I <3 NY 和 DC Comics 等。其中,I <3 NY 已经成为了纽约市的象征,而 DC Comics 的标志则展现了超级英雄的力量和魅力。

Saul Bass - Saul Bass 是美国最著名的电影开场片和标志设计师之一,他设计的标志包括 AT&T、Kleenex 和 United AIrlines 等。其中,AT&T 的标志是一只手拿着电话听筒,代表着通信和联系的力量。

Massimo Vignelli - Massimo Vignelli 是意大利最伟大的图形设计师之一,他设计的标志包括 American AIrlines、Bloomingdale's 和 Ford 等。其中,Ford 的标志是一个蓝色的椭圆形,代表着汽车的精致和高贵。

Michael Bierut - Michael Bierut 是美国最有才华的图形设计师之一,他设计的标志包括 Hillary Clinton 2016、Saks Fifth Avenue 和 MIT Media Lab 等。其中,Hillary Clinton 2016 的标志是一个 H 和一个箭头组成的标志,代表着希望和改变。

Lindon Leader - Lindon Leader 是美国最有天赋的标志设计师之一,他设计的标志包括 FedEx 等。其中,FedEx 的标志是一个紫色和橙色的箭头,代表着速度和可信赖。

Ivan Chermayeff - Ivan Chermayeff 是美国最有才华的图形设计师之一,他设计的标志包括 NBC、National Geographic 和 Showtime 等。其中,NBC 的标志是一个彩色的鸟笼,代表着娱乐和创造力。

Tom Geismar - Tom Geismar 是美国最着名的平面设计师之一,他设计的标志包括 Xerox、Chase Bank 和 Mobil 等。其中,Mobil 的标志是一个红色的圆圈和一个蓝色的斜线,代表着能源和创新。

Chermayeff & Geismar & Haviv - Chermayeff & Geismar & Haviv 是美国最著名的标志设计团队之一,他们设计的标志包括 Armani Exchange、National Parks Service 和 Library of Congress 等。其中,Armani Exchange 的标志是一个黑色的手写字母,代表着时尚和品味。

10.公式:【字母 LOGO 设计】+【其他风格】+【你想要的画面】,比如“极简风格”

公式:【字母 LOGO 设计】+【其他风格】+【你想要的画面】,比如“极简风格”

字母 LOGO 设计,极简风格,一个女孩做瑜伽

Letter logo design, minimalist style, girl doing yoga

再多个控制,想要一个简单的背景和线条,那么我们可以写:

字母 LOGO 设计,极简线条,做瑜伽的女孩,白色背景上面我们说了,LOGO 的 4 种类型,有字形 LOGO,对于 AI 绘画来说,它识别不了文字,AI 出来的字母不是正确的文字,但是不妨碍我们可以利用它来进行排版。

上面我们说了,LOGO 的 4 种类型,有字形 LOGO,对于 AI 绘画来说,它识别不了文字,AI 出来的字母不是正确的文字,但是不妨碍我们可以利用它来进行排版。

以上面的图为例,一些聪明的朋友已经发现,LOGO 中多了文字,那是因为我的关键词不是单纯的【LOGO】,而是【字母 LOGO】,加上字母,会随机出现字母,而且,文字的排版已经不需要我们再去设计,将图片中的文字用 PS 或者美图秀秀等工具消除,再输入我们想要的字母即可。

以一个图为例:

修改前

修改后

可做的定制包括但不限定于:设计企业 LOGO 及周边产品,比如店铺的 LOGO,书籍封面图,店铺纪念徽章,书签等

7.7 AI 绘画如何应用于产品定制 @刘楚宾🔥

7.7.1 玩法介绍

产品定制的范畴其实非常大,比如手机壳图案、帆布袋、马克杯、DIY 多功能卡套、钥匙扣定制等,都可以属于产品定制。

本章节,我们以品牌周边为例,展示 AI 绘画在产品定制中的玩法。

AI 绘画在产品定制中的优势,与前文的其他玩法相似,不部分优势不再赘述:

1. 提高产品新颖度

2. 满足个性化需求

3. 加速上市速度:AI 可以在短时间内生成海量设计样本,供设计师选择和打样,大大加快新产品的设计与上市速度,锁定潮流并占领市场;

4. 降低研发成本:AI 可以自动生成产品设计方案,减少人工绘制样稿的工作量,有效降低新产品研发过程中的成本投入;

5. 激发创意灵感

6. 增强品牌传播效果:AI 设计的新奇品牌周边更易在社交媒体上引发传播,能够在消费者间产生“新奇效应”而迅速走红网络,有效增强品牌的社交传播力;

7. 提高工作效率当然,AI 绘画也有其局限性:

当然,AI 绘画也有其局限性:

1. 缺乏品牌特征:AI 建立的图像生成模型难以全面掌握品牌的视觉特征和个性,生成的设计方案可能缺乏品牌识别度,难以塑造品牌印象。这需要设计师进行二次创作与调整,比如用 PS 排版和分层;

2. 图片质量参差不齐

3. 注意版权问题:AI 生成的图像可能侵犯他人版权;

4. 创意局限性:AI 生成图像的分布会限制在模型训练的数据集范围内,创意类型可能过于单一,难以真正突破设计范式,实现全新的革命性设计,这需要人工 design thinking 来推动;

5. 缺乏文化内涵:AI 生成的图像天然缺乏人工设计那样丰富的文化内涵,难以表达品牌的文化理念或传达情感。这需要人工设计师进行创作与演绎;

6. 依赖数据资源:AI 图像生成需要大量的数据集进行模型训练,数据的质量和数量会直接影响生成结果;

7. 缺乏审美判断:AI 系统难以进行真正的审美判断与把控,需要人工美术与审美设计的参与。

7.7.2 如何实操

7.7.2.1 玩法一:百度文心一格

文心一格网址:https://yige.baidu.com/

第一次定制的可以领取优惠券,会便宜点哈,然后点击【立即定制】,选好哪个款式,然后点击下一步。

7.7.2.2 玩法二:MidJourney 画图

用 MidJourney 画出图案,然后再去淘宝或者 PDD 上面找定制商家,直接搜索【XX 定制】,然后再询问客服,是否支持一件定制。

如何使用 MidJourney,可参考章节【四、学会用 MidJourney 完成 AI 绘画】

步骤分为两步:

① 和客户确定图案类型,然后画图;

② 找平台商家定制,然后加价给到顾客,赚差价。

周边产品图案主题可以是以下系列风格(也是部分常用关键词):

可以是星座、星⾠系列、十二生肖系列;

如果是手机图案,那尺寸就需要 9:16 的尺寸,也就是--ar 9:16,如:

7.7.3 变现方式

产品定制的变现主要还是以接单为主,这就要求我们日常多发作品展示。

变现渠道主要有:

私域变现:朋友圈、群聊、粉丝群+快团团,案例可以参考【13.3 头像壁纸变现方式】

公域变现:小红书、抖音、快手、视频号等平台发布图文笔记或者视频。

部分账号可能会接到一些定制商单,但是目前变现方式都未成体系,感兴趣的小伙伴可以尝试做个先驱者。

7.8 AI 绘画如何应用于头像壁纸 @刘楚宾🔥

7.8.1 玩法介绍

头像壁纸大家都很熟悉,在 AI 绘画爆火之初,就已经有许多朋友产出头像壁纸,做图文号实现变现了,现在,AI 绘画在头像壁纸领域的玩法更加丰富。

AI 绘画+头像壁纸的优势与前文其他玩法类似,这里不再赘述。

虽然 AI 绘画和头像壁纸有很多优点,但也存在一些劣势。比如说,由于 AI 的算法受限于数据集和模型,生成的作品可能会缺乏创造性和艺术感。与此同时,AI 在处理复杂的主题和情感时,也可能无法达到人类的水平,导致生成的作品过于平淡或者表现不到位。

此外,AI 绘画和头像壁纸也存在版权问题。因为 AI 生成的作品大多数是根据已有的数据和模型进行生成,所以可能会存在与他人作品相似的情况,这就需要我们谨慎使用和保护版权。

7.8.2 如何实操

② 右键点击图片,选择复制链接:

③ 在输入框/imaging prompt+链接+描述语

重点:将你想生成的头像的画面用英文描述下来(不写描述语 MidJourney 就会给你天马行空的画了),比如说 :

宝宝,短头发、笑、皮克斯,卡通......( babies,short hAIr,cartoon,smile,pixar,cartoon)

iw 值范围是 0.5-2,数值越大和原图越接近:

iw 值范围是 0.5-2,数值越大和原图越接近:

到此我们第 1 个步骤完成,开始第 2 个步骤。

第二步:InsightFaceSwap 换脸部分

① 邀请 InsightFaceSwap bot(https://discord.com/api/oauth2/authorize?client_id=1090660574196674713&permissions=274877945856&scope=bot)到你的 Discord 聊天室(就和你拉 MidJourney 机图片放进去后,记得按下回车键。

图片放进去后,记得按下回车键。

出现这个就表示命名成功。

③ 换脸术,原理就是把我们上传的这张图的脸,换到我们用 MidJourney 生成的图片的脸上面。

以上就是成功换脸完毕。

以上就是成功换脸完毕。

注意事项:

可以使用「/listid」来列出目前注册的所有 ID。总数不能超过 10 个。也可以用「/delid」和「/delall」命令来删除 ID;

注册的 ID 名字只能用英文和数字,并且不超过 8 个字符;

你可以输入多个 idname, 用逗号分割,用来实现多人脸替换的效果。例如「/setid me,you,him,her」;

可以通过重新上传相同的 ID 名字来覆盖旧的 ID 特征;

如果你不想上传自己的照片,可以调用 insightface python package, 来生成自己的人脸特征,并保存成为一个 。npy 的 512 维向量文件上传;

尽量的 ID 照片尽量保证 :清晰、正脸、无遮挡;

不推荐上传:带眼镜的照片、过度美颜失去面部纹理的照片;

每个 Discord 账号每天可以执行 50 次命令,为了避免自动化脚本;

也可以选择某个风格的照片训练成自己的 lora 模型:

比如在风格广场选择别人训练好的 lora 模型,点五角星,然后再回到图生图界面:

图生图界面中,选择彩虹女孩这个 lora,底模(基础模型)选 3D 二次元:

选择风格强度 0.40+,强度越大,越接近 lora 模型;

编辑强度选择 0.35 左右,我们只改变部分,这样才会像原图;

张数就是你要生成多少张;

图片质量,可以选高清,生成速度慢一点而已。

也可以选择两个 lora 模型混合。

以上就是用 Vega AI 制作头像壁纸的方式。

7.8.3 变现方式

案例二:知识付费

该账号起号 3 天,粉丝接近 2 万粉,并制作付费交付课程,付费会员几百个,客单价 299-599 之间。

一个宝妈,平时就爱给自己的宝贝拍照,了解到 AI 绘画后,自己用 MidJourney 试了下效果很好,自己很满意,就琢磨着能不能通过这个赚点钱呢,补贴家用。

很快,她就用快团团发布 AI 绘画团购,在朋友圈和群发了个拼团,没想到两天时间,一千多人拼团,关键还没啥成本(就花费自己的人力成本):

而这些,只需要套用关键词+垫图,就能直接出这种风格的照片。我们可以算一下她的收入:9.9 元*1500 人=14850 元,这直接就 5 位数。

对于超过 99%的人来说,使用 MidJourney 来创作自己的肖像照是不可行的。除非你是个大明星,这意味着在网上有几千上万张你的相片。但是现在,你可以借助 InsightFaceSwap 这个 Discord bot, 来帮助客户实现这个想法。

7.9 AI 绘画如何应用于室内装饰 @饼公子

7.9.1 玩法介绍

AI 绘画在室内装饰领域,不仅可以完成硬包出图,还可以完成软包出图,室内装潢渲染图、装饰效果图、装饰挂画、制作家具效果图等都可以做到。

AI 绘画在室内装饰的优势:

作为渲染图、宣传图,AI 绘画风格新奇,色彩和构图都很特别,可以为室内空间带来惊喜和视觉冲击力;

相比传统的手工艺术品或者知名艺术家的作品,AI 艺术品的成本更加亲民可及。这使更多人有机会使用艺术品装饰住所;

作为装饰画可以快速打印。

当然,AI 绘画仍有较大局限性,它无法提供完整的尺寸、色号、品牌等信息,落地困难。

7.9.2 如何实操

推荐工具:MidJourney

如何使用 MidJourney,可参考章节【四、学会用 MidJourney 完成 AI 绘画】

关键词公式:【设计类型】,【主体】,【主体设定】,【风格设定】,【质量词】+(质感词)

7.9.2.1 家具设计

AI 绘画可以根据不同类型的家具来进行图片构造,碰撞出不同的思维火花,尤其是关于某个家具不同材质的变化,更是快捷便利。

举个例子:玻璃质北欧风转椅,钢铁质北欧风转椅,棉花糖柔软质北欧风转椅,

Made of glass, Nordic style swivel chAIr, transparent, refraction of light, white background, simple, HD --v 5

玻璃制造,北欧风转椅,透明,光的折射,白色背景,简约,HD

7.9.2.2 装饰画

Wall art, geometric patterns, collection, gold and black, white background, HD --v 5

艺术挂画,几何图案,集合,金与黑,白色背景

室内设计,客厅,一个沙发,极简主义,侘寂风,原木色,温暖的阳光透过窗户,

Interior design, living room, a sofa, minimalism, wabi-sabi style, log color, warm sunlight through the window --v 5

7.9.3 常用关键词

再来复习一遍关键词公式:【设计类型】,【主体】,【主体设定】,【风格设定】,【质量词】+(质感词)设计类型:室内设计 interior design、建筑设计 architectural design、椅子设计 chAIr design、餐桌设计 dining table design、沙发设计 sofa design 等等

设计类型:室内设计 interior design、建筑设计 architectural design、椅子设计 chAIr design、餐桌设计 dining table design、沙发设计 sofa design 等等

主体设定:材质、形状、颜色等等

风格:北欧风 Nordic style、包豪斯 Bauhaus、现代风格 Modern、田园风格 Rustic、复古风格 Vintage、地中海风格 Mediterranean、阿拉伯风格 Arabic、工业风格 Industrial、波斯风格 Persian 等等

质感词(有时候有效果):坚硬 hard、柔软 soft、粗糙 rough 等

去谷歌搜索一些著名的室内、建筑设计师,写进 MidJourney 会有惊喜:

菲利普·斯塔克(Philippe Starck)。法国设计大师,作品涉及产品设计、家具设计、室内设计等领域。代表作有皇家度假村酒店、法拉利车间等。以简洁和功能性著称。

扎哈·哈迪德(Zaha Hadid)。伊拉克裔英国女建筑设计师,被称为“女王建筑师”。作品以曲线流畅和前卫夸张著称。代表作有广州歌剧院、阿联酋摩天大楼等。

彼得·马里诺(Peter Marino)。美国建筑与设计师,擅长高端奢华风格设计。客户包括路易威登、香奈儿、迪奥等品牌。作品分布在纽约、巴黎、东京、米兰等全球各地。

潘妮露·琼斯(Patricia Urquiola)。西班牙室内设计师,作品风格简洁大方又不乏温馨惬意之美。曾为意大利设计品牌 Moroso、德国设计品牌 Walter Knoll 等设计产品和空间。

罗斯·班斯纳(Ross Lovegrove)。英国知名室内设计师和建筑设计师,作品风格流畅功能性极强。代表作包括伦敦 queens 大酒店和德国汉诺威体育场。

阿曼达·莱文达尔(Amanda Levete)。英国建筑设计师,风格简洁和富于创新精神。曾任 FOA 建筑设计事务所合伙人,代表作包括伦敦 V&A 博物馆外立面和葛兰者广场。

大卫·芝兰(David Chipperfield)。英国当代建筑大师,风格简洁素雅。代表作有柏林新博物馆、伦敦爱乐音乐厅翻新工程等。

目前,AI 绘画在室内装饰领域尚未探索出体系化的变现方式,大家可以尝试做个先驱者,躬身探索。

7.10 AI 绘画如何应用于美甲设计 @饼公子

7.10.1 玩法介绍

用 AI 生成的图像做成美甲,也是目前比较热门的一个玩法,有些美甲店也会在线上开设 AI 美甲设计的账号,吸引更多流量:

可以用 AI 生成的抽象艺术或花卉图像转化为美甲贴纸设计,这类设计色彩鲜艳,充满未来感,会给人很强的视觉冲击力;

可以用 AI 生成的人物肖像或动物图像作为美甲贴纸设计或直接绘画在指甲上,这类设计生动有趣,具有很高的个性化。

可以用 AI 生成的风景或建筑图像转化为美甲图案设计,如蓝天白云,层峦叠翠的山丘等自然风光,或者古典建筑的元素等都可以作为设计灵感。

7.10.2 如何实操

推荐工具:MidJourney

如何使用 MidJourney,可参考章节【四、学会用 MidJourney 完成 AI 绘画】关键词公式:【美甲】,【美甲类型】,【主体设定】,【风格】,【色调】,【质量词】

关键词公式:【美甲】,【美甲类型】,【主体设定】,【风格】,【色调】,【质量词】

7.10.2.1 按色系出图

青色:

NAIl art, cyan, white geometric pattern, minimalism, HD --v 5

美甲,青色,白色几何图案,极简主义,HD

黄色:

NAIl Art, Yellow, Intricate Black Pattern, HD --v 5

美甲,黄色,复杂的黑色花纹,HD

7.10.2.2 按甲型出图

方形 Square:

NAIl art, powder blue, square, simple white pattern, HD --v 5

美甲,浅蓝色,方形,简单的白色花纹,HD

7.10.2.3 按风格出图

迪士尼:

NAIl Art, Disney, dark red, best quality --v 4

美甲,迪士尼风格,暗红色,最佳质量

圣诞:

7.10.3 常用关键词

来复习一下关键词公式:【美甲】,【美甲类型】,【主体设定】,【风格】,【色调】,【质量词】

常用关键词列举:

美甲类型:方形 square、圆形 circular、尖型 pointed、椭圆 elliptical、长尖 long pointed、口红 lipstick、芭蕾 ballet 等等

主体设定:亮片 Sequins、发光 Luminescence、珠光 Pearlescence、高科技全息 High tech Holography 等等

风格:艺术风格(如巴洛克 Baroque、洛可可 Rococo、奇异幻想 fantastic)、节日主题(新春 Spring Festival、圣诞 Christmas)、风格(简约 simple、复杂 complex、奢华 luxury、XX 品牌)、钻石珠宝 diamond jewelry、动物 animals、迪士尼 Disney 等等

色调:单色 Single color、混色 mixed color、多色 multi color、莫兰迪色 Morandi color 等等

7.11 AI 绘画如何应用于摄影 @饼公子

7.11.1 玩法介绍

真实的摄影照片往往需要摄影师亲自到场拍摄,AI 绘画的介入,则能让我们通过关键词的组合,产出更自由、不被地域光线等限制的照片。

通过写关键词,我们就可以展现出非常有质感的“照片”。比如延时摄影、高速摄影、慢快门、航拍、仰拍、光涂鸦、商业摄影、风光摄影、人像摄影等等。

AI 绘画在摄影的优势:

更加自由和创造性。AI 绘画不受摄影器材和场景的限制,可以自由发挥创造性,创造出全新的视觉效果和意象;

不受光线和色彩限制。AI 绘画可以自由控制光线方向和色彩搭配,不受现实场景的限制;

作品更加抽象和概念化。AI 绘画可以将现实图像抽象和概念化,传达更丰富的内涵和意境;极低成本构建场景,提前感受效果。

极低成本构建场景,提前感受效果。

AI 绘画在摄影的局限性:

细节描绘较差,AI 绘画目前难以达到某些真实感和细节描绘的效果;

多主体描述存在较大问题,目前比较适合出一个主体的画面;

对于非训练集中的内容,难以出现。举例:张家界在训练集中,可以出现,滕王阁不在训练集中,无法非常接近的出现。

7.11.2 如何实操

推荐工具:MidJourney

如何使用 MidJourney,可参考章节【四、学会用 MidJourney 完成 AI 绘画】

关键词公式:【摄影类型】, 【摄影师】,【镜头设定】,【主体】,【主体设定】,【用光】,【环境】,【颜色】,航拍:

航拍:

Aerial photography, by Cecil Beaton, black Mercedes G50, driving on a frozen lake, surrounded by forest, natural light, chiaroscuro, best quality --ar 3:2 --v 5

航拍,by 塞西尔·比顿,黑色奔驰 G50,行驶在结冰的湖面上,周围是森林,自然光,明暗对比,最佳质量

商业摄影:

Commercial Photography, Pure Gold Crown, studded with gems, shiny, metallic Sheen, Soft Light, Clean Background, from Museum, HD, --v 5

商业摄影,纯金皇冠,镶嵌满宝石,闪亮,金属光泽,柔光,干净的背景,来自博物馆,HD

7.11.3 常用关键词

关键词公式:【摄影类型】, 【摄影师】,【镜头设定】,【主体】,【主体设定】,【用光】,【环境】,【颜色】,【质量】常用关键词列举:

常用关键词列举:

摄影类型:高速摄影 High-speed photography、延时摄影 time-lapse photography、航拍 aerial photography、GOpro、光涂鸦 light graffiti、商业视觉摄影 commercial visual photography 等等

摄影师:安妮·莱博维茨 Annie Leibovitz、多罗西娅·兰格 Dorothea Lange、塞西尔·比顿 Cecil Beaton、哈尔斯曼 Halsman、安格斯·麦克比恩 Angus McBean、伊芙·阿诺德 Eve Arnold、欧文·佩恩 Irving·Penn、贝伦尼斯·阿博特 Berenice Abbott 等等

镜头:广角 wide angle、中景 medium shot、鱼眼镜头 fisheye lens、蔡司镜头 Zeiss lens、佳能 Canon、奥林巴斯 Olympus、景深 depth of field、DOF,高感光度 high sensitivity,低感光度 low sensitivity 等等

角度:第一人称视角 POV、仰拍 Upward shot、俯拍 downward shot、极低角度 extremely low angle、特写 close-up 等

用光:逆光 Backlighting、顺光 Front Lighting、剪影 Silhouette、顶光 Top Lighting、舞台光 Stage Lighting、伦勃朗光 Rembrandt Lighting、丁达尔光 Tyndall Lighting、自然光 Natural Lighting 等等

质量词:超详细 Ultra detAIled、精细 detAIled、最好的质量 best quality、非常精致和美丽 very delicate and beautiful、高分辨率 high resolution、8k、HD 高清、非常详细的 CG very detAIled CG,非常详细 very detAIled,杰作 masterpiece

目前,AI 绘画在摄影领域尚未探索出体系化的变现方式,大家可以尝试做个先驱者,躬身探索。

如何生成上述二维码呢?今年 6 月,生财有术邀请圈友@重庆-美羊羊老师 为出过一版「艺术二维码」视频教程,大家可以跟着视频学习👉《如何生成精美又能赚钱的艺术二维码》@重庆-羊羊羊

如果你想要追寻更高难度,可以参考下文 @明月老师的技术向文字版教程。

以下是@明月老师 的深度研究成果:

这些二维码都可以使用微信直接识别出来,而且是通过 SD 文生图直接生成的。

做到这种程度,艺术性和实用性达到了一定的平衡,但想要产出类似图片,建议先学习前文的 SD 教程👉

【五、学会用 Stable Diffusion 完成 AI 绘画】

学会出图后,你可以

自己定制属于自己 IP 的艺术二维码引流,预防平台检测

AI 艺术二维码小程序挂流量主

与各种品牌合作,植入广告推广变现

可以做成各种周边衍生品,比如包包、纸杯、雨伞等

二维码参数

遇到图片二维码可以用草料二维码进行解析,得出来二维码链接之后可以进行下一步操作。

二维码样式

不同的二维码样式出来的效果也不同,如上图(来自安东尼大佬)。

正面描述词

1girl, solo ,(flower:1.3) , long skirt, dark background, long white hair , angel, backlighting, Dark background, ,

正面描述词这块可以加上,Ribbons, feathers, birds, flowers, lace, snowflakes, waves, leaves, architecture,hair 等描述词,可以让二维码融合的更好,更具有美感,一次性加上其中一种元素即可。

百花酿的 lora 作用也是让画面中增加更多花朵元素,同理,如果有其他元素的 lora 也可以添加进去。

负面描述词

nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, nsfw,(worst quality:1.4), (low quality:1.4), (normal quality:1.4), ng deepnegative _v175t,text,logo,watermark,signature, bad_prompt_version2-neg,badhandv4, By bad artist -neg, verybadimagenegative_v1.3,

badhandv4, By bad artist -neg, verybadimagenegative_v1.3,

负面描述词是通用负面描述词,没什么好讲的。

唯一要提的是里面用到了很多 Embedding 嵌入型模型,bad_prompt_version2-neg, badhandv4, By bad artist -neg, verybadimagenegative_v1.3,这些全部都是,如果你没有下载这些模型,单单使用这些描述词是不起作用的。

尺寸

Size: 880x880

尺寸不建议超过 1024*1024,因为会额外出现很多额外的,令人意想不到的内容。

尺寸也不建议使用 512*512,因为大多模型用这个尺寸出来的图像细节方面都不尽人意。

768*768 倒是个不错的选择,后期可以通过高清修复进行放大。

模型

Model hash: cbfba64e66, Model: 动漫插画小清新 CounterfeitV30_v30,

模型这块可以多尝试一下不同类型的模型,个人测试下来,动漫模型都有较不错的效果。

控制器 1

ControlNet 1: "preprocessor: tile_resample, model: control_v11f1e_sd15_tile [a371b31b]

第一个模型使用的是 tile 模型,目的是在画面生成的过程中控制生成的前一部分,以免让算法随意发挥。

简单的做个比喻,如果你想要一棵树木按照自己的想法生长就要在不同的成长阶段进行修剪。

现在我们的目的也是一样的,我想让生成出来的图像按照我们预想的方向发展,那我们就要对其进行控制。

tile 模型的作用很多,可以在图像放大的过程中增加一定的细节,也可以很好的控制图像的形状。在这里也可以使用 Brightness 模型进行控制,但是我使用下来感觉 tile 效果更好一些。

控制器 1 权重

weight: 0.4

tile 模型在生图过程中起到的作用太过明显,需要把权重降低,避免对画面起到太过明显的作用。

控制器 1 起始时间 starting/ending: (0, 0.25)

starting/ending: (0, 0.25)

这个就对应了小树苗的不同生长阶段,也就是生图的前 1/4 阶段,这块至关重要。

不一定要从生图开始阶段就介入控制,可以自行把控。开始时间 0-0.1 都可以,结束时间 0.2-0.3 都可以。这个控制范围尽量控制在 0-0.3 之间。

需要给到另一个控制器一定的发挥空间。

控制器 2

ControlNet 0: "preprocessor: inpaint_global_harmonious, model: control_v1p_sd15_qrcode_monster [a6e58995]

另一个模型就相当重要了,生图的大多数时间都要用这个模型进行控制。

qrcode_monster 模型可以让二维码发生更加自然的变化。

控制器 2 权重

weight: 1.6

权重越低,图片中的二维码越难扫描出来,权重越高,图片中的二维码越容易扫描出来。

同样的,低权重下的图片美感更强,高权重下美感更弱。

控制器 2 起始时间

starting/ending: (0.25, 1)

前部分已经用其他模型进行控制了,那么后半部分就需要用 qrcode_monster 模型进行控制了。

如果想让算法有自由发挥的空间。介入时间可以控制在 0.25-0.4 之间,超过 0.4 的话二维码扫描难度会增大。

结束时间可以控制在 0.8-1 之间,可以提早结束控制让 AI 算法有一定的自由发挥空间。

高清修复 Hires upscale: 2, Hires upscaler: R-ESRGAN 4x+

Hires upscale: 2, Hires upscaler: R-ESRGAN 4x+

如果按照上述的参数和方法成功做出来了可以扫描的二维码。

但是想要放大图像,可以启用高清修复,放大倍数默认*2,放大算法使用 R-ESRGAN 4x+,重绘幅度调整到 0.4,这里千万不能调的太高。

内容来源:【技术向】一文讲透如何用 SD 制作出来高质量艺术二维码、《如何生成精美又能赚钱的艺术二维码》

7.13 AI 绘画如何应用于四维彩超 @竹子🔥

AI 绘画+四维彩超的玩法并不是一个常规赛道,但圈友@竹子 快速下场,并抢占了市场先机,实现 17 天收入过万,目前也在持续开展这个项目。

比起普通画宝宝头像,孕妈妈更好奇宝宝未出生时的样子,都愿意为 AI 图 + 四维彩超生成图付费。

图片的具体生成方式,主要是 Midjourney 图生图。

变现路径一:客单画图变现

抖音短视频/小红书笔记-引流到微信-客单画图变现

引流到私域后的变现方式,就是接四维 AI 绘图的客单,比如 29.9 一单。但是如果想画得像或者客户的四维照片质量不太好的话,可能每单需要花 20-30 分钟。

前期每天的客单量大概 20 到 30 左右(团队内有位小伙伴一天可以做 50+,日收入连续三天 1k+,很猛,如果不那么追求完美的话),后期稳定的话一天也有 10 单+,这样就比较轻松,可以有空学习一些别的知识。

变现路径二:知识付费

当你的项目做的有起色的时候,就会有别人想入场赚钱,客单中也夹杂了个别询问怎么收徒,愿意付费学习的人。不但可以自己收学员,还能让做出成绩的学员收徒,自己拿小部分比例的返点。

知识付费是一个很好的变现渠道,比自己画图收入来的快得多。

除此之外还可以选择在一些抖音合作的知识付费平台上传课程,可以上传课程后将课程购买链接挂载在短视频或者直播间,这样应该可以卖得更多(当然,课程平台是需要付费的,了解了一下大概 1999-5999 元一年)。

样应该可以卖得更多(当然,课程平台是需要付费的,了解了一下大概 1999-5999 元一年)。

圈友@竹子 主要的变现方式为路径一,在引流方式和转化方式上,她也做了一些调整尝试,但这些内容就不在 AI 绘画的手册中具体展开了,大家可以查看下方原帖。

内容来源:《新手小白受到一条风向标的启发,执行拉满,跑通抖音四维彩超 AI 项目,实现 17 天收入过万的复盘》@竹子

另一篇圈友的精华帖中,也详细说明了她在「AI 绘画 + 四维彩超」玩法上的一些尝试,大家可以查看原帖:

《抖音三天快速起号,四维彩超宝宝 AI 绘画项目,播放量 100w+,引流精准粉近 400,月入过万》@一棵小苗苗

7.14 更多 AI 绘画玩法🔥

7.14.1 AI 绘画落地案例合集

@AI 绘画师日记 星球的成员 整理了一份涵盖面比较广的 AI 绘画落地案例合集,其中谈到 AI 绘画与手账、纹身、口播视频等当下热门话题的结合玩法,大家可以点击文档查看细节,或许你能从中找到自己在 AI 绘画中的切入口。

本章节为部分案例简介,更多完整案例点击下方链接:

AI 绘画+纹身:

AI 绘画生成纹身图案可以让我们尽情发挥无限创意。只需输入一些关键词和意向,就能生成多种多样、独一无二的纹身设计。无论是想要别具一格的水彩风格还是浓郁的传统风格,我们都能够轻松找到完美的纹身图案。

📌

关键词

魔法词:(tatoo pattern)纹身图案

Charts and graphs of charts and graphs, charts containing graphs and graphs committing charts, the charts and graphs have charts and graphs inside them

Charts and graphs of charts and graphs, charts containing graphs and graphs committing charts, the charts and graphs have charts and graphs inside them

图表和图形的图表,包含图表和提交图表的图表,图表和图形在其中有图表和图形

用于展示数据、统计信息和关系,如柱状图、折线图、饼图等。

7.14.2 AI 绘画变现思路合集

本章节以下内容,更多展现的是大家可尝试的变现方向或思路,部分来源于圈友实操经历,部分来源于风向标。这里不对思路做详细拆解,仅做简单介绍,主要用途是希望帮大家打开变现思路。

AI 绘画+创意字:

AI 创意字存在各式各样的场景当中,可以是一张车水马龙的图片、一张精美的海报,也可以是各种人物的影子、衣服、帽子等等,这种有趣的 AI 创意字都是用 SD 生成,通过 controlnte 约束就能制作出来

🔥亮点:足够新颖,吸引眼球,且很多人不了解背后原理,能打信息差

参考资料:

《AI 创意字如何制作?如何变现?》@吴东子(视频版教程)🔥亮点:老照片的玩法反复火,由此可以窥见定制服务的市场需求,私人定制能延伸出许多意料外的新需求

🔥亮点:老照片的玩法反复火,由此可以窥见定制服务的市场需求,私人定制能延伸出许多意料外的新需求

参考资料:

《AI 绘画 + ChatGPT + 生日定制祝福》@七小

《AI 绘画老照片修复进行接单变现》@老旺

《AI 绘画生成奶奶的虚拟数字人》@土豆君

参考资料:《AI 绘画 + 十二星座成为小红书爆款》@纳兰乘风

参考资料:《AI 绘画 + 十二星座成为小红书爆款》@纳兰乘风

AI 绘画 + 公众号流量主:

AI 绘画目前在公众号上的玩法,主要是辅助出图,比如根据真实图片生成 AI 图,能降低发文风险,或者生成美女图片,搭配情感类文章,文章流量不错

🔥亮点:两种玩法结合,实现 1+1>2 的效果,且操作很简单参考资料:

参考资料:

《AI 绘画 + ChatGPT + 追热点:12 天收益 39900+》@妞妞

《AI 绘画+公众号,广告主变现》@奇点

《公众号写作流量主变现之美女图片方向》@叶华

《公众号流量主,ChatGPT + AI 绘画,3 天入池,5w+》@元彻

AI 绘画+资料引流/知识付费:

信息差玩法,通过售卖词汇、教程、课程、资料,或引流到社群完成变现,产品成本基本为 0,但依赖流量和产品的交付,制作钩子和挖掘关键词素材是项目要点。

🔥亮点:目前衍生出 AI 绘画+唐诗/简历等新玩法,方式新颖,变现空间不错

参考资料:《吃透红利!AI 绘画赚钱指南引流变现全案(保姆级教程)》@老旺

《吃透红利!AI 绘画赚钱指南引流变现全案(保姆级教程)》@老旺

《小白 30 分钟能跑通的高上限 MVP :创业粉引流-喂饭级教程》@苍述

《AI 绘画 + 唐诗 300 首,12 个视频涨粉近 4000》@Daemon

《AI 绘画自动生成简历,可在小红书、微博引流》@上川书记

《AI 绘画出图 + 虎扑引流》@姚麻

AI 绘画 + 网盘拉新:

在小红书、知乎绘制 AI 图并发布→将图片放入网盘→创建群聊→设置公告→私信后发网盘链接,只要有用户注册或付费,就有收益

参考资料:《AI 绘画变现思路分享》@蕃茄

AI 绘画+动画制作 @刘楚宾

在过去,动画制作需要庞大的制作团队和昂贵的设备。一个制作周期可能需要数百人和数年时间才能完成。但是,随着人工智能技术的不断发展,制作动画的过程变得更加高效、快速和简单。

在未来,你可以通过一个人工智能动画制作软件,就可以轻松地制作出一部高质量的动画。这个软件将根据你提供的素材和指令,自动化地生成人物角色、背景和动画场景。它会利用机器学习和深度学习算法来分析和理解你的意图,从而生成出逼真的动画效果。

不仅如此,这个软件还可以通过深度学习技术自我进化,不断优化自身的生成效果和质量。这将大大减少人工智能动画制作的时间和成本,让更多的人可以参与到动画制作中来。

此外,随着虚拟现实技术的发展,未来人工智能动画制作也将会变得更加逼真和真实。你可以利用虚拟现实技术,让人物角色和场景真实地呈现在你的眼前,甚至可以亲身体验到动画中的故事情节。

当然,人工智能技术也带来了一些新的挑战和问题。比如,人工智能制作的动画缺少人类的情感和创造力,难以表达出更深层次的情感和细节。此外,由于人工智能技术仍然处于发展初期,一些不可预知的错误和问题可能会在制作过程中出现。

总的来说,随着未来人工智能技术的不断发展,动画制作将变得更加高效、快速和简单。人工智能动画制作软件将会成为制作动画的主流方式。但是,我们需要认识到,人工智能只是一种工具,它并不能完全替代人类的创造力和想象力。在动画制作中,人类的想象力和创意是至关重要的,它可以为动画注入灵魂和生命力。

更多玩法可参考 AI 绘画变现案例合集,其中内容根据生财有术星球帖整理而来:

《AI 绘画变现案例合集》@生财有术

AI 绘图作为目前的大热门项目,无数人在扎堆学习,也有无数人在琢磨如何用它变现。毋庸置疑的是,AI 绘画领域有无限的变现机会与探索前景。

我们鼓励大家积极下场,多尝试、多做图、多发布。与其在观众席等待比赛结果,不如先行下场,或许你就个开启 AI 变现新时代的第一人。

新手就是靠执行力,在找准方向后,执行力到位,是可以收获自己第一桶金的。

最后,AI 绘画也将会不断面临新的挑战和问题。比如说,如何平衡艺术创作和商业需求,如何保护版权和隐私,如何解决 AI 算法的伦理和安全问题等等,这都是 AI 绘画在未来需要持续关注和探索的问题。

未来,AI 绘画将会在技术、应用场景和社会影响等方面不断发展和壮大,为我们的生活和工作带来更多的惊喜和便利。