现在的运营不懂点AI工具都不好意思说自己在做亚马逊,stable diffusion的第一课你不来看看吗?
想学习 stable diffusion 吗?这份初学者指南适用于零经验的新手,无论是对 stable diffusion 还是其他 AI 图像生成器一无所知。
你将获得 stable diffusion 的概述和一些基本的有用提示。
在本页面上尝试使用 stable diffusion AI。这是学习的最佳方式!
什么是 stable diffusion?
stable diffusion AI 是一种生成 AI 图像的潜在扩散模型。生成的图像可以像相机拍摄的照片一样逼真,也可以具有专业艺术家制作的艺术风格。
最好的部分是它是免费的-你可以在你的个人电脑上运行它。
如何使用 stable diffusion?
你需要给它一个描述图像的提示。例如:
姜饼屋,二三维模型,聚焦,白色背景,吐司,脆脆麦片
stable diffusion 会将这个提示转化为以下图像。你可以根据同一个提示生成任意多个变体。
stable diffusion 的优势是什么?
有类似的文本到图像生成服务,比如 DALLE 和 MidJourney。为什么选择 stable diffusion?stable diffusion 的优势包括:
开源:许多爱好者创建了免费的工具和模型。设计用于低功耗计算机:运行它是免费或廉价的。
stable diffusion 是免费的吗?
在你自己的Windows或Mac机器上运行时,stable diffusion是免费的。在线服务可能会收取适度的费用,因为有人需要为你提供运行所需的硬件。
尝试stable diffusion在线演示 理解stable diffusion的最佳方式是亲自尝试。
点击链接尝试在线跑一下图片:Stable Diffusion 2-1 - a Hugging Face Space by stabilityai
在上面的stable diffusion图像生成器中尝试一下。以下是四个简单的步骤。
闭上眼睛
想象你想要制作的图像
尽可能详细地用文字描述图像(为了获得最佳结果,请确保描述主题和背景,并使用大量形容词)
将其写在下面的提示输入框中
你可以保持负面提示不变。
这是一些简单示例的提示列表,你可以尝试。
一只可爱的西伯利亚猫在海滩上奔跑
van Gogh风格的机器人
战斗的法国斗牛犬,数字艺术,吸引人,美丽,精细的细节,详细的面部,超精细的闭眼,神秘侠盗眼罩,ArtStation,环境光
切换模型以查看效果。你将在本指南的最后一部分了解有关模型的内容。
stable diffusionv1.5:官方基础模型。在各种风格中具有通用性。逼真视觉v2.0:擅长生成照片风格逼真的图像。任意风格v3.0:动漫风格。
你可能已经注意到图像可能会符合你的期望或差得太多。别担心,有很多方法可以改进图像。请继续阅读。
stable diffusion能做什么?
从文本生成图像 stable diffusion最基本的用法是将文本转化为图像(txt2img)。以下是使用stable diffusion可以生成的一些图像示例。
动漫风格
超写实风格
奇幻
从另一张图像生成图像
图像到图像(img2img)使用stable diffusion将一张图像转化为另一张图像。这个功能虽说现在还不够完善,但是训练好了对以后我们做电商 产品图片作用极大。
以下是将苹果图像转化为逼真照片的示例。
图像到图像根据输入图像和提示生成图像。
图像编辑 你可以使用修补技术(inpainting)来修复人工智能或真实图像的一部分。这与Photoshop的新生成填充功能类似,但是免费使用。
制作视频 使用stable diffusion制作视频有两种主要方法:(1)从文本提示制作和(2)从另一个视频制作。
从文本提示制作视频是一种流行的方式。你可能在社交媒体上见过其中之一。它看起来像这样。
第二种方法是使用stable diffusion对视频进行风格化处理。请参阅视频到视频的教程。
上面是原图像
生成后的图像
最好先掌握文本到图像和图像到图像,然后再深入研究。
如何使用stable diffusion?
在线生成器 对于绝对初学者,我建议使用上面提供的免费在线生成器或其他在线服务,搜索Stable Diffusion 2-1 - a Hugging Face Space by stabilityai(不能加链接,所以有兴趣的朋友自行搜索先玩一下)。你可以开始生成图像,无需进行繁琐的设置。
高级图形用户界面(GUI) 免费在线生成器的缺点是功能相当有限。
如果你已经用熟了在线生成器,可以使用更高级的图形用户界面(GUI)。你可以使用各种工具。以下是其中一些例子:
高级提示技巧。
使用修补技术修复图像的一小部分。
根据输入图像生成图像(图像到图像)。
通过给出指令来编辑图像。
AUTOMATIC1111 是一个流行的选择。可以参阅设置Google Colab云服务器的快速入门指南(下次文章讲一下怎样在谷歌云上使用stable diffusion)。如果你有适合的电脑,也可以在个人电脑上运行。请参阅Windows和Mac的安装指南(对电脑配置比较高,在本地安装也挺复杂的,不太建议安装在本地)。
如何构建一个好的提示(Prompt)?
要构建一个好的提示,有很多要学习的内容。但基本的方法是尽可能详细地描述你的主题。确保包含强有力的关键词来定义风格。
使用提示生成器是学习逐步过程和重要关键词的好方法。对于初学者来说,学习一组强有力的关键词及其预期效果是至关重要的。这就像学习新语言的词汇一样。你还可以在这里找到一个关键词和笔记的简短列表。
生成高质量图像的一个捷径是重复使用现有的提示。去提示集合中,选择一张你喜欢的图像,然后输入提示!缺点是你可能不明白为什么它会生成高质量的图像。阅读提示的说明,并修改提示来观察效果。
另外,可以使用像Playground AI这样的图像收集网站。选择一张你喜欢的图像,并重新构思提示。但是对于获得高质量提示来说,这可能就像大海捞针一样困难。
将提示视为一个起点,根据自己的需要进行修改。
构建好提示的经验法则 有两个原则:(1)详细和具体,(2)使用强有力的关键词。
详细和具体
尽管人工智能取得了飞跃的进展,但stable diffusion仍然不能读懂你的思维。你需要尽可能详细地描述你的图像。
比如说,你想生成一张街景中的女性图片。一个简单的提示
a woman on street
会给你生成这样的图片:
嗯,也许你不想生成一位奶奶,但从技术上讲,这与你的提示相符。你不能怪stable diffusion...
所以,相反地,你应该写得更详细。
a young lady, brown eyes, highlights in hair, smile, wearing stylish business casual attire, sitting outside, quiet city street, rim lighting
看到了明显的差异。所以要努力提高你的提示构建技巧!
使用强有力的关键词 有些关键词比其他关键词更有影响力。例如:
名人的名字(例如 Emma Watson)
艺术家的名字(例如 van Gogh)
艺术媒介(例如插图、绘画、摄影)
谨慎使用它们可以引导图像朝着你想要的方向发展。
你可以在构建提示的基础知识中了解更多关于提示构建和示例关键词的内容。
想更简单些吗?就像做作业一样,你可以使用ChatGPT来生成提示!
那些参数是什么,我应该改变它们吗?大多数在线生成器允许你改变一组有限的参数。以下是一些重要的参数:
图像大小:输出图像的尺寸。标准尺寸为512×512像素。将其改为纵向或横向尺寸可能会对图像产生重大影响。例如,使用纵向尺寸来生成全身图像。
采样步骤:至少使用20个步骤。如果看到模糊的图像,可以增加步骤。
CFG比例:典型值为7。如果你希望图像更符合提示,请增加该值。
种子值:-1会生成一个随机图像。如果你希望生成相同的图像,可以指定一个值。参考其他设置的建议。
stable diffusion相对midjourney可控性更佳,功能更强大,但是相对来说操作门槛也更高。不少绅士们都只把它用来生成美女图片,但是我想说用它来挣钱才是它最大的价值点。