揭秘三大图像生成平台:DALL-E2、Midjourney和StableDiffusion的大不同!
文章主题:声明, 人工智能, 图像生成, 文本到图像
随着Diffusion Model的普及,AI绘画只需要你输入文本描述,模型就能在几分钟内生成精准匹配的精美图像。本文从使用步骤、费用和商用等角度对3个主流平台进行比较:DALL·E2、Midjourney、Stable Diffusion。
作者:韩信子@ShowMeAI 深度学习实战系列:https://www.showmeai.tech/tutorials/42 自然语言处理实战系列:https://www.showmeai.tech/tutorials/45/> 计算机视觉实战系列:https://www.showmeai.tech/tutorials/46/> 本文地址:https://www.showmeai.tech/article-detail/392声明:版权所有,转载请联系平台与作者并注明出处
收藏ShowMeAI查看更多精彩内容🚀随着Diffusion Model的广泛应用,相信大家已经在网络上见识到了大量由人工智能(AI)生成的图像。这些图像均利用了”文本到图像”的生成模型制作而成:只需输入一段文本描述(称为Prompt/提示),AI模型就能在短短数秒或几分钟内,生成一幅或多个精确匹配提示、美观度极高的图像。
ShowMeAI在前序的文章中也做了一些相关的介绍:
你给文字描述,AI艺术作画,精美无比!附源码,快来试试! 使用Hugging Face发布的diffuser模型快速绘画截止目前为止,三个最流行的AI作画产品是 Stable Diffusion、 Midjourney和 DALL·E 2。
在本文中,ShowMeAI将对这3种模型进行比较,我们不会介绍这些 AI 模型后面的复杂数学原理,而聚焦在使用方法和效果对比。
DALL·E2
DALL·E2由 OpenAI开发,目前产品版本处于 beta 阶段。
如何使用
① 文本提示作图
在DALL·E2中,我们能够利用『文本到图像』和『文本引导的图像到图像』两大生成算法,轻松地创造出理想中的图片。其中,『文本引导的图像到图像』这一算法更是实用便捷,您只需上传一张图片,AI就会根据您的提示,生成一幅全新的画作。
上图 DALL·E 作画提示词:A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画)。② 文本提示的图到图
这款工具具备”编辑生成图像”的功能,通过采用”文本引导图像到图像”的生成算法,我们能够在已有图像的基础上创建新的图像,从而扩展原有图像的尺寸或对被遮挡的图像进行补全创作。
③ 分辨率和格式
在 DALL·E2 中,所有生成的图像都具有 1024 x 1024 的固定图像大小 。
使用注意事项
首次使用DALL·E服务可以获取50个免费积分(需在首个月内使用完毕)。后续月份,您将每月获得15个免费积分(同样规则,积分不叠加)。每个提示default会生成4个图像,消耗约1个积分,您也可选择付费15美元获取115次作图机会。
DALL·E2 生成的图像可以用于任何合法目的,包括商✦业用途。Midjourney
Midjourney 由同名研究实验室开发,目前处于公测阶段。
如何使用
生成图像 Midjourney ,您可以使用 Midjourney Discord 服务器。
① 文本提示作图
Midjourney的『文本提示做图』也非常简单,也同样是提交提示文本,就可以生成对应的结果。
上面的截图,是在 Midjourney Discord Server 上提交提示 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。② 图像变体&高分辨率
此外,您可以创建生成图像的其他变体或将生成的图像放大到更高分辨率。
我们也可以输入一个或多个图像的 URL,以其作为初始,配以提示文本引导作图。
③ 分辨率和格式
Midjourney支持创建各种格式的图像,图像分辨率高达 2048 x 2048 。
使用注意事项
首次加入Midjourney Discord家庭,我们能够获取25分钟的免费GPU时间,这大约能支持25次免费的图像生成(每次生成大约需要1GPU分钟)。当你发出一个请求,系统将会生成四个备选作品供你选择。
Midjourney允许付费会员将 Midjourney 生成的图像用于商✦业用途。Stable Diffusion
Stable Diffusion 由 CompVis、 Stability AI和 LAION开源,于 2022 年 8 月发布,大家都可以使用(但需要一些服务器计算资源支撑)。
如何使用
如果要本地运行 Stable Diffusion,至少需要 10GB VRAM 的 GPU。 Huggingface 提供了有关如何使用 Stable Diffusion 教程。
如果您不想编写和触碰任何代码,也可以使用 Dream Studio Web 应用程序,只需要注册一个帐户即可。
① 文本提示做图
# Dream Studio 的 “文本到图像” 功能提供多种选项,用户可设定生成图像的步驟數、隨機種子等,甚至可以設定每次生成的圖像數量(1至9之間)。
上图为 Dream Studio 提示词 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。一个快捷尝试的方式是在 HuggingFace的 Diffuse the Rest应用里尝试,如下图所示:
② 分辨率和格式
使用 Stable Diffusion,您可以创建各种格式的图像,图像分辨率高达 1024 x 1024。
使用注意事项
首次注册 DreamStudio beta 将获得价值 2 英镑的积分。 这大约相当于 200 次单张图免✦费生成的额度。 免✦费试用后可以按 10 英镑的增量购买额外的积分。
随意使用来自 DreamStudio Beta 和 Stable Diffusion beta Discord 服务的图像用于任何用途, 包括商✦业目的 。总结
在本文中,我们比较了目前最流行的3个图像生成平台 DALL·E2、Midjourney、Stable Diffusion。对比的结果汇总如下表:
不过请大家注意,下表可能会发生变化,因为这三个模型正在积极开发中,功能也在不断完善。下方的信息来源时间点为2022年9月。参考资料
你给文字描述, AI 艺术作画,精美无比!附源码,快来试试!:https://www.showmeai.tech/article-detail/313 使用Hugging Face发布的diffuser模型快速绘画:https://www.showmeai.tech/article-detail/312 DALL·E2:https://openai.com/dall-e-2/ OpenAI:https://openai.com/ Midjourney:https://www.midjourney.com/ Midjourney Discord 服务器:https://discord.gg/midjourney Stable Diffusion:https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb CompVis:https://github.com/CompVis Stability AI:https://stability.ai/ LAION:https://laion.ai/ Dream Studio Web 应用程序:https://beta.dreamstudio.ai/ Diffuse the Rest:https://huggingface.co/spaces/huggingface/diffuse-the-rest推荐阅读
数据分析实战系列 :https://www.showmeai.tech/tutorials/40 机器学习数据分析实战系列:https://www.showmeai.tech/tutorials/41 深度学习数据分析实战系列:https://www.showmeai.tech/tutorials/42 TensorFlow数据分析实战系列:https://www.showmeai.tech/tutorials/43 PyTorch数据分析实战系列:https://www.showmeai.tech/tutorials/44 NLP实战数据分析实战系列:https://www.showmeai.tech/tutorials/45 CV实战数据分析实战系列:https://www.showmeai.tech/tutorials/46 AI 面试题库系列:https://www.showmeai.tech/tutorials/48
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!