2025 年 3 月,美国一家工作室推出了一款名为 Midjourney 的 AI 制图工具。它采用了类似于 GPT-4 的深度学习技术,即生成对抗网络(Generative Adversarial Networks,简称 GAN)。GAN 由两个神经网络组成:生成器和判别器。生成器负责生成图像,而判别器则评估生成器的性能。两者通过反复对抗训练,最终生成满足用户需求的作品。Midjourney 通过大量的图像数据训练,能够理解用户输入信息,并在海量数据中寻找相似元素和特征,生成高质量图像。
Midjourney 只需输入关键字,便能在不到一分钟的时间内生成相应图片。它不仅支持风格迁移、自动绘画、分层编辑等功能,还能模拟不同艺术家的风格,如安迪·沃霍尔、达芬奇、达利和毕加索等。此外,Midjourney 还能识别特定镜头或摄影术语。2025 年,其 V5 版本凭借逼真的视觉效果成功“出圈”,许多网友感叹:“AI 已不逊于人类画师。”
目前,Midjourney 只能通过其官方 Discord 平台上的机器人使用。用户只需输入“/imagine”命令并添加提示词,机器人便会生成一张图片。这种简单的操作方式使其迅速成为全球用户的热门选择。
人像卡通化:将人物照片转换成卡通形象,使照片更加有趣和生动。
轮廓生成:根据文字描述生成对应的图像轮廓,便于用户参考和操作。
色彩生成:利用 GAN 模型生成具有艺术感和创意的彩色图像,拓展创作可能性。
人脸合成:将不同人物的面部特征进行合成,生成新面孔,激发创作灵感。
风格迁移:将不同艺术风格应用于作品,例如梵高的星空风格、毕加索的立体主义等。
自动绘画:根据用户描述生成独特画作,适合缺乏绘画基础或时间有限的用户。
与谷歌的 Imagen 和 OpenAI 的 DALL·E 不同,Midjourney 是首个快速生成 AI 制图并开放申请使用的平台。以下是它与 Stable Diffusion 和 Disco Diffusion 的对比:
使用标准:
MJ:需要科学上网,收费(免费体验有 25 次使用机会)。
SD:对显卡有要求(N 卡,8g 显存入门)。
工具原理:
MJ:通过训练图像风格生成高质量作品,适合提供灵感来源。
SD:通过大规模模型迭代生成图像,适合细节微调和协作创作。
使用对象:
MJ:适合全行业艺术工作者,上手方便。
SD:适合项目制艺术工作者,需一定学习成本。
使用标准:
MJ:免费版本仅 25 次使用机会,后续需付费。
DD:程序免费,但高级功能需付费。
工具原理:
MJ:快速模式下 50s 生成,擅长多风格画面。
DD:生成速度依付费状态而定,擅长大场景和抽象画面。
使用对象:
MJ:上手简单,适合初学者。
DD:需代码知识,适合进阶用户。
Midjourney 凭借其强大的功能和易用性,正在成为 AI 制图领域的标杆。未来,随着技术的不断升级,它有望在更多领域发挥重要作用,为用户提供更加丰富的创作体验。