|
看看 MidJourney 从第一天开始的 8 个版本的开发:神经网络如何从第一个版本发展到第 6 个版本以及 15 个类别的图像比较。
MidJourney 的新手不知道自 2022 年 2 月发布 V1 以来它已经进步了多少。不要误会我的意思,欧博第一个版本非常酷,但它与 2023 年 12 月发布的第 6 个版本之间的区别就像白天和黑夜! 我今天要回顾的 MidJourney 的每个版本(V1、V2、V3、V4、V5、V5.1、V5.2 和 V6)都有其独特的特点。老实说,我不能说哪一个比其他更好,尤其是从 V4 开始。这就是为什么了解它们的差异并将您最喜欢的版本用于不同目的非常重要! 今天我将向您讲述MidJourney的演变。 从它令人着迷的年代顺序和特征,到我为您准备的所有 8 个版本的 MidJourney 中使用 15 个不同类别的相同提示的令人着迷的图像比较! 请务必读到最后,查看 V1 到 V6 生成的图像的比较!
截至 2024 年 1 月,Discord 上的 MidJourney 机器人拥有约 1600 万用户,其中 145 万是活跃用户。让我们看看 MidJourney 已经走了多远: MidJourney V1: 发布日期:2022 年 2 月 MidJourney 的初始入门阶段从向精选的 500 名用户发布产品开始。这些早期用户随后有机会邀请另外 500 名用户,使用户总数达到 1,000 名, 创始人 David Holtz 要求用户在社交媒体上分享这些图像。 MidjourneyV2: 发布日期:2022 年 4 月 12 日 MidJourney 引入了两个新功能,“Upscaling”和“Variations”,作为其 V2 模型的一部分。 由于 MidJourney 越来越受欢迎,该服务的需求量很大,并且候补名单也在迅速增长。在收集社区反馈后,MidJourney 制定了具体的定价计划并转向付费测试模式: MidjourneyV3: 发布日期:2022 年 7 月 25 日 MidJourney V3 已发布,具有新的“风格化”和“质量”参数。 值得注意的是,MidJourney Discord 社区的用户数量已超过 100 万,甚至超过了流行的 Fortnite 和 Minecraft Discord 服务器: MidjourneyV4: 发布日期:2022 年 11 月 5 日 V4 模型采用 MidJourney 开发的新代码库和 AI 架构,是第一个在其独特的“MidJourney AI Supercluster”上训练的模型。 V4 也是第一个可以生成让人想起照片和渲染的逼真图像的模型,并且在社交媒体上非常受欢迎。 midjoruneyV5: 发布日期:2023 年 3 月 16 日 MidJourney V5 不断提高真实感和美观度,创造出名副其实的图像。在 V5 中,需要更长的提示才能达到所需的美感。 请注意,欧博娱乐V5.0 型号比后来的 V5.1 型号产生更多的摄影世代。 MidjourneyV5.1: 发布日期:2023 年 5 月 3 日 MidJourney V5.1 比以前的版本具有更显着的默认美感,使其更易于使用更短、更简单的文本提示。 它可以更好地解释自然语言提示,具有更高的一致性,提高图像清晰度,产生更少的伪影和边缘,并支持新功能,例如用于重复模式的--tile 。 MidjourneyV5.2: 发布日期:2023 年 6 月 23 日 MidJourney V5.2 可提供高质量的结果,具有更清晰的细节、更好的色彩、对比度和构图。它可以更好地理解提示并更好地响应各种 --stylize 选项。 MidJourney V5.2还进一步增强了照片真实感。 流行的 MidJourney 功能,如缩小、怪异模式、修复“变化(区域)”和风格调整器也在 V5.2 中以短语形式发布。 MidjoruneyV6: 发布日期:2023 年 12 月 21 日 经过九个多月的紧张开发, MidJourney V6(alpha版本)现已发布。它提供了卓越的图像质量增强功能,将照片级真实感提升到了一个新的水平,并显着提高了即时理解能力。 在 MidJourney 中,您第一次可以在图像上生成文本。 在本节中,我使用相同的提示,为您准备了 15 个不同类别的所有 8 个版本的 MidJourney 图像的精彩比较,包括: 诗意的 想象馆 填色本 等距图 矢量图 标志设计 超现实主义 著名艺术家的风格 卡通片 产品样机 食物 风景 内部的 动物 人(儿童、中年男子、年轻女子) 🧠 在每张图片对比下面,我也会分享我个人的想法。 双重反射的奇迹
🧠我的想法: 我真的很喜欢 V5 和 V5.1 的外观。同样有趣的是,图像 V1、V2 和 V3 具有非常相似的组件
🧠我的想法: 我发现 V1 到 V3 的图像非常有趣,看着它们我笑得很开心。我最喜欢的风格是V4,V6的真实感令人惊叹! 彩色书页,简单的线条画,画着一头戴帽子的猪,孤立的白色背景
🧠我的想法: 观看这些图像就像观看某人从头开始学习绘画一样。随着时间的推移,改进的程度简直是惊人的。 4.等轴测图 带植物和书籍的家庭办公室的等距插图
🧠我的想法: 我喜欢创建等距图像,因为它们看起来很有趣!我最喜欢的图像来自 V5.2。可以看到MidJourney AI模型的知识相比V1/V2/V3和V4提升了多少,尤其是在理解“等距”等复杂概念方面。 坐在办公桌前使用笔记本电脑工作的女性的平面矢量图解,孤立的白色背景
🧠我的想法: 令我惊讶的是,V1 到 V3 都清楚什么是“矢量图”。另一方面,在这种情况下我最喜欢的风格是V6!
🧠我的想法: 正如您在这里所看到的,V6 的文本生成确实改变了游戏规则 - 您的图像上不再有随机文本! 这是一幅超现实的人类肖像,头部是一个地球仪,来自世界各地的不同地标相互融合,采用彼得·马克斯充满活力的调色板风格。
🧠我个人的想法: V6生成的图像简直太漂亮了!我也喜欢V1的禁欲外观。 安迪·沃霍尔风格的红唇亚洲女人
🧠我个人的想法: V1 - V3:哈哈😂...在我看来,V4 的图像最能代表安迪·沃霍尔的风格。 一个家庭和他们的狗去野餐的卡通画
🧠我的想法: 我个人最喜欢V5的画面风格。然而,从V5.2开始,它对我来说似乎太“皮克斯”了。另一方面,V1到V3让我想起了剪纸艺术。 润肤露产品模型、带金色泵的琥珀色玻璃瓶、黑色和金色植物图案
🧠我的想法: 我在提示中指出的细节 - “带有金色泵的琥珀色玻璃瓶” - 只能由 V6 完全重复。感谢您对提示的更好理解! 食品杂志照片:披萨配融化的奶酪、番茄和迷迭香
🧠我的想法: 在准备这组图片时,我的肚子开始咕咕叫。😋 披萨,有人吗? 瑞士阿尔卑斯山山谷的照片,开满野花,日落时分
🧠我的想法: V1到V3的图像超出了我的预期,尤其是在油画风格上。 植物爱好者之家的照片,高角度,沙漠景观,高高的窗户,简约的内饰,晨光,深绿色和金色
🧠我的想法: 只有 V6 图像才能真正理解“高角度”这个词,而且 V6 图像中的细节量简直令人难以置信。 🧠我的想法: 图片 V1-V3 中可怜的猫实在是太搞笑了! V6 看起来就像一张真实的照片,老实说我无法看出它是人工智能生成的。
孩子们 照片:一名 6 岁女孩在玫瑰园闻玫瑰香
🧠我的想法: 不用说,V1-V3就是一场灾难!在V4和V5中,女孩们似乎是在吃玫瑰而不是闻玫瑰,这很有趣。就我个人而言,我非常喜欢 V5.1 和 V5.2 镜头中梦幻般的发光色调。 中年男子 泰国一名中年男性嘟嘟车司机的照片,皮肤风化
🧠我的想法: 抱歉,如果您对 V1-V3 图像感到震惊,我不确定为什么 V1-V3 模型会以某种方式将“风化的皮肤”解释为“烧伤的皮肤”...另一方面,我发现 V5 中生成的图像.2 和 V6 极其逼真! 年轻女子 一位年轻女子的特写肖像,她的脸部分被米色透明织物遮住,高光和阴影的混合,用 Ektrachrome 胶片拍摄
🧠💁🏻♀ 我的想法: 我注意到 V1-V3 模型在识别人的种族方面存在偏差。例如,他们将“一位脸部分被米色透明织物遮住的年轻女性”解释为印度/中东女性。另一方面,我认为V6的图像非常漂亮! 与两年前相比,看看我们的图像质量 - 这简直令人难以置信! 我甚至无法想象未来几年生成人工智能领域的事情将如何发展。但我相信我们都很幸运能够参与这个过程! (责任编辑:) |



















