Midjourney V7 完整使用教程 2026
AI 绘图从入门到精通,提示词技巧与参数全解析
1 Midjourney 是什么?V7 的革命性升级
Midjourney 是由 David Holz(Leap Motion 联合创始人)于 2022 年创立的 AI 图像生成平台。通过自然语言描述(Prompt),用户可以在几十秒内生成高质量的图像。经过 V1 到 V6 的迭代,2026 年发布的 V7 模型标志着 AI 绘图进入了一个全新的时代。
与前代相比,V7 的核心突破在于:对人体解剖结构的精准把控、对复杂场景的构图理解力、以及首次实现了可靠的图内文字渲染。这些能力使 Midjourney 不再只是”生成漂亮图片”的玩具,而是真正可以嵌入商业设计流程的生产力工具。
V7 vs V6:关键差异
| 能力 | V6 | V7 |
|---|---|---|
| 人体解剖 | 偶尔出错(多余手指等) | 接近完美,极少出错 |
| 文字渲染 | 不支持/乱码 | 支持英文、数字精准渲染 |
| 光影系统 | 良好 | 物理级精准,支持 HDR |
| 构图理解 | 基本空间关系 | 复杂多主体场景精确布局 |
| 细节保真度 | 高 | 超高(纹理、材质、反射) |
| 一致性 | 角色跨图一致性差 | Character Reference 角色锁定 |
2 新手入门:从注册到第一张图
注册与订阅
Midjourney 目前提供两种使用方式:Discord Bot 和 Web 编辑器(alpha.midjourney.com)。新用户需要先在 midjourney.com 注册账号并选择订阅计划。
访问 midjourney.com
点击 Sign Up,使用 Discord 账号或 Google 账号注册。首次使用需要绑定有效的支付方式。
选择订阅计划
Basic($10/月,200张)、Standard($30/月,无限慢速)、Pro($60/月,无限快速+隐私模式)。推荐从 Standard 起步。
进入创作界面
在 Discord 的 #newbies 频道输入 /imagine + 提示词,或直接使用 Web 编辑器。Web 编辑器提供更好的图片管理和编辑体验。
Discord 基本命令
在 Discord 中,所有 Midjourney 操作都通过斜杠命令完成:
/imagine— 核心生图命令,后接提示词/describe— 上传图片,AI 反向生成提示词/blend— 混合 2-5 张图片的风格/settings— 调整默认模型版本、风格化程度等/info— 查看剩余额度和账户信息
3 提示词写作核心法则
提示词(Prompt)是 Midjourney 的灵魂。好的提示词能让 AI 精准理解你的创作意图,差的提示词只会产出随机的、不可控的结果。掌握提示词写作是使用 Midjourney 的第一道关键门槛。
提示词基本结构
一个优秀的 Midjourney 提示词通常包含以下几个层次:
主体描述
Who/What — 画面的核心主体。例如:”a samurai warrior”、”a cozy coffee shop”
环境与场景
Where — 主体所处的环境。例如:”in a bamboo forest at dawn”、”on a rainy Tokyo street”
风格与媒介
How — 视觉风格和艺术媒介。例如:”oil painting style”、”cinematic photography”、”Studio Ghibli anime”
技术参数
Parameters — 控制输出的技术参数。例如:”–ar 16:9 –stylize 750 –v 7″
提示词进阶技巧
权重控制:使用双冒号(::)可以为提示词不同部分分配权重。例如 a red car:: in a forest::0.5 会让 AI 更强调红色汽车,森林作为次要背景。权重默认为 1,数字越大越被强调。
否定提示词:使用 --no 参数排除不想要的元素。例如 --no text, watermark, people 可以避免画面中出现文字、水印和人物。
描述密度:提示词不宜过短也不宜过长。过短(如 “cat”)会让 AI 自由发挥,结果不可控;过长(超过 60 个词)会导致 AI 注意力分散。理想长度是 15-40 个英文词。
高频风格关键词速查
| 风格类型 | 关键词示例 | 效果描述 |
|---|---|---|
| 摄影写实 | photorealistic, 8K, RAW photo, DSLR | 接近真实照片的质感 |
| 电影感 | cinematic, film grain, anamorphic lens | 电影大片般的色调和构图 |
| 插画 | digital illustration, concept art, matte painting | 数字插画风格 |
| 动漫 | anime style, Studio Ghibli, cel shading | 日系动漫画风 |
| 3D渲染 | 3D render, Octane render, Blender, isometric | 三维建模渲染效果 |
| 水彩/油画 | watercolor, oil painting, impasto, brushstrokes | 传统绘画质感 |
4 关键参数完全指南
参数(Parameters)是控制 Midjourney 输出的精密旋钮。掌握参数的使用,是从”碰运气”到”精准出图”的关键跨越。
画面比例 –ar
--ar 控制输出图片的宽高比。默认为 1:1 方形。常用比例:
--ar 16:9— 横版宽屏,适合桌面壁纸、YouTube 封面--ar 9:16— 竖版,适合手机壁纸、Instagram Story、小红书--ar 3:2— 经典摄影比例--ar 4:5— Instagram 帖子最佳比例--ar 21:9— 超宽屏,适合电影场景
风格化 –stylize (–s)
--stylize 控制 Midjourney 对美学的自主发挥程度。取值范围 0-1000:
--s 0— 最严格遵循提示词,美学自由度最低--s 100— 默认值,平衡遵循度和美感--s 250-500— 推荐范围,AI 会在遵循提示词的基础上增加艺术美化--s 750-1000— 高度艺术化,AI 大幅自由发挥,可能偏离提示词
混乱度 –chaos (–c)
--chaos 控制四张初始图的多样性。取值 0-100:
--c 0— 四张图非常相似,适合已经找到满意方向后的微调--c 25-50— 适度多样,推荐的探索范围--c 80-100— 四张图差异极大,适合寻找灵感时使用
其他常用参数
–quality (–q)
渲染质量。–q 0.25(快速低质)、–q 0.5(平衡)、–q 1(默认高质量)。更高质量消耗更多 GPU 时间。
–seed
固定随机种子,使同一提示词生成相似结果。配合微调提示词时非常有用,可以隔离变量观察效果差异。
–tile
生成可无缝拼接的图案纹理,适合制作壁纸、布料花纹、包装设计等。
–weird (–w)
增加实验性/超现实感。取值 0-3000,数值越高越”离谱”。适合探索非常规的创意方向。
5 图生图与风格迁移
除了纯文字生图,Midjourney 还支持以图片作为输入来引导生成。这是商业设计中最常用的工作流之一。
图片提示(Image Prompt)
在提示词前面加上图片 URL,Midjourney 会参考图片的构图、色调和内容来生成新图。格式为:/imagine [图片URL] [文字提示词]。多张图片 URL 之间用空格分隔,最多支持 5 张参考图。
图片权重 –iw
--iw 控制参考图片对最终结果的影响力。取值 0-3(V7 默认 1):
--iw 0.5— 轻微参考,文字描述主导--iw 1— 平衡参考,默认值--iw 2-3— 强参考,输出会非常接近原图
Style Reference (–sref)
V7 引入的风格参考是一个革命性功能。使用 --sref [图片URL] 可以锁定参考图的”艺术风格”(色调、笔触、质感),但不受其内容影响。这意味着你可以用一张梵高的画作为 sref,然后生成任何主题的梵高风格图片。
Character Reference (–cref)
角色一致性是 AI 绘图的最大痛点之一。V7 的 --cref 功能可以锁定参考图中的角色外观(面部特征、发型、体型),在不同场景中保持同一角色的一致性。这对漫画创作、品牌 IP 设计和故事板制作极其重要。
6 编辑器:局部重绘与扩展画布
Midjourney 的 Web 编辑器(alpha.midjourney.com/editor)提供了类似 Photoshop 的后期编辑能力,让你可以对已生成的图片进行精细调整。
Inpainting(局部重绘)
选中图片的某个区域,输入新的描述,Midjourney 会只重新生成选中区域,保持其余部分不变。应用场景:修复手部/面部细节、替换背景元素、修改服装细节、添加/移除特定物体。
Outpainting(扩展画布)
将画布向任意方向扩展,Midjourney 会根据现有内容智能补全新区域。这对于将方形图片转换为宽幅横图或竖图特别有用,也是制作全景图的利器。
Upscale(高清放大)
V7 支持将图片放大到最高 4K 分辨率,同时保持甚至增强细节。对于需要印刷输出(海报、展板)的场景至关重要。放大后的图片在细节、纹理和锐度上都有显著提升。
7 风格控制进阶技巧
摄影风格模拟
通过在提示词中加入具体的摄影技术参数,可以让 Midjourney 模拟不同的摄影效果:
- 镜头效果:35mm lens, 85mm portrait lens, fisheye, macro photography, tilt-shift
- 光线条件:golden hour, blue hour, harsh midday sun, neon lighting, rim lighting, Rembrandt lighting
- 相机型号:shot on Hasselblad, Leica M, Canon 5D — 不同品牌会带来微妙的色彩和质感差异
- 胶片模拟:Kodak Portra 400, Fujifilm Velvia, Ilford HP5 — 模拟经典胶片色调
艺术家风格参考
Midjourney 对数百位艺术家的风格有深度理解。在提示词中加入 in the style of [artist name] 可以引导画风。几个特别有效的方向:
- 概念艺术:Greg Rutkowski, Craig Mullins, Syd Mead
- 插画:James Jean, Loish, Alphonse Mucha
- 摄影:Annie Leibovitz, Gregory Crewdson, Steve McCurry
- 超现实:Beeple, Simon Stålenhag, Zdzisław Beksiński
8 V7 文字渲染能力解析
在 V7 之前,AI 绘图工具最大的短板就是无法正确渲染文字。V7 首次实现了可靠的英文和数字渲染,这对商业设计具有革命性意义。
文字渲染技巧
- 将文字内容放在引号中:
"SALE 50% OFF" - 保持文字简短(1-5 个单词效果最佳)
- 指定文字的位置:
text on top of the image - 指定文字风格:
neon sign text, vintage typography, handwritten - 英文和数字可靠性最高,中文/日文渲染仍不稳定
应用场景:Logo 概念设计、社交媒体海报、产品包装预览、活动 Banner、书籍封面概念稿。
9 商业出图工作流
将 Midjourney 融入商业设计流程,关键在于建立可复现、可迭代的标准化工作流。
创意简报 → 提示词
将设计需求转化为结构化的 Midjourney 提示词。先确定主体、环境、风格、比例、色调等核心要素。
探索阶段(高 Chaos)
使用 –c 50-80 快速探索多种方向,–q 0.5 降低质量节省额度。在 20-30 次生成中找到满意的大方向。
聚焦阶段(低 Chaos + Seed)
锁定满意的图片 seed,微调提示词细节。使用 –c 0-10 确保结果可控,逐步逼近理想画面。
精修阶段(Inpainting + Upscale)
使用编辑器修复细节问题(手部、文字、边缘),然后 Upscale 到商业印刷级分辨率。
后期处理
导出到 Photoshop/Figma 做最终的色彩校正、排版合成和格式输出。Midjourney 输出的是素材,不是成品。
电商产品图工作流
Midjourney 在电商领域的应用非常广泛。通过图生图功能,可以快速为产品生成不同场景的展示图:
- 场景图:将产品照片作为 image prompt,描述理想的使用场景
- 模特图:使用 –cref 锁定品牌模特形象,批量生成穿搭展示
- 氛围图:为产品详情页生成配套的 lifestyle 场景图

Midjourney V7 已可生成商业可用级别的高品质图像
10 Midjourney vs DALL·E 3 vs Stable Diffusion
| 对比维度 | Midjourney V7 | DALL·E 3 | Stable Diffusion 3 |
|---|---|---|---|
| 图像质量 | ⭐⭐⭐⭐⭐ 业界最佳 | ⭐⭐⭐⭐ 优秀 | ⭐⭐⭐⭐ 优秀(需调参) |
| 提示词理解 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐(GPT加持) | ⭐⭐⭐⭐ |
| 文字渲染 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ 最佳 | ⭐⭐⭐ |
| 风格多样性 | ⭐⭐⭐⭐⭐ 极强 | ⭐⭐⭐ 偏统一 | ⭐⭐⭐⭐⭐ 完全可控 |
| 自定义程度 | ⭐⭐⭐⭐ 参数丰富 | ⭐⭐ 有限 | ⭐⭐⭐⭐⭐ 完全开源 |
| 使用门槛 | 中等(需学参数) | 极低(自然语言) | 高(需技术能力) |
| 价格 | $10-60/月 | 含于 ChatGPT Plus $20/月 | 免费(需自备 GPU) |
| 商用版权 | 付费用户拥有完整商用权 | 用户拥有 | 取决于模型许可 |
选择建议:追求最高图像品质和艺术感 → Midjourney;需要与文字深度结合、低门槛使用 → DALL·E 3;需要完全可控/本地部署/大批量生成 → Stable Diffusion。对于大多数设计师和内容创作者,Midjourney 是性价比最高的选择。
11 订阅方案与性价比分析
| 计划 | 月价 | 快速GPU | 慢速GPU | 隐私模式 | 适合人群 |
|---|---|---|---|---|---|
| Basic | $10 | 3.3h/月 | — | ❌ | 个人尝鲜、偶尔使用 |
| Standard | $30 | 15h/月 | 无限 | ❌ | 内容创作者、设计师 |
| Pro | $60 | 30h/月 | 无限 | ✅ | 商业设计、高频使用 |
| Mega | $120 | 60h/月 | 无限 | ✅ | 团队/工作室 |
12 常见问题 FAQ
Midjourney 生成的图片可以商用吗?
付费订阅用户拥有所生成图片的完整商用权(包括印刷、广告、品牌等)。免费试用期间生成的图片仅限个人非商用用途。企业年收入超过 $1M 需要使用 Pro 或 Mega 计划。
如何获得更稳定的角色一致性?
使用 –cref 功能上传角色参考图,配合 –cw(角色权重,0-100)调整参考强度。建议先生成一张满意的角色正面照作为 cref 基准图,然后在不同场景中复用。
为什么我的图片总是生成失败或很慢?
常见原因:提示词触发内容过滤被屏蔽、GPU 高峰期排队、提示词过长导致处理超时。建议避免敏感词汇,使用 /relax 慢速模式避开高峰。
可以用 Midjourney 生成 NSFW 内容吗?
不可以。Midjourney 有严格的内容审核机制,禁止生成暴力、色情和其他违规内容。违规账号将被永久封禁。
Midjourney 支持中文提示词吗?
技术上支持,但效果远不如英文。强烈建议使用英文提示词。可以先用 ChatGPT 或 DeepL 将中文创意翻译成英文描述。
