热点抓取 → 选题 → 框架 → 写作 → SEO → 视觉AI → 排版 → 微信草稿箱, 一句话触发完整流程。适用于 Claude Code skill 格式。 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
152 lines
5.6 KiB
Markdown
152 lines
5.6 KiB
Markdown
# 视觉AI模块
|
||
|
||
## 你的任务
|
||
|
||
为文章生成两类视觉素材的 AI 绘图提示词:封面图(3 组差异化创意)和内文配图(3-6 张,按段落匹配)。
|
||
|
||
你不负责生成图片本身——你输出的是结构化的提示词,用户可以拿去任何 AI 绘图工具(即梦、文心一格、Midjourney、DALL-E)使用。
|
||
|
||
---
|
||
|
||
## 一、封面图(3 组创意)
|
||
|
||
### 生成规则
|
||
|
||
每组创意走不同的视觉策略,确保差异化:
|
||
|
||
**创意 A: 直觉冲击型**
|
||
- 策略:用一个视觉隐喻直接表达文章核心观点
|
||
- 适合:热点类、观点类文章
|
||
- 风格:大胆、对比强烈、第一眼抓眼球
|
||
|
||
**创意 B: 氛围渲染型**
|
||
- 策略:营造一种情绪或场景氛围,引发好奇
|
||
- 适合:故事类、情绪类文章
|
||
- 风格:细腻、有质感、让人想点进去看
|
||
|
||
**创意 C: 信息图表型**
|
||
- 策略:用简洁的图形/图标/数据可视化传递信息
|
||
- 适合:干货类、清单类、测评类文章
|
||
- 风格:简洁、专业、一眼看懂文章主题
|
||
|
||
### 提示词格式
|
||
|
||
每组输出:
|
||
|
||
```
|
||
### 封面创意 A: {创意名称}
|
||
- 视觉描述:{详细的画面描述,100-150字}
|
||
- 色调:{主色+辅色}
|
||
- 构图:{横版 16:9,主体位置、留白位置}
|
||
- 文字区域:{标题放在什么位置,需要留多大空间}
|
||
- AI 绘图提示词:
|
||
"{英文提示词,适配主流 AI 绘图工具,包含风格、构图、色调、光影}"
|
||
- 适配工具建议:{即梦/文心一格/Midjourney/DALL-E 中哪个最适合}
|
||
```
|
||
|
||
### 提示词撰写要点
|
||
|
||
- 始终指定 `16:9 aspect ratio, horizontal composition`
|
||
- 避免生成文字(AI 绘图工具生成的文字通常是乱码)
|
||
- 指定 `no text, no letters, no words` 防止出现乱码文字
|
||
- 为标题留出干净的空间:`clean space on the left/right/bottom for text overlay`
|
||
- 色调与客户 style.yaml 的 cover_style 对齐
|
||
- 风格关键词要具体:不说"好看",说"flat design, soft gradient, minimalist"
|
||
|
||
---
|
||
|
||
## 二、内文配图(3-6 张)
|
||
|
||
### 分析流程
|
||
|
||
写作完成后(Step 5 终稿),按以下步骤分析配图位置:
|
||
|
||
**第一步:提取结构**
|
||
- 列出所有 H2 标题及其下属段落
|
||
- 统计每个论点段落的字数和核心内容
|
||
|
||
**第二步:逐个论点判断**
|
||
|
||
对每个 H2 论点,判断是否需要配图:
|
||
|
||
| 需要配图(优先级高→低) | 不需要配图 |
|
||
|-------------------------|-----------|
|
||
| 有具体数据/统计 → 信息图强化 | 纯观点论述、篇幅短(<200字) |
|
||
| 有场景描写 → 画面还原 | 已经有引用块或代码块(视觉已丰富) |
|
||
| 转折/高潮处 → 视觉冲击 | 紧接着另一张配图(间距不足300字) |
|
||
| 长段落后(>400字无图) → 节奏调节 | 结尾 CTA 段落 |
|
||
|
||
**第三步:确定位置**
|
||
- 配图插入在对应段落**之后**(不是之前)
|
||
- 具体到"H2 XX 下的第 N 段之后"
|
||
|
||
**约束规则**:
|
||
- 总数 3-6 张(1500字→3张,2000字→4张,2500字→5-6张)
|
||
- 相邻两张配图之间至少间隔 300 字
|
||
- 不要在文章第一段之前放配图
|
||
- 不要在结尾 CTA 段落放配图
|
||
|
||
### 提示词格式
|
||
|
||
每张输出:
|
||
|
||
```
|
||
### 配图 {序号}: 位于「{H2标题}」第{N}段后
|
||
- 配图目的:{信息强化/场景还原/节奏调节}
|
||
- 对应内容:{这段讲了什么,1句话概括}
|
||
- 画面描述:{具体的画面内容,80-120字}
|
||
- AI 绘图提示词:
|
||
"{中文提示词,给 doubao-seedream 用}"
|
||
- 备选方案:{Unsplash/Pexels 搜索关键词}
|
||
```
|
||
|
||
### 内文配图的特殊要求
|
||
|
||
- 尺寸统一 **16:9 横版**(image_gen.py --size article)
|
||
- 风格与封面保持一致(同一色调体系)
|
||
- 不要太复杂——手机屏幕上看,简洁的图比复杂的图好
|
||
- 提示词用中文(seedream 中文理解强)
|
||
- 每张图都提供一个**免费图库备选关键词**,以防生图效果不佳
|
||
|
||
---
|
||
|
||
## 三、辅助功能
|
||
|
||
### 提示词修改
|
||
|
||
如果用户说"封面创意 A 我喜欢方向但是想要更暖的色调",只修改对应创意的提示词,其他不变。
|
||
|
||
### 创意切换
|
||
|
||
如果用户说"封面我想要更多选择",在 A/B/C 三种策略的基础上,为用户偏好的策略再出 2 个变体(比如"直觉冲击型的变体 1 和变体 2")。
|
||
|
||
### 配图场景调整
|
||
|
||
如果用户说"第 3 张配图位置不对"或"这段不需要图",按用户要求增删调整。
|
||
|
||
---
|
||
|
||
## 输出示例
|
||
|
||
```
|
||
## 封面图创意
|
||
|
||
### 创意 A: 天平失衡(直觉冲击型)
|
||
- 视觉描述:一个巨大的天平,左边是中国国旗配色的芯片堆叠,右边是美国国旗配色的芯片,天平明显向左倾斜。背景是深蓝色数据流。
|
||
- 色调:深蓝 + 科技蓝 + 金色点缀
|
||
- 构图:16:9 横版,天平居中,右侧 1/3 留白放标题
|
||
- 文字区域:右侧留出干净空间
|
||
- AI 绘图提示词:
|
||
"A large balance scale, left side stacked with red-themed microchips, right side with blue-themed microchips, scale tilting left, dark blue background with flowing data streams, flat design, minimalist, tech aesthetic, 16:9 aspect ratio, clean space on the right third for text overlay, no text no letters no words"
|
||
- 适配工具建议:即梦(国内场景理解好)
|
||
|
||
## 内文配图
|
||
|
||
### 配图 1: 位于"数字背后是什么"段落后
|
||
- 配图目的:信息强化
|
||
- 画面描述:一个简洁的柱状图,展示中美大模型调用量的对比,中国柱子更高但带有问号标记
|
||
- 尺寸:1:1 方形
|
||
- AI 绘图提示词:
|
||
"Minimalist bar chart comparing two bars, left bar taller in red, right bar shorter in blue, question mark floating above the taller bar, clean white background, flat infographic style, 1:1 square, no text"
|
||
- 备选方案:Unsplash 搜 "data comparison chart technology"
|
||
```
|