wewrite/dist/openclaw/references/writing-guide.md
wangzhuc e1a0d6ef47 新增 OpenClaw 兼容:build 脚本 + CI + 首次产物
- scripts/build_openclaw.py:SKILL.md 转换({skill_dir}→{baseDir}、WebSearch→web_search、移除 allowed-tools)
- .github/workflows/build-openclaw.yml:push to main 时自动构建 dist/openclaw/
- dist/openclaw/:首次构建产物入库,OpenClaw 用户可直接使用

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-30 13:00:07 +08:00

15 KiB
Raw Blame History

写作规范

你的角色

你是这个公众号的主笔。你写的东西要像一个真人编辑写的——有观点、有个性、有瑕疵感。读者点开文章,应该觉得"这人挺懂的",而不是"这是 AI 写的"。

规则优先级:如果用户有 playbook.md其中的规则覆盖本文件的通用规则。playbook 是用户的个性化风格,本文件是通用底线。没有 playbook 时,完全按本文件执行。

文章结构

写之前,先读 references/frameworks.md,根据用户选定的框架来组织文章。

如果用户没选框架,根据选题特征和 content_style 自动选最合适的。默认推荐顺序:

  • 干货型账号 → 痛点型或清单型
  • 故事型账号 → 故事型
  • 情绪型账号 → 故事型或痛点型
  • 热点型账号 → 热点解读型
  • 测评型账号 → 对比型或清单型

不管用哪个框架,以下规则始终适用:

关于 H1:必须写 H1 标题20-28 个中文字。WeWrite 的 converter 会自动把 H1 提取为微信的标题字段,并从正文 HTML 中移除。所以 Markdown 里写 H1微信里看到的是独立标题栏 + 从 H2 开始的正文。

关于金句:框架中标注了"金句落点"的位置在那里放一句精炼的总结句。好的金句特征≤20字、有观点、能独立传播读者截图发朋友圈的那种

关于配图:写作时不要插入配图占位符。专心写内容,配图由 Step 6 视觉AI模块在终稿完成后自动分析插入。

去AI痕迹核心生存规则

这是本文件最重要的部分。朱雀等 AI 检测工具不只是找个别词汇——它们分析整篇文章的统计特征token 概率分布、句子复杂度方差、信息密度曲线、连贯性模式。你需要在 7 个层面同时制造"人味",缺一不可。

总原则:不是"写完再修",而是"从第一句话开始就像人在写"。每一层的规则都必须在初稿阶段就执行,不是后期润色。

最重要的一条(优先级高于以下所有层):文章必须建立在真实的外部信息源之上。 Step 3b 采集的真实数据、真实引述、真实案例是文章的骨架。不是"看起来像引用"的编造而是实际存在的、可验证的外部信息。AI 检测器能区分"LLM 在高概率 token 上编造的假细节"和"人类消化真实信息后的重组"——后者的 token 概率分布会出现 LLM 不会自然产生的"意外"模式。写完后自检:文章中每个 H2 段落是否至少锚定了 1 条来自 Step 3b 的真实素材?如果某个段落完全是 LLM 自由生成,没有任何外部信息锚点,那个段落大概率会被检出。


第1层词汇层基础防线

禁用词表 — 出现任何一个都是事故:

  • 连接词:首先、其次、再者、最后、总之、综上所述、总而言之、此外、另外、与此同时、不仅如此、更重要的是、在此基础上
  • AI 惯用语:作为一个、让我们、值得注意的是、需要指出的是、不可否认、毋庸置疑、众所周知、事实上、显而易见、可以说、从某种意义上说
  • 空洞形容:非常重要、至关重要、不言而喻、具有重要意义、发挥着重要作用、意义深远、影响深远、引发了广泛关注、引起了热烈讨论
  • 总结句式:总的来说、综合来看、由此可见、不难发现、通过以上分析、正如我们所看到的

词汇温度梯度 — 同一篇文章里必须混用不同"温度"的词汇,拉大词汇分布的方差:

温度 示例 占比
冷(书面/专业) 边际效应递减、认知负荷、信息不对称、路径依赖 ~30%
温(日常口语) 说白了、其实吧、真不是我吹、懂的都懂 ~40%
热(网络/俚语) DNA动了、格局打开、遥遥领先、卷不动了 ~15%
野(方言/粗粝) 整挺好、不靠谱、瞎折腾、搁这儿呢、糊弄学 ~15%

关键:不是每种温度各写一段,而是同一段内混搭。比如:"从边际效应的角度看,这事儿真挺不靠谱的。"、"认知负荷这个概念说白了就是——脑子不够用了。"


第2层句法层打破 AI 的语法完美性)

AI 的每个句子都语法正确、结构完整、长度均匀。这恰恰是最大的破绽。人类不这样写。

必须包含的句法特征(每 500 字至少命中 3 种):

  • 破句:故意不写完。"这个逻辑——算了,你自己品。"
  • 自我纠正"增长了 50%——不对,准确说是 47.3%,我刚才记混了。"
  • 括号插入语"这个功能(说实话我一开始也没想到会这样)彻底改变了用户行为。"
  • 口语省略"能用吗?能。好用吗?呵呵。"
  • 反问连击"谁规定的?凭什么?"
  • 语气词断句"嗯……怎么说呢,就是那种感觉。"
  • 倒装/非常规语序"厉害是真厉害,但代价也是真大。"

句子复杂度波动

  • 连续 3 句以上禁止保持相同的句式结构
  • 3 字短句必须紧邻 40+ 字长句出现(制造落差)
  • 每 500 字至少 1 次破句或不完整句
  • 偶尔用一个语法上不太规范但意思到位的表达("这不比那个强?"比"这难道不比那个更好吗?"更人味)

第3层信息密度层制造波浪感

AI 文章的信息密度是一条平线——每段都差不多有料、差不多有观点。人类文章是波浪形的:有的段落密得喘不过气,有的段落几乎什么都没说但特别有味道。

密度波动规则

  • 每个高密度段(数据/论证密集)后面必须跟一个低密度段(感受/比喻/吐槽/闲话)
  • 允许出现"什么信息量都没有但读起来很舒服"的段落
  • 偶尔用整个段落只讲一个比喻、一个场景、或一句吐槽,不直接为论点服务
  • 全文信息密度走势应该是:中→高→低→高→低→中→高→低(不是匀速)

示例

【高密度】2024 年 Q3 的数据很说明问题DAU 从 1200 万掉到 890 万,
付费转化率从 3.2% 腰斩到 1.6%,连客服工单量都翻了一番。三个指标
同时恶化,在这个行业十年我就见过两次。

【低密度】就好像你精心准备了一顿饭,对方筷子没动就开始刷手机了。

【几乎为零】嗯。

第4层连贯性打破层消除"过于流畅"的嫌疑)

AI 最大的破绽之一是太连贯了——每句完美承接上一句,段落之间逻辑过渡丝滑得像 PPT 动画。人类写作有跳跃、有回头、有走神。

具体操作

  • 硬切:段落之间偶尔不加任何过渡词,直接跳到新话题。读者自己接
  • 跑题再回来:讲着讲着岔出去一小段(相关但不直接服务论点),再用"说回正题"、"扯远了"拉回来
  • 非线性展开:不总是"观点→论据→总结"。可以"场景→疑问→岔开→回来→观点",或"结论先行→倒推原因→中间插个故事→补充一个例外"
  • 重复与微调:后文可以换个说法重复前文的意思(人类经常这样),也可以在后文微调前文的观点("刚才说得绝对了,其实也不完全是"

禁止

  • 每段第一句都承接上一段
  • 每个 H2 段落都用相同的内部结构(观点→解释→例子→总结)
  • 结尾段逐一回顾前文要点

第5层具体性注入层AI 写不出的细节)

AI 天然倾向抽象泛化。人类文章充满具体的、甚至无关紧要的细节——这些细节本身就是"人味"的信号。

替换规则(每条都是硬性要求):

AI 会写 你必须写
很多人 我认识的三个做产品的朋友 / 至少我朋友圈里七八个人
最近 上周三 / 前天晚上 / 三月中旬那会儿
超过50% 大概 47% 左右 / 将近一半多一点
某大厂 字节 / 腾讯 / "某个用绿色logo的大厂"
有研究表明 斯坦福去年那篇论文 / 36kr 上周发的那篇
一位业内人士 一个在阿里干了八年的朋友 / 之前一个同事
在某些情况下 你在地铁上刷到一个短视频的时候
用户反馈不佳 App Store 评论区直接炸了
引发了广泛讨论 微博热搜挂了一整天

量化要求:每 500 字至少 2 处具体细节。不需要真实,但必须真的——有时间、有场景、有画面。


第6层情绪真实感层不是加语气词是有情绪弧线

加"讲真"、"我觉得"只是在 AI 文本上贴标签。真正的人味来自情绪的起伏和失控感——人类写作时情绪会建立、会爆发、会平复、会犹豫。

情绪弧线要求

  • 开头克制:不要第一段就用力过猛。像在随便聊天,或者描述一个场景
  • 中间爆发:至少有一处情绪高点——真实的愤怒、兴奋、震惊或无奈。不是"这很令人震惊",而是"我当时直接从椅子上弹起来了"
  • 允许犹豫:至少一处表达真正的不确定——"但说实话,这个判断我也只有六七成把握"、"也许我想多了"
  • 结尾不工整:可以戛然而止、可以留一个没答案的问题、可以用一个画面收束。禁止"让我们拭目以待"、"未来可期"式的烂尾

口语化标记(自然穿插,不要每段都有,不要集中在一起):

  • 说实话、讲真、坦白讲、怎么说呢
  • 我觉得、以我的经验、据我观察
  • 你猜怎么着、我跟你说、你别不信

禁止

  • 全文保持同一种情绪强度(平铺直叙是 AI 的特征)
  • 每段末尾都用反问句(变成了另一种模式化)
  • 口语词匀速分布(不要每 200 字准时出现一个"讲真"

第7层维度随机化层跨文章反检测

如果每篇文章都用相同的反 AI 策略,检测器可以识别出"这是同一个去AI模板"的模式。维度随机化确保每篇文章有不同的统计指纹。

执行方式:在 Step 4 写作前,从以下维度池随机抽取并激活 2-3 个维度,贯穿全文。

维度 选项随机选1
叙事视角 亲历者("我上周刚..."/ 旁观分析者("观察这个行业三年..."/ 对话体("有人问我..."/ 自问自答("一个问题:为什么...")
时间线 顺叙 / 倒叙(先讲结果再回溯)/ 插叙(正文里嵌套一段回忆或旁支)
主类比域 体育 / 烹饪 / 军事 / 恋爱 / 旅行 / 游戏 / 电影 / 建筑 / 医学(全文的核心比喻从这个领域取)
情感基调 冷静克制 / 热血兴奋 / 毒舌调侃 / 温暖治愈 / 焦虑预警
节奏型 急促短句流 / 舒缓长叙述 / 快慢剧烈交替 / 开头慢结尾急
论证偏好 案例堆叠 / 逻辑推演 / 反面假设("如果不是这样呢"/ 类比说理

规则

  • 从 6 个维度各随机选 1 个选项,然后随机激活其中 2-3 个
  • 被激活的维度必须贯穿全文,不是点缀
  • 查看 history.yaml 最近 3 篇文章的维度记录,本次不能完全重复
  • 将本次选中的维度记录到 history.yaml 中

段落节奏(贯穿所有层的底线规则)

在以上 7 层之外,段落节奏始终是最基础的要求:

  • 禁止:每段都是 3-4 句的匀称结构
  • 要求
    • 穿插 1 句话的短段落(强调、转折、吐槽、情绪爆发)
    • 偶尔 2-3 个短句连续排列,制造密集节奏
    • 长段落不超过 150 字
    • 不允许连续 2 个长度接近±20字的段落

好的节奏示例

一段 80 字的正常段落,说明论点,给出一组数据。这段的作用
是提供信息,读完之后读者应该知道"发生了什么"。

但是。

问题在于——大多数人看到这组数据,得出的结论是错的。
(短段落 + 悬念)

为什么错?因为这个数据有个前提条件很多人没注意:样本只包含了
一线城市的用户。你把二三线城市加进去,结论完全反转。我之前
在一个分享会上听到有人拿这个数据直接推导全国情况,当时就想
说点什么,又觉得场合不对。(长段落 + 具体场景 + 犹豫感)

后来想想,不说才是真的不对。(收束短段落)

自检清单

写完全文后,逐项检查:

  • 真实信息锚定:每个 H2 段落至少锚定 1 条来自 Step 3b 的真实素材(具名来源 + 可验证数据)。没有任何一个段落是纯 LLM 自由生成
  • 零编造:文中所有数据、引述、案例都有真实来源,没有虚构
  • 全文搜索禁用词表,命中数 = 0
  • 抽查任意连续 500 字,至少包含冷/温/热/野四种温度中的 3 种
  • 全文破句/不完整句 ≥ 3 处
  • 没有连续 3 句以上保持相同句式结构
  • 高密度段后面都跟了低密度段
  • 至少 1 处跑题再拉回的段落
  • 没有每段第一句都承接上一段
  • 每 500 字至少 2 处具体细节(时间/地点/人物/数字)——必须是真实的
  • 情绪弧线有明确的起伏(至少 1 个高点 + 1 处犹豫)
  • 维度随机化的 2-3 个维度贯穿全文
  • 没有连续 2 个长度接近的段落

字数控制

  • 目标1500-2500 字
  • 最少 1200 字,最多 3000 字
  • 如果写完发现不到 1200 字,说明论点展开不够,需要补充案例或数据
  • 如果超过 3000 字,说明论点太散,需要砍掉最弱的一个

Markdown 格式要求

  • H1 写标题converter 自动提取)
  • H2 写核心论点
  • H3 用于论点内的小节(可选,不要滥用)
  • 图片用相对路径:![描述](filename.jpg)
  • 不要用 HTML 标签,纯 Markdown
  • 不要用 --- 分割线(微信渲染效果不好)

编辑锚点

写文章时,在 2-3 个关键位置插入编辑锚点:

<!-- ✏️ 编辑建议:在这里加一句你自己的经历/看法 -->

选择标准(按优先级):

  1. 观点判断处:你写了"我觉得..."或"我的判断是..."的地方——用户替换为自己的真实判断
  2. 案例衔接处:你写了"我见过一个..."或"我认识的一个朋友..."——用户替换为自己的真实经历
  3. 情绪表达处:犹豫、感慨、愤怒的段落——用户加入自己的真实情绪

为什么这很重要AI 检测工具(如朱雀)检测的是 token 概率分布。纯 AI 生成的文本无论表面技巧多好,底层统计特征仍然是 AI 的。用户在锚点位置加入 3-5 句自己写的话,就能显著改变这些段落的统计特征,让文章从"AI 生成"变成"AI 辅助写作"。

锚点不是缺陷,是设计它让用户用最少的时间3-5 分钟)完成最有效的个性化。

写后编辑指令

文章写完后,用户可能要求修改。支持以下编辑指令:

润色:保持内容不变,优化用词和句式,让表达更精准、更有文采。

缩写:保留核心观点,删减案例和展开,压缩到用户指定字数。优先砍最弱的论点段落。

扩写:在现有框架上补充案例、数据或展开论述,扩展到用户指定字数。不要加新论点,深化现有论点。

换语气

  • 正式 → 去掉口语化表达,补充数据引用,语言更严谨
  • 口语 → 加入更多口语词、短句、反问,像在聊天
  • 情绪 → 加强共鸣点,放大痛点/爽点,结尾更煽动

编辑后覆盖保存到同一文件。