HiccupRL

dao-skill

面向毛泽东选集/毛泽东著作、王阳明心学/传习录、曾国藩家书三类中文思想材料的语料检索、对照阅读、观点归纳与写作辅助 skill。当用户要求比较毛泽东、王阳明、曾国藩,或要求基于这些原典做读书笔记、主题索引、摘录、研究备忘录、文章草稿时触发。

HiccupRL 1 Updated 2w ago

Resources

10
GitHub

Install

npx skillscat add hiccuprl/dao-skill

Install via the SkillsCat registry.

SKILL.md

/dao-skill — 中文思想语料库阅读 Skill

这个 skill 的目标不是人格模仿,而是把三类中文思想材料组织成可检索、可引用、可继续扩充的 corpus:

  1. 毛泽东选集 / 毛泽东著作:重点关注实践论、矛盾论、调查研究、群众路线、统一战线、持久战、组织路线等主题。
  2. 王阳明心学 / 传习录:重点关注心即理、知行合一、致良知、格物、事上磨炼、四句教等主题。
  3. 曾国藩家书 / 书信材料:重点关注修身、持家、立志、勤俭、读书、用人、治军、居官、交友等主题。

数据组织

语料与索引默认放在以下路径:

  • data/corpus/all.json — 统一 JSONL-like 结构的全量条目列表。
  • data/corpus/*.json — 按 collection 拆分的结构化材料。
  • data/corpus/*.md — 方便 grep 的 Markdown 汇编。
  • data/summary.json — 抓取时间、来源、数量、许可说明和风险说明。
  • references/source_index.md — 来源索引。
  • references/core_concepts.md — 主题概念索引。
  • references/quote_index.md — 代表性短摘录索引。
  • references/reading_workflow.md — 阅读与回答流程。
  • config/sources.yaml — 可抓取来源的 allowlist 与许可备注。

使用原则

1. 先检索,再回答

回答涉及具体原典观点时,先检索语料:

bash references/search_corpus.sh "知行合一"
bash references/search_corpus.sh "群众路线"
bash references/search_corpus.sh "勤俭"

如果语料尚未抓取,先运行:

python scripts/scraper.py --config config/sources.yaml --out data/corpus
python scripts/build_references.py --data data/corpus --out references
python scripts/check_repo.py

2. 区分“原文”“解释”“我的综合”

输出时保持三层分明:

  • 原文层:引用 corpus 中的原句或短摘录,并标注标题、作者、来源 URL。
  • 解释层:解释该句在原文语境中的意思。
  • 综合层:跨材料比较、提炼方法论或转写成现代语言。

不要把后人的概括直接说成作者原话。

3. 不随便拼接不同传统

这三类材料的思想背景不同:

材料 核心语境 阅读时避免
毛泽东著作 革命、组织、战争、社会实践、政治经济分析 把政治口号化文本当作抽象心性哲学
王阳明 / 传习录 宋明理学、心性修养、知行关系、工夫论 把“致良知”简化成现代鸡汤
曾国藩家书 家训、修身、处世、治军、官场伦理 只摘励志句而忽略具体家族与时代处境

4. 版权与来源优先

只使用 config/sources.yaml 中列出的公开来源。对于古籍材料,优先使用公版或 Wikisource 等明确开放来源;对于现代作者/现代整理本,必须保留来源与许可说明。毛泽东相关文本在不同法域可能有版权差异,抓取脚本会记录来源与风险备注;不从随机转载站批量搬运。

典型任务

A. 做主题读书笔记

流程:检索关键词 → 按材料分组 → 每组给 3-5 条短摘录 → 解释语境 → 总结共同点与差异。

适合主题:

  • “实践”在《实践论》与“事上磨炼”之间的关系
  • “知行合一”和“调查研究”的方法论比较
  • 曾国藩“勤俭/慎独”和阳明“致良知”的修身差异

B. 做研究备忘录

结构建议:

  1. 问题定义
  2. 相关原文
  3. 历史语境
  4. 概念辨析
  5. 可迁移的方法论
  6. 需要谨慎处

C. 写文章草稿

保持“原典依据 + 现代问题”的结构,不要只堆金句。

推荐结构:

  1. 现代问题或场景
  2. 原典中的关键判断
  3. 三类材料如何给出不同答案
  4. 对今天的实践建议
  5. 局限与反例

D. 建立专题索引

scripts/build_references.py 从 corpus 生成:

  • 概念索引
  • 来源索引
  • 短摘录索引
  • 主题阅读路线

反模式

  • 不要伪造原文或出处。
  • 不要把随机网络译注当作原典。
  • 不要大段复刻现代版权整理本。
  • 不要把复杂思想压缩成“成功学语录”。
  • 不要只给结论而不交代原文依据。
  • 不要把毛泽东、王阳明、曾国藩强行说成同一种思想体系。

最后的准则

当语料不足时,明确说“当前 corpus 未找到足够依据”,然后给出需要补抓的来源或关键词。这个 skill 的可信度来自可追溯材料,而不是来自口气笃定。