一个强大的学术论文搜索和文献管理工具,专为OpenClaw设计。 支持arXiv、Google Scholar、PubMed等学术数据库的搜索、引用生成和文献整理。 使用场景: - (1) 快速文献调研和前沿研究跟踪 - (2) 学术写作时的参考文献管理 - (3) 批量处理论文元数据和引用信息 - (4) 研究趋势分析和热点发现 当用户需要查找学术文献、管理参考文献或跟踪研究进展时使用此技能。 技能特点: - 🔍 多数据库支持(arXiv、Crossref等) - 📚 自动BibTeX引用生成 - 📊 多种输出格式(Text/JSON/Markdown) - 🎯 智能搜索和筛选 - 🔄 批量处理和自动化
Resources
10Install
npx skillscat add lloyd-jahn/openclaw-paper-search Install via the SkillsCat registry.
SKILL.md
paper-search - 学术论文搜索技能
一个功能完整的学术论文搜索和文献管理工具,专为科研工作者、学生和开发者设计。
🚀 快速开始
安装
# 1. 复制技能目录到OpenClaw的skills目录
cp -r paper-search /path/to/openclaw/skills/
# 2. 安装Python依赖
pip install -r requirements.txt基本使用
# 搜索arXiv论文
python3 scripts/search_arxiv.py --query "machine learning" --max-results 10
# 获取BibTeX引用
python3 scripts/get_bibtex.py --arxiv "2402.04557v1"
# 整理搜索结果
python3 scripts/paper_organizer.py --input results.json --output organized.md📖 详细功能
1. arXiv论文搜索
支持高级搜索语法和多种筛选选项:
# 基本搜索
python3 scripts/search_arxiv.py --query "deep learning"
# 按分类搜索
python3 scripts/search_arxiv.py --query "cat:cs.LG AND transformer"
# 按日期排序
python3 scripts/search_arxiv.py --query "AI" --sort-by submittedDate --sort-order descending
# 多种输出格式
python3 scripts/search_arxiv.py --query "quantum" --format json > results.json
python3 scripts/search_arxiv.py --query "neural networks" --format markdown > papers.md2. 引用管理
自动生成标准BibTeX引用格式:
# 通过arXiv ID获取
python3 scripts/get_bibtex.py --arxiv "2402.04557v1"
# 通过DOI获取
python3 scripts/get_bibtex.py --doi "10.1038/s41586-021-03819-2"
# 批量处理
python3 scripts/get_bibtex.py --input ids.txt --output references.bib3. 论文整理
智能整理和分类搜索结果:
# 整理为Markdown报告
python3 scripts/paper_organizer.py --input search_results.json --output report.md
# 生成阅读清单
python3 scripts/paper_organizer.py --input papers.json --format reading-list
# 按主题分类
python3 scripts/paper_organizer.py --input results.json --group-by category🎯 适用场景
科研工作者
- 文献调研:快速查找相关研究
- 参考文献管理:自动生成引用格式
- 研究跟踪:定期搜索最新论文
- 合作发现:查找相关作者和研究机构
学生
- 课程论文:收集参考文献
- 毕业论文:系统文献综述
- 学术入门:了解领域基础知识
- 项目研究:查找技术方案和算法
开发者
- 技术调研:查找算法实现和优化
- 开源项目:参考相关研究和实现
- 技术选型:比较不同技术方案
- 趋势分析:了解技术发展方向
🔧 脚本说明
scripts/search_arxiv.py
功能:arXiv论文搜索
参数:
--query:搜索查询(支持arXiv高级语法)--max-results:最大结果数(1-1000)--start:起始位置(用于分页)--sort-by:排序方式(relevance/lastUpdatedDate/submittedDate)--sort-order:排序顺序(ascending/descending)--format:输出格式(text/json/markdown)
scripts/get_bibtex.py
功能:BibTeX引用生成
参数:
--arxiv:arXiv ID(如2402.04557v1)--doi:DOI(如10.1038/s41586-021-03819-2)--identifier:自动检测标识符类型--input:输入文件(包含多个ID)--output:输出文件路径
scripts/paper_organizer.py
功能:论文整理和分类
参数:
--input:输入文件(JSON格式)--output:输出文件路径--format:输出格式(markdown/reading-list/bibtex)--group-by:分组方式(category/author/year)
📁 项目结构
paper-search/
├── SKILL.md # OpenClaw技能描述(本文件)
├── README.md # 详细项目文档
├── LICENSE # MIT许可证
├── requirements.txt # Python依赖
├── .gitignore # Git忽略文件
├── scripts/ # 主要脚本
│ ├── search_arxiv.py # arXiv搜索
│ ├── get_bibtex.py # BibTeX生成
│ └── paper_organizer.py # 论文整理
├── examples/ # 使用示例
│ ├── basic_search.py # 基础搜索示例
│ └── batch_process.py # 批量处理示例
├── tests/ # 单元测试
│ └── test_search.py # 搜索功能测试
└── references/ # 参考文档
└── api_reference.md # API参考💡 实用技巧
搜索技巧
# 1. 使用分类代码限制领域
python3 scripts/search_arxiv.py --query "cat:physics.chem-ph AND catalyst"
# 2. 组合搜索条件
python3 scripts/search_arxiv.py --query "machine learning AND (neural OR deep)"
# 3. 排除特定词汇
python3 scripts/search_arxiv.py --query "quantum NOT computing"
# 4. 短语搜索
python3 scripts/search_arxiv.py --query '"graph neural network"'批量处理
# 1. 批量搜索多个主题
topics=("AI" "ML" "DL")
for topic in "${topics[@]}"; do
python3 scripts/search_arxiv.py --query "$topic" --max-results 5 --format json > "${topic}.json"
done
# 2. 批量生成BibTeX
cat paper_ids.txt | while read id; do
python3 scripts/get_bibtex.py --arxiv "$id"
done > references.bib自动化工作流
#!/bin/bash
# 自动化文献调研脚本
# 1. 搜索最新论文
python3 scripts/search_arxiv.py \
--query "cat:cs.LG" \
--max-results 20 \
--sort-by submittedDate \
--sort-order descending \
--format json > latest_papers.json
# 2. 提取arXiv ID
jq -r '.[].id' latest_papers.json | sed 's|.*/||' > arxiv_ids.txt
# 3. 生成BibTeX
python3 scripts/get_bibtex.py --input arxiv_ids.txt --output references.bib
# 4. 生成报告
python3 scripts/paper_organizer.py --input latest_papers.json --output report.md
echo "文献调研完成!"⚠️ 注意事项
API使用限制
- arXiv API:每小时最多请求120次
- Crossref API:免费用户有限制
- 遵守各数据库的使用条款
学术诚信
- 仅用于文献调研和学习
- 尊重知识产权和版权
- 正确引用参考文献
技术限制
- 需要Python 3.7+环境
- 需要网络连接访问API
- 部分数据库需要API密钥
🔄 更新和维护
版本历史
- v1.0.0 (2026-03-16): 初始版本发布
- arXiv搜索功能
- BibTeX引用生成
- 论文整理工具
问题反馈
- GitHub Issues: https://github.com/yourusername/paper-search/issues
- OpenClaw社区: https://discord.gg/clawd
贡献指南
欢迎提交Pull Request或报告问题!
📄 许可证
本项目采用 MIT 许可证 - 查看 LICENSE 文件了解详情。
开始你的学术探索之旅吧! 🎓🔍