Resources
2Install
npx skillscat add harifatherkr/hwp-parser/skills-openclaw Install via the SkillsCat registry.
SKILL.md
HWP Parser Skill
HWP/HWPX 파일을 텍스트, HTML, ODT, PDF로 변환하는 스킬입니다.
Prerequisites
# Python 3.11+ with venv
cd /path/to/hwpparser
python3 -m venv venv
source venv/bin/activate
pip install -e .Commands
텍스트 추출
hwpparser convert input.hwp -f text -o output.txtHTML 변환
hwpparser convert input.hwp -f html -o output.htmlODT 변환
hwpparser convert input.hwp -f odt -o output.odtPDF 변환 (Chrome headless)
hwpparser convert input.hwp -f pdf -o output.pdf일괄 변환
hwpparser batch ./documents/ -f text -o ./output/Output Formats
| Format | Extension | Description |
|---|---|---|
text |
.txt |
순수 텍스트 추출 |
html |
.html |
HTML 문서 변환 |
odt |
.odt |
OpenDocument 포맷 |
pdf |
.pdf |
PDF (Chrome headless) |
Examples
HWP 파일에서 텍스트 추출하기
# 사용자 요청: "이 HWP 파일 내용 읽어줘"
hwpparser convert document.hwp -f text -o /tmp/output.txt
cat /tmp/output.txt여러 HWP 파일을 HTML로 변환
# 사용자 요청: "documents 폴더의 모든 HWP를 HTML로 변환해줘"
hwpparser batch ./documents/ -f html -o ./html_output/Troubleshooting
pyhwp 의존성 오류
pip install pyhwp sixPDF 변환 실패
Chrome 또는 Chromium 설치 필요:
# macOS
brew install --cask google-chrome
# Ubuntu
sudo apt install chromium-browser