Claude Code에서 스킬(Skill)을 많이 설치하면 토큰 비용에 얼마나 영향이 있을까 궁금했습니다.
세션에서 설치한 스킬을 직접적으로 사용하지 않아도 Claude Code 가 분명 인식을 할 것이며 세션에서 특정 스킬을 사용할지 말지 판단하려면 스킬 목록을 탐색해야 할테니까요.
실제 환경을 기반으로 분석한 결과를 작성해 봤습니다.
스킬 로딩 메커니즘: Lazy Loading
Claude Code는 Lazy Loading 방식으로 스킬을 관리합니다.
| 단계 | 로드 내용 | 토큰 영향 |
|---|---|---|
| 시작 시 (Discovery) | 스킬 이름 + 설명만 | 스킬당 ~50-200 토큰 |
| 활성화 시 (Activation) | 전체 SKILL.md 내용 | 스킬당 ~500-2000 토큰 |
| 비활성화 상태 | 없음 | 거의 없음 |
At startup, Claude loads only the name and description of each available Skill. This keeps startup fast while giving Claude enough context to know when each Skill might be relevant.
실제 환경 분석: 17개 스킬 설치 시
테스트 환경에서 ~/.claude/skills 폴더에 17개의 전역 스킬이 설치되어 있습니다:
설치된 스킬 목록
- n8n 관련 (7개): n8n-code-javascript, n8n-code-python, n8n-expression-syntax, n8n-mcp-tools-expert, n8n-node-configuration, n8n-validation-expert, n8n-workflow-patterns
- Claude Code 확장 (6개): hook-creator, skill-creator, skill-wizard, slash-command-creator, subagent-creator
- 유틸리티 (4개): seer, web-artifacts-builder, youtube-collector, linear-work-tracker
스킬별 메타데이터 토큰 추정
| 스킬 | description 길이 | 추정 토큰 |
|---|---|---|
| hook-creator | 350자 | ~90 |
| linear-work-tracker | 320자 | ~80 |
| n8n-code-javascript | 250자 | ~65 |
| n8n-code-python | 200자 | ~50 |
| n8n-expression-syntax | 240자 | ~60 |
| n8n-mcp-tools-expert | 260자 | ~65 |
| n8n-node-configuration | 230자 | ~60 |
| n8n-validation-expert | 300자 | ~75 |
| n8n-workflow-patterns | 300자 | ~75 |
| seer | 130자 | ~35 |
| skill-creator | 230자 | ~60 |
| skill-wizard | 270자 | ~70 |
| slash-command-creator | 200자 | ~50 |
| subagent-creator | 220자 | ~55 |
| web-artifacts-builder | 없음 | ~10 |
| youtube-collector | 200자 (한글) | ~100 |
총 토큰 영향
| 항목 | 토큰 |
|---|---|
| 스킬 메타데이터 합계 | ~1,000-1,200 |
| 형식 오버헤드 (목록 구조 등) | ~200-300 |
| 세션당 총 영향 | ~1,200-1,500 토큰 |
비용 관점에서의 분석
- Claude Opus 4.5 기준: 입력 $15/MTok
- 17개 스킬 = ~1,300 토큰 ≈ $0.02/세션
- 하루 50 세션 = ~$1/일
최적화 권장사항
1. SKILL.md는 간결하게 (200-500줄 권장)
---
name: pdf-processing
description: Extract text, fill forms, merge PDFs
allowed-tools: Read, Bash(python:*)
---
# 핵심 내용만
## 추가 리소스
- [자세한 API 참조](REFERENCE.md) (필요시만 읽음)
2. Progressive Disclosure 패턴 적용
SKILL.md (핵심만)
├── reference.md (필요시 읽음)
└── examples.md (필요시 읽음)
3. 스킬 설명을 명확하게 작성
- 나쁜 예: “문서 처리 도움”
- 좋은 예: “PDF에서 텍스트와 테이블 추출, 양식 작성, 문서 병합. PDF 관련 작업할 때 사용”
4. 불필요한 스킬 비활성화
---
name: internal-skill
user-invocable: false # 사용자 메뉴에서 숨김
---
결론
많은 스킬이 있어도 토큰 사용량에 미치는 영향은 제한적입니다.
- 시작 시: 미미한 오버헤드 (메타데이터만)
- 실행 중: 활성화된 스킬만 토큰 비용 발생
- 비활성화 스킬: 거의 영향 없음
17개 스킬 기준 세션당 약 1,200-1,500 토큰으로, 전체 컨텍스트 윈도우(200K)의 0.6-0.75% 정도입니다. Claude Code의 Lazy Loading 설계 덕분에 스킬을 많이 설치해도 실질적인 비용 문제는 없습니다.
참고: https://github.com/jarrodwatts/claude-hud 를 설치해서 확인해보면 매 request 시작시 1.5k 토큰이 소모되는 걸 확인할 수 있었습니다.
그런데, 1개의 세션에서 대화중 오고가는 메시지는 계속해서 전체 백업방식으로 진행되기 때문에 세션 대화 내용이 길어지면 길어질수록 어떨까 생각해보게 됩니다. 이전 히스토리에 스킬 메타정보가 포함되어 있는 것은 아닐까 생각하게 됩니다.
좋은 스킬이라면 우선 설치해놓고 보는 스타일이라면 양도 점점 늘어날 수 있습니다.(전역 설치(~/.claude/)된 스킬이라면 기본적으로 탐색 대상이 됩니다.
[ 스킬 메타정보 + 이전 히스토리 + 마지막 사용자 입력 메시지 ]