
안녕하세요, 자바파커입니다.
"설정도 다 했고, 습관도 잡았는데... 팀 전체의 Claude Code 비용을 체계적으로 관리하고 싶어요."
초급편에서 기본 습관을, 중급편에서 설정 최적화를 다뤘습니다. 고급편에서는 시스템 차원의 토큰 관리 전략을 정리합니다. 개인 사용뿐 아니라 팀·프로젝트 단위로 비용을 통제하는 방법까지 포함합니다.
이 글은 [초급 → 중급 → 고급] 시리즈의 마지막 편입니다.
1. Memory 시스템으로 반복 설명 완전 제거
CLAUDE.md가 "프로젝트 규칙서"라면, Memory는 **"나와 Claude 사이의 공유 기억"**입니다.
Memory란?
Claude Code의 Memory 시스템은 대화가 끝나도 유지되는 영구 저장소입니다. 사용자 선호, 프로젝트 맥락, 피드백 등을 파일로 저장해두면 새 세션에서도 자동으로 참조합니다.
~/.claude/projects/{프로젝트}/memory/
├── MEMORY.md ← 인덱스 (자동 로드)
├── user_profile.md ← 사용자 정보
├── feedback_style.md ← 피드백/선호
└── project_arch.md ← 프로젝트 맥락토큰 절약에 어떻게 도움이 되나?
Memory가 없으면 매 세션마다 반복하게 되는 설명들:
# 매 세션 시작마다 이런 말을 하고 있다면...
"이 프로젝트는 Next.js 14 + TypeScript야.
DB는 PostgreSQL이고 Prisma 쓰고 있어.
테스트는 vitest, 배포는 Vercel.
코드 스타일은 airbnb 규칙 따르고..."이걸 Memory에 한 번 저장하면:
"이번에 기억해줘" 라고 말하면 됩니다.이후 세션에서는 이 정보가 자동으로 로드됩니다. 매번 50~100토큰씩 절약되고, 세션이 쌓일수록 누적 효과가 큽니다.
Memory 작성 팁
## <!-- memory/project_stack.md -->
name: 프로젝트 기술 스택
description: 현재 프로젝트의 기술 스택과 규칙
type: project
---
Next.js 14 App Router + TypeScript strict mode
DB: PostgreSQL + Prisma ORM
테스트: vitest + Testing Library
배포: Vercel
코드 스타일: ESLint airbnb + Prettier핵심: Memory 파일도 MEMORY.md 인덱스를 통해 매번 로드되므로, 짧고 핵심만 담아야 합니다. Memory가 길어지면 오히려 토큰 낭비입니다.
2. Skill로 프롬프트 토큰 최소화
Skill은 반복되는 작업 지시를 파일로 저장해 슬래시 명령어로 호출하는 기능입니다.
토큰 관점에서 Skill의 가치
Skill 없이 매번 입력하는 경우:
블로그 포스팅 써줘.
톤은 "~합니다" 체로, 친근하지만 가볍지 않게.
"안녕하세요, 자바파커입니다"로 시작.
마크다운으로 작성하고, 구분선으로 섹션 나누고,
표와 코드 블록 적극 활용하고,
마지막에 댓글 유도 질문 넣어줘.
SEO 태그도 넣고...
(~200토큰)Skill로 호출하면:
/blog-post Claude Code 토큰 절약법
(~10토큰)매 호출마다 ~190토큰 절약. Skill 파일은 호출 시에만 로드되므로, 사용하지 않을 때는 컨텍스트를 차지하지 않습니다.
Skill 최적화 작성법
## <!-- .claude/skills/code-review.md -->
name: code-review
description: PR 코드 리뷰 수행
---
변경된 파일을 분석하고 아래 항목만 체크:
1. 버그 가능성
2. 성능 이슈
3. 보안 취약점
각 항목 발견 시 파일:라인 형식으로 보고.
문제 없으면 "LGTM" 한 줄만 출력.팁: Skill 내부 지시도 간결하게. "친절하게 설명해줘" 같은 문구 대신, 출력 형식을 명확히 지정하면 응답 토큰도 줄어듭니다.
3. 워크트리(Worktree) 격리로 컨텍스트 분리
워크트리는 같은 저장소의 독립적인 작업 복사본을 만드는 Git 기능입니다. Claude Code에서는 서브에이전트를 워크트리에서 실행하여 컨텍스트를 완전히 분리할 수 있습니다.
워크트리가 토큰을 줄이는 원리
메인 세션 (feature-A 작업 중)
│
├── /clear 없이 feature-B 작업 시작
│ → feature-A 컨텍스트가 계속 누적 (토큰 낭비)
│
└── 워크트리에서 feature-B 실행
→ 완전히 독립된 컨텍스트 (토큰 절약)실전 활용
Claude Code에서 서브에이전트를 워크트리 모드로 실행하면, 해당 작업은 별도의 Git 브랜치에서 독립적으로 진행됩니다.
"feature-B를 별도 워크트리에서 구현해줘.
메인 브랜치에 영향 없이 작업하고 결과만 알려줘."이렇게 하면 메인 대화의 컨텍스트를 오염시키지 않으면서 병렬 작업이 가능합니다.
4. max-turns로 자동 실행 제한
Claude Code가 자율적으로 작업할 때, 예상보다 많은 턴을 사용하는 경우가 있습니다. max-turns 옵션으로 이를 제한할 수 있습니다.
# CLI에서 턴 수 제한
claude --max-turns 10 "이 버그 수정해줘"왜 턴 제한이 필요한가?
| 상황 | 턴 수 | 토큰 소모 |
|---|---|---|
| 단순 버그 수정 | 3~5턴 | 적음 |
| 삽질하는 Claude | 20~50턴 | 매우 많음 |
| 무한 루프 (드물지만 발생) | 100턴+ | 폭발 |
max-turns를 설정하면 Claude가 지정된 턴 내에서 작업을 마치지 못하면 중단됩니다. 이때 상황을 파악하고, 더 구체적인 지시를 주거나 접근 방식을 바꿀 수 있습니다.
권장 설정:
| 작업 유형 | 권장 max-turns |
|---|---|
| 단순 수정 | 5~10 |
| 기능 구현 | 15~25 |
| 대규모 리팩토링 | 30~50 |
5. 비용 모니터링과 예산 설정
API 사용량 모니터링
Anthropic Console에서 API 키별 사용량을 확인할 수 있습니다.
# 현재 세션 비용 확인
# Claude Code 내에서
/cost예산 제한 설정
API 사용 시 월별 예산 한도를 설정할 수 있습니다.
# Anthropic Console에서 설정
# Settings → Plans & Billing → Usage Limits
# 월별 사용 한도를 설정하면 초과 시 API 호출이 차단됨팀 단위 비용 관리
팀에서 Claude Code를 사용한다면:
- API 키 분리 — 프로젝트별/팀원별 API 키를 분리하여 사용량 추적
- 예산 알림 — 사용량이 임계치(80%)에 도달하면 알림 설정
- 사용 가이드 공유 — 이 시리즈의 초급/중급 체크리스트를 팀 위키에 공유
6. CI/CD 파이프라인에서의 토큰 최적화
Claude Code를 CI/CD에서 자동화 도구로 사용하는 경우, 토큰 관리가 특히 중요합니다.
CI에서의 토큰 절약 전략
# GitHub Actions 예시 — 필요한 작업만 정확히 지정
claude --max-turns 5 --model claude-sonnet-4-6 \
"src/ 디렉토리의 변경된 파일에 대해 코드 리뷰하고
문제가 있으면 GitHub 코멘트로 남겨줘.
문제 없으면 'LGTM'만 출력."CI/CD 체크리스트:
| 항목 | 설정 |
|---|---|
| 모델 | Sonnet 또는 Haiku (Opus 불필요) |
| max-turns | 작업별 최소값 설정 |
| 프롬프트 | 출력 형식을 명확히 지정 |
| .claudeignore | 테스트/빌드 산출물 제외 |
7. 전체 토큰 최적화 아키텍처
지금까지 초급·중급·고급에서 다룬 모든 전략을 하나의 구조로 정리합니다.
┌─────────────────────────────────────────────┐
│ 토큰 최적화 아키텍처 │
├─────────────────────────────────────────────┤
│ │
│ [Layer 1: 습관] ← 초급편 │
│ ├── /compact & /clear │
│ ├── 간결한 프롬프트 │
│ └── 작업 단위 분리 │
│ │
│ [Layer 2: 설정] ← 중급편 │
│ ├── .claudeignore │
│ ├── autocompact │
│ ├── 모델 전환 전략 │
│ └── Hook 자동화 │
│ │
│ [Layer 3: 시스템] ← 고급편 │
│ ├── Memory 시스템 │
│ ├── Skill 최적화 │
│ ├── 워크트리 격리 │
│ ├── max-turns 제한 │
│ └── 비용 모니터링 │
│ │
└─────────────────────────────────────────────┘적용 우선순위
| 순위 | 방법 | ROI (투자 대비 효과) |
|---|---|---|
| 1 | /clear + 세션 분리 | 최고 — 0초 투자, 즉각 효과 |
| 2 | .claudeignore | 높음 — 5분 설정, 영구 효과 |
| 3 | autocompact | 높음 — 1분 설정, 영구 효과 |
| 4 | 모델 전환 전략 | 높음 — 습관만 들이면 됨 |
| 5 | 간결한 프롬프트 | 중간 — 꾸준한 의식 필요 |
| 6 | Memory 시스템 | 중간 — 초기 설정 필요 |
| 7 | Skill 파일 | 중간 — 반복 작업이 있을 때 |
| 8 | max-turns | 중간 — 자율 실행 시 필수 |
| 9 | 워크트리 격리 | 상황적 — 병렬 작업 시 유용 |
| 10 | CI/CD 최적화 | 상황적 — 자동화 사용 시 |
고급편 요약 — 최종 체크리스트
| # | 방법 | 절약 효과 | 적용 난이도 |
|---|---|---|---|
| 1 | Memory 시스템 | ★★★★☆ | 보통 |
| 2 | Skill 최적화 | ★★★★☆ | 보통 |
| 3 | 워크트리 격리 | ★★★☆☆ | 어려움 |
| 4 | max-turns 제한 | ★★★★★ | 쉬움 |
| 5 | 비용 모니터링 | ★★★☆☆ | 보통 |
| 6 | CI/CD 최적화 | ★★★★☆ | 어려움 |
| 7 | 전체 아키텍처 적용 | ★★★★★ | 단계적 |
FAQ
Q. 이 모든 걸 한꺼번에 적용해야 하나요?
아닙니다. 초급편부터 순서대로 적용하세요. 초급의 습관만으로도 50% 이상 절약되고, 중급 설정까지 적용하면 70% 이상 줄어듭니다. 고급 전략은 비용이 여전히 높거나 팀 단위로 관리가 필요할 때 도입하면 됩니다.
Q. Memory가 너무 많아지면 오히려 토큰이 늘어나지 않나요?
네, 그렇습니다. MEMORY.md 인덱스는 매 세션 시작 시 로드되므로, 200줄을 넘지 않도록 관리해야 합니다. 오래되거나 불필요한 Memory는 주기적으로 정리하세요.
Q. Max 요금제에서도 이 전략들이 유효한가요?
Max 요금제도 시간당/일별 사용량 제한이 있습니다. 토큰을 효율적으로 쓰면 rate limit에 덜 걸리고, 같은 시간에 더 많은 작업을 처리할 수 있습니다. 속도와 생산성 측면에서 여전히 중요합니다.
시리즈 마무리
3편에 걸쳐 Claude Code 토큰 절약 전략을 정리했습니다.
| 편 | 핵심 | 대상 |
|---|---|---|
| 초급 | 습관 (compact, clear, 프롬프트) | Claude Code 입문자 |
| 중급 | 설정 (claudeignore, Hook, 모델 전환) | 일정 기간 사용한 유저 |
| 고급 | 시스템 (Memory, Skill, 워크트리, CI) | 파워유저 & 팀 리더 |
결국 핵심은 하나입니다: Claude에게 보내는 컨텍스트를 최소한으로 유지하면서, 필요한 정보만 정확히 전달하는 것.
이 원칙만 기억하면, 새로운 기능이 추가되더라도 토큰 절약 전략을 스스로 세울 수 있습니다.
여러분만의 토큰 절약 노하우가 있다면 댓글로 공유해주세요! 시리즈를 읽어주셔서 감사합니다.