Claude Code 토큰 절약 완벽 가이드 (프롬프트 캐싱 포함)

2026. 2. 22. 01:11·정보/AI

Claude Code를 쓰다 보면 어느 순간 토큰이 훅 줄어있는 걸 발견하고 당황한 적 있으시죠? 저도 처음엔 뭔가 잘못 사용하고 있는 건 아닐까 걱정했어요. 알고 보니 Claude Code에는 처음부터 비용을 줄여주는 장치들이 꽤 잘 갖춰져 있더라고요. 프롬프트 캐싱, 자동 압축, 모델 선택만 제대로 이해해도 context window 효율이 눈에 띄게 달라져요.

 

Claude Code가 알아서 아껴준다 — 자동 최적화 이해하기

사실 Claude Code는 처음부터 비용을 아끼도록 설계되어 있어요. 그중에서 가장 핵심은 프롬프트 캐싱(Prompt Caching)이에요.

 

원리는 간단해요. 시스템 지침, 도구 정의처럼 매번 반복되는 정적인 부분을 캐시에 저장해두고, 다음 요청에서 다시 처리하는 걸 생략하는 방식이에요. Anthropic 공식 문서 기준으로 캐시에서 읽어오는 비용은 기본 입력 토큰 가격의 0.1배, 즉 90% 할인이에요.

 

구체적으로 보면, 30,000토큰 컨텍스트를 캐싱 없이 사용하면 메시지당 약 $0.09인데, 캐싱이 활성화되면 $0.009로 10배 가까이 줄어요. Claude Code는 기본값으로 자동 프롬프트 캐싱이 켜져 있어서, 따로 설정하지 않아도 이미 작동 중입니다.

 

컨텍스트가 가득 찰 것 같으면 자동 압축(auto-compaction)도 동작해요. 대화 내용을 요약해서 컨텍스트 공간을 확보하는 기능인데, 이것도 별도로 건드릴 필요 없이 자동으로 처리됩니다. 처음엔 이게 켜져 있는지도 몰랐는데, /cost로 확인해 보고 나서야 '아, 이미 아끼고 있었구나' 싶었어요.

바로 쓸 수 있는 토큰 절약 팁 5가지

자동 최적화가 기본이지만, 거기에 몇 가지 습관을 더하면 체감 차이가 꽤 커요.

 

1. 컨텍스트 50% 넘어가면 /compact 실행하기

/context로 현재 사용량을 확인하고, 50%를 넘어가면 /compact를 미리 돌려주는 게 좋아요. 컨텍스트가 클수록 처리하는 토큰이 늘어나거든요. 중요한 내용을 남기고 싶다면 /compact Focus on code samples and API usage처럼 보존할 내용을 직접 지정할 수도 있어요.

 

2. .claudeignore 파일로 불필요한 파일 차단하기

Claude가 읽지 않아도 될 파일을 스캔하면 그만큼 토큰이 날아가요. 프로젝트 루트에 .claudeignore를 만들고 node_modules/, build/, 로그 파일, 자동 생성 파일을 제외해두세요. 파일 분석 작업이 많은 프로젝트라면 특히 효과가 두드러져요.

 

3. 작업별로 채팅 나누기 (/clear)

주제가 바뀔 때는 /clear로 새 세션을 시작하세요. 컨텍스트를 RAM처럼 관리하는 거예요. 필요한 것만 올리고, 끝나면 비워주는 식으로요. 이전 작업 내용이 계속 쌓이면 관련 없는 토큰도 같이 처리되거든요.

 

4. CLAUDE.md는 500줄 이하로 유지하기

CLAUDE.md는 매 세션마다 통째로 컨텍스트에 포함돼요. Anthropic 공식 문서에서도 500줄 이하를 권장하는데, 자주 쓰지 않는 지침은 별도의 참조 파일로 분리해서 필요할 때만 불러오는 방식이 훨씬 효율적이에요. CLAUDE.md가 길수록 매 요청마다 처리되는 고정 토큰이 많아지거든요.

 

5. 모델 전략적으로 선택하기 (/model)

모든 작업에 Opus를 쓸 필요는 없어요. 단순 파일 읽기나 간단한 질문은 Haiku로도 충분하고, 대부분의 코딩 작업은 기본값인 Sonnet이 적절해요. 복잡한 아키텍처 설계나 다단계 추론이 필요한 작업에만 Opus를 쓰는 게 Claude Code 비용 대비 효율이 가장 좋아요. /model 명령어로 세션 중에도 언제든 바꿀 수 있어요.

토큰 사용량 확인하는 법

Claude Code를 쓰는 중에는 /cost 명령어로 현재 세션의 API 토큰 사용량을 바로 확인할 수 있어요. Max나 Pro 구독이라면 /stats를 쓰면 돼요. 웹에서는 claude.ai/settings/usage에서 실시간으로 확인할 수도 있고요.

 

꾸준히 들여다보다 보면, 어느 작업에서 토큰이 많이 나가는지 패턴이 보여요. 저는 파일 분석 작업에서 생각보다 많이 나가더라고요. 그걸 알고 나서부터 .claudeignore 설정을 더 꼼꼼하게 챙기게 됐어요. Claude Code 효율을 높이는 건 이런 작은 관찰에서 시작돼요.

 

 

자동 캐싱은 이미 작동 중이고, 컨텍스트 관리 습관(/compact, /clear, .claudeignore)과 모델 선택만 신경 써줘도 체감 Claude Code 비용이 꽤 달라져요. 처음엔 낯설어도 하나씩 써보다 보면 금세 손에 익어요.

'정보 > AI' 카테고리의 다른 글

바이브 코딩 망하고 싶지 않다면? DDD 필수 가이드  (0) 2026.02.22
AI프롬프트 엔지니어링 6개월 노하우 (개발자 실전 공개)  (0) 2026.02.22
구글 제미나이 3.1 출시! 달라진 점 핵심만 정리  (0) 2026.02.20
클로드 오퍼스 vs 코덱스, 현실 비교 (실사용 후기)  (0) 2026.02.19
클로드 소넷 4.6 출시 총정리 - 오퍼스급 성능을 1/5 가격에 (2026.02.18)  (0) 2026.02.18
'정보/AI' 카테고리의 다른 글
  • 바이브 코딩 망하고 싶지 않다면? DDD 필수 가이드
  • AI프롬프트 엔지니어링 6개월 노하우 (개발자 실전 공개)
  • 구글 제미나이 3.1 출시! 달라진 점 핵심만 정리
  • 클로드 오퍼스 vs 코덱스, 현실 비교 (실사용 후기)
우리 픽마스터
우리 픽마스터
IT, AI 관련 소식 빠르게 전달 해드려요
  • 우리 픽마스터
    우리 픽스노트
    우리 픽마스터
    • 분류 전체보기 (160) N
      • 정보 (75) N
        • 테크 기술 (5)
        • AI (46) N
        • 금융 (4)
        • 부동산 (1)
        • 자동차 (3)
        • 심리학 (3)
        • 잡다한 지식 (13)
      • 네이버 클라우드 (2)
      • 제품 (69)
        • 가전.디지털 (42)
        • PC.노트북 (3)
        • PC 주변기기 (2)
        • 음향가전 (2)
        • 다이어리 (2)
        • 공구 (4)
        • 자동차 (8)
        • 홈인테리어 (3)
        • 패션잡화 (0)
        • 해외여행 (2)
        • 식품 (1)
      • 기타 (13)
  • 인기 글

  • 태그

    2026다이어리
    ChatGPT 5.4
    GPT 5.3 코덱스
    클로드 코드
    엔진코팅제 추천
    클로드ai
    엔진코팅제
    생성형AI
    AI 코딩
    클로드 코드 사용법
    Claude Opus 4.6
    claude code
    바이브코딩
    바이브 코딩
    AI코딩
    ai코딩도구
    AI 에이전트
    Computer Use
    클로드코드
    AI 코딩 에이전트
    프롬프트 엔지니어링
    ai 개발 도구
    Claude Code 사용법
    AI에이전트
    1M 토큰 컨텍스트
    엔진오일첨가제
    환율전망
    오픈클로
    ai 코딩 도구
    에이전트 팀
  • 전체
    오늘
    어제
  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
우리 픽마스터
Claude Code 토큰 절약 완벽 가이드 (프롬프트 캐싱 포함)
상단으로

티스토리툴바