콘텐츠로 이동

ULTRAPLAN과 비용 분석

ULTRAPLAN은 소스 코드에서 확인된 복잡한 다단계 작업을 위한 고급 계획 기능 입니다. 원격으로 Opus 4.6 모델 을 사용하여 계획을 수립하며, 3초 간격 폴링브라우저 승인 흐름 을 포함합니다. 빌드 플래그 ULTRAPLAN으로 게이팅되어 있으며, 피처 게이트 tengu_ultraplan_model로 점진적 롤아웃됩니다.

일반 실행:
요청 → 즉시 실행 → 결과
ULTRAPLAN 실행:
요청 → [계획 수립 단계]
├── 요구사항 분석
├── 단계 분해
├── 의존성 파악
├── 위험 요소 식별
└── 실행 계획 확정
[실행 단계]
├── 단계 1 실행 → 검증
├── 단계 2 실행 → 검증
└── 단계 N 실행 → 최종 검증

ULTRAPLAN의 핵심 원칙은 **“먼저 생각하고, 그 다음 행동한다”**입니다.

단계활동결과물
계획 수립요구사항 분석, 전략 결정실행 계획 문서
검토사용자 승인 또는 자동 진행승인된 계획
실행단계별 구현실제 코드/변경
검증각 단계 완료 확인검증 보고서
// ULTRAPLAN 활성화 예시 (추정 API)
for await (const message of query({
prompt: '결제 시스템을 마이크로서비스로 분리해 주세요',
options: {
ultraplan: true,
planReviewMode: 'auto', // 또는 'manual'
maxPlanSteps: 20
}
})) {
if (message.type === 'plan') {
console.log('계획 수립 완료:', message.plan.steps.length, '단계');
}
}

Claude Code는 모든 세션의 토큰 사용량과 비용을 자동으로 추적합니다.

// result 메시지 전체 구조
{
"type": "result",
"subtype": "success",
"session_id": "abc-123",
"cost_usd": 0.1284,
"duration_ms": 28500,
"duration_api_ms": 23100,
"is_error": false,
"num_turns": 12,
"usage": {
"input_tokens": 45200,
"output_tokens": 8900,
"cache_read_input_tokens": 38000,
"cache_creation_input_tokens": 5200
}
}

캐시 히트율 계산:

캐시 히트율 = cache_read_input_tokens / input_tokens × 100
예시: 38000 / 45200 × 100 = 84.1%

캐시 히트율이 높을수록 비용이 크게 절감됩니다.

const usage = await sendControlRequest({
type: 'control',
subtype: 'get_context_usage'
});
// 상세 분류 응답
{
"total_tokens": 200000, // 최대 컨텍스트 윈도우
"used_tokens": 67430, // 현재 사용량
"available_tokens": 132570, // 잔여 용량
"usage_percent": 33.7, // 사용률 (%)
"breakdown": {
"system_prompt": 12400, // 시스템 프롬프트
"tool_definitions": 8200, // 도구 정의
"conversation": 38500, // 대화 히스토리
"tool_results": 6100, // 도구 실행 결과
"pending": 2230 // 처리 중인 내용
}
}
전략구현 방법절감 효과
시스템 프롬프트 캐싱고정 시스템 프롬프트 사용입력 비용 최대 90%
컨텍스트 압축/compact 명령어 주기적 실행20-40%
모델 다운그레이드단순 작업에 Haiku 활용95% (Opus 대비)
배치 처리여러 파일을 한 번에 처리오버헤드 감소
결과 재사용동일 분석 반복 요청 방지중복 비용 제거

비용 데이터를 지속적으로 수집하면 팀의 AI 사용 패턴을 파악하고 예산을 효율적으로 관리할 수 있습니다.