ULTRAPLAN과 비용 분석
ULTRAPLAN이란?
섹션 제목: “ULTRAPLAN이란?”ULTRAPLAN은 소스 코드에서 확인된 복잡한 다단계 작업을 위한 고급 계획 기능 입니다. 원격으로 Opus 4.6 모델 을 사용하여 계획을 수립하며, 3초 간격 폴링 과 브라우저 승인 흐름 을 포함합니다. 빌드 플래그 ULTRAPLAN으로 게이팅되어 있으며, 피처 게이트 tengu_ultraplan_model로 점진적 롤아웃됩니다.
일반 실행: 요청 → 즉시 실행 → 결과
ULTRAPLAN 실행: 요청 → [계획 수립 단계] │ ├── 요구사항 분석 ├── 단계 분해 ├── 의존성 파악 ├── 위험 요소 식별 └── 실행 계획 확정 │ [실행 단계] │ ├── 단계 1 실행 → 검증 ├── 단계 2 실행 → 검증 └── 단계 N 실행 → 최종 검증계획 수립과 실행 분리
섹션 제목: “계획 수립과 실행 분리”ULTRAPLAN의 핵심 원칙은 **“먼저 생각하고, 그 다음 행동한다”**입니다.
| 단계 | 활동 | 결과물 |
|---|---|---|
| 계획 수립 | 요구사항 분석, 전략 결정 | 실행 계획 문서 |
| 검토 | 사용자 승인 또는 자동 진행 | 승인된 계획 |
| 실행 | 단계별 구현 | 실제 코드/변경 |
| 검증 | 각 단계 완료 확인 | 검증 보고서 |
// ULTRAPLAN 활성화 예시 (추정 API)for await (const message of query({ prompt: '결제 시스템을 마이크로서비스로 분리해 주세요', options: { ultraplan: true, planReviewMode: 'auto', // 또는 'manual' maxPlanSteps: 20 }})) { if (message.type === 'plan') { console.log('계획 수립 완료:', message.plan.steps.length, '단계'); }}비용 분석 시스템
섹션 제목: “비용 분석 시스템”Claude Code는 모든 세션의 토큰 사용량과 비용을 자동으로 추적합니다.
// result 메시지 전체 구조{ "type": "result", "subtype": "success", "session_id": "abc-123", "cost_usd": 0.1284, "duration_ms": 28500, "duration_api_ms": 23100, "is_error": false, "num_turns": 12, "usage": { "input_tokens": 45200, "output_tokens": 8900, "cache_read_input_tokens": 38000, "cache_creation_input_tokens": 5200 }}캐시 히트율 계산:
캐시 히트율 = cache_read_input_tokens / input_tokens × 100예시: 38000 / 45200 × 100 = 84.1%캐시 히트율이 높을수록 비용이 크게 절감됩니다.
get_context_usage 세분화 분석
섹션 제목: “get_context_usage 세분화 분석”const usage = await sendControlRequest({ type: 'control', subtype: 'get_context_usage'});
// 상세 분류 응답{ "total_tokens": 200000, // 최대 컨텍스트 윈도우 "used_tokens": 67430, // 현재 사용량 "available_tokens": 132570, // 잔여 용량 "usage_percent": 33.7, // 사용률 (%) "breakdown": { "system_prompt": 12400, // 시스템 프롬프트 "tool_definitions": 8200, // 도구 정의 "conversation": 38500, // 대화 히스토리 "tool_results": 6100, // 도구 실행 결과 "pending": 2230 // 처리 중인 내용 }}비용 최적화 전략
섹션 제목: “비용 최적화 전략”| 전략 | 구현 방법 | 절감 효과 |
|---|---|---|
| 시스템 프롬프트 캐싱 | 고정 시스템 프롬프트 사용 | 입력 비용 최대 90% |
| 컨텍스트 압축 | /compact 명령어 주기적 실행 | 20-40% |
| 모델 다운그레이드 | 단순 작업에 Haiku 활용 | 95% (Opus 대비) |
| 배치 처리 | 여러 파일을 한 번에 처리 | 오버헤드 감소 |
| 결과 재사용 | 동일 분석 반복 요청 방지 | 중복 비용 제거 |
비용 데이터를 지속적으로 수집하면 팀의 AI 사용 패턴을 파악하고 예산을 효율적으로 관리할 수 있습니다.