Model selection — qué modelo para qué tarea¶
A mayo de 2026. Pinned IDs, NO aliases evergreen.
Frontier (mayo 2026)¶
| Modelo | ID exacto | $/MTok in/out | Ctx | Cutoff | Mejor para |
|---|---|---|---|---|---|
| Claude Opus 4.7 | claude-opus-4-7 |
$5 / $25 | 1M | Jan 2026 | Planning arquitectónico, mockup→código pixel-faithful, design system audit, reasoning largo. Vision hasta 2576px. |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
$3 / $15 | 1M | Aug 2025 | Coding diario, componentes, refactors, tests. "Perfect design taste". Default Claude Code. |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 |
$1 / $5 | 200k | Feb 2025 | Clasificación, extracción de tokens, subagents paralelos, hooks. |
Dentro del sandbox de artifacts (Claudeception)¶
Hard-coded por guía oficial: claude-sonnet-4-20250514. No lo cambies sin razón fuerte — preserva la cuota del visitante.
Heurística práctica¶
Tarea → Modelo
────────────────────────────────────────────────────
Plan top-level / arquitectura → Opus 4.7 (effort xhigh)
Mockup PNG → componente React → Opus 4.7 (vision 2576px)
Auditoría completa de design system → Opus 4.7
Componente individual / refactor → Sonnet 4.6
Tests Playwright / Vitest → Sonnet 4.6
Subagent ui-reviewer → Haiku 4.5
Subagent que clasifica issues → Haiku 4.5
Skill activation / parsing rápido → Haiku 4.5
Hook PostToolUse (LLM judge) → Haiku 4.5
Opus 4.7 — caveats¶
- Tokenizer nuevo: puede consumir hasta 35% más tokens para el mismo texto. Mide coste con
count_tokensantes de mover workloads grandes desde Sonnet. - Adaptive thinking only: no
budget_tokensmanual. Effort levels:low | medium | high | xhigh | max.xhighes default en Claude Code Enterprise. - Vision high-res: 2576px lado largo / 4784 tokens por imagen (vs 1568px previos). Ideal para mockups densos.
Sonnet 4.6 — caveats¶
- Mejor balance precio/rendimiento del catálogo.
- Iguala Opus 4.5 en long-horizon coding según Anthropic.
- Recomendado para 80% del trabajo diario.
Haiku 4.5 — caveats¶
- Context "solo" 200k (vs 1M de los grandes). Suficiente para tareas atómicas.
- Ideal para paralelizar: lanza 5-10 subagents Haiku para procesar issues, archivos, o snippets en paralelo.
- Para extracción estructurada con schema estricto, fuerza
tool_choice: {type: "tool", name: "extract"}.
Legacy aún accesibles (mayo 2026)¶
claude-opus-4-5-20251001— predecesor Opus, todavía usable.claude-sonnet-4-5-20250929— predecesor Sonnet.claude-haiku-4-5-20251001— Haiku actual (mismo modelo, mismo ID).
Retirados el 20-abr-2026: Sonnet 4.0 y Opus 4.0 originales. Si tu código aún los referencia, actualiza ya.
Coste por superficie típica¶
Para que aterrices la decisión en cifras (Claude API, sin caching):
| Workload | Tokens in | Tokens out | Sonnet 4.6 | Opus 4.7 |
|---|---|---|---|---|
| Componente Button | 2k | 1k | $0.021 | $0.035 |
| Landing completa (5 secciones) | 5k | 8k | $0.135 | $0.225 |
| Mockup PNG → componente | 8k (img) + 3k | 5k | $0.099 | $0.165 |
| Code review de PR mediana | 15k | 3k | $0.090 | $0.150 |
Aplica caching (TTL 1h) en CLAUDE.md + design system → recorta ~70% del input.
Anti-pattern¶
- Usar Opus para todo "por si acaso" → coste se dispara, latencia también. Usa Sonnet por defecto.
- Usar Haiku para tarea creativa principal (landing entera) → output será visiblemente más slop. Haiku brilla en clasificación / extracción / subagentes acotados.
- Hardcodear aliases (
claude-opus-4,claude-sonnet-latest) → silently breaks cuando Anthropic actualiza. Pinned IDs siempre.
Migración entre versiones¶
Cuando Anthropic publique 4.8 / 5.0:
- Lee el changelog — los breaking changes están listados.
- Corre tu eval suite con el nuevo modelo (skill
skill-creatortiene runner). - Actualiza
ANTHROPIC_MODELen.claude/settings.jsony todos los pinned IDs en el código. - Vuelve a calibrar
effortsi pasas de Sonnet a Opus o viceversa. - Verifica costes con
count_tokenspor el cambio de tokenizer.