Saltar a contenido

Model selection — qué modelo para qué tarea

A mayo de 2026. Pinned IDs, NO aliases evergreen.

Frontier (mayo 2026)

Modelo ID exacto $/MTok in/out Ctx Cutoff Mejor para
Claude Opus 4.7 claude-opus-4-7 $5 / $25 1M Jan 2026 Planning arquitectónico, mockup→código pixel-faithful, design system audit, reasoning largo. Vision hasta 2576px.
Claude Sonnet 4.6 claude-sonnet-4-6 $3 / $15 1M Aug 2025 Coding diario, componentes, refactors, tests. "Perfect design taste". Default Claude Code.
Claude Haiku 4.5 claude-haiku-4-5-20251001 $1 / $5 200k Feb 2025 Clasificación, extracción de tokens, subagents paralelos, hooks.

Dentro del sandbox de artifacts (Claudeception)

Hard-coded por guía oficial: claude-sonnet-4-20250514. No lo cambies sin razón fuerte — preserva la cuota del visitante.

Heurística práctica

Tarea                                       → Modelo
────────────────────────────────────────────────────
Plan top-level / arquitectura               → Opus 4.7 (effort xhigh)
Mockup PNG → componente React               → Opus 4.7 (vision 2576px)
Auditoría completa de design system         → Opus 4.7
Componente individual / refactor            → Sonnet 4.6
Tests Playwright / Vitest                   → Sonnet 4.6
Subagent ui-reviewer                        → Haiku 4.5
Subagent que clasifica issues               → Haiku 4.5
Skill activation / parsing rápido           → Haiku 4.5
Hook PostToolUse (LLM judge)                → Haiku 4.5

Opus 4.7 — caveats

  • Tokenizer nuevo: puede consumir hasta 35% más tokens para el mismo texto. Mide coste con count_tokens antes de mover workloads grandes desde Sonnet.
  • Adaptive thinking only: no budget_tokens manual. Effort levels: low | medium | high | xhigh | max. xhigh es default en Claude Code Enterprise.
  • Vision high-res: 2576px lado largo / 4784 tokens por imagen (vs 1568px previos). Ideal para mockups densos.

Sonnet 4.6 — caveats

  • Mejor balance precio/rendimiento del catálogo.
  • Iguala Opus 4.5 en long-horizon coding según Anthropic.
  • Recomendado para 80% del trabajo diario.

Haiku 4.5 — caveats

  • Context "solo" 200k (vs 1M de los grandes). Suficiente para tareas atómicas.
  • Ideal para paralelizar: lanza 5-10 subagents Haiku para procesar issues, archivos, o snippets en paralelo.
  • Para extracción estructurada con schema estricto, fuerza tool_choice: {type: "tool", name: "extract"}.

Legacy aún accesibles (mayo 2026)

  • claude-opus-4-5-20251001 — predecesor Opus, todavía usable.
  • claude-sonnet-4-5-20250929 — predecesor Sonnet.
  • claude-haiku-4-5-20251001 — Haiku actual (mismo modelo, mismo ID).

Retirados el 20-abr-2026: Sonnet 4.0 y Opus 4.0 originales. Si tu código aún los referencia, actualiza ya.

Coste por superficie típica

Para que aterrices la decisión en cifras (Claude API, sin caching):

Workload Tokens in Tokens out Sonnet 4.6 Opus 4.7
Componente Button 2k 1k $0.021 $0.035
Landing completa (5 secciones) 5k 8k $0.135 $0.225
Mockup PNG → componente 8k (img) + 3k 5k $0.099 $0.165
Code review de PR mediana 15k 3k $0.090 $0.150

Aplica caching (TTL 1h) en CLAUDE.md + design system → recorta ~70% del input.

Anti-pattern

  • Usar Opus para todo "por si acaso" → coste se dispara, latencia también. Usa Sonnet por defecto.
  • Usar Haiku para tarea creativa principal (landing entera) → output será visiblemente más slop. Haiku brilla en clasificación / extracción / subagentes acotados.
  • Hardcodear aliases (claude-opus-4, claude-sonnet-latest) → silently breaks cuando Anthropic actualiza. Pinned IDs siempre.

Migración entre versiones

Cuando Anthropic publique 4.8 / 5.0:

  1. Lee el changelog — los breaking changes están listados.
  2. Corre tu eval suite con el nuevo modelo (skill skill-creator tiene runner).
  3. Actualiza ANTHROPIC_MODEL en .claude/settings.json y todos los pinned IDs en el código.
  4. Vuelve a calibrar effort si pasas de Sonnet a Opus o viceversa.
  5. Verifica costes con count_tokens por el cambio de tokenizer.