Elon Musk y su compañía xAI han lanzado Grok 4, un modelo de inteligencia artificial multimodal que, según sus pruebas, supera a Google Gemini 2.5 Pro y OpenAI o3-high en rendimiento académico, razonamiento lógico y resolución de problemas STEM. Además, presenta una versión avanzada: Grok 4 Heavy, con capacidades multiagente.
🚀 Rendimiento en Benchmarks Clave
📊 Evaluaciones Académicas y de Razonamiento
| Benchmark | Grok 4 | Grok 4 Heavy | Competencia (Mejor Resultado) |
|---|---|---|---|
| Humanity’s Last Exam (HLE) | 25.4% | 44.4% | Gemini 2.5 Pro (26.9%) |
| ARC-AGI-2 | 16.2% | – | Claude Opus 4 (~8%) |
| MMLU (Índice Inteligencia) | 86.6% | – | OpenAI o3-high (84%) |
🔬 STEM y Programación
| Benchmark | Grok 4 | Grok 4 Heavy |
|---|---|---|
| GPQA | 87.5% | 88.9% |
| AIME | 98.8% | 100% |
| SWE-Bench (Grok 4 Code, agosto 2025) | – | 72-75% |
*»Grok 4 ya no comete errores en exámenes de matemáticas/física, a menos que las preguntas sean deliberadamente engañosas»* — Elon Musk (@elonmusk).
💡 ¿Qué Hace a Grok 4 Diferente?
✅ Multimodalidad avanzada: Procesa texto, imágenes y datos estructurados.
✅ Herramientas multiagente (Grok 4 Heavy): Mayor capacidad de análisis en paralelo.
✅ Detección de ambigüedades: Identifica errores en preguntas y ofrece respuestas alternativas.
💰 Precios y Planes de Suscripción
Para Desarrolladores (API)
-
$3 por millón de tokens de entrada.
-
$15 por millón de tokens de salida.
-
$0.75 por millón de tokens en caché.
Para Consumidores
| Plan | Precio | Acceso |
|---|---|---|
| Gratis | $0/mes | Grok 3 (limitado) |
| SuperGrok | $30/mes | Grok 4 + Grok 3 |
| SuperGrok Heavy | $300/mes | Grok 4 Heavy + Grok 4 + Grok 3 |
🔍 ¿Cómo se Compara con la Competencia?
-
vs. Gemini 2.5 Pro: Grok 4 lidera en HLE (44.4% vs 26.9%) y ARC-AGI-2 (16.2% vs ~8%).
-
vs. OpenAI o3-high: Mejor índice de inteligencia (73 vs 70).
-
Claude Opus 4: Queda rezagado en razonamiento lógico.
📅 Próximos Lanzamientos
-
Grok 4 Code: Especializado en programación (agosto 2025).
-
Integración con X (Twitter): Respuestas en tiempo real con contexto de publicaciones.
💬 ¿Probarás Grok 4? ¡Comenta si crees que supera a ChatGPT y Gemini!
🔗 Más información:






