Grok 4 de xAI: El Modelo Multimodal que Supera a Gemini y ChatGPT

Published:

Elon Musk y su compañía xAI han lanzado Grok 4, un modelo de inteligencia artificial multimodal que, según sus pruebas, supera a Google Gemini 2.5 Pro y OpenAI o3-high en rendimiento académico, razonamiento lógico y resolución de problemas STEM. Además, presenta una versión avanzada: Grok 4 Heavy, con capacidades multiagente.


🚀 Rendimiento en Benchmarks Clave

📊 Evaluaciones Académicas y de Razonamiento

Benchmark Grok 4 Grok 4 Heavy Competencia (Mejor Resultado)
Humanity’s Last Exam (HLE) 25.4% 44.4% Gemini 2.5 Pro (26.9%)
ARC-AGI-2 16.2% Claude Opus 4 (~8%)
MMLU (Índice Inteligencia) 86.6% OpenAI o3-high (84%)

🔬 STEM y Programación

Benchmark Grok 4 Grok 4 Heavy
GPQA 87.5% 88.9%
AIME 98.8% 100%
SWE-Bench (Grok 4 Code, agosto 2025) 72-75%

*»Grok 4 ya no comete errores en exámenes de matemáticas/física, a menos que las preguntas sean deliberadamente engañosas»* — Elon Musk (@elonmusk).


💡 ¿Qué Hace a Grok 4 Diferente?

✅ Multimodalidad avanzada: Procesa texto, imágenes y datos estructurados.
✅ Herramientas multiagente (Grok 4 Heavy): Mayor capacidad de análisis en paralelo.
✅ Detección de ambigüedades: Identifica errores en preguntas y ofrece respuestas alternativas.


💰 Precios y Planes de Suscripción

Para Desarrolladores (API)

  • $3 por millón de tokens de entrada.

  • $15 por millón de tokens de salida.

  • $0.75 por millón de tokens en caché.

Para Consumidores

Plan Precio Acceso
Gratis $0/mes Grok 3 (limitado)
SuperGrok $30/mes Grok 4 + Grok 3
SuperGrok Heavy $300/mes Grok 4 Heavy + Grok 4 + Grok 3

🔍 ¿Cómo se Compara con la Competencia?

  • vs. Gemini 2.5 Pro: Grok 4 lidera en HLE (44.4% vs 26.9%) y ARC-AGI-2 (16.2% vs ~8%).

  • vs. OpenAI o3-high: Mejor índice de inteligencia (73 vs 70).

  • Claude Opus 4: Queda rezagado en razonamiento lógico.


📅 Próximos Lanzamientos

  • Grok 4 Code: Especializado en programación (agosto 2025).

  • Integración con X (Twitter): Respuestas en tiempo real con contexto de publicaciones.


💬 ¿Probarás Grok 4? ¡Comenta si crees que supera a ChatGPT y Gemini!

🔗 Más información:

- Advertisement -
Jorge
Jorgehttps://nksistemas.com
Soy Jorge, Sr Sysadmin Linux/DevOps/SRE y creador de NKSistemas.com Trabajo con plataformas: Linux, Windows, AWS, GCP, VMware, Helm, kubernetes, Docker, etc.

Related articles