Recientemente probé tanto Grok-3 como DeepSeek con lo que parecía una tarea sencilla:
Escribe una historia de 50 palabras usando SOLO palabras que comiencen con la letra "S".
Ambas IA fallaron en sus primeros intentos:
Grok-3: 47 palabras (4 incorrectas)
DeepSeek: 53 palabras (7 incorrectas)
Lo intenté 3 veces más, pero seguían cometiendo errores.
Entonces activé el "modo de pensamiento" y las cosas se pusieron interesantes.
DeepSeek fue súper rápido (12 segundos), pero aún así no lo logró: 49 palabras y 1 incorrecta.
Grok-3, en cambio, se tomó su tiempo (1 min 40 s), pero aquí está lo interesante: empezó a corregir sus propios errores y finalmente lo consiguió con esta historia perfecta:
“_Smart, sophisticated system starts searching. System sifts signals systematically. Signals show significant sequences. Such sequences suggest solutions. Solutions solve situations successfully. System succeeds splendidly. Scientists see system's superior skills. System's success stuns scientists significantly. Scientists study system's structure secretly. System's secrets seem sacred. System stays silent, seeming satisfied, showing strength._”
Conclusión: A veces, la precisión gana a la velocidad. Grok-3 puede ser más lento, pero parece manejar mejor las tareas lingüísticas complejas que requieren seguir reglas estrictas.