Wordle: estrategia óptima + simulador
Hay 11.099 posibles palabras en el Wordle(ES). Cuando escribes una palabra, cada una de sus 5 letras puede colorearse de 3 formas distintas lo que resulta en un total de 243 (3^5) posibles patrones de colores.
Un ejercicio que podemos hacer es montar una tabla: en vertical las 11.099 palabras y en horizontal los 243 patrones de colores. En cada celda ponemos el número de palabras que quedan posibles, es decir, las 11.099 menos aquellas descartadas al introducir la palabra de esa fila y devolvernos la app el patrón de colores de esa columna.
Esta es justo la tabla que he hecho en la hoja "Análisis" del simulador. Con esta tabla podemos sacar la media de número de palabras restantes para cada palabra introducida. Nos interesa que esta media sea lo más baja posible. ROSEA gana, media de 250. Es decir, lo esperable al introducir ROSEA es que nos quedemos con un conjunto de palabras posibles de solo 250. Su distribución según qué patrón de colores salga sería esta.
Cuanto más uniforme sea esa distribución mejor. De hecho, lo ideal sería que fuera una línea recta (horizontal) y que para cualquier patrón de color resultante nos quedasen ~46 palabras (11.099/243). Pero no existe ninguna palabra así.
Esta es la distribución de medias. A la izquierda del todo ROSEA (250) y a la derecha del todo JUJUY (5.579).
Y estas serían las mejores y peores palabras para empezar.
Entonces, ¿la mejor palabra para empezar es ROSEA? Probablemente pero no necesariamente. La mejor palabra o la jugada óptima será aquella que nos lleve a la solución en un menor número de intentos. El juego no termina hasta que hemos descartado 11.098 palabras (todas menos 1). Podemos asegurar que ROSEO es la palabra con la que es esperable que descartemos una mayor cantidad de opciones. Es decir, es aparentemente la que más nos acerca a la meta. Pero esto es solo una heurística. Es posible que otra palabra que nos permita descartar menos opciones en el primer intento tenga más fácil continuación para descartar en el segundo intento. El camino más rápido a la cima de la montaña no tiene por qué ser una línea recta. Un rodeo podría ser la opción óptima.
O dicho de otra forma, las 250 palabras que es esperable que nos queden tras decir ROSEA podrían ser mucho más difíciles de descartar (por ser muy parecidas entre ellas por ejemplo) que las 258 que nos quedan tras decir AIREO. No solo importa el número de opciones restantes, también cuáles son.
Pero el algoritmo exhaustivo analizando secuencias de intentos, es mucho más profundo y me resulta computacionalmente imposible.
En cualquier caso me ha parecido un problema muy chulo y he aprendido a utilizar mejor algunos recursos de googlesheets como el filter o los regex.
Una cosa más. En el simulador también he incluido (en la hoja "Simulador") un pequeño entorno al que puedes ir metiendo la palabra que has puesto en el Wordle y el patrón de colores que ha salido y las fórmulas van aplicando en cascada las restricciones y descartes a las 11.099 palabras originales. Así se puede ir viendo cuántas palabras quedan posibles y cuáles son.