IA Generativa para resolver un sudoku. La IA alucina con la imagen
Como aclaración al título, cuando se dice que una IA alucina significa que ha dado un resultado equivocado y aleatorio al ojo humano.
La IA Generativa resolviendo un sudoku
Decidí hacer el encargo a Copilot, de Microsoft, y le pedí completar el sudoku adjuntando la imagen que puedes ver.
En la siguiente seuencia se puede ver el resultado. Solo la primera fila es correcta, a partir de la segunda fila cambia incluso los números que ya están dados:
Como se puede apreciar, Copilot no sabe resolver sudokus. Por cierto, puede ver que la respuesta no es la misma a la primera, y además el formato de respuesta es diferente.
Cambio a Google, le pregunté lo mismo a Gemini:
Nuevamente como puede observarse, se ha equivocado, ha cambiado de lugar números que estaban ya marcados.
Ahora es el turno de ChatGPT. La siguiente imagen ilustra el inicio de la petición, y después el resultado. Entremedias hay un montón de texto y explicciones que me han ayudado a entender por qué también falla:
Error en la interpretación de la imagen
ChatGPT antes de entregar el resultado explicó lo que hacía, y pude descubrir que había interpretado mal las posiciones de los números, y a partir de ahí, alucinó e hizo las correcciones que consideró necesarias.
Así que hice yo mismo la imagen en texto y la entregué a todos de la siguiente forma:
5,9,8,4,2,3,7,6,1
4,x,x,9,x,7,2,5,8
x,7,x,x,5,x,4,9,3
1,2,5,7,3,4,x,8,x
3,8,6,2,9,5,1,4,7
9,4,7,6,8,1,5,3,2
x,1,x,x,x,9,x,7,x
x,5,4,x,7,2,x,1,x
7,x,9,x,x,x,x,2,x
En el siguiente gráfico pueden verse las diferentes respuestas, y el hecho de que todas son diferentes:
Si echa un vistazo a las imágenes, ChatGPT no lo ha conseguido, aunque dice que sí, pero se rindió, puedes ver una x en la última fila. Curiosamente Microsoft Copilot usa la tecnología de ChatGPT y dan resultados diferentes.
En el caso de Google Gemini, ha cometido un error, o mejor dicho, cambió los números fuente, no todos, pero hay cambios. Microsoft Copilot ha estado a punto de resolverlo, pero en el último cuadrante, abajo a la derecha, no añadió el número 8, y en vez de esto se dio por satisfecho usando dos número 6, lo que provoca que en la última fila haya dos número 6.
He incluido en la última ronda a Perplexity, hay momentos en que este motor hace buenas redacciones y comprende mejor los prompt en español. Me ha gustado la forma de presentación del resultado, porque a diferencia de todos los demás, lo ha hecho en el mismo formato que le he dado. Pero tampoco lo ha conseguido. Creo que es quien más cerca ha estado, pero en la penúltima fila hay dos número 1, evidentemente dos número 1 en el último cuadrante, y dos número 4 en el penúltimo cuadrante (3,2).
Todavía no es inteligente
Pronto lo conseguirá. Quizá el ejercicio que les he dado les ayude a futuro, si bien no le he dado información al respecto del resultado, es decir no le he dicho que está mal. La forma de resolución es bastante similar, y muy lineal. No ha levantado datos a espacios de memoria para analizar posteriormente, han ido resolviendo de forma lineal, por esta razón todos los que se equivocan lo hacen en la penúltima o la última fila.
Le puede interesar, publicado el 15 de julio de 2024, como continuación a este post:
La Inteligencia Artificial me miente y además suma mal
Comentarios
Publicar un comentario