La generación de imágenes AI de Baidu es una máquina de memes literal

En los últimos días, el chatbot/generador de imágenes con IA de Baidu, ERNIE Bot (o Wenxin Yiyan en chino), ha producido numerosas imágenes hilarantes y defectuosas. La mayoría de los errores estaban relacionados con modismos chinos y nombres de platos, que en algunos escenarios incluyen nombres de animales pero no necesariamente se refieren a animales reales.

Mientras tanto, los usuarios han descubierto que algunas de las extrañas imágenes generadas son el resultado de la traducción automática. Específicamente, los usuarios creen que se debe al proceso de Baidu de traducir indicaciones del chino al inglés antes de generar imágenes en lugar de generar imágenes directamente a partir de las indicaciones en chino.

"Autobús" y "ratón" resultó en la generación de imágenes inexactas en ERNIE Bot«Autobús» y «ratón» dieron como resultado la generación de imágenes inexactas en ERNIE Bot

En primer lugar, existe una imagen ampliamente difundida asociada al término «bus», que en el ámbito de la informática se refiere a una estructura interna que actúa como un canal compartido para la transmisión de información.

Este término comparte su nombre con una clase de vehículo en inglés. No obstante, en chino, estos dos significados se expresan con dos palabras separadas. Como resultado, cuando el término informático chino se utiliza como aviso en ERNIE Bot, genera una imagen del vehículo.

Cuando se usa el término chino para «ratón de computadora» en el mensaje, ERNIE Bot genera una imagen de un ratón, el animal, de manera similar.

ERNIE Bot separó los caracteres para "viejo"“señora” y "pastel" al referirse a la pastelería Lao Po Bing.ERNIE Bot separó los caracteres de «viejo», «dama» y «pastel» al referirse al pastel Lao Po Bing.

Posteriormente, los usuarios en línea descubrieron que la IA de Baidu dibujó una serie de nombres de platos de manera muy imprecisa.

Lao Po Bing es un tipo de pastelería china. Lao Po significa esposa, pero por separado los dos caracteres significan «anciana» en chino. A partir de los resultados, es evidente que ERNIE Bot separó literalmente a Lao Po y mostró los resultados de una anciana y un pastel.

Al traducir un plato de albóndigas de cerdo, ERNIE Bot generó una imagen engañosa de una cabeza de león roja y llameante.Al traducir un plato de albóndigas de cerdo, ERNIE Bot generó una imagen engañosa de una cabeza de león roja y llameante.

Hong Shao Shi Zi Tou es un plato chino clásico que consiste en grandes albóndigas de cerdo estofadas en una salsa junto con verduras. Aunque Shi Zi Tou se traduce como «cabeza de león», el nombre en realidad se refiere a la forma redonda de las albóndigas en lugar de a las partes reales del león. Sin embargo, ERNIE Bot cometió el error de traducir el nombre literalmente, lo que resultó en una imagen engañosa de una cabeza de león roja y llameante.

La interpretación de ERNIE Bot de San Bei Ji es literal y muestra tres híbridos de taza de pollo.La interpretación de ERNIE Bot de San Bei Ji es literal y muestra tres híbridos de taza de pollo.

El plato San Bei Ji, que se traduce como «tres tazas de pollo», generalmente consiste en salsa de soya, aceite de sésamo y vino de arroz. Sin embargo, la interpretación de ERNIE Bot es bastante literal y muestra tres híbridos de taza de pollo.

La interpretación de imágenes de ERNIE Bot para el "año del mono, mes del caballo."La interpretación de la imagen de ERNIE Bot para el «año del mono, mes del caballo».

Hou Nian Ma Yue es un modismo chino que literalmente significa «año del mono, mes del caballo». Se usa para describir un tiempo incierto o impredecible en el futuro, similar al modismo inglés «alguna vez en el nunca jamás».

La frase proviene del zodíaco chino, donde cada año y mes se asocia con un animal. Sin embargo, la respuesta de ERNIE Bot parece incluir la interpretación literal de un mono, un caballo y la luna como elementos individuales.

ERNIE Bot ha representado un teléfono inteligente y una manzana por separado para representar el iPhone.ERNIE Bot ha representado un teléfono inteligente y una manzana por separado para representar el iPhone.

El iPhone, que es una línea de teléfonos inteligentes creada por Apple Inc., es otro ejemplo de una mala interpretación por parte de la IA.

El último desarrollo de Baidu, tras el éxito de Chat GPT, ha dado lugar a una acalorada discusión entre los usuarios y fanáticos sobre estas imágenes «fuera de tema», y algunos expresaron una total falta de preocupación por perder su trabajo a manos de la IA.

El 23 de marzo, Baidu emitió un comunicado en respuesta a los comentarios sobre la función de texto a imagen de ERNIE Bot. Aclararon que las capacidades de su herramienta provienen del modelo de texto a imagen de desarrollo propio ERNIE-ViLG.

La declaración enfatizó que ERNIE Bot aún se encuentra en la fase de desarrollo. «ERNIE Bot está aprendiendo y creciendo constantemente a medida que todos lo usan. Tenga confianza y dedique algo de tiempo a nuestra tecnología y productos de desarrollo propio. No difunda rumores, y esperamos que ERNIE Bot pueda brindar más alegría a todos».