En febrero, un conjunto de fotos de cosplay generadas por IA ganó una inmensa popularidad en Internet por su impresionante calidad y representación precisa de los personajes. El creador, Kanyon Industries, recibió una gran atención por su uso de la tecnología de IA en el arte.
Usar un manejo de sombras más natural.
¿Hueles a mar?#carril azur #AzurLane #Carril Azur #cheshire #cheshire #AI #difusiónestable pic.twitter.com/0gFqmCUyhc— Industrias Kanyon (@auditore_k) 15 de febrero de 2023
Las fotos obtuvieron rápidamente millones de visitas en varias plataformas de redes sociales, y algunos espectadores confundieron las imágenes generadas por IA con fotos de la vida real. Además, el administrador de Bilibili inicialmente marcó el trabajo por estar en la categoría de presentación incorrecta, ya que no sabían que las imágenes no eran fotos reales de cosplay.
Captura de pantalla del mensaje de Bilibili del aviso de «categoría de envío incorrecta».
A pesar del entusiasmo en torno al arte generado por IA, existen preocupaciones sobre su impacto en los entusiastas del cosplay tradicional y el potencial de uso no autorizado de imágenes generadas por IA. Para abordar estos problemas, hablamos con Kanyon Industries sobre sus opiniones al respecto.
Kanyon Industries no comenzó a publicar arte generado por IA hasta principios de 2023, pero habían estado atentos a los dibujos de IA desde el lanzamiento de DALL-E 2. Kanyon Industries cree que las tecnologías de IA cambiarían enormemente los flujos de trabajo en muchos aspectos, pero la rápida el desarrollo de la tecnología todavía los sorprendió. En lugar de saltar a la tendencia de inmediato, decidieron observar durante un tiempo. «Lo que ahora me toma mucho tiempo lograr puede volverse fácilmente alcanzable en unos pocos meses», dijo Kanyon Industries. Cuando se lanzó el modelo LoRA, sabían que era el momento adecuado para comenzar a usar el arte generado por IA.
LoRA, uno de los métodos de entrenamiento de modelos de IA, puede corregir fácil y rápidamente detalles como el estilo artístico, los personajes y las acciones.
Para Kanyon Industries, experimentar con «AI Cosplay» no fue solo por diversión, ya que creen que fue un desafío técnico para revelar el potencial del dibujo de IA. Cada personaje objetivo tiene características diferentes, algunas de las cuales ni siquiera existen en la realidad.
Al describir el flujo de trabajo de su arte, dijeron: «Debo entrenar modelos LoRA separados para cada personaje, y el efecto de cada modelo varía según las condiciones de entrenamiento. Básicamente, se requiere ajustar los parámetros desde cero cuando se cambia a un modelo diferente».
Cuando se le preguntó sobre el debate sobre si «la IA reemplazaría a los humanos», Kanyon Industries explicó que no es su preocupación y afirmó: «La IA no reemplazará a nadie, solo los humanos pueden reemplazar a los humanos». En su mente, compararían el dibujo con IA como una “forma avanzada de Photoshop”, una herramienta útil que mejorará significativamente los flujos de trabajo de los artistas en el futuro, y no mucho más.
Citando un estudio de Harvard Business Review que encuestó a más de 1000 empresas en 12 industrias, Kanyon Industries refuerza su creencia de que una mejor colaboración entre humanos y la inteligencia artificial conduce a mayores mejoras en el rendimiento.
El gráfico de la investigación de HBR muestra que un mayor número de colaboraciones da como resultado una mejor mejora del rendimiento.
Kanyon Industries reconoce que, en ese momento, existen límites a lo que se podría lograr con el arte generado por IA. Cada una de sus obras estaba compuesta por casi cien imágenes, y algunas todavía sufrían de imperfecciones como el problema del «dedo malo».
Según Kanyon Industries, hay tres áreas críticas en las que la tecnología de dibujo de IA debe mejorar: el rendimiento fundamental, la operatividad y la eficacia del entrenamiento del modelo de IA.
Explican que el rendimiento fundamental depende del desarrollo del algoritmo, que es el principio subyacente de las imágenes generadas por IA. Un algoritmo más eficiente y eficaz puede mejorar significativamente la calidad y la productividad de los resultados.
La operabilidad se refiere a la capacidad de controlar completamente la IA y dirigirla en la dirección correcta, de forma similar a cómo un volante controla un automóvil. Sin una buena operatividad, el arte generado por IA solo puede producir imágenes aleatorias y no puede integrarse en procesos industriales. Se han desarrollado varios métodos de control, incluidos el reconocimiento de huesos, la detección de bordes y la detección de profundidad, basados en ControlNet.
Una imagen de ejemplo muestra la operabilidad potencial de ControlNet
Los modelos de entrenamiento utilizan principalmente el complemento Seg para vincular la semántica a los valores de color y construir directamente composiciones en la imagen para especificar diferentes elementos en diferentes áreas.
Una imagen de ejemplo compartida por Kanyon Industries sobre cómo el complemento Seg ayudó en el dibujo de IA.
Kanyon Industries confiaba en su postura sobre las controversias que rodean a la IA en cuestiones legales, éticas y de derechos de autor. Creían firmemente que la IA es solo una herramienta y que la responsabilidad de su uso debería recaer en los humanos detrás de ella. Reconocieron que los países cuentan con regulaciones integrales para varios delitos, como la infracción de los derechos de imagen en China cuando se usa IA para reemplazar rostros, que está cubierto en las «Regulaciones de gestión para la síntesis profunda de los servicios de información de Internet» emitidas por el gobierno chino. en 2022.
De cara al futuro, Kanyon Industries ve un futuro brillante con la IA. Imaginan que la tecnología se utilizará ampliamente en la industria de las novelas para brindar experiencias de lectura visualmente sorprendentes con ilustraciones baratas y de alta calidad. Además, creen que la IA puede optimizar los flujos de trabajo en la industria de la animación y el cómic al ayudar a realizar bocetos y ediciones originales. Además, la IA puede ayudar en la producción de diversos activos artísticos y el modelado automático en la industria de los juegos y el cine, lo que permite una producción eficiente y rentable. Esto acelerará el desarrollo de juegos y películas, lo que dará lugar a más productos culturales y de entretenimiento que enriquecerán la vida de las personas.
Kanyon Industries espera que la IA mejore la creatividad humana, lo que dará como resultado más productos culturales de alta calidad y permitirá que las personas se concentren en sus intereses personales y en su creatividad.