Hace solo unas décadas las computadoras no eran capaces de leer un texto escrito y hoy son capaces no solo de eso sí no de generarlo y en cualquier idioma, para además leerlo y ofrecer una opinión generativa de lo leído. Les voy a escribir sobre lo que leí en la página oficial de OpenAI y su inquietante conclusión al final sobre Sora, la inteligencia artificial que promete crear videos a partir de texto y de forma consistente. OpenAI, la empresa detrás del chatbot mas conocido del planeta y posiblemente el más eficaz ahora sorprende con el anuncio de su inteligencia artificial para la creación de video a partir de texto. En su web afirman que están entrenando o enseñando a Sora a qué comprenda el mundo físico en movimiento y con esto lograr que lo pueda interpretar de forma que pueda interactuar con el mundo real. Sora es un modelo de inteligencia artificial de texto a vídeo que puede generar hasta 1 minuto de video manteniendo calidad y la consistencia en las indicaciones del usuario. A fecha de publicación de este post Sora se encuentra disponible solo para miembros del equipo rojo, algunos artistas, cineastas y diseñadores que se mantienen probando y aportando sus conocimientos para mejorar y cubrir las áreas críticas de ética y seguridad. Dentro de las capacidades más destacables de Sora ya podemos ver qué han logrado generar escenas complejas dónde hay mucho movimiento y elementos en acción mantenimiento una consistencia visual nunca antes vistas en otros modelos de inteligencia artificial. Una cámara sigue detrás de un SUV vintage blanco con un portaequipajes … Una cámara de drones gira alrededor de una hermosa iglesia… Estos dos ejemplos son increíbles, aquí podemos ver la potencia de esta herramienta y como en cualquier momento va revolucionar la forma de crear contenido visual. Este modelo tiene un profundo conocimiento del lenguaje y puede generar múltiples tomas dentro de un mismo video de forma persistente precisa y mostrando personajes con estilo visual acordé. Según algunos vídeos complejos podemos notar errores y algunas incoherencias principalmente si se le piden cosas con muchos detalles podría perder la forma o no mantenerla. En la página de OpenAI comentan que puede tener problemas en algunos casos de causa y efecto como si un personaje muerde un helado luego no se pueda ver el mordisco del helado. También puede fallar en peticiones dónde se requiere mantener una escena por largo tiempo como una vista de drones por un recorrido en ciudad con muchos edificios, movimientos, tránsito, vehículos, personas y en una cámara específica. También puede crear movimientos inverosímiles en los personajes. El equipo rojo mencionado por OpenAI es un grupo de expertos en áreas variadas que van desde ciberseguridad hasta expertos en desinformación y prejuicios para detectar y regular el contenido de odio y fake news. La cámara mira directamente a los coloridos edificios de Burano. Italia.. https://cdn.openai.com/sora/videos/italian-pup.mp4 Sora es de los avances de OpenIA que fusiona Chatgpt y Dall-E y de forma similar a la forma en que usan los tokens y el recaptioning, Sora puede seguir más fielmente el texto del usuario en el vídeo generado. También podemos utilizar una imagen fija para que a partir de esa inspiración Sora nos cree un vídeo. Sora está aprendiendo y actualmente está comprendiendo el mundo real y creando videos a partir de texto y nos muestra un vistazo de lo que está por llegar a a las manos de los creadores digitales. Mi conclusión final es que algo similar a lo que ocurrió con la presentación de ChatGPT y de repetirse su éxito las consecuencias en la industria de los audiovisuales y la creación de contenido digital las cosas cambiaran de forma radical, del otro lado de la moneda la seguridad para determinar que video es real de cual es artificial cada vez será mas difícil y abre las puertas también a los engaños y manipulaciones por lo que también representa un reto en materia de seguridad. Y en palabras finales y muy atrevidas de parte de OpenAI en su web se despiden diciendo que: “Este puede ser un gran hito para lograr la AGI” |
Archivos
Septiembre 2024
Categorías
Todo
|