*24-04-18* Hoy Microsoft ha anunciado VASA, un modelo de IA experimental desarrollado por nuestro departamento de investigación que sirve para generar videos realistas a partir de una sola imagen y un audio. VASA-1, es capaz no sólo de producir movimientos labiales sincronizados con el audio, sino también de capturar matices faciales y movimientos naturales de la cabeza. Nuestra investigación se centra en generar capacidades visuales que den realismo a avatares virtuales de IA, con el objetivo de aplicarlo a escenarios que ayuden a las personas. Sin embargo, al igual que otras técnicas de generación de vídeo, esta también podría ser utilizada potencialmente para hacerse pasar por humanos. Por eso, aplicamos técnicas para la detección de deepfakes. Estos vídeos generados por este método contienen elementos identificables para anticipar su veracidad. Aun reconociendo la posibilidad de un uso indebido, es imperativo reconocer el considerable potencial positivo que puede tener. Los beneficios -como aumentar la equidad educativa, mejorar la accesibilidad de las personas con problemas de comunicación, ofrecer compañía o apoyo terapéutico a quienes lo necesitan, entre muchos otros- subrayan la importancia de esta investigación y de otras líneas que se están desarrollando. Solo concebimos la 𝗜𝗔 𝗱𝗲 𝗳𝗼𝗿𝗺𝗮 𝗿𝗲𝘀𝗽𝗼𝗻𝘀𝗮𝗯𝗹𝗲, que tenga como objetivo mejorar el bienestar humano y no tenemos previsto lanzar ninguna demostración en línea, API, producto, ni detalles adicionales de implementación hasta que estemos seguros de que la tecnología se utilizará de forma responsable y de acuerdo con la normativa vigente. <iframe width="600" height="350" src="https://www.youtube.com/embed/OO0jP-_09Yc" title="VASA" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe> #IAResponsable #IAGenerativa