eugenegp: (Default)
[personal profile] eugenegp
Ну что, дорогие журналисты и факт-чекеры, приехали, куда ехали. Микрософт выпустил VASA-1, которая создает говорящую голову по 1 (одной) фотографии, в т.ч. несуществующего лица, и 1 (одной) записи голоса. 57 языков. "на компьютере с одним GPU NVIDIA RTX 4090 генерирует видео размером 512x512 со скоростью 45 кадров в секунду в пакетном режиме и до 40 кадров в секунду в режиме онлайн-потока с задержкой всего 170 мс".
"He said, she said..."


https://www.microsoft.com/en-us/research/project/vasa-1/
Page generated Dec. 28th, 2025 01:08 am
Powered by Dreamwidth Studios