eugenegp: (Default)
[personal profile] eugenegp
Ну что, дорогие журналисты и факт-чекеры, приехали, куда ехали. Микрософт выпустил VASA-1, которая создает говорящую голову по 1 (одной) фотографии, в т.ч. несуществующего лица, и 1 (одной) записи голоса. 57 языков. "на компьютере с одним GPU NVIDIA RTX 4090 генерирует видео размером 512x512 со скоростью 45 кадров в секунду в пакетном режиме и до 40 кадров в секунду в режиме онлайн-потока с задержкой всего 170 мс".
"He said, she said..."


https://www.microsoft.com/en-us/research/project/vasa-1/
Page generated Apr. 12th, 2026 07:00 pm
Powered by Dreamwidth Studios