Fugatto - wielozadaniowe narzędzie AI do pracy z dźwiękiem od NVIDIA

Światowy potentat w produkcji procesorów graficznych i innych układów scalonych, amerykańska korporacja NVIDIA, zaprezentowała swoje narzędzie do obróbki audio oparte o technologię AI.
Fugatto ma być “szwajcarskim scyzorykiem do dźwięku”, jak określa sam producent. Obsługa narzędzia opiera się o komendy słowne. Zatem wystarczy napisać “z prośbą”, by Fugatto zmieniło jeden dźwięk w drugi lub wyseparowało konkretną partię instrumentalną z miksu, a ono już to zrobi. Jak podkreśla NVIDIA, to dopiero pierwszy krok w rozwoju tej technologii.
Fugatto to bazowy model transformatora generatywnego, który opiera się na wcześniejszej pracy zespołu NVIDIA w takich obszarach, jak modelowanie mowy, kodowanie dźwięku i rozumienie dźwięku.
Pełna wersja wykorzystuje 2,5 miliarda parametrów i została wytrenowana na banku systemów NVIDIA DGX pakujących 32 procesory graficzne NVIDIA H100 Tensor Core” - podaje producent. Wszystko wskazuje, że to dopiero początek rozpychania się AI w branży audio…