Nowości

Nvidia twierdzi, że jej sztuczna inteligencja może rozwiązać niektóre z największych problemów w rozmowach wideo

Nvidia ogłosiła nową platformę wideokonferencyjną dla programistów o nazwie Nvidia Maxine, która, jak twierdzi, może rozwiązać niektóre z najczęstszych problemów w rozmowach wideo.

Maxine będzie przetwarzać połączenia w chmurze za pomocą procesorów graficznych Nvidii i podnosić jakość połączeń na wiele sposobów za pomocą sztucznej inteligencji. Korzystając ze sztucznej inteligencji, Maxine może wyrównać twarze i spojrzenia rozmówców, tak aby zawsze patrzyli bezpośrednio na kamerę, zmniejszyć wymaganą przepustowość połączeń nawet o 90 procent, przesyłając tylko „kluczowe punkty twarzy”, a także zwiększyć rozdzielczość filmów. Inne funkcje dostępne w Maxine to ponowne oświetlenie twarzy, tłumaczenie i transkrypcja w czasie rzeczywistym oraz animowane awatary.

Oczywiście nie wszystkie te funkcje są nowe. Kompresja wideo i transkrypcja w czasie rzeczywistym są dość powszechne, a Microsoft i Apple wprowadziły wyrównywanie spojrzeń w Surface Pro X i FaceTime, aby zapewnić ludziom kontakt wzrokowy podczas rozmów wideo (chociaż funkcje wyrównania twarzy Nvidii wyglądają na znacznie bardziej ekstremalną wersję tego).

Jednak Nvidia bez wątpienia ma nadzieję, że jej wpływ na przetwarzanie w chmurze i imponujące prace badawczo-rozwojowe w zakresie sztucznej inteligencji pomogą jej wznieść się ponad konkurentów. Prawdziwym testem będzie jednak sprawdzenie, czy jakiekolwiek znane firmy zajmujące się wideokonferencjami faktycznie stosują technologię Nvidii. Maxine nie jest platformą konsumencką, ale zestawem narzędzi dla firm zewnętrznych do ulepszania ich własnego oprogramowania. Jak dotąd Nvidia nie ogłosiła żadnych partnerów, którzy będą używać Maxine w przyszłości, chociaż twierdzi, że jest to „w dyskusjach” z wieloma z nich. Jak pokazano na poniższym obrazku, wszyscy główni dostawcy usług w chmurze oferują Maxine w ramach usług chmurowych Nvidia GPU.

Funkcje oparte na sztucznej inteligencji dostępne dla Nvidia Maxine obejmują kompresję AI, wyrównanie twarzy i super rozdzielczość
: Nvidia

Podczas telekonferencji z reporterami, dyrektor generalny Nvidii ds. Mediów i rozrywki Richard Kerris opisał Maxine jako „naprawdę ekscytujące i bardzo aktualne ogłoszenie” i podkreślił jej kompresję wideo opartą na sztucznej inteligencji jako szczególnie przydatną funkcję.

„Wszyscy doświadczyliśmy czasów, w których przepustowość była ograniczeniem w naszych konferencjach, które obecnie prowadzimy na co dzień” – powiedział Kerris. „Jeśli zastosujemy sztuczną inteligencję do tego problemu, możemy zrekonstruować różne sceny na obu końcach i przesyłać tylko to, co jest potrzebne, a tym samym znacznie zmniejszyć przepustowość”.

Nvidia twierdzi, że jej funkcja kompresji wykorzystuje metodę sztucznej inteligencji znaną jako generatywne sieci przeciwnika lub GAN do częściowej rekonstrukcji twarzy dzwoniących w chmurze. Jest to ta sama technika, której używa się w wielu deepfake’ach. „Zamiast przesyłać strumieniowo cały ekran pikseli, oprogramowanie sztucznej inteligencji analizuje kluczowe punkty twarzy każdej osoby podczas rozmowy, a następnie inteligentnie ponownie ożywia twarz w filmie po drugiej stronie” – powiedziała firma w poście na blogu. „Dzięki temu możliwe jest przesyłanie strumieniowe wideo przy znacznie mniejszej ilości danych przesyłanych tam i z powrotem przez internet”.

Jak zawsze w przypadku tych wczesnych ogłoszeń, będziemy musieli zobaczyć więcej tej technologii w akcji i poczekać na jakiekolwiek umowy partnerskie zawarte przez Nvidię, zanim dowiemy się, jaki wpływ będzie to miało na codzienne rozmowy wideo. Ale zapowiedź Nvidii pokazuje, że przyszłość wideokonferencji będzie bardziej sztuczna niż kiedykolwiek wcześniej, a sztuczna inteligencja będzie używana do prostowania oczu, a nawet rekonstrukcji twarzy, wszystko w imię oszczędzania przepustowości.

Zostaw komentarz

Maciek Luboński
Z wykształcenia jestem kucharzem , ale to nie przeszkadza mi pisać dla Was tekstów z wielu ciekawych dziedzin , których sam jestem fanem.Piszę dużo i często nie na tak jak trzeba , ale co z tego skoro tak naprawdę liczy się pasja.

Najlepsze recenzje

Video

gallery

Facebook