Google testuje możliwość przesyłania filmów do analizy w aplikacji Gemini

Google testuje możliwość przesyłania filmów do analizy w aplikacji Gemini

Użytkownicy aplikacji Gemini mogą już nie tylko przesyłać dokumenty i obrazy, ale również własne pliki wideo. Sztuczna inteligencja od Google potrafi je przeanalizować, streścić lub odpowiedzieć na konkretne pytania dotyczące ich treści, – informuje 9to5Google.

Wideo jako nowy typ danych wejściowych

Nowa funkcja umożliwia użytkownikom załadowanie wideo bezpośrednio do czatu, podobnie jak wcześniej mogli wklejać link do filmu z YouTube. Wideo jest widoczne nad konwersacją i można je ponownie odtworzyć z poziomu aplikacji. Przykładowo, Gemini potrafi wskazać godzinę wyświetlaną na ekranie urządzenia Nest Hub lub opisać jesienny krajobraz leśny na nagraniu.

Jak działa przesyłanie plików

Wideo przesyła się poprzez przycisk „+” z możliwością wyboru pliku z galerii lub menedżera plików. Jeśli funkcja jest aktywna na danym koncie, użytkownik zobaczy opcję wyboru wideo. W przeciwnym razie pliki będą wyszarzone i nie będzie można ich dodać.

Stopniowe wdrażanie i ograniczenia

Możliwość przesyłania filmów nie została jeszcze udostępniona szeroko. Jej dostępność zależy od wersji aplikacji, typu konta oraz urządzenia – funkcja działa zarówno na Androidzie (Google app 16.23 beta), jak i na iOS, w wariantach Gemini 2.5 Flash i 2.5 Pro. Nie jest jeszcze dostępna w wersji przeglądarkowej, gdzie pojawia się komunikat „File type unsupported”. Wbudowana kamera Gemini wciąż nie obsługuje nagrywania wideo.

Avatar
Paz 14, 2022

Intel planuje zwolnić tysiące pracowników

Już w tym miesiącu tysiące ludzi w całej firmie mogą zostać bez pracy. Bloomberg podaje, że zwolnienie uderzy szczególnie mocno w działy sprzedaży i marketingu, a to około 20% pracowników. Jeszcze w lipcu firma liczyła 113,700 pracowników.
0
Lip 14

Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Firma xAI zaprezentowała dwa nowe modele — Grok 4 oraz Grok 4 Heavy — zaledwie dzień po tym, jak chatbot Grok wygenerował na platformie X odpowiedzi zawierające antysemickie odniesienia. Według xAI wersja Heavy korzysta z architektury multi-agentowej, w której wiele instancji modelu analizuje zapytanie równolegle, a następnie porównuje wyniki przed udzieleniem odpowiedzi. To podejście, określane jako test-time compute scaling, zwiększa wykorzystanie mocy obliczeniowej podczas wnioskowania.
0
Maj 2, 2023

76% pracowników branży gamingowej rozważa poszukiwanie nowej pracy w 2023 roku

W tym roku SkillSearch przeprowadziło 9. doroczne Badanie Wynagrodzeń i Satysfakcji, skierowane do pracowników branży gier komputerowych.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies