Google testuje możliwość przesyłania filmów do analizy w aplikacji Gemini

Google testuje możliwość przesyłania filmów do analizy w aplikacji Gemini

Użytkownicy aplikacji Gemini mogą już nie tylko przesyłać dokumenty i obrazy, ale również własne pliki wideo. Sztuczna inteligencja od Google potrafi je przeanalizować, streścić lub odpowiedzieć na konkretne pytania dotyczące ich treści, – informuje 9to5Google.

Wideo jako nowy typ danych wejściowych

Nowa funkcja umożliwia użytkownikom załadowanie wideo bezpośrednio do czatu, podobnie jak wcześniej mogli wklejać link do filmu z YouTube. Wideo jest widoczne nad konwersacją i można je ponownie odtworzyć z poziomu aplikacji. Przykładowo, Gemini potrafi wskazać godzinę wyświetlaną na ekranie urządzenia Nest Hub lub opisać jesienny krajobraz leśny na nagraniu.

Jak działa przesyłanie plików

Wideo przesyła się poprzez przycisk „+” z możliwością wyboru pliku z galerii lub menedżera plików. Jeśli funkcja jest aktywna na danym koncie, użytkownik zobaczy opcję wyboru wideo. W przeciwnym razie pliki będą wyszarzone i nie będzie można ich dodać.

Stopniowe wdrażanie i ograniczenia

Możliwość przesyłania filmów nie została jeszcze udostępniona szeroko. Jej dostępność zależy od wersji aplikacji, typu konta oraz urządzenia – funkcja działa zarówno na Androidzie (Google app 16.23 beta), jak i na iOS, w wariantach Gemini 2.5 Flash i 2.5 Pro. Nie jest jeszcze dostępna w wersji przeglądarkowej, gdzie pojawia się komunikat „File type unsupported”. Wbudowana kamera Gemini wciąż nie obsługuje nagrywania wideo.

Avatar
May 23

Nowy Claude może donieść na ciebie na policję

Niedawno pojawił się Claude 4, a w systemowej mapie modeli entuzjaści odkryli funkcję, która prawdopodobnie umożliwia modelowi powiadamianie odpowiednich służb, jeśli ktoś próbuje wygenerować coś nielegalnego.
0
Aug 9, 2023

ChatGPT odpowiada poprawnie tylko na 48% pytań programistycznych

W badaniu zadali ChatGPT 517 pytań dot. Stack Overflow.
0
Jun 11

OpenAI udostępnia model o3-pro – nowy standard w zadaniach wymagających precyzyjnego rozumowania

OpenAI wprowadziła do użytku o3-pro – najbardziej zaawansowany model AI w swojej ofercie. Został on zaprojektowany jako rozszerzona wersja modelu o3, specjalizującego się w rozwiązywaniu problemów wymagających logicznego myślenia. Model o3-pro dostępny jest już dla użytkowników ChatGPT Pro i Team, a także poprzez API.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies