Google testuje możliwość przesyłania filmów do analizy w aplikacji Gemini

Google testuje możliwość przesyłania filmów do analizy w aplikacji Gemini

Użytkownicy aplikacji Gemini mogą już nie tylko przesyłać dokumenty i obrazy, ale również własne pliki wideo. Sztuczna inteligencja od Google potrafi je przeanalizować, streścić lub odpowiedzieć na konkretne pytania dotyczące ich treści, – informuje 9to5Google.

Wideo jako nowy typ danych wejściowych

Nowa funkcja umożliwia użytkownikom załadowanie wideo bezpośrednio do czatu, podobnie jak wcześniej mogli wklejać link do filmu z YouTube. Wideo jest widoczne nad konwersacją i można je ponownie odtworzyć z poziomu aplikacji. Przykładowo, Gemini potrafi wskazać godzinę wyświetlaną na ekranie urządzenia Nest Hub lub opisać jesienny krajobraz leśny na nagraniu.

Jak działa przesyłanie plików

Wideo przesyła się poprzez przycisk „+” z możliwością wyboru pliku z galerii lub menedżera plików. Jeśli funkcja jest aktywna na danym koncie, użytkownik zobaczy opcję wyboru wideo. W przeciwnym razie pliki będą wyszarzone i nie będzie można ich dodać.

Stopniowe wdrażanie i ograniczenia

Możliwość przesyłania filmów nie została jeszcze udostępniona szeroko. Jej dostępność zależy od wersji aplikacji, typu konta oraz urządzenia – funkcja działa zarówno na Androidzie (Google app 16.23 beta), jak i na iOS, w wariantach Gemini 2.5 Flash i 2.5 Pro. Nie jest jeszcze dostępna w wersji przeglądarkowej, gdzie pojawia się komunikat „File type unsupported”. Wbudowana kamera Gemini wciąż nie obsługuje nagrywania wideo.

Avatar
Sep 13, 2024

Samsung planuje redukcję zatrudnienia do 30% w wybranych działach

Samsung Electronics przygotowuje się do zredukowania swojej globalnej siły roboczej nawet o 30% w niektórych działach, jak podają źródła wewnętrzne.
0
Dec 19, 2023

Zalety nowego modelu sztucznej inteligencji Gemini Pro dla developerów

0
Apr 24

OpenAI wprowadza GPT‑4.1 — nową rodzinę modeli zoptymalizowanych pod kątem kodowania i zadań z długim kontekstem

OpenAI udostępniła trzy nowe modele językowe w API: GPT‑4.1, GPT‑4.1 mini oraz GPT‑4.1 nano. Wszystkie obsługują kontekst o długości do 1 miliona tokenów i oferują istotne usprawnienia w zakresie pisania kodu, rozumienia długiego kontekstu oraz przestrzegania instrukcji. Modele nie są dostępne w ChatGPT, ale można je wykorzystać w aplikacjach poprzez interfejs API.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies