Pod koniec corocznej konferencji programistów Google I/O w Shoreline Amphitheatre w Mountain View dyrektor generalny Google, Sundar Pichai, ujawnił, że firma powiedziała „AI” 121 razy. To było w zasadzie sednem dwugodzinnego przemówienia Google – wprowadzenie sztucznej inteligencji do każdej aplikacji i usługi Google, z której korzystają ponad dwa miliardy ludzi na całym świecie. Oto wszystkie najważniejsze aktualizacje ogłoszone przez Google podczas wydarzenia.
Aktualizacje dla Gemini 1.5 Flash i Gemini 1.5 Pro
Google ogłosiło zupełnie nowy model sztucznej inteligencji o nazwie Gemini 1.5 Flash, który według niego jest zoptymalizowany pod kątem szybkości i wydajności. Lampa plasuje się pomiędzy Gemini 1.5 Pro a Gemini 1.5 Nano, czyli mniejszym modelem firmy na rodzimym rynku. Google twierdzi, że stworzył Flasha z niektórymi cechami, które odróżniają Gemini Pro od konkurencyjnych modeli, takimi jak dłuższe okno kontekstowe zawierające milion tokenów, ponieważ programiści chcieli stworzyć aplikacje i usługi oparte na sztucznej inteligencji, aby uczynić go lżejszym i tańszym modelem niż Gemini Pro. Jeszcze w tym roku Google podwoi okno kontekstowe Gemini do dwóch milionów tokenów, co oznacza, że będzie mogło jednocześnie przetwarzać dwie godziny wideo, 22 godziny audio, ponad 60 000 linii lub ponad 1,4 miliona słów. .
Projekt Astra
Gdy Google zaprezentowało Project Astra, wczesną wersję uniwersalnego asystenta opartego na sztucznej inteligencji, dyrektor generalny Google DeepMind, Temis Hassabis, powiedział, że opracowana przez Google wersja agenta AI „będzie pomocna w życiu codziennym”.
W filmie, który według Google został nakręcony w jednym ujęciu, użytkownik Astry pokazuje kamerę trzymającą telefon w londyńskim biurze Google – głośnik, kilka symboli na tablicy i za oknem – oraz coś, co wydaje się być naturalną rozmową z aplikacja. W jednym z najciekawszych momentów filmu użytkownik mówi dokładnie, gdzie wcześniej położył okulary, bez konieczności ich podnoszenia.
Film kończy się niespodzianką – gdy użytkownik odnajdzie i założy brakujące okulary, dowiadujemy się, że posiada on wewnętrzny system kamer oraz możliwość płynnego prowadzenia rozmowy z użytkownikiem za pomocą Project Astra. Konkurent inteligentnych okularów Ray-Ban firmy Meta.
Zapytaj Zdjęcia Google
Zdjęcia Google były już inteligentne, jeśli chodzi o wyszukiwanie konkretnych zdjęć lub filmów, ale dzięki sztucznej inteligencji Google przenosi wszystko na wyższy poziom. Jeśli jesteś subskrybentem Google One w USA, będziesz mógł zadać Zdjęciom Google podchwytliwe pytanie, np. „Pokaż mi najlepsze zdjęcie z każdego parku narodowego, który odwiedziłem”, gdy funkcja ta zostanie wdrożona w następnym kilka miesięcy. Zdjęcia Google korzystają z informacji GPS i określają „najlepsze” opcje
Vio i zdjęcie 3
Nowe silniki Google do tworzenia multimediów oparte na sztucznej inteligencji nazywają się Veo i Imagen 3. Veo to odpowiedź Google na Sorę OpenAI. Google twierdzi, że może tworzyć „wysokiej jakości” filmy w rozdzielczości 1080p, które trwają „ponad minutę” i potrafią zrozumieć koncepcje kinowe, takie jak poklatkowe.
Tymczasem obraz 3 to generator zamiany tekstu na obraz, który według Google radzi sobie z tekstem lepiej niż jego poprzednik, obraz 2. Rezultatem jest najwyższej jakości model zamiany tekstu na obraz, „niesamowity poziom szczegółowości”, jasne, realistyczne obrazy” i mniej artefaktów, co w zasadzie porównuje go z DALLE-3 OpenAI.
Duże aktualizacje wyszukiwarki Google
Google wprowadza duże zmiany w sposobie działania w zakresie wyszukiwanych haseł. Większość ogłoszonych dzisiaj aktualizacji obejmuje możliwość zadawania bardziej złożonych pytań („Znajdź najlepsze studia jogi lub pilates w Bostonie i pokaż szczegółowe informacje o ich ofertach wprowadzających oraz godzinach spacerów z Beacon Hill”), a także korzystaj z wyszukiwania w celu planowania posiłków i wakacji. „Niedostępne, dopóki nie wyrazisz zgody na Search Labs, platformę firmy, która umożliwia wypróbowanie funkcji eksperymentalnych.
Ale duża nowa funkcja, którą Google nazywa nakładkami AI i którą firma testuje od roku, w końcu jest udostępniana milionom ludzi w USA. Wyszukiwarka Google będzie teraz domyślnie wyświetlać odpowiedzi wygenerowane przez sztuczną inteligencję na górze wyników, a firma twierdzi, że do końca roku udostępni tę funkcję ponad miliardowi użytkowników na całym świecie.
Bliźnięta na Androidzie
Google integruje Gemini bezpośrednio z Androidem. Kiedy Android 15 zostanie wprowadzony jeszcze w tym roku, Gemini będzie wiedział, jaką aplikację, obraz lub film używasz, dzięki czemu będziesz mógł je wyświetlić i zadać pytania kontekstowe. Gdzie to pozostawia Asystenta Google, który już to robi? Kto wie! Google nie wspomniał o tym podczas dzisiejszego przemówienia.
Było też kilka innych aktualizacji. Google zapowiedział, że doda cyfrowe znaki wodne do filmów i tekstów generowanych przez sztuczną inteligencję, udostępni Gemini w bocznym panelu Gmaila i Dokumentów oraz doda wirtualny zespół AI do miejsca pracy, który będzie podsłuchiwał rozmowy telefoniczne i wykrywał, czy rzeczywiście ktoś z Tobą rozmawia. oszukany. Czas i wiele więcej.
Bądź na bieżąco ze wszystkimi aktualnościami z Google I/O 2024 Tutaj!