Společnost Google v polovině května uspořádala konferenci I/O 2024, na níž představila spoustu vizí a novinek v oblasti umělé inteligence. Šlo sice o konferenci primárně pro vývojáře, ale vše, o čem se dočtete níže najdete již brzy na svých PC i smartphonech. Umělá inteligence vám pomůže v práci s náročnými úkoly, ale i v domácnosti při hledání brýlí a dalších předmětů a již brzy za vás vyřídí reklamaci, objedná dovolenou a ochrání vás před podvodnými telefonáty.
Společnost Google jako již tradičně v polovině května uspořádala konferenci Google I/O 2024. Letos na to ale šla trochu jinou cestou. Neukázala žádný nový smartphone, protože svou novinku Google Pixel 8a již odhalila minulý měsíc, chystaný Android 15 bude představen naopak později. Celá prezentace se totiž nesla v duchu umělé inteligence, čehož jasným důkazem je fakt, že v jejím průběhu zaznělo slovní spojení AI celkem 121 krát. Konference sice slouží primárně vývojářům, ale všechny novinky, o kterých se dočtete níže budou již brzy dostupné i na vašem smartphonu.
Vše, co potřebujete vědět o nových telefonech od Googlu, se dozvíte v tomto článku.
Project Astra aneb asistent budoucnosti
Project Astra představuje opravdový průlom v umělé inteligenci. Jde o dosud nejdokonalejšího AI asistenta s odpověďmi v reálném čase, který navíc dokáže „vidět“ skrze kameru vašeho smartphonu, ale kupříkladu i chytrých brýlí. Stručně řečeno jde o AI osobního asistenta, který dokáže v reálném čase odpovídat a zpracovávat video vstup. Video níže dokonale ilustruje, jak pracuje s kontextem, pamatuje si zdánlivě nerelevantní věci jen z letmo zachyceného videa, a tak vám pomůže najít např. brýle a další předměty, což byl dříve pro asistenty tohoto typu neřešitelný problém.
Očekává se, že tento AI asistent v blízké budoucnosti nahradí klasického Google Asistenta jak jej známe dnes a stane se nedílnou součástí nových telefonů s operačním systémem Android.
Google Gemini má jasně největší kontextové okno
Google Gemini je v současnosti nejpoužívanější AI produkt společnosti Google a aktuálně jde o přímou konkurenci nástroje ChatGPT od OpenAI, případně Microsoft Copilot ve vyhledávači Bing. Hlavní předností této platformy je multimodálnost v základu. Zatímco Google Gemini je již od počátku navržen jako nástroj pro zpracování nebo generování textu, obrázků či videa, ostatní platformy se to musí teprve „učit“ a text je generován pouze jako mezikrok.
V čem má Google Gemini oproti konkurenci jasně navrch, je velikost tzv. kontextového okna. To si lze jednoduše představit jako množství vámi zadaných informací, nad nimiž dokáže umělá inteligence v jeden moment uvažovat. Nejvyšší model Google Gemini 1.5 Pro nyní dokáže konzistentně uvažovat až nad 1 milionem tokenů. Jedná se zhruba o 10 hodin audia, 1 hodina videa, případně 700 tisíc slov. Do konce tohoto roku by se navíc měly schopnosti rozšířit až na 2 miliony tokenů.
Není to jen „obyčejný“ chat bot
Google Gemini v žádném případě není jen další „tuctový“ chat bot. Zvládá číst i vytvářet v různých formátech nativně, velmi rychle i dlouhým kontextem. Nově se můžete u chat verze těšit na přednastavená chatová okna, jak je již znáte u konkurence. Tato funkce, u Googlu nazývaná Gemini Gems, vám umožní vytvořit si např. Gem osobního trenéra, kterému nastavíte popisek, o němž bude při každém spuštění uvažovat. Stále jasněji se totiž ukazuje, že když chatu vštípíte, že je kondiční trenér s léty zkušeností, jsou jeho výstupy mnohem fundovanější. Do popisu můžete kupříkladu přidat styl motivace, který vyžadujete. Všechny odpovědi se pak budou držet vámi požadovaného formátu.
Vybírat můžete ze dvou Gemini modelů
Na samotném vrcholu rodiny Gemini nadále zůstává model Gemini 1.5 Pro, Google ale představil alternativu v podobě Gemini 1.5 Flash. Jedná se o odlehčený model, který má poskytovat co nejrychlejší odpovědi. Má všechny výsady Gemini, ať už multimodálnost či dlouhé kontextové okno, odpovědi však nebudou tak detailní a propracované, jako u varianty Pro. Oba modely Gemini však budou mít své využití. Zatímco Pro se hodí na složitější úkoly, Flash najde uplatnění tam, kde je nejdůležitější rychlost.
Google ukázal i nové generativní modely Veo a Imagen 3
Značná část prezentace byla věnována také generativní umělé inteligenci. Představen byl model pro generování videa z textu Veo, schopný vytvářet Full HD videa v různých stylech, trvající déle než jednu minutu. Zdokonalený model pro generování obrázku z textu Imagen 3 je zaměřen zejména na detaily, je tak schopen věrně zobrazit i ty nejkonkrétnější požadavky a produkovat opravdu fotorealistické snímky. Vše, co Gemini vygeneruje včetně videí, bude nově opatřeno neměnným „vodoznakem“ SynthID, za účelem falešného vydávání vygenerovaného obsahu za pravý.
Gemini pro Google Workspace je dokonalou posilou vašeho týmu
Gemini se nově stane i součástí firemního balíčku populárních produktů Google Workspace, čítající např. Gmail, Disk Google, Kalendář Google, Dokumenty Google a mnohé další. Google Gemini zde budete moci přidat jako „nového kolegu“. Potřebujete uspořádat faktury z emailů do jednoho místa? Pro Gemini žádný problém, navrch vám k tomu vytvoří tabulku příjmů a výdajů, obohacenou o relevantní grafy.
S Gemini půjde komunikovat i v rámci skupinového chatu, podobně jako s vašimi kolegy. Potřebujete se ujistit, že je váš projekt již připraven k vydání? Stačí se jen zeptat a pokut se nikdo z vašich skutečných kolegů neozve, Gemini projde všechny soubory i dostupná data, upozorní na potenciální problémy a navrhne další postup. Na výstup pak klidně může reagovat kdokoli z týmu zadáním dalšího úkolu, jehož zpracování by běžně zabralo i hodiny, ale Gemini již během pár minut přijde s uceleným řešením.
AI jako součást vyhledávání Google
Zatímco předchozí část byla věnována především profesionálům, zbytek textu se již bude týkat nás všech. Umělá inteligence se totiž již brzy stane nedílnou součástí nejpoužívanějšího vyhledávače na světě. Google na konferenci I/O 2024 ukázal, co vše již AI při vyhledávání dovede. Mezi klíčové funkce patří shrnutí, kdy Gemini pospojuje informace z vyhledaných článků, aby vám je „naservírovala“ jako jeden celek, doplněný o všechny dostupné zdroje. Vyhledávání rovněž zvládne zpracovat i složitější požadavky. Na prezentaci byl ukázán dotaz „najdi nejlepší Jóga nebo Pilates studio v Bostonu, ukaž nabídky pro začátečníky a pěší vzdálenost od mého bydliště“. Gemini si jednotlivé požadavky rozdělí do několika kroků, všechny požadované informace získá a vše vám přehledně zobrazí v přehledném blokovém rozhraní uzpůsobeném tomu, co právě hledáte. K vyhledávání textem a hlasem navíc přibude i video, pravděpodobně na bázi Project Astra.
Circle to Search již nejen u Samsungu
Obrázkový vyhledávač Circle to Search, který byl doposud výsadou vlajkových telefonů Samsung Galaxy S24 Ultra se již brzy stane nedílnou součástí většiny telefonů s operačním systémem Android (pravděpodobně Android 15). Není divu, když se na jeho vývoji podíleli Samsung a Google společně. Circle to Search dokáže vyhledávat obrázky na základě podobnosti se zakroužkovaným objektem, nově se ale naučí i řešit matematické úlohy. Jak se zdá, tuto funkci budou žáci milovat a učitelé nenávidět. Stačí jen zakroužkovat slovní úlohu, rovnici či graf a Circle to Search je tu v mžiku se správným řešením včetně postupu. Více o telefonech Samsung S24 najdete v následujícím článku.
AI Agent za vás vyřídí reklamaci, naplánuje dovolenou a ochrání před hovory
Aby Google přinesl umělou inteligenci opravdu všem, představil tzv. AI agenty. AI agenti v sobě snoubí vše, co umělá inteligence od Googlu nabízí. Objednali jste si nové boty, ale jsou vám příliš malé? AI agent si daný úkol rozplánuje do několika kroků a dokáže pracovat napříč různým softwarem. Během chvilky tak projde vaše emaily, najde fakturu a zjistí, kde jste boty zakoupili a vyplní potřebné formuláře. Vám pak jen řekne, kam boty zanést, případně objedná svoz. Nad vším ale budete mít kontrolu, AI agent se vás vždy zeptá, zda má daný krok provést, vše tak budete mít plně ve své moci. Jde však prozatím o rané testování, opravdové nasazení této technologie je spíše otázkou několika let.
Google rovněž demonstroval, jak může umělá inteligence odhalit podezřelé hovory, v nichž se vás snaží podvodníci okrást o peníze. Podle společnosti Google lidé ztratili v posledních měsících kvůli takto cíleným podvodům více než bilion dolarů, proto vyráží do boje se svými AI agenty. Jakmile umělá inteligence v hovoru rozpozná vzorec podezřelého chování, např. volající po vás chce osobní údaje, pin ke kartě nebo hesla k účtům, okamžitě vás na potenciální hrozbu upozorní.
***
Tak co tomu říkáte? Zdá se, že umělá inteligence je na vzestupu a brzy se s ní střetne opravdu každý!