Google вчера ја одржа нивната позната Google I/O конференција и како што можеше да се претпостави и очекува, истата беше целосно насочена кон напредокот во развојот на вештачката интелигенција.
Од компанијата истакнаа дека тие инвестираат во оваа област повеќе од 10 години, но сепак новиот правец и развој на генеративната вештачка интелигенција и големите јазични модели може да се каже дека се на почетокот.
На конференцијата беа презентирани повеќе новини поврзани со вештачката интелигенција, поточно со Gemini, големиот јазичен модел од компанијата. Google не пропушти да истакне дека нивниот модел е „мултимодален“ уште од самиот почеток, односно способен да работи со текст, звук, видео, слики и слично без потреба од користење на различни модели. Резултатот кој се добива, односно одговорот исто така функционира со сите овие видови на „инпути“.
Една од главните новини кои беа презентирани и која привлече можеби најголемо внимание, а посебно и по претставувањето на GPT-4o во истата недела е Project Astra.
Project Astra ја прикажува „мултимодалноста“ на Gemini најдобро досега, а овозможува корисниците да ја користат камерата на својот мобилен за целосна интеракција со моделите. Корисниците можат да добијат информации за тоа која е околината која ја прикажуваат, да најдат одредени предмети, да добијат објаснување за код и уште многу повеќе.
Видеото во продолжение ја прикажува оваа нова технологија, а со тоа и што може да очекуваме во иднина.
Друга интересна работа која беше најавена во рамките на Google I/O беше новата функција „Ask Photos“. Се работи за интеграција на Gemini во Google Photos, а корисниците ќе можат да поставуваат прашања и многу полесно да го најдат тоа што го бараат од досега со системот кој беше на основа на клучни зборови.
Еден од примерите за како функционира Ask Photos е можноста да се праша која е регистрацијата на автомобилот на корисникот или да му биде прикажан напредокот на ќерката во пливањето.

Gemini ќе биде интегриран и во останатите сервиси и апликации од Google, како Gmail, односно во сите Workspace апликации. Корисниците ќе можат да побараат сумирање на подолга имејл комуникација, сумирање на состаноци и слично.
Google исто така најави проширување на достапноста на Gemini во Google Search, со очекување за повеќе земји во периодот што следи, како и проширување на достапноста на Gemini 1.5 Pro за повеќе корисници.
Што се беше презентирано на Google I/O 2024 можете да видите на видеото во продолжение кое ја сумира конференцијата во кратки 10 минути.