9

Google come Iron man, pronta a lanciare il suo Jarvis il nuovo assistente di Chrome

Il nuovo assistente AI, alimentato da Gemini 2.0, promette di gestire attività web su misura per gli utenti.

NOTIZIA di Simone Lelli   —   27/10/2024
La presentazione di Google Gemini

Google sta preparando il lancio di un nuovo agente AI, denominato Project Jarvis, pensato per operare all'interno di Google Chrome. Questa innovazione sarà progettata per assistere gli utenti in una serie di compiti quotidiani online, dal raccogliere informazioni al fare acquisti e prenotazioni. A differenza di molti strumenti orientati al mondo aziendale, Jarvis si rivolge agli utenti consumer e sarà una delle prime applicazioni su larga scala alimentate dal modello Gemini 2.0. Secondo quanto riportato, il rilascio iniziale è previsto per dicembre, anche se in fase di test limitato.

Le funzionalità di Jarvis

Alla conferenza I/O 2024 di maggio, il CEO di Google, Sundar Pichai, aveva anticipato la possibilità di utilizzare Gemini per creare agenti intelligenti, in grado di supportare le persone nel ragionamento e nella pianificazione, completando attività su vari sistemi, sempre con l'approvazione e la supervisione degli utenti. Pichai descriveva questa tecnologia come capace di "ragionare su più passaggi" per realizzare attività complesse e portare a termine operazioni online autonomamente.

Gli agenti di Google Gemini.
Gli agenti di Google Gemini.

La funzionalità di Project Jarvis sarà probabilmente integrata direttamente in Chrome e potrà eseguire attività che includono la ricerca di informazioni, la selezione e l'acquisto di prodotti o la prenotazione di viaggi e voli online. Secondo quanto riportato, questo agente AI sarà in grado di "automatizzare compiti quotidiani su browser" utilizzando Gemini 2.0 e basandosi su un sistema di intelligenza artificiale evoluto che consentirà l'esecuzione di numerose attività online con interventi minimi da parte dell'utente.

Uno degli elementi chiave della progettazione di Jarvis risiede nella sua capacità di "comprendere" le attività web attraverso una serie di screenshot del desktop, interpretando le immagini per decidere quali azioni intraprendere. Questo sistema è in grado di cliccare pulsanti, compilare campi testuali e navigare tra pagine web seguendo una sequenza logica di azioni predeterminate. Tuttavia, il processo non è immediato: richiede un periodo di riflessione di alcuni secondi tra un'azione e l'altra, il che implica che al momento Jarvis operi attraverso il cloud piuttosto che esclusivamente sui dispositivi degli utenti. Questo potrebbe indicare che il prodotto non sia ancora del tutto pronto per un lancio su vasta scala, anche se il rilascio per i tester è previsto per dicembre.

Integrazione di Gemini

Durante l'evento I/O, Pichai aveva mostrato come Gemini potesse supportare Chrome in molte attività organizzative e di sintesi delle informazioni per gli utenti. L'integrazione tra Gemini e Chrome consente a Jarvis di "pianificare e organizzare" operazioni complesse come la gestione di eventi e appuntamenti, nonché la raccolta e la sintesi di dati e risultati di ricerca.

Alcune funzioni di Gemini.
Alcune funzioni di Gemini.

Questo tipo di intelligenza artificiale "agente" rappresenta una sfida avanzata per i sistemi di AI attuali. Jarvis, infatti, è progettato per completare operazioni su più passaggi e svolgere compiti complessi che potrebbero risultare noiosi o ripetitivi per un utente. Pichai ha definito il funzionamento di Jarvis come una simulazione delle azioni di un utente su Chrome, ma in modo automatizzato e attraverso l'uso di intelligenza artificiale. In questo contesto, Google mira a rendere il processo più veloce e meno impegnativo per l'utente, ma mantenendo il controllo e la supervisione su ciascuna fase del processo.

Project Jarvis dovrebbe rappresentare uno dei primi esempi tangibili delle potenzialità di Gemini 2.0, che si prevede sarà lanciato a dicembre. La fase iniziale di lancio, tuttavia, sarà riservata a un gruppo selezionato di tester, il che lascia presagire che Google voglia prima perfezionare il funzionamento dell'assistente prima di una distribuzione su scala più ampia.