“Avete superato il limite di calcolo.” È questo, in sostanza, il messaggio che Google ha inviato a Meta. Secondo un’inchiesta del Financial Times, il colosso di Mountain View ha dovuto frenare l’uso del suo modello di intelligenza artificiale Gemini da parte di Meta, perché la domanda di potenza di calcolo era diventata insostenibile. Non è una semplice interruzione momentanea: i data center stanno tirando il fiato sotto il peso di richieste in crescita esponenziale, proprio mentre l’intelligenza artificiale si fa strada su larga scala. La notizia è emersa a marzo, quando Google ha imposto un tetto, spingendo Zuckerberg e i suoi a insegnare ai loro team a usare i token con più parsimonia durante l’interazione con i modelli linguistici.
Secondo il Financial Times, già a marzo 2024 Google aveva fatto presente a Meta che non poteva più sostenere ulteriori carichi di lavoro sul modello Gemini. Questa mossa ha messo in luce un problema meno evidente ma cruciale: la domanda di infrastrutture per l’intelligenza artificiale cresce più veloce delle capacità offerte dai provider. E questo nonostante i data center di Google siano tra i più avanzati al mondo. La crescita esponenziale di richieste da parte di clienti come Meta ha superato i limiti tecnici e operativi disponibili.
Il blocco colpisce direttamente l’accesso di Meta alle risorse necessarie per addestrare e far funzionare Gemini. È una misura simile a quella riservata agli utenti che esagerano con le versioni gratuite di chatbot, ma qui su scala industriale, con milioni di richieste da gestire. Insomma, un campanello d’allarme sulla saturazione delle infrastrutture cloud dedicate all’AI.
Dopo l’avvertimento di Google, Meta ha messo in campo strategie per ridurre il consumo di risorse legate a Gemini. Una delle mosse principali è stata chiedere ai dipendenti di usare i token — le unità di elaborazione nelle richieste ai modelli linguistici — con maggiore parsimonia. L’obiettivo è evitare sprechi che aggraverebbero ulteriormente la pressione sulle infrastrutture.
Anche se Meta ha i suoi modelli AI, come Llama, continua a fare affidamento su Gemini per funzioni chiave, sia interne che pubbliche. Questo spiega l’urgenza di trovare un equilibrio tra domanda e offerta di potenza di calcolo. Gestire meglio i token non aiuta solo a rispettare i limiti imposti da Google, ma può anche rendere i progetti AI più sostenibili nel tempo.
Gemini non è un semplice esperimento per Meta, ma un pilastro in diversi ambiti. Viene usato per alimentare chatbot intelligenti che supportano il servizio clienti, per assistere gli inserzionisti sulla piattaforma, e per fornire strumenti di programmazione che aiutano gli sviluppatori a scrivere codice più velocemente e gestire i progetti interni.
Ma non finisce qui. Gemini è anche al centro dei sistemi che individuano e rimuovono contenuti nocivi sui social, oltre a monitorare truffe e attività fraudolente, garantendo una maggiore sicurezza agli utenti. Questo modello avanzato permette a Meta di mantenere alti standard di moderazione e assistenza, anche se ora deve fare i conti con i limiti infrastrutturali imposti da Google.
Il RedMagic Astra aveva già acceso la curiosità degli appassionati di gaming phone con il…
Quando un chip deve lavorare nello spazio o in scenari militari estremi, non ci sono…
Un prototipo di Gran Turismo cinese è stato pizzicato sulle strade, avvolto in una livrea…
Il riso Venere nero, con quel suo profumo intenso che resta impresso, è diventato un…
Nel cuore di Pechino, tra il 22 e il 25 giugno 2024, Xiaomi ha ospitato…
Nei corridoi delle fabbriche CATL, un robot umanoide si muove con precisione quasi umana. Il…