È arrivata l’era dell’IA che capisce non solo le parole, ma anche ciò che vede: OpenAI ha rilasciato due nuovi modelli avanzati, o3 e o4-mini, capaci di “pensare con le immagini” in modo più preciso rispetto alle versioni precedenti.
Questi modelli, disponibili per gli utenti a pagamento, sono in grado di ragionare su disegni, diagrammi e fotografie, anche di bassa qualità, integrando i contenuti visivi nel processo logico. Impiegano deliberatamente più tempo per rispondere, privilegiando accuratezza e profondità.
Oltre a comprendere le immagini, possono navigare sul web, generare immagini e sono stati addestrati tramite apprendimento per rinforzo, un sistema che premia le risposte corrette.
Secondo OpenAI, questa nuova generazione è in grado di affrontare problemi complessi e articolati, gestendo in autonomia le informazioni ricevute. Rispetto ai modelli come GPT-4 o GPT-3.5, offrono una comprensione più profonda di domande complesse e una coerenza maggiore nelle risposte.
“La potenza combinata del ragionamento all’avanguardia con l’accesso completo agli strumenti si traduce in prestazioni significativamente superiori nei test accademici e nelle applicazioni reali”, afferma OpenAI.
Nei prossimi giorni, OpenAI prevede di lanciare anche o3-pro, una versione ancora più avanzata del suo modello di punta specializzato nel ragionamento, che sarà disponibile esclusivamente per gli utenti Pro. Nel frattempo, questi ultimi continueranno a utilizzare o1-pro, ancora attivo in attesa del rilascio del nuovo aggiornamento.