STEPHANIE ARNETT / MIT TECHNOLOGY REVIEW

Perché le aziende cinesi puntano sull’IA open-source

Per Alibaba e diverse startup cinesi di IA, l’IA open-source rappresenta un’opportunità per una commercializzazione più rapida e un riconoscimento globale.

Ho parlato molto dei modelli linguistici di grandi dimensioni cinesi e nell’ultimo anno sono riuscito a provarne parecchi. Ma molte persone, soprattutto quelle che non hanno molta familiarità con la Cina o con la lingua cinese, probabilmente non sanno nemmeno da dove cominciare se vogliono testare questi modelli.

La buona notizia è che non è poi così difficile! Di recente ho scoperto che molti modelli di IA cinesi sono molto più accessibili all’estero di quanto mi aspettassi. È possibile accedere alla maggior parte di essi registrando un account sui loro siti web o utilizzando piattaforme di IA open-source popolari come Hugging Face. Ho quindi pubblicato questa guida pratica che elenca una dozzina dei migliori chatbot LLM cinesi che potete utilizzare e i metodi per accedervi facilmente in pochi minuti, da qualsiasi parte del mondo.

Durante i miei esperimenti con questi modelli, una cosa è apparsa subito chiara: mentre la maggior parte delle aziende cinesi di IA ha fissato un limite più alto per l’accesso ai propri prodotti rispetto alle loro controparti occidentali, una tendenza all’open-sourcing dei modelli di IA li sta rendendo sempre più accessibili a un pubblico d’oltreoceano.

Prendiamo ad esempio Qwen (o Tongyi Qianwen, come viene chiamato in cinese). Si tratta del modello AI di punta di Alibaba. A differenza dei concorrenti nazionali come Baidu, ByteDance o Tencent, Alibaba ha scelto di offrire Qwen come modello open-source e di consentire agli sviluppatori e ai clienti commerciali di utilizzarlo gratuitamente.

Il modello, che ha appena ricevuto un importante aggiornamento 2.0 lo scorso giugno, ha ricevuto molti riconoscimenti internazionali. Nella classifica più recente di Hugging Face, che confronta le prestazioni di tutti i principali LLM open-source, Qwen2 si è classificato al primo posto, superando Llama 3 di Meta e Phi-3 di Microsoft.

Allo stesso modo, anche alcune startup cinesi, come DeepSeek e 01.AI, hanno deciso di rendere i loro modelli open source e le prestazioni dei loro prodotti LLM hanno fatto guadagnare loro un’alta posizione in classifica. Aziende come queste offrono gratuitamente i loro modelli a persone sia all’interno che all’esterno della Cina.

La domanda naturale da porsi è: perché? Che cosa significa AI open-source e perché queste aziende scommettono che rendere i loro modelli più aperti e accessibili sarà una buona decisione commerciale?

Secondo Kevin Xu, investitore tecnologico e fondatore di Interconnected Capital, per Alibaba si tratta di una strategia di crescita del business del cloud. “La semplice considerazione economica è che se il loro modello open-source diventa popolare, un maggior numero di persone utilizzerà Alibaba Cloud per costruire applicazioni AI utilizzando i modelli open-source di Alibaba, e questo ovviamente andrà a vantaggio di Alibaba Cloud come azienda”, afferma.

Tutto ciò che Alibaba ha fatto nel campo dell’IA open-source – rilasciando i propri modelli al pubblico e costruendo una piattaforma open-source che imita Hugging Face nella speranza di riunire la comunità dell’IA in Cina – ha lo scopo di convincere più persone a iscriversi ad Alibaba Cloud e a pagare per utilizzare i suoi server.

Anche per le startup cinesi di IA che non operano nel settore del cloud, l’IA open-source offre comunque una libreria collaudata per una commercializzazione più rapida. Dal punto di vista dello sviluppo, consente loro di adattare modelli open-source consolidati come Llama di Meta per accelerare il processo di sviluppo del prodotto. Dal punto di vista del mercato, li spinge a pensare ad architetture di modelli alternativi che possano aiutarli a distinguersi dalla massa.

“In questo momento, l’IA in Occidente tende ad avere una visione molto fissa di come rendere migliore un modello di IA, [che] consiste semplicemente nell’aggiungere più dati o nello scalare di più”, afferma Eugene Cheah, fondatore di Recursal AI, una piattaforma di IA open-source con sede a San Francisco. È estremamente difficile per i piccoli ritardatari del settore LLM giocare a questo gioco e sviluppare un modello che possa competere con GPT-4 o Gemini quando OpenAI e Google hanno un vantaggio superiore in termini di risorse di calcolo.

Il problema è ancora più grave per le aziende cinesi, poiché i controlli sulle esportazioni degli Stati Uniti non consentono loro di accedere facilmente a chip all’avanguardia. “Poiché sono limitati dalla scarsità di GPU”, afferma Cheah, “vedo che i gruppi cinesi sono disposti a sperimentare idee selvagge per migliorare il modello. E alcune di queste idee stanno dando risultati”: hanno portato a modelli più efficienti e meno costosi da addestrare e utilizzare, che possono interessare i clienti attenti al budget e aiutare le aziende cinesi a trovare una nicchia di mercato accanto ai giganti dell’IA.

Perché è importante? Innanzitutto, questi modelli di intelligenza artificiale open-source presentano un futuro alternativo in cui l’industria non è dominata solo da soggetti molto ricchi come OpenAI, Microsoft e Google. Inoltre, dimostrano che gli scienziati e le aziende cinesi sono in grado di creare LLM open-source all’avanguardia che possono persino superare i prodotti delle loro controparti occidentali.

Xu fa notare che Abacus AI, una startup con sede a San Francisco, ha rilasciato quest’anno un modello adattato e perfezionato dal modello Qwen open-source di Alibaba. Viene addirittura definito “Qwen liberato”. L’introduzione da parte delle aziende cinesi di modelli ad alte prestazioni su cui le startup statunitensi possono basarsi è un esempio dello scenario migliore dell’IA open-source, “in cui tutti costruiscono l’uno sull’altro come un ciclo di sviluppo positivo”, afferma Xu. “Non si tratta di un’unica direzione in cui le aziende cinesi prendono tutto il meglio dagli Stati Uniti, ma ora le cose stanno andando anche nella direzione opposta”.

Related Posts
Total
0
Share