“Alibaba” lansira model umjetne inteligencije koji je “jači” od “Deep Sec-a

Kineska tehnološka kompanija Alibaba objavila je danas, u srijedu, lansiranje nove verzije svog modela umjetne inteligencije Qwen 2.5, tvrdeći da je moćnija od one koju je objavio "Deep Sec", što je izazvalo šok u Amerikancu tehnološki sektor.

Nova super verzija Qwen 2.5, tvrdi Alibaba, nadmašuje veoma hvaljeni DeepSeek-V3 model koji je napravio talase u svijetu tehnologije poslednjih nekoliko dana.

Prema onome što prenose mediji, neobično vrijeme lansiranja Qwen 2.5-Max, na prvi dan lunarne Nove godine, vrijeme proslave kineske Nove godine, i u vrijeme kada je većina Kineza na odmoru s posla i sa svojim porodicama, ukazuje na pritisak koji je nametnuo uspon kineske kompanije za vještačku inteligenciju DeepSeek u protekle tri nedelje napao je ne samo svoje inostrane konkurente, već i svoje domaće rivale, prije svega Alibabu.

Jači od Deepseeka i GPT Chata

Alibabina kineska jedinica za računarstvo u oblaku potvrdila je da je Qwen 2.5-Max model skoro nadmašio modele GPT-4o, DeepSeek-V3 i Llama-3.1-405B u svim oblastima, u najavi objavljenoj na njenom zvaničnom WeChat nalogu.

DeepSeek-ovo izdavanje svog DeepSeek-V3 AI asistenta 10. januara, zajedno sa izdavanjem njegovog modela R1 20. januara, šokiralo je Silicijumsku dolinu i izazvalo pad tehnoloških zaliha, pošto su niski troškovi razvoja i korištenja kineskog startupa naveli investitore.

Alibaba kompanija

Ali uspjeh DeepSeeka također je podstakao borbu među njegovim lokalnim konkurentima za nadogradnju svojih AI modela.

Na primjer, dva dana nakon objavljivanja DeepSeek-R1, vlasnik TikToka ByteDance objavio je ažuriranje svog vodećeg AI modela, za koji je tvrdio da je nadmašio OpenAI-ov o1 model koji podržava Microsoft u AIME-u, benchmark testu koji mjeri koliko dobro modeli razumiju... Umjetna inteligencija i njen odgovor na složena uputstva.

Ovo odražava tvrdnju DeepSeeka da njegov R1 model parira OpenAI-jevom o1 na nekoliko performansi.

Što se tiče nove verzije Alibabinog modela umjetne inteligencije, jedinica za računarstvo u oblaku, Qwen, rekla je u objavi na X platformi da je DeepSeek V3 talas privukao pažnju cijele zajednice umjetne inteligencije na velike modele, a u isto vrijeme, radili su na izgradnji Qwen2 5-Max, velikog inteligentnog lingvističkog modela chatbot koji je prethodno obučen za velike podatke i kasnije obučen korištenjem SFT i RLHF formatiranih recepata.

"Deep Sick" pogađa narativ "američke dominacije" nad umjetnom inteligencijom

“Ostvaruje konkurentske performanse u odnosu na vrhunske modele, nadmašujući DeepSeek V3 u mjerilima kao što su Arena Hard, LiveBench, LiveCodeBench i GPQA-Diamond,” nastavila je.

Qwen-ina službena stranica zaključila je tvit rekavši: "U budućnosti nećemo samo nastaviti da se širimo u pre-treningu, već ćemo i ulagati u proširenje učenja s pojačanjem. Nadamo se da će Qwen moći istražiti nepoznato u bliskoj budućnosti."

Alibaba

DeepSeek

Znate više o temi ili prijavi grešku

“Alibaba” lansira model umjetne inteligencije koji je “jači” od “Deep Sec-a

Više od 9 miliona iftara podijeljeno u Poslanikovoj džamiji tokom ramazana

Robert De Niro na protestu protiv Trumpa: "Vrijeme je da mu kažemo ne, mora biti zaustavljen"

Na Bilinom Polju rade grijači za uklanjanje snježnog nanosa sa travnjaka

Radončić: Zaustavit ćemo Konakovićevu pljačku stoljeća, koja i Nikšića šalje u zatvor

"Ako se ovo otkrije, mrtva sam": Miriam Adelson i dokumentarac "Dosjei Bibi" šokirali Netanyahua

Prvi čovjek UEFA-e stiže u Zenicu da gleda susret BiH i Italije

SAD ispalile više od 850 Tomahawka u četiri sedmice rata s Iranom, raste zabrinutost zbog zaliha

Kako je propao plan "kurdske invazije" na Iran: Mossad je godinama radio na tome, ali sada nemaju nade