
Photo by John Schnobrich on Unsplash
Alibaba julkaisee uuden Qwen-tekoälymallin ja väittää sen suoriutuvan paremmin kuin DeepSeek-V3
Kiinalainen jättiläinen Alibaba julkaisi uusimman version lippulaiva tekoälymallistaan, Qwenistä, tänä keskiviikkona. Yhtiö väittää, että se pystyy suorittamaan tehtäviä paremmin kuin suosittu DeepSeek-V3.
Kiire? Tässä ovat nopeat faktat!
- Alibaba julkaisi uusimman päättelymallinsa Qwen 2.5-Max tämän keskiviikon.
- Kiinalainen jättiläinen väittää, että se suoriutuu paremmin kuin suositut mallit, kuten DeepSeek-V3, GPT-4o ja Llama-3.1-405B.
- Yhtiö lanseerasi myös Qwen2.5-VL:n tällä viikolla, tekoälymallin, joka pystyy käsittelemään kuvia ja toimimaan tekoälyagenttina tietokoneiden ja mobiililaitteiden avulla tehtävien suorittamiseen.
Reutersin mukaan Alibaba lanseerasi uuden Qwen 2.5-Max -nimisen päättelymallin juuri Kiinan kuun uudenvuoden juhlien aikana. Tämä uutuus liittyy osaksi viime päivinä tapahtunutta valtavaa tekoälykehitystä ja lisää kotimaista kilpailua.
Maanantaina DeepSeek nousi ensimmäiseksi Apple’n App Storessa Yhdysvalloissa, ohittaen ChatGPT:n, mikä huolestutti muita tekoälyalan yrityksiä ja säikäytti sijoittajat—Nvidian osakkeet laskivat 17% vain yhdessä päivässä.
Nyt Alibaba on ilmoittanut julkaisevansa uusimmat Qwen-mallinsa—se julkaisi 100 avoimen lähdekoodin tekoälymallia Qwen-sarjaan viime vuoden syyskuussa—lupaten parempia tuloksia kuin suositut eturintaman mallit.
”Qwen 2.5-Max suoriutuu paremmin (…) lähes kaikilla mittareilla kuin GPT-4o, DeepSeek-V3 ja Llama-3.1-405B,” kirjoitti yritys virallisella WeChat-tilillään.
Uuden päättelymallin Qwen 2.5-Maxin API on saatavilla Alibaban pilvipalvelun kautta ja käyttäjät voivat myös testata mallia sen chat-sivulla.
”Kehitämme Qwen2.5-Maxia, suurimittakaavaista MoE-mallia, joka on esikoulutettu yli 20 biljoonalla tunnuksella ja jota on edelleen jälkikoulutettu kuratoiduilla Supervised Fine-Tuning (SFT) ja Reinforcement Learning from Human Feedback (RLHF) -menetelmillä”, kirjoitti Qwen-tiimi Githubissa.
Kiinalainen jättiläinen julkaisi myös maanantaina Qwen2.5-VL:n, joukon multimodaalisia tekoälymalleja, jotka voivat myös käsitellä kuvia ja päästä käsiksi matkapuhelimiin ja tietokoneisiin tehtävien suorittamiseksi. OpenAI ilmoitti samanlaisesta ominaisuudesta, Operator, joka antaa ChatGPT:n suorittaa tehtäviä itsenäisesti ottaen käyttäjän tietokoneen hallintaan.
Alibaban tiimin mukaan kaikki Qwen-mallit suoriutuvat paremmin kuin vastaavat versiot OpenAI:lta, Microsoftilta, Googlelta, Metalta ja DeepSeekiltä.
Jätä kommentti
Peruuta