DeepSeekin tekoäly oppii ajattelemaan itseään varten

Image by Matheus Bertelli, from Pexels

DeepSeekin tekoäly oppii ajattelemaan itseään varten

Lukuaika: 2 min

Kiinalainen startup-yritys DeepSeek on yhteistyössä Tsinghua-yliopiston kanssa kertonut kehittäneensä älykkäämmän tavan auttaa tekoälymalleja ajattelemaan paremmin ja nopeammin, ilman tarvetta suurille tietokoneille tai kalliille resursseille.

Kiire? Tässä tiivistettynä tärkeimmät faktat:

  • DeepSeek loi itseään parantavan tekoälyn käyttämällä itseperiaatteellista kritiikin säätöä (SPCT).
  • SPCT opettaa tekoälyä arvioimaan omaa työtään itse luotujen sääntöjen avulla.
  • Menetelmä parantaa suorituskykyä ilman massiivista laskentatehoa.

Läpimurto tulee uudesta tekniikasta, jota kutsutaan itseohjautuvaksi kritiikin säätämiseksi (Self-Principled Critique Tuning, SPCT). SPCT eroaa tavasta parantaa tekoälyn suorituskykyä yksinkertaisesti tekemällä AI-malleista suurempia – SPCT ei vaadi paljon energiaa eikä laskentatehoa opettaakseen tekoälyn arvioimaan omaa työtään itse luotujen sääntöjen avulla.

Se toimii sisäänrakennetun ”tuomarin” kautta, joka varmistaa, että tekoälyn vastaus noudattaa sen sisäisiä päättelysääntöjä ja vaikuttaa sopivalta ihmisen tuotannolle. Kun tekoäly antaa vankkaa palautetta, se saa positiivista palautetta, mikä auttaa parantamaan sen kykyä vastata samankaltaisiin kysymyksiin tulevaisuudessa.

DeepSeek soveltaa tätä menetelmää osana DeepSeek-GRM-järjestelmäänsä, joka tarkoittaa Generative Reward Modelingiä. GRM toimii eri tavalla kuin perinteiset menetelmät, koska se suorittaa rinnakkaisia tarkistuksia parantaakseen sekä tarkkuutta että johdonmukaisuutta.

”Ehdotamme Self-Principled Critique Tuning (SPCT) -menetelmää, joka edistää skaalautuvien palkkioiden luontikäyttäytymistä”, tutkijat kirjoittivat artikkelissaan. ”SPCT mahdollistaa [mallin] sopeutuvan periaatteisiin ja kritiikkiin input-kyselyn ja vastausten perusteella, mikä johtaa parempiin lopputulospalkkioihin.”

Tämän järjestelmän avulla DeepSeek väittää, että sen tekoäly kykenee nyt suoriutumaan paremmin kuin kilpailijansa, kuten Googlen Gemini, Metan Llama ja OpenAI:n GPT-4o, erityisesti monimutkaisten tehtävien, kuten päättelyn tai päätöksenteon suhteen, kuten Euronews on huomauttanut.

On tärkeää huomata, että DeepSeek ilmoittaa aikovansa julkaista nämä uudet työkalut avoimen lähdekoodin ohjelmistoina, vaikka julkaisupäivää ei ole vielä jaettu.

Piditkö tästä artikkelista? Arvostele se!
Todella huono Melko huono Ihan ok Melko hyvä! Tosi hyvä!

Olemme innoissamme siitä, että pidit työstämme!

Mainitsisitko arvostettuna lukijanamme meidät Trustpilotissa? Se tapahtuu nopeasti ja merkitsee meille paljon. Kiitos, että olet mahtava!

Arvostele meidät Trustpilotissa
0 Arvostellut 0 käyttäjää
Otsikko
Kommentti
Kiitos palautteestasi
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Jätä kommentti

Loader
Loader Näytä lisää...