
Image by TechCrunch, from Flickr
AI, joka miettii ennen kuin se puhuu? Claude 3.7 Sonnet esittelee hybridireasonointia
Anthropic on julkaissut Claude 3.7 Sonnetin, uuden version AI-mallistaan, joka esittelee valinnaisen ”laajennetun ajattelun” tilan, antaen käyttäjille enemmän kontrollia siitä, miten malli käsittelee monimutkaisia tehtäviä.
Kiire? Tässä ovat pikafaktat!
- Malli parantaa päättely- ja ongelmanratkaisutaitoja mahdollistamalla itsetutkiskelun ennen vastaamista.
- Laajennettu ajattelutila on saatavilla vain maksullisissa suunnitelmissa.
- Claude Code, koodausavustaja, on rajoitetussa esikatselussa kehittäjille
Anthropic on julkaissut päivitetyn tekoälymallin, Claude 3.7 Sonnetin, joka esittelee hybridiajattelun, mahdollistaen käyttäjille valinnan nopeiden vastausten ja laajennetun ajattelun välillä.
Tämän uuden lähestymistavan tavoitteena on parantaa ongelmanratkaisua antamalla mallille lisäaikaa arvioida ja hiota vastauksiaan tarvittaessa.
Vakiomoodissa Claude 3.7 Sonnet toimii iteratiivisena parannuksena edeltäjäänsä, Claude 3.5 Sonnetiin nähden. Laajennetussa ajattelutilassa malli kuitenkin harjoittaa itsetutkiskelua ennen vastauksen antamista.
Michael Gerstenhaber, Anthropicin tuotepäällikkö AI:lle, kuvasi ominaisuutta keinona, jolla käyttäjät voivat tasapainottaa vasteaikaa ja päättelyn syvyyttä. ”[Käyttäjällä] on paljon kontrollia käyttäytymiseen – kuinka kauan se ajattelee, ja voi vaihtaa päättelykykyä ja älykkyyttä ajan ja budjetin kanssa”, hän sanoi, kuten WIRED raportoi.
Tämä prosessi on tarkoitettu parantamaan tarkkuutta aloilla, jotka vaativat monivaiheista päättelyä, kuten matematiikka, fysiikka, koodaus ja ohjeiden noudattaminen. Käyttäjät, jotka ovat vuorovaikutuksessa mallin kanssa API:n kautta, voivat määrittää rajan sille, kuinka monta merkkiä se käyttää ”ajattelemiseen”, mikä mahdollistaa vasteajan ja kustannusten hallinnan.
WIRED huomauttaa, että päivitys sisältää myös ”raaputuslevy”-ominaisuuden, joka tekee mallin päättelyvaiheet näkyviksi sen käsitellessä pyyntöä. Tämä lähestymistapa on samankaltainen kuin menetelmät, joita käytetään muissa tekoälymalleissa, kuten DeepSeek:ssä.
Anthropic ilmoittaa, että Claude 3.7 Sonnet on optimoitu todellisen maailman sovelluksiin kilpailutyylisen suorituskykymittauksen sijaan. Varhaiset testit viittaavat siihen, että laajennettu päättelytila parantaa suorituskykyä tehtävissä, jotka liittyvät monimutkaisiin koodikantoihin, edistyneeseen työkalujen käyttöön ja koko pinon ohjelmistokehitykseen.
Mallia on arvioitu SWE-bench Verified ja TAU-bench -alustoilla, jossa sen kerrotaan suoriutuvan paremmin kuin edelliset versiot, kuten Anthropic on raportoinut.
CNN huomauttaa, että Anthropic on pitänyt Claude 3.7 -mallin hinnan samana kuin aiemmissa malleissa, sijoittaen sen alle OpenAI:n viimeisimpien tarjousten. Sen hinta on 3 dollaria miljoonaa syötetokenia kohti ja 15 dollaria miljoonaa tulostetokenia kohti, verrattuna OpenAI:n 15 dollariin ja 60 dollariin vastaavissa tasoissa.
Jätä kommentti
Peruuta