
OpenAI új nyílt forráskódú modelljei: forradalmi lehetőségek
OpenAI nemrégiben két új, nyílt forráskódú nyelvi modellt dobott piacra, amelyek az Apache 2.0 engedéllyel érhetők el. Ezek a modellek kifejezetten azzal a céllal készültek, hogy erős, valós teljesítményt nyújtsanak, miközben a felhasználók által elérhető hardveren futtathatók. A modellek közül az egyik, a gpt-oss-120b, akár egy 16 GB-os GPU-val rendelkező, csúcskategóriás laptopon is működtethető, míg a másik, a gpt-oss-20b, hasonlóan jól teljesít a kisebb eszközökön is.
Valós teljesítmény alacsonyabb hardverköltséggel
A gpt-oss-120b modell 117 milliárd paramétert tartalmaz, és a legújabb OpenAI o4-mini modellhez hasonló szintű teljesítményt nyújt a logikai feladatokban, mindössze egy 80 GB-os GPU-val. Ezzel szemben a gpt-oss-20b, ami 21 milliárd paramétert tartalmaz, szintén jó teljesítményt nyújt, és mindössze 16 GB-os GPU-val futtatható, ami lehetővé teszi, hogy a fejlesztők a kisebb, otthoni gépeken is használják a modelleket. Ez a fejlesztési lehetőség jelentősen csökkenti a szükséges infrastruktúra költségeit, így a modellek szélesebb körben elérhetők.
Fejlett érvelés és eszközhasználat
Az OpenAI bejelentette, hogy az új modellek a hasonló méretű nyílt forráskódú modellekhez képest is jobban teljesítenek az érvelési feladatokban és az eszközhasználat terén. A cégnél hangsúlyozták, hogy ezek a modellek rendkívül jól alkalmazhatók olyan folyamatokban, ahol fontos az instrukciók követése és a komplex logikai feladatok megoldása. Az új modellek támogatják a láncolt gondolkodást (Chain-of-Thought, CoT), amely lehetővé teszi a fejlesztők számára, hogy különböző szintű érvelést alkalmazzanak attól függően, hogy a feladat mennyire bonyolult.
Az OpenAI emellett fejlesztői útmutatókat is közzétett, amelyek segítik a modellek integrálását különböző platformokkal, mint például a Hugging Face és a GitHub. A modellek a legújabb API-kat is támogatják, így a fejlesztők könnyedén testreszabhatják őket saját alkalmazásaikhoz.
A biztonság kérdése az open-weight AI modellekben
Az OpenAI a nyílt súlyú modellek fejlesztése során hangsúlyt fektetett a biztonságra a teljesítmény mellett. A tesztelések során bebizonyosodott, hogy a gpt-oss-120b modell nem érte el a veszélyes szintet a biológiai, kémiai vagy kiberkockázatok terén, még szándékosan rosszindulatú finomhangolás alatt sem. A láncolt gondolkodás átláthatóságának megőrzése érdekében az OpenAI szándékosan nem alkalmazott szigorú korlátozásokat a modellek képességeire, amely ugyanakkor a „hallucinációk” megjelenéséhez is vezethet.
A nyílt forráskódú modellek tesztelése során az OpenAI megfigyelte, hogy a modellek a méretük miatt a hallucinációs benchmarkokban gyengébben teljesítettek, mint a korábbi o4-mini modell. Azonban a valós alkalmazásokban, ahol a modellek képesek információt keresni a weben vagy külső adatbázisokból, a hallucinációk előfordulásának valószínűsége várhatóan csökken.
Mire figyeljenek a fejlesztők a hallucinációk kapcsán?
A nyílt forráskódú modellek használata során fontos, hogy a fejlesztők tisztában legyenek a hallucinációk kockázatával, és megfelelő szűrőket alkalmazzanak. Az OpenAI figyelmeztetett arra, hogy a láncolt gondolkodás közvetlen megjelenítése felhasználók számára nem ajánlott anélkül, hogy előzetes szűrésen ne menne keresztül. A modellek képességeit érdemes alaposan tesztelni az alkalmazások bevezetése előtt, hogy minimalizálják a potenciális kockázatokat.
Mit gondol a szakértő a nyílt forráskódú modellek jelentőségéről?
Megkérdeztük Császár Viktor SEO szakértőt, hogy mit gondol az OpenAI nyílt forráskódú modelljeiről. Viktor véleménye szerint:
„Az OpenAI új nyílt forráskódú modelljei valódi áttörést jelentenek a mesterséges intelligencia területén. A lehetőség, hogy ezek a modellek alacsony költséggel működjenek, óriási előnyt ad a kisebb fejlesztőknek és startupoknak. A biztonság és a testreszabhatóság szempontjából is pozitív lépés, hogy az OpenAI a láncolt gondolkodás átláthatóságát hangsúlyozza. Ugyanakkor fontos, hogy a fejlesztők tisztában legyenek a hallucinációk kockázataival, és megfelelő intézkedéseket tegyenek az alkalmazásaikban. A jövőbeli alkalmazások szempontjából ez a fejlesztés mérföldkőnek számít a mesterséges intelligencia integrálásában.”
További információkért látogasson el Császár Viktor weboldalára: Császár Viktor SEO szakértő.
Forrás: SearchEngineJournal.com

