Bemutatkozik az Ironwood: Google Cloud legújabb, hetedik generációs TPU-ja

A mesterséges intelligencia fejlődése egyre nagyobb igényeket támaszt a hardverrel szemben, amely képes gyorsan és hatékonyan kiszolgálni a komplex modelleket. A Google erre reagálva mutatta be legújabb fejlesztését, az Ironwood nevű hetedik generációs Tensor Processing Unit-ot (TPU), amely forradalmasítja az AI-számításokat a Cloud platformon. Ez az új chip különösen az AI-inferencia és a modellszolgáltatás területén jelent kiemelkedő előrelépést, miközben energiahatékonysága is rekordot dönt.

Az Ironwood az AI-inferencia korszakára szabva

Az AI-technológiák fejlődése egyre inkább a valós idejű, gyors válaszokat adó modellek kiszolgálására fókuszál, így az Ironwood kifejezetten erre a feladatra lett optimalizálva. A chip kimagasló teljesítményt nyújt alacsony késleltetésű, nagy volumenű AI-inferencia esetén, akár négyszer hatékonyabb, mint az előző generáció. Ez azt jelenti, hogy az Ironwood nemcsak gyorsabb, de energiafelhasználás szempontjából is sokkal gazdaságosabb, így az egyik legerősebb és legkorszerűbb egyedi szilíciummegoldás a piacon.

Óriási hálózatban összekapcsolt TPU-k

Az Ironwood az AI Hypercomputer szívét képezi, amely egy integrált szuperszámítógépes rendszer, és amely a számítási, hálózati, tárolási és szoftveres teljesítményt egyaránt maximalizálja. A rendszer úgynevezett podokba csoportosítja az egyedi TPU-kat, az Ironwood esetében pedig egyetlen „szuperpodban” akár 9216 chip is összekapcsolható. Ezek az eszközök egy újszerű, 9,6 Tb/s sebességű Inter-Chip Interconnect hálózaton keresztül kommunikálnak, így az adatátvitel páratlanul gyors és hatékony. Az ilyen mértékű összekapcsolás lehetővé teszi az 1,77 petabájt megosztott nagy sávszélességű memóriához való gyors hozzáférést, ami jelentősen csökkenti az energiafelhasználást és a számítási időt még a legösszetettebb AI-szolgáltatások esetén is.

Az AI tervez AI-t: az Ironwood fejlődésének motorja

Az Ironwood fejlesztése nem csupán mérnöki munka eredménye, hanem a Google kutatóinak és mérnökeinek folyamatos együttműködésén alapul. Míg más cégek külső beszállítókra támaszkodnak, a Google DeepMind és TPU-tervező csapatai szoros kooperációban dolgoznak együtt, hogy a legújabb modellek – mint például a Gemini – igényeit közvetlenül beépítsék a hardverbe. A kutatók ráadásul mesterséges intelligenciát is alkalmaznak az új chipek tervezéséhez, az úgynevezett AlphaChip módszerrel, amely megerősítéses tanulás segítségével generálja a legoptimálisabb chip-architektúrákat. Ez az innovatív megközelítés az elmúlt három TPU-generációnál, így az Ironwoodnál is jelentős gyorsulást eredményezett.

Az Ironwood így nem csupán egy új hardvereszköz, hanem az AI-számítások hatékonyságát új szintre emelő, intelligensen tervezett megoldás, amely a Google Cloud ügyfelei számára mostantól elérhetővé vált. Ez a fejlesztés fontos mérföldkő a mesterséges intelligencia infrastruktúrájában, amely elősegíti a még összetettebb és gyorsabb AI-alapú szolgáltatások létrejöttét.

Forrás: az eredeti angol cikk itt olvasható