Az EigenAI elindítja a bit-pontos determinisztikus AI-következtetést a Mainneten

Az EigenAI elindítja a bit-pontos determinisztikus AI-következtetést a Mainneten

Az EigenCloud kiadta EigenAI platformját a mainneten, azzal az állítással, hogy megoldja az autonóm AI rendszereket sújtó alapvető problémát: nem lehet ellenőrizni azt, amit nem lehet reprodukálni.

A technikai eredmény itt jelentős. Az EigenAI bit-pontos determinisztikus következtetéseket nyújt a gyártási GPU-kon – ami azt jelenti, hogy azonos bemenetek azonos kimeneteket eredményeznek 10 000 tesztfutás során – mindössze 1,8% további késleltetéssel. Ez mindenki számára fontos, aki valódi pénzt kezelő AI-ügynököket épít.

Miért rombolja az LLM véletlenszerűsége a pénzügyi alkalmazásokat

Futtassa ugyanazt a parancsot kétszer a ChatGPT-n. Különböző válaszok. Ez nem hiba – így működik a lebegőpontos matematika a GPU-kon. A kernel ütemezés, a változó kötegelt feldolgozás és a nem asszociatív halmozás mind apró eltéréseket eredményeznek, amelyek különböző kimenetekhez vezetnek.

A csevegőrobotok esetében ezt senki sem veszi észre. De mi van az AI kereskedési ügynökkel, aki a tőkéddel kereskedik? Vagy a jóslatpiaci orákulummal, amely eldönti, ki nyeri meg a 200 millió dolláros fogadást? Az inkonzisztencia kockázattá válik.

Az EigenCloud a Polymarket hírhedt „Zelenskyy öltönyt viselt?” piacát hozza fel esettanulmányként. Több mint 200 millió dolláros forgalom, önkényes döntéshozatal vádjai, és végül az emberi kormányzásnak kellett közbeavatkoznia. Ahogy a piacok növekednek, az emberi döntéshozatal nem. Az AI bíró elkerülhetetlen lesz – de csak akkor, ha az a bíró minden alkalommal ugyanazt az ítéletet hozza.

A technikai háttér

A determinizmus elérése a GPU-kon minden réteg ellenőrzését igényelte. Az A100 és H100 chipek azonos műveletek esetén eltérő eredményeket adnak a kerekítés architektúrájának különbségei miatt. Az EigenAI megoldása: az operátoroknak és a verifikátoroknak azonos GPU SKU-kat kell használniuk. Tesztjeik 100%-os egyezési arányt mutattak azonos architektúrájú futtatások esetén, 0%-ot pedig keresztarchitektúrás futtatások esetén.

A csapat a standard cuBLAS kernelt egyedi implementációkkal váltotta fel, warp-szinkron redukciókat és fix szálsorrendet használva. Nincs lebegőpontos atomikus művelet. A llama.cpp-re építettek, mert annak kódbázisa kicsi és ellenőrizhető, és letiltották a dinamikus gráf-fúziót és más, variabilitást okozó optimalizálásokat.

A teljesítményköltség a standard cuBLAS átviteli sebességének 95-98%-át teszi ki. A független H100 csomópontokon végzett kereszt-host tesztek azonos SHA256 hash-értékeket eredményeztek. A háttérben futó GPU-terhelésekkel végzett stressztesztek ütemezési ingadozást okoztak? Az eredmények továbbra is azonosak voltak.

Gazdasági ellenőrzés

Az EigenAI a blokklánc-rollupokból átvett optimista ellenőrzési modellt használ. Az operátorok titkosított eredményeket tesznek közzé az EigenDA-n, a projekt adat-elérhetőségi rétegén. Az eredményeket alapértelmezés szerint elfogadják, de vitás esetekben kifogásolhatók.

Kifogás esetén a hitelesítők újra végrehajtják a megbízható végrehajtási környezetekben. Mivel a végrehajtás determinisztikus, a hitelesítés bináris lesz: egyeznek-e a bájtok? Az egyezés hiánya a kötött tétből való levonást eredményez. Az üzemeltető pénzt veszít, a kifogás emelők és a hitelesítők pedig pénzt kapnak.

A gazdasági tervezés célja, hogy a csalás negatív várható értékű legyen, ha a vitatás valószínűsége egy bizonyos küszöböt átlép.

Mi épül most

A közvetlen alkalmazások egyértelműek: előrejelző piaci döntőbírók, akiknek ítéletei reprodukálhatók és ellenőrizhetők, kereskedési ügynökök, akiknél minden döntés naplózásra kerül és vitatható, valamint kutatási eszközök, amelyeknél az eredmények nem bizalom, hanem újrafuttatás révén kerülnek peer-review-ra.

Az általánosabb tendencia itt összhangban van a vállalkozások növekvő érdeklődésével a determinisztikus mesterséges intelligencia iránt a szabályozási követelményekkel terhelt szektorokban. Az egészségügy, a pénzügy és a jogi alkalmazások egyre inkább igénylik azt a fajta reprodukálhatóságot, amelyet a valószínűségi rendszerek nem tudnak garantálni.

Hogy az EigenAI 2%-os felára elfogadható-e a nagyfrekvenciás alkalmazások számára, az még kérdéses. De a jelentős tőkét kezelő autonóm ügynökök számára a végrehajtás integritásának bizonyítására való képesség megérheti a teljesítményadót.

A teljes fehér könyv részletesen bemutatja a formális biztonsági elemzést, a kernel tervezési specifikációkat és a slashing mechanizmust azok számára, akik az infrastruktúrára építenek.

Kép forrása: Shutterstock

Via: Blockchain News