Ben Fielding: Fielding: A gépi intelligencia decentralizálása

Egy zajos íróasztallal kezdődött. Az íróasztal egy fából készült fülke volt az észak-angliai Northumbria Egyetem egyik laboratóriumában, ahol egy fiatal mesterséges intelligencia kutató kezdte meg a doktori pályafutását. Ez 2015-ben történt. A kutató Ben Fielding volt, aki a korai GPU-kkal teletömött nagy gépet épített a mesterséges intelligencia fejlesztéséhez. A gép olyan hangos volt, hogy zavarta Fielding labortársait. Fielding az íróasztal alá zsúfolta a gépet, de az olyan nagy volt, hogy a lábait kényelmetlenül oldalra kellett dugnia.
Fieldingnek volt néhány szokatlan ötlete. Azt vizsgálta, hogy a mesterséges intelligencia "rajok" - sok különböző modellből álló klaszterek - hogyan tudnának egymással beszélgetni és tanulni egymástól, ami javíthatná a kollektív egészet. Egyetlen probléma volt csak: az íróasztala alatt álló zajos gép valósága bilincsbe verte. És tudta, hogy túlerőben van. "A Google is végezte ezt a kutatást" - mondja most Fielding. "Nekik több ezer [GPU] volt egy adatközpontban. Amit csináltak, az nem volt őrültség. Ismertem a módszereket... Rengeteg javaslatom volt, de nem tudtam lefuttatni őket."
Ben Fielding, a Gensyn vezérigazgatója a torontói Consensus 2025 konferencia egyik előadója.
Jeff Wilser a The People's AI: The Decentralized AI Podcast házigazdája, és a Consensus 2025 konferencián az AI Summit házigazdája lesz.
Egy évtizeddel ezelőtt Fieldingre rájött a dolog: A számítási korlátok mindig problémát jelentenek. 2015-ben már tudta, hogy ha a számítási kapacitás az akadémián kemény korlát volt, akkor az feltétlenül az lesz, amikor az AI mainstream lesz.
A megoldás?
Decentralizált AI.
Fielding 2020-ban (Harry Grieve-vel együtt) társalapította a Gensyn-t, vagyis évekkel azelőtt, hogy a decentralizált AI divatba jött volna. A projekt kezdetben a decentralizált számítási rendszer kiépítéséről volt ismert - és erről beszélgettem Fieldinggel a CoinDesk számára és konferenciákon panelről panelre -, de a vízió valójában valami szélesebb körű: "A gépi intelligencia hálózata". Megoldásokat építenek a technológiai stack felfelé és lefelé.
És most, egy évtizeddel azután, hogy Fielding zajos íróasztala bosszantotta a laboros társait, a Gensyn korai eszközei már a vadonban vannak. A Gensyn nemrég adta ki az "RL Swarms" protokollját (amely Fielding doktori munkájának leszármazottja), és nemrég indította el a Testnetet - amely a blokkláncot is bevonja a rendszerbe.
Az AI Summitot megelőző beszélgetésben a torontói Consensusban, Fielding alapozót ad az AI Swarmsról, elmagyarázza, hogyan illeszkedik a blokklánc a kirakósba, és megosztja, hogy miért kellene minden újítónak - nem csak a technológiai óriásoknak - "joga lenne gépi tanulási technológiákat építeni."
Az interjú tömörítve és enyhén szerkesztve lett az érthetőség érdekében.
Gratulálunk a Testnet elindításához. Mi a lényege?
Ben Fielding:
Melyek voltak ezek az eredeti, blokklánc előtti funkciók?
Az RL [Reinforcement Learning] Swarmot néhány hete indítottuk el, ami megerősítő tanulás, a tréning után, mint egy peer-to-peer hálózat.
Ez a legegyszerűbb, ha így gondolkodunk róla. Amikor egy előre betanított modell átmegy az érvelő képzésen - mint a DeepSeek-R1 -, megtanulja kritizálni a saját gondolkodását, és rekurzívan javul a feladattal szemben. Ezután képes javítani a saját válaszán."
Ezt a folyamatot egy lépéssel továbbvisszük, és azt mondjuk: "Nagyszerű, hogy a modellek kritizálják a saját gondolkodásukat és rekurzívan javítanak. Mi lenne, ha más modellekkel is beszélgethetnének, és kritizálhatnák egymás gondolkodását?". Ha sok modellt összehozol egy csoportba, amelyek mind tudnak egymással beszélni, akkor elkezdhetik megtanulni, hogyan küldjenek információt a többi modellnek... azzal az általános céllal, hogy magát az egész raj javuljon."
Gotcha, ez megmagyarázza a "Swarm" nevet."
Rendben. Ez az a képzési módszer, amely lehetővé teszi, hogy sok modell mintegy párhuzamosan kombinálódjon, hogy javítsa a végső metamodell eredményét, amelyet ezekből a modellekből hozhat létre. Ugyanakkor minden egyes modell önmagában is javul. Ha tehát Ön egy MacBookon lévő modellel érkezne, csatlakozna egy órára egy rajhoz, majd visszalépne, akkor a rajban lévő tudás alapján egy továbbfejlesztett helyi modellje lenne, és a rajban lévő többi modellt is továbbfejlesztette volna. Ehhez a kollaboratív képzési folyamathoz bármelyik modell csatlakozhat, és bármelyik modell elvégezheti. Szóval ez az RL Swarm.
Oké, szóval ez az, amit néhány hete adtál ki. Most hol jön a képbe a blokklánc?
A blokklánc tehát azt jelenti, hogy az alacsonyabb szintű primitívek egy részét továbbvisszük a rendszerbe.
Tegyünk úgy, mintha valaki nem értené az "alacsonyabb szintű primitívek" kifejezést. Mit értesz ez alatt?
Igen, tehát úgy értem, hogy nagyon közel magához az erőforráshoz. Tehát ha a szoftver stackre gondolsz, van egy GPU stacked egy adatközpontban. A GPU tetején vannak meghajtók. Vannak operációs rendszerek, virtuális gépek. Mindezek a dolgok felfelé haladnak.
Az alacsonyabb szintű primitív tehát a legközelebb áll a technológiai stack alsó alapjához. Jól értem?
Igen, pontosan. Az RL Swarm pedig alapvetően annak demonstrációja, hogy mi minden lehetséges. Ez csak egy kissé hevenyészett demonstrációja annak, hogy igazán érdekes, nagy léptékű, skálázható gépi tanulást végezzünk. A Gensyn azonban az elmúlt több mint négy évben az infrastruktúra kiépítésével foglalkozott. És most ebben az időszakban vagyunk, amikor az infrastruktúra a v0.1 béta szintjén van. Minden készen van. Készen áll az indulásra. Ki kell találnunk, hogyan mutassuk meg a világnak, hogy mi lehetséges, amikor ez elég nagy változást jelent abban, ahogyan az emberek a gépi tanulásról gondolkodnak.
Az úgy hangzik, mintha sokkal többet csinálnátok, mint decentralizált számítást, vagy akár infrastruktúrát?
Három fő komponensünk van, ami az infrastruktúránk alatt helyezkedik el. Végrehajtás - következetes végrehajtási könyvtárakkal rendelkezünk. Van saját fordítóprogramunk. Vannak reprodukálható könyvtáraink bármilyen hardvercélhoz.
A második darab a kommunikáció. Tegyük fel, hogy egy modellt a világ bármelyik kompatibilis eszközén futtathatsz, de el tudod érni, hogy beszéljenek egymással? Ha mindenki ugyanazt a szabványt választja, akkor alapvetően mindenki úgy tud kommunikálni, mint a TCP/IP az interneten. Így építjük ezeket a könyvtárakat, és az RL Swarm egy példa erre a kommunikációra.
Végezetül pedig az ellenőrzés.
Ah, és gondolom, itt jön a képbe a blokklánc...
Képzeljünk el egy olyan forgatókönyvet, amelyben a világ minden eszköze következetesen működik. Összekapcsolhatnák a modelleket. De vajon meg tudnak-e bízni egymásban? Ha összekötném a MacBookomat a tiéddel, igen, ugyanazokat a feladatokat tudnák végrehajtani. Igen, tudnának tenzorokat küldeni oda-vissza, de vajon tudják-e, hogy amit a másik eszköznek küldenek, az valóban megtörténik a másik eszközön, vagy sem?
A jelenlegi világban valószínűleg aláírnánk egy szerződést, hogy igen, egyetértünk abban, hogy az eszközeink a helyes dolgokat fogják csinálni. A gépi világban ennek programozottan kell történnie. Tehát ez az utolsó darab, amit felépítünk, kriptográfiai bizonyítások, valószínűségi bizonyítások, játékelméleti bizonyítások, hogy ez a folyamat teljesen programozható legyen.
Ez az a pont, ahol a blokklánc a képbe kerül. A blokklánc minden elképzelhető előnyét biztosítja, mint például a tartós személyazonosság, a fizetések, a konszenzus stb. A teszthálózattal most azt csináljuk, hogy fogjuk az RL Swarmot és a többi infrastruktúra alapelemeit, és hozzáadjuk a blokklánc-összetevőket, és azt mondjuk: "Hé, ha most csatlakozol egy rajhoz, akkor van egy állandó identitásod, ami egy decentralizált főkönyvben létezik."
A jövőben lesz lehetőséged fizetni, de most van ez a bizalmi konszenzusmechanizmus, amellyel megszüntethetjük a vitákat. Ez tehát a Gensyn jövőbeli infrastruktúrájának egyfajta MVP-je, amelyhez menet közben fogjuk hozzáadni a komponenseket."
Mondja el, hogy mi várható?
Amikor elérjük a főhálózatot, az összes szoftver és infrastruktúra a blokklánc ellenében működik, mint a bizalom, a fizetések, a konszenzus stb. forrása, az identitás. Ez ennek az első lépése. Ez az identitás hozzáadása, és azt mondja, hogy amikor csatlakozol egy rajhoz, akkor regisztrálhatsz, mint ugyanaz a személy. Mindenki tudja, hogy ki vagy, anélkül, hogy valahol egy központi szervert vagy weboldalt kellene ellenőrizni.
Most vaduljunk el, és beszéljünk tovább a jövőről. Hogy néz ez ki egy év múlva, két év múlva, öt év múlva? Mi a sarkcsillag?
A végső vízió az, hogy az összes erőforrást, ami a gépi tanulás alatt van, azonnal programozottan elérhetővé tesszük mindenki számára. A gépi tanulást erősen korlátozzák az alapvető erőforrások. Ez létrehozza ezt a hatalmas árkot a központosított AI-cégek számára, de ennek nem kell léteznie. Nyílt forrásból is elérhető, ha meg tudjuk építeni a megfelelő szoftvert. A Gensyn tehát a mi véleményünk szerint az összes alacsony szintű infrastruktúrát megépíti, hogy ez a lehető legközelebb kerüljön a nyílt forráskódhoz. Az embereknek joguk kell, hogy legyen gépi tanulási technológiákat fejleszteni.
Ben Fielding
Via: CoinDesk: Bitcoin, Ethereum, Crypto News and Price Data