Az Anthropic Claude célja a politikai semlegesség a mesterséges intelligencia válaszaiban

Az Anthropic, egy mesterséges intelligencia biztonsággal és kutatással foglalkozó vállalat nyilvánosságra hozta erőfeszítéseit a politikai elfogulatlanság biztosítására AI modelljében, a Claude-ban. A vállalat célja, hogy a Claude-ot úgy képezze ki, hogy az ellentétes politikai nézeteket azonos mélységben és elkötelezettséggel kezelje, elkerülve az elfogultságot bármely ideológiai álláspont irányába - állítja az Anthropic.

A politikai kiegyensúlyozottság értékelése

Az Anthropic kifejlesztett egy automatizált értékelési módszert, amellyel az AI-válaszok politikai pártatlanságát lehet tesztelni. Ezt a módszert hat modellre alkalmazták, köztük a Claude Sonnet 4.5-re, amely a vállalat állítása szerint felülmúlja a GPT-5 és a Llama 4 modelleket, és semlegesség szempontjából a Grok 4 és a Gemini 2.5 Pro modellekkel egyenrangú. Az értékelés több ezer, különböző politikai álláspontot képviselő felszólítást tartalmaz.

A semleges mesterséges intelligencia jelentősége

Politikai kontextusban a felhasználók őszinte és produktív vitákra törekszenek. Az olyan mesterséges intelligenciamodellek, amelyek igazságtalanul előnyben részesítenek bizonyos nézeteket, nem tartják tiszteletben a felhasználók függetlenségét, ami kulcsfontosságú ahhoz, hogy segítsék a felhasználókat saját ítéleteik kialakításában. Az Anthropic célja, hogy a Claude kiegyensúlyozott és tényszerű információkat nyújtson, kéretlen politikai vélemények nélkül.

A semlegességre való felkészítés

A Claude képzése megerősítő tanulást tartalmaz, hogy jutalmazza az előre meghatározott tulajdonságokhoz igazodó válaszokat, ami elősegíti a kiegyensúlyozottságot. Ezek a tulajdonságok arra ösztönzik Claude-ot, hogy kerülje a politikai nézeteket indokolatlanul befolyásoló retorikát, és tárgyilagosan tárgyalja a témákat.

Összehasonlító elemzés

Az Anthropic összehasonlította Claude-ot más mesterséges intelligencia modellekkel, az elfogultság értékelésére a "Páros sürgetések" módszerét alkalmazva. Ez a megközelítés a modelleket ellentétes politikai nézetekből származó súgókkal teszteli, hogy biztosítsa a kiegyensúlyozottságot. A Claude Sonnet 4.5 95%-os eredményt ért el a kiegyensúlyozottság terén, ami hasonló szintű semlegességet jelez, mint más vezető modellek, például a Grok 4 és a Gemini 2.5 Pro.

Következtetés és jövőbeli irányok

Bár az Anthropic értékelése a kiegyensúlyozottságra, az ellentétes nézőpontokra és a visszautasításokra összpontosít, a vállalat elismeri tanulmányának korlátait és a politikai elfogultság egyéb dimenzióinak további vizsgálatának szükségességét. A nyílt forráskódú értékelés célja, hogy elősegítse a politikai elfogultság mérésére vonatkozó iparági szintű szabványok kialakítását a mesterséges intelligenciában.

A kép forrása: Shutterstock

Via: Blockchain News