Tävling för studenter intresserade av AI.
AI Alignment Awards är en tävling som söker förslag på hur man på ett tillförlitligt sätt kan förstå och kontrollera avancerade AI-system. Priserna är upp till 100 000 dollar och den nya deadlinen är den 1 maj.
AI har utvecklats snabbt. Kommer detta att vara till nytta eller katastrofalt? AI Alignment Awards tror att detta kommer att bero på vår förmåga att på ett tillförlitligt sätt förstå och kontrollera avancerade AI-system - något som forskarna ännu inte vet hur de ska göra, inte ens med nuvarande modeller.
AI Alignment Awards håller i två tävlingar för att göra framsteg inom detta problem:
The Goal Misgeneralization Contest (baserad på Langosco et al., 2021 and Shah et al., 2022): AI lär sig ofta oavsiktliga mål. Målmissgeneralisering inträffar när en förstärkningslärande agent behåller sina förmågor out-of-distribution (OOD), men ändå strävar efter fel mål. Hur kan vi förhindra eller upptäcka målfelgeneralisering?
Shutdown Contest (baserat på Soares et al., 2015): Människor säger ibland: “Om AI:n håller på att gå överstyr kan vi bara stänga av den”, men detta kan vara en svår teknisk utmaning. Allt eftersom AI-system blir mer avancerade, hur kan vi designa eller träna dem så att de inte försöker hindra operatörer från att stänga av dem?
Det finns inget förkunskapskrav för att delta!
För mer information se AI Alignment Awards hemsida.