Aflarea motivelor pentru care AIs sunt confuze de anumite jocuri
Când câștigul depinde de intuirea unei funcții matematice, AI-urile se confruntă cu dificultăți. Conform arstechnica.com, chiar și metodele de antrenament care funcționează excelent pentru șah eșuează în cazul jocurilor mult mai simple.
👉 Performanța Alpha în jocuri simple și imparțiale
Cu seria sa de AI-uri pentru jocuri Alpha, grupul DeepMind de la Google părea să fi găsit o metodă prin care AI-urile sale pot aborda orice joc, stăpânind jocuri precum șahul și Go prin auto-joc repetat în timpul antrenamentului. Totuși, unele lucruri ciudate s-au întâmplat când oamenii au început să identifice poziții din Go care ar pierde în fața unor jucători relativ noi, dar care ar înfrunta cu ușurință un AI similar în jocul Go.
Deși înfrângerea unui AI la un joc de masă poate părea relativ trivială, poate ajuta la identificarea modurilor de eșec ale AI-ului sau a modurilor prin care putem îmbunătăți antrenamentul pentru a evita dezvoltarea acestor puncte oarbe de la început—lucruri care pot deveni critice pe măsură ce oamenii se bazează pe inputul AI pentru tot mai multe probleme. Un studiu recent publicat în Machine Learning descrie o întreagă categorie de jocuri unde metoda folosită pentru antrenarea AlphaGo și AlphaChess eșuează.
👉 Nim și provocările antrenării AI-ului
Jocurile în cauză pot fi remarcabil de simple, așa cum este exemplificat de un joc la care au lucrat cercetătorii: Nim, care implică doi jucători ce își iau rând pe rând la eliminarea bețișoarelor dintr-un tablou în formă de piramidă până când unul rămâne fără o mișcare legală. Nim constă în organizarea unui set de rânduri de bețișoare, cu rândul de sus având un singur bețișor, iar fiecare rând de sub el având cu două mai mult decât cel de deasupra.
Aceasta creează un tablou în formă de piramidă. Cei doi jucători își iau rândul în a elimina bețișoare din tablou, alegând un rând și apoi eliminând de la un item la întreaga conținută a rândului. Jocul continuă până nu mai există mișcări legale. Este un joc simplu care poate fi ușor învățat de copii. De asemenea, se dovedește a fi un exemplu critic al unei întregi categorii de seturi de reguli care definesc „jocurile imparțiale”. Acestea diferă de jocuri precum șahul, unde fiecare jucător are propriul set de piese; în jocurile imparțiale, cei doi jucători împărtășesc aceleași piese și sunt legați de același set de reguli.
Importanța lui Nim provine dintr-un teoremă care arată că orice poziție într-un joc imparțial poate fi reprezentată printr-o configurație a unei piramide Nim. Aceasta înseamnă că, dacă ceva se aplică la Nim, se aplică la toate jocurile imparțiale. Una dintre caracteristicile distinctive ale lui Nim și altor jocuri imparțiale este că, în orice moment al jocului, este ușor să evaluezi tabloul și să determini care jucător are potențialul de a câștiga.
Pe scurt, poți analiza tabloul și știi că, dacă continui să faci mișcările optime de acum înainte, probabil vei câștiga. Asta necesită doar să introduci configurația tabloului într-o funcție de paritate, care face calculele pentru a-ți spune dacă ești în avantaj. (Desigur, persoana care câștigă în acel moment ar putea face o mișcare suboptimă și ar putea ajunge să piardă. Iar seria exactă de mișcări optime nu este determinată până la final, deoarece va depinde de exact ceea ce face adversarul tău.)