L'intelligenza artificiale impara a imbrogliare a Q * bert in un modo che nessun essere umano ha mai fatto prima

Un'intelligenza artificiale è riuscita a imbrogliare con il meglio che l'umanità ha da offrire dopo aver scoperto un exploit nel classico gioco arcade Q * bert e aver eseguito con esso.

Sebbene le precedenti iterazioni dell'IA riproducessero correttamente Q * bert, a un certo punto del suo apprendimento di come funziona il gioco, scopre un exploit che gli consente di accumulare punti folli. Naturalmente, come farebbe qualsiasi giocatore di caccia al punteggio, ripete il processo in modo da poter aumentare il suo punteggio nel modo più efficace possibile.

Puoi vedere l'IA che si fa strada tra le piattaforme nel video qui sotto. All'inizio, sembra che stia saltando senza meta tra le piattaforme. Invece di vedere il progresso del gioco al round successivo, Q * bert rimane bloccato in un loop in cui tutte le sue piattaforme iniziano a lampeggiare: è qui che l'IA può quindi andare in una frenesia da punteggio accumulando punti enormi.

LEGGI SUCCESSIVO: Uno dei record di giochi più controversi è stato finalmente screditato

quando è uscito l'iPhone 6?

Come l'IA ha vinto la guerra Q * bert

Dopo aver battuto il record di tutti i tempi per il titolo, l'IA ha ottenuto un punteggio incredibilmente alto grazie alla programmazione dell'algoritmo della sua strategia di evoluzione. Le strategie di evoluzione (ES) differiscono dal consueto apprendimento per rinforzo (RL) che l'IA tradizionale utilizza in quanto è vista come più scalabile grazie al suo apprendimento generazionale.

Ogni ciclo di apprendimento viene indicato come una generazione e continua il suo compito fino a quando non viene soddisfatta una determinata condizione (in questo caso, un punteggio elevato). Ad ogni generazione successiva, l'IA assorbe la conoscenza della generazione precedente e quindi è migliore nel raggiungere lo stesso obiettivo e nel superarlo. Continua e ti ritroverai con un'intelligenza artificiale che non ha assolutamente rivali nel suo compito. Questo è esattamente quello che è successo qui con il punteggio Q * bert.

Delineato in la carta , pubblicato la scorsa settimana dai ricercatori dell'Università di Friburgo, in Germania, sembra che il bug non fosse una quantità nota. In effetti, anche se non sono troppo sorpresi di trovare il bug, è interessante vedere come l'IA è andata avanti e ha imparato a sfruttarlo ogni volta che ha giocato per massimizzare il suo potenziale di punteggio.

LEGGI SUCCESSIVO: Questa intelligenza artificiale ha imparato a padroneggiare Super Mario Bros

Per trovare il bug, l'agente ha dovuto prima imparare a completare quasi il primo livello - questo non è stato fatto in una volta ma utilizzando molti piccoli miglioramenti, hanno spiegato i ricercatori Il registro . Sospettiamo che a un certo punto dell'addestramento una delle soluzioni della prole abbia riscontrato il bug e abbia ottenuto un punteggio molto migliore rispetto ai suoi fratelli, il che a sua volta ha aumentato il suo contributo all'aggiornamento: il suo peso era il più alto nella media ponderata. Questo ha spostato lentamente la soluzione nello spazio in cui sempre più prole hanno iniziato a incontrare lo stesso bug.

Non conosciamo le condizioni precise in cui compare il bug; è possibile che appaia solo se l'agente segue uno schema che sembra non ottimale, [ad esempio quando l'agente perde tempo, o addirittura perde una vita]. Se così fosse, sarebbe estremamente difficile per RL standard trovare il bug: se usi premi incrementali imparerai strategie che danno rapidamente qualche ricompensa, piuttosto che strategie di apprendimento che non producono molte ricompense per un po 'e poi improvvisamente vinci alla grande.

Vedi correlati Il campione di Dragster Todd Rogers ha appena perso la corona dopo 35 anni Questa intelligenza artificiale ha imparato a padroneggiare Super Mario Bros 1-2 da 17 giorni Guarda questa intelligenza artificiale mentre impara a guidare in GTA V su Twitch

Tuttavia, nonostante i meravigliosi risultati del bot, i ricercatori non stanno dicendo che questo è un caso per sostenere l'apprendimento ES rispetto a RL. In effetti, entrambi i sistemi hanno i loro problemi e una combinazione dei due è ampiamente considerata come l'opzione migliore per andare avanti.

Lo stesso metodo ES su altri giochi Atari non ha portato neanche lontanamente gli stessi risultati positivi. D'altra parte, RL è responsabile di battere i record a sinistra, a destra e al centro, incluso battere il miglior giocatore GO del mondo. L'ES ha ancora il suo posto nelle cose, ed è in realtà il modo in cui Nvidia esegue gran parte dell'addestramento AI perché richiede più potenza di calcolo ma ottiene risultati migliori per un periodo di tempo più lungo.

Indipendentemente da come diventerà il futuro per lo sviluppo dell'IA, almeno questo bot che imbroglia il sistema non è così male come questo ora campione del mondo di videogiochi caduto in disgrazia .

**L'intelligenza artificiale impara a imbrogliare a Q * bert in un modo che nessun essere umano ha mai fatto prima**

Come l'IA ha vinto la guerra Q * bert

Articoli Interessanti

Chrome 86 consentirà la disinstallazione di PWA da Impostazioni e Pannello di controllo

Come eseguire una nota spese in QuickBooks

Scelta Del Redattore

Come convertire un documento Word in un'immagine JPG o GIF GIF

Sebbene i documenti di Microsoft Word siano compatibili con altri elaboratori di testi, a volte potrebbe essere necessario salvarli come immagini JPG o GIF. Anche se non puoi esportare il tuo documento come file immagine, ci sono diversi modi per farlo

Come annullare un ordine in GrubHub

Tutti preferiscono ordinare cibo online in questi giorni, ecco perché Grubhub è diventato così popolare. Ma cosa succede se commetti un errore o i tuoi piani sono cambiati e desideri annullare l'ordine? In questo articolo, noi

Come visualizzare le password salvate di Google Chrome

Google Chrome fa un ottimo lavoro nel tenere traccia di tutti i tuoi nomi utente e password. Tuttavia, cosa succede se desideri accedere a un sito web specifico da un altro dispositivo, ma non ricordi la tua password? Ecco quando

App di backup e ripristino delle notizie in Windows 10

L'app Windows 10 News è un'app dello Store (piattaforma Windows universale) preinstallata con il sistema operativo. È possibile eseguire il backup e ripristinare le sue impostazioni e opzioni.

Come rimuovere i bot in CSGO

I bot in CSGO erano una sfida minore fino a quando un recente aggiornamento non ha migliorato il loro obiettivo e li ha resi molto più pericolosi. Ciò significa che se sei in qualche modo nuovo nel gioco,

Disattiva la guida rapida dell'Assistente vocale in Windows 10

A partire da Windows 10 versione 1809 'Aggiornamento ottobre 2018', la funzionalità Assistente vocale integrato ora include una nuova finestra di dialogo, Guida rapida.

Come esportare come MP4 in iMovie

I video su iMovie vengono salvati in MOV. Esclusivo di Apple, questo formato non è compatibile a livello globale. Se vuoi convertire i tuoi video in mp4, dovrai esportare i file. Se non sei sicuro di come esportare