WE 1
PÅ VÄG IN: NÄSTA AI-GENERATION KOMMER REVOLUTIONE
RA INDUSTRIN Den teknologiska utvecklingstakten går nu fort. Medan alla inom industrin fortfarande har fullt upp med att tala om och lära sig det nya begreppet »deep learning«, så är nu nästa AI-trend på väg att slå igenom: »Reinforcement Learning« (RL). »RL erbjuder en mer direkt påverkan på verksamheten och därför borde det redan nu satsas mer på detta område inom industrin«, säger Leonard Johard, doktor inom maskininlärning och en av världens främsta experter inom RL. TEXT: EWA ARVE Reinforcement Learning (RL). »Reinforcement Learning är en idé som har grott lika länge som de neurala nätverken i sig, men det fick sitt stora genombrott i forskarvärlden runt 2013. Det tog sin inspiration från tidiga studierna av dopaminsignalen i det mänskliga belöningssystemet. På grund av många lovande resultat är nu detta det hetaste forsknings- och tillämpningsområdet inom AI.«, säger Leonard Johard, doktor inom maskininlärning och en av världens främsta experter inom RL. Vad RL är Deep learning har blivit en term för den moderna formen av neurala nätverk. »Klassisk deep learning, utan reinforcement learning, innebär så kallad övervakad inlärning. I övervakad inlärning lär sig datorn att imitera ett samband. Ska vi till exempel styra en helikopter kan vi lära datorn att imitera pilotens reaktioner på helikopterns rörelser i luften. Det är ungefär som att ta flyglektioner genom att enbart sitta titta på piloter flyga på film. I bästa fall kan man bli lika bra som piloten på filmen och vi behöver mängder av filmrullar med en mänsklig pilot för att inte datorn ska feltolka pilotens tankesätt«, säger Leonard och fortsätter: »Reinforcement learning innebär istället att vi låter datorn ta spakarna och själv upptäcka hur man styr. Vi visar helt enkelt datorn helikopterns rörelser. Om datorn flyger energieffektivt och säkert ökar vi belöningen. Om piloten tappar kontrollen minskar vi belöningen. I stället för att spela in massor av filmer med människa ger vi den en säker simulatormiljö. Med tillräckligt många flygtimmar kan datorer bli bättre piloter än människor och just i helikopterfallet skedde detta redan för över tio år sedan.« Ett annat förhållande till tid En styrka med RL är att en dator har ett annat förhållande till tid och ett annat tålamod med upprepningar än vad människor har. Det innebär att en algoritm kan upprepa samma övningar om och om igen miljontals gånger på några timmar. »Reinforcement Learning är nu verklighet och har redan med stor framgång effektiviserat driften av vindkraftverk och energianvändningen i serverhallar«, säger AI-experten Leonard Johard. AI 10 är idag en mycket upphaussad vetenskap med många djup och stora bottnar. En av de idag mest uppmärksammade inriktningarna, som slog igenom redan 2006 men som först nu börjar tillämpas inom företag och industri, är det som kallas för »deep learning«. Inom forskningen är det nu en ny trend som kommer på stark frammarsch, 1986 NEURALA NÄTVERK 2006 DEEP LEARNING 2013 REINFORCEMENT LEARNING CA 2020 ARTIFICIELLA DRÖMMAR FYRA UTVECKLINGSSTEG INOM AI , ENLIGT LEONARD JOHARD