Innovatie in industriële automatisering in stroomversnelling
Bij Batenburg Beenen zijn we voortdurend bezig om voorop te lopen in technologie. Zodat we onze opdrachtgevers en relaties met onze smarter focus kunnen helpen aan een brighter tomorrow. De opkomst van zelflerende algoritmes helpt ons te innoveren en passende oplossingen te vinden voor onze opdrachtgevers. Zo werken we sinds kort aan 'reinforcement learing', waarmee we intelligentie kunnen vinden in omgevingen met weinig data en/of gedrag hieruit kunnen herkennen.
Meer informatie?
Alex van Dalen
Managing Director
Wat is reinforcement learning?
Reinforcement Learning (RL) is een vorm van machine learning waarbij een "agent" beslissingen leert te nemen door autonoom acties te ondernemen in een omgeving om bepaalde doelen te bereiken. Het proces houdt in dat de "agent" interactie heeft met zijn omgeving, acties onderneemt op basis van zijn huidige toestand en feedback ontvangt in de vorm van beloningen of straffen om de beste strategieën of het beste beleid te leren voor het selecteren van zijn acties.
Als AI Engineer bij Batenburg Beenen is Madhur Madhur dagelijks bezig met het optimaliseren van deze zelflerende software. In principe ontstond de behoefte om een robot van A naar B te laten bewegen zonder gehinderd te worden door obstakels die hij op de route tegenkomt. Op dit moment kunnen de robots vast komen te zitten bij een obstakel en moet een engineer handmatig programmeren hoe elk obstakel op de route vermijd moet worden, zodat de robot toch zijn actie kan uitvoeren. Met behulp van reinforcement learning kan de robot zelf bepalen hoe hij obstakels moet vermijden en acties ondernemen om een geoptimaliseerde route van A naar B te genereren.
Simulaties
Testen in ‘real life’ is vaak te duur en te gevaarlijk. Door simulaties kunnen alle onzekerheden al gemodelleerd worden: rapid prototyping. Testen gaat hierdoor veel sneller. Met simulaties trainen we de agents al klaar voordat ze daadwerkelijk in de robot worden geïmplementeerd. Dit zorgt er ook voor dat ze , wanneer ze in de robot zitten, makkelijker gefinetuned kunnen worden omdat ze al bekend zijn met de situatie. Zelfs wanneer er geen data is, kunnen we bij Batenburg Beenen met een probleemstelling aan de slag middels simulaties.
De toekomst van reinforcement learning
De komst van Reinforcement Learning biedt een positief toekomstbeeld. Door het zelflerende vermogen is er steeds minder programmering en data nodig en dit geeft engineers de mogelijkheid om efficiënter te werken. Robots worden ook steeds nuttiger voor dagelijkse werkzaamheden, want het zelflerende vermogen geeft ze de mogelijkheid om zich sneller en wendbaarder te ontwikkelen. In tegenstelling tot voorgeprogrammeerde situaties die in de huidige industrie gebruikt worden kan met behulp van reinforcement learning een robot in dynamische omgevingen werken.