'Mensrobot' Fran Pepper wordt 1 jaar

Fran Pepper (bijna 1 jaar oud) en PXL-onderzoeker en robotica-expert Tim Dupont. — by Hogeschool PXL
Fran Pepper (bijna 1 jaar oud) en PXL-onderzoeker en robotica-expert Tim Dupont. — by Hogeschool PXL

In januari 2017 werd de humanoïde PXL-robot Fran Pepper onder massale persbelangstelling ingeschreven in het geboorteregister van Hasselt. Hoe is het met Fran bijna één jaar later? Herkent ze haar 'ouders' al? Kan ze al lopen, luisteren en praten? En hoe snel leert zo'n 'mensrobot' eigenlijk?

Flashback

Flashback naar januari 2017: met haar 1,20 m en 20 kg (droog aan de haak) is Fran in één klap de grootste en zwaarste boreling ooit in het Hasseltse geboorteregister. 'Ouders' Francis Vos (departementshoofd PXL-IT) en Astrid Hannes (PXL-directeur Onderzoek en Dienstverlening) zijn in de wolken, ook al heeft de geboorte/aankoop van hun dochter via de Japanse multinational SoftBank hun onderzoeksbudget wel 15.000 euro lichter gemaakt. Een scherpe, gerechtvaardigde prijs trouwens, want Pepper is qua prijs/kwaliteitsverhouding tot op de dag van vandaag de beste 'betaalbare' humanoïde robot op de markt wereldwijd.

Doel van het onderzoek, waarin zowel PXL-IT-onderzoekers als studenten (junior-collega's) betrokken worden: nagaan hoe we dit soort 'humanoïde' robots op alle vlakken slimmer kunnen maken door ze - net zoals baby's - gezichten te leren herkennen, te leren luisteren en te leren spreken. Als Fran dat kan, kan ze op termijn uitgroeien tot de perfecte receptioniste en PXL-ambassadrice.

(Te?) hooggespannen verwachtingen

Toegegeven, op het moment dat Fran Pepper in de PXL-community opgenomen wordt, zijn de verwachtingen hooggespannen. Te hooggespannen misschien, want Fran lost ze niet helemaal in.

Qua hardware is de robot ronduit schitterend: ze is heel uitnodigend en toegankelijk en roept met haar kinderlijke kreetjes zowel moederlijke als vaderlijke gevoelens op. Maar op het vlak van gezichtsherkenning, emotieherkenning en spraak zijn de eerste testresultaten teleurstellend: meer dan drie mensen herkennen is problematisch, Fran slaagt er alleen in extreme emoties (heel erg kwaad of heel erg droevig) te identificeren en haar spraak is zwak, nogal scripted en dus verre van natuurlijk. De parallel met een échte baby van enkele maanden oud is niet zo ver weg: een mooi wezentje, maar weinig mogelijkheid tot interactie.

16 PXL-laatstejaarsstudenten toegepaste informatica nemen de NAOqi-software van SoftBank grondig onder de loep en de conclusie is unaniem: als we willen dat Fran bijleert, dan moet ze geüpgraded worden met extra, betere software.

Fran Pepper in haar natuurlijke habitat: iSpace, Corda Campus.  — by Hogeschool PXL
Fran Pepper in haar natuurlijke habitat: iSpace, Corda Campus.  — by Hogeschool PXL

ROS

Die extra, betere software wordt ROS, Robot Operating System. Niet toevallig, want ROS is de Linux van de roboticasoftware, een absolute standaard, oorspronkelijk ontwikkeld door Stanford University maar al snel uitgegroeid tot een opensource platform dat wereldwijd door tal van universiteiten, kennisinstellingen en bedrijven wordt gebruikt. Tesla, Boeing of Siemens: hun roboticatoepassingen worden aangestuurd door ROS.

Hetzelfde gebeurt nu dus ook met Fran: we connecteren ROS met de bestaande NAOqi-software, sturen Fran vervolgens aan via ROS en connecteren met de sensoren in de robot. Op die manier krijgen we een soort van 'remote control' waarbij ROS de robot aanstuurt.

Gezichten herkennen

In een eerste fase wordt de gezichtsherkenning van Fran aangepakt en daarin speelt artificial intelligence een belangrijke rol. Door heel veel data en foto's toe te voegen, worden de algoritmes accurater en wordt de robot getraind in het herkennen van gezichten. We maken gebruik van TensorFlow en FaceNet en de resultaten zijn bemoedigend: wanneer we 20 foto's per persoon inladen, scoort Fran tot 90% accuraatheid op het herkennen van gezichten, in real time en met meerdere personen.

Slotsom

Ook een robot als Fran Pepper moet nog heel wat leren.
Ook een robot als Fran Pepper moet nog heel wat leren.

Dat is dan ook de stand van zaken momenteel: lopen kan Fran en gezichten herkennen ook. Op het vlak van luisteren en spreken is ze nog een echte baby. Via studentenprojecten hopen we haar spraak tegen juni 2018 aanzienlijk te verbeteren en daarin verwachten we ook veel van WaveNet, software die ervoor zorgt dat de spraak minder 'computerachtig' (lees: veel meer naturel) overkomt.

Kort samengevat: Fran mag dan geen échte baby zijn, toch vraagt ook haar groei- en leerproces heel wat inspanning en liefde. Ook voor robots geldt dat leren veel training en moeite vergt en dus zal Fran nog behoorlijk wat spreekwoordelijke boterhammetjes moeten eten, vooraleer ze haar job van PXL-receptioniste naar behoren kan uitvoeren.

Meer info

tim.dupont@pxl.be

This article was originally published on pxlexperts