Ik heb sinds kort een nieuw speeltje: een app van het bedrijf Beyond Verbal. Zij gebruiken kunstmatige intelligentie om uit ruwe opnames van iemands stem de verschillende emoties te destilleren en daaraan conclusies te verbinden. Zoek even op ‘Moodies’ in deAppstore of Playstore (gratis).
De app werkt heel simpel. Je drukt de opnameknop in tijdens een gesprek of toespraak en Moodies zal na twintig seconden live op het scherm gaan rapporteren. Moodies luistert niet naar de inhoud van wát er gezegd wordt, maar naar hoe de spreker zich op dat moment voelt. Elke paar seconden kan de stemming veranderen, en hoe langer Moodies meeluistert, hoe zekerder de app is van de einduitslag.
Ik maak er tegenwoordig een sportvan om tijdens congressen Moodies mee te laten luisteren. Als ik dan zelf aan de beurt ben, lees ik aan het publiek de resultaten voor. Zij zijn er vaak vanonder de indruk hoezeer de analyse van Moodies past bij het beeld dat zij zelf ook hadden bij een spreker.
Een plek waar emoties in stemherkenning al jaren een belangrijke rol spelen, zijn callcenters. Het kan haast niet anders of je hebt de volgende melding ook een keer gehoord: ‘Dit gesprek kan voor trainingsdoeleinden worden opgenomen.’ Tot voor kort dacht je misschien dat er evaluatiegesprekken zouden plaatsvinden tussen junior medewerkers en hun teamleiders. Dat ze de bandjes aan het einde van de dag gingen terugluisteren om uit te vinden waar nog ruimte voor verbetering was. Nalezing van deze column weet je dat met ‘training’ iets heel anders wordt bedoeld. Die gesprekken werden niet opgenomen om de menselijke medewerkers te trainen, maar om de algoritmen te trainen!
Elke keer dat je de melding te horen kreeg en niet de telefoon op de haak gooide gaf je het bedrijf toestemming jouw stem, jouw woorden, jouw frustratie, jouw complimenten en jouw feedback te gebruiken om de algoritmen te voorzien van nieuwe data. De callcentermedewerker kon tijdens het gesprek labels aanbrengen. ‘Deze meneer klinkt erg boos.’ Of: ‘Hij toont begrip.’
Het Amerikaanse bedrijf Mattersight heeft hier een succesvol model omheen gebouwd. Zij gebruiken zulke opnames en de notities om psychologische profielen samen te stellen. Inmiddels hebben zij meer dan 120 miljoen profielen opgebouwd, waarbij niet alleen gelet wordt op de inhoud van de gesprekken, maar ook op je ademhaling, tekenen van stress en tone of voice.
Vinden we dat OK? We zijn er inmiddels aangewend dat we op veel plekken gefilmd worden. De CCTV camera’s hangen overal en vaak kun je het bordje ‘u wordt gefilmd’ wel ergens zien hangen. Als je het daar niet mee eens bent, kun je besluiten om de ruimte niet betreden.
Maar bij een gesprek met een callcenter is dat anders. Laten we daarom die nutteloze mededeling ‘Dit gesprek kan voor trainingsdoeleinden worden opgenomen’ vervangen door een die de lading beter dekt:
Tijdens dit gesprek monitoren wij uw emotionele toestand om onze doelstellingen van dit kwartaal te halen. Toets een 1 om hiermee akkoord te gaan. Toets een 2 om dit uit te schakelen en door een onbevangen medewerker te woord te worden gestaan.