Industrial analytics embedden in een organisatie

Bevindingen van het industrial data science congres 2019

Blog Thomas Jones – De verhalen die in de wandelgangen voorbij gaan over industrial analytics hebben vaak iets mythisch, alsof het over een droomwereld gaat. Maintenance engineers fantaseren over een wereld waarin ze geen preventief onderhoud meer hoeven te plannen, omdat de magie van het algoritme zijn gang wel gaat. Quality control specialisten stellen zich een werkelijkheid voor waarin steekproeven niet meer nodig zijn, omdat de procesdata perfect aangeeft welke producten defecten hebben. Productie managers wachten op de dag dat ze weken of zelfs maanden van tevoren met precisie kunnen voorspellen hoe veel productie ze moeten gaan draaien.

Het probleem met dergelijke verhalen is dat, hoewel ze op een fantastische manier de mogelijkheden van de toekomst schetsen, ze ook zo hoog gegrepen zijn dat de meeste mensen niet weten waar ze zouden moeten beginnen – met als resultaat dat er inderdaad maar weinig organisaties zijn die er ook echt mee aan de slag gaan. Het is een klassiek probleem: omdat het einddoel onmogelijk ver weg lijkt, is het moeilijk om de eerste stappen te nemen.

De werkelijkheid is dat er veel concrete, waardevolle en haalbare toepassingen zijn voor data science in een industriële setting, maar de meeste van deze toepassingen zullen een beperkte scope hebben en zich richten op het oplossen van een specifiek probleem voor de business. Net als in de medische wetenschap is er niet één middel dat alle problemen verhelpt, maar met een arsenaal aan middelen voor verschillende kwalen kom je toch nog een heel eind.

Op het Industrial Data Science (IDS) congres 2019 in Dortmund was het dus opvallend dat de nadruk niet lag op de techniek van een data science project, maar op de vraag hoe organisaties zichzelf kunnen positioneren om kansen voor industrial analytics vlug op te merken, op de juiste waarde te schatten en op een effectieve manier tot actie over te gaan. Bij verschillende sprekers komen uiteraard verschillende antwoorden op deze vraag, maar grofweg zijn ze terug te brengen tot drie categorieën: je hebt de juiste mensen nodig, de juiste manier van organiseren, en de juiste tools.

De juiste mensen

Het vermogen van een organisatie om rap industrial analytics projecten uit te voeren hangt vooral af van de mensen die daarbij betrokken kunnen worden. Data scientists liggen daarin zeker voor de hand – zonder professionals die bedreven zijn in statistiek en de relevante programmeertalen kun je niet beginnen.

Niet minder belangrijk, maar wellicht minder zichtbaar, zijn de functioneel georiënteerde experts die bekend zijn met de applicaties waar de informatie vandaan moet worden getrokken. Ze spelen een belangrijke rol in het begrijpen en interpreteren van de data, en kunnen aangeven wat de beperkingen zijn van de resultaten van je analyse. Veel data analytics projecten lopen uiteindelijk vast op data kwaliteit, dus het is belangrijk om deze mensen in een vroeg stadium aan te laten haken. Als je daarnaast een koppeling wilt leggen tussen analyse en actie in het productieve proces zijn deze mensen onmisbaar.

Daarnaast heb je het fenomeen “Citizen Data Scientists” – een term voor mensen die voldoende bekend zijn met statistiek en data science om kansen voor een oplossing te herkennen en daarop aan te kunnen sturen. Idealiter zijn deze mensen verspreid over je hele organisatie, zodat ze een natuurlijke link vormen tussen de business waar ze werkzaam zijn en het project. Ze kunnen de waarde van een oplossing toetsen en het project feedback geven over de daadwerkelijke inhoud van hun vakgebied.

De juiste projectorganisatie

Een van de meest uitdagende aspecten van industrial analytics projecten is ervoor zorgen dat het geen IT aangelegenheid wordt, waar de rest van het bedrijf zich vooral niet mee bemoeit, maar juist iets waar de business diep bij betrokken is. Naast de noodzaak voor bovenstaande rollen, met name ook de Citizen Data Scientists, is de juiste vorm van projectorganisatie ook belangrijk. Er zijn meerdere manieren om analytics projecten te embedden in een organisatie, maar tijdens het congres wordt meerdere malen impliciet of expliciet verwezen naar agile project methoden bij organisaties die succesvolle analytics projecten hebben uitgevoerd. Uiteraard is agile tegenwoordig een hippe term voor bedrijven die proactief bezig zijn met hun projectorganisatie, dus valt dit vast ook deels te verklaren door selection bias, maar er zijn kenmerken van agile project methoden die voordelen kunnen bieden voor analytics projecten ten opzichte van traditionele projectvoering.

Ten eerste hebben agile projectmethoden, zoals Scrum of DevOps, ingebouwde mechanismen om ervoor te zorgen dat projecten dicht tegen de business aan blijven zitten door te zorgen voor regelmatige feedback- en inputmomenten. Daarmee blijft de business niet alleen bij het huidige project aangehaakt, maar krijgen ze ook de kans om te leren wat wel en niet werkt binnen de organisatie. En het kan ze stimuleren om alert te blijven op andere kansen binnen hun vakgebied.

Ten tweede hebben juist kleine projecten – waar de meeste analytics projecten onder zullen vallen – relatief veel baat bij ‘gewoon beginnen’, zonder dat ze eerst moeten wachten op een volledig design document of een uitgebreide lijst met wensen en eisen. Een snelle, compacte proof-of-concept kan al helpen om vertrouwen te wekken bij de business, voor wie toepassingen van industrial analytics vaak nog onbekend zijn; of, als uit de eerste opstart al blijkt dat een bepaald project niet gaat werken – bijvoorbeeld vanwege gebrekkige data kwaliteit – dan weet je dit zo snel mogelijk, zodat je er geen onnodige tijd aan verspilt.

Ten derde is het concept van (steeds opnieuw) prioriteren van features en zelfs hele projecten, dat zo typerend is voor agile projecten, zeer geschikt voor het rappe tempo van technologische ontwikkeling op het gebied van analytics en data science. Dit geldt zowel binnen projecten (welke features bieden de meeste waarde aan onze gebruikers?),  als op portfolio niveau (welke projecten hebben de meeste waarde voor de doelstellingen van de organisatie?)

De juiste tools

Naast de juiste mensen en de juiste manier van organiseren is het belangrijk dat analytics projecten ondersteund worden met de juiste tools. Hierbij zijn er twee belangrijke uitdagingen: allereerst moeten teams snel analytics applicaties kunnen bouwen – liefst op zo’n manier dat ook functionele experts en citizen data scientists mee kunnen kijken om waar nodig bij te kunnen sturen. Daarnaast moeten deze applicaties op zo’n manier gebouwd worden dat het IT landschap binnen de organisatie beheersbaar blijft.

Op het congres werd veel gesproken over de data science specifieke applicatie Rapidminer, een programma dat de ontwikkeling van analytics applicaties versnelt en ook beheer ondersteunt. Dit had zeker ook te maken met de rol van Rapidminer als hoofdsponsor van het congres, maar de kwaliteit van de software blijkt uit de manier waarop het programma bij diverse deelnemers aan het congres al actief gebruikt wordt als centrale spil in hun analytics projecten.

Waar tijdens het congres niet over werd gesproken, maar wat zeker een belangrijke aanvulling is op de vakgebied-specifieke tooling van Rapidminer, is het gebruik van een algemene low-code development platform zoals Mendix. Hiermee kunnen niet alleen data analytics processen worden uitgevoerd, maar allerlei bedrijfsprocessen worden afgevangen en aangevuld. Dit maakt het eenvoudiger om de uitkomsten van analyses in te laten grijpen in een productief proces of bedrijfsprocedure.

In beide gevallen wordt het mogelijk om een applicatie in gebruik te nemen die beheerd kan worden door mensen die niet direct bij de bouw van het programma betrokken waren, maar voldoende kennis hebben van het platform. Daarnaast zijn dergelijke tools cloud-based, waardoor ze makkelijk schaalbaar zijn en in de toekomst uitgebreider of op andere plekken in de organisatie inzetbaar kunnen zijn.

De mythe doorbreken

Op een congres als IDS 2019 word je geconfronteerd met de werkelijkheid van industrial analytics projecten. Uiteraard word je fantasie geprikkeld door de hype van data science – er zijn ook echt een aantal grootse, gedurfde projecten de revue gepasseerd! Maar de belangrijkste bijdrage is wellicht het besef dat alledaagse, huis-tuin-en-keuken analytics projecten bij diverse organisaties al regelmatig worden uitgevoerd. Dit zijn successen die vaak achter de schermen zonder grote fanfare plaatsvinden, maar intussen wel bewijzen dat data analytics géén magic bullet is, maar nu al door organisaties toegepast kan worden.