Welke route legt het FD af op het gebied van data science en analytics

Luc Meys (31) is Manager Business Intelligence & Marketing Intelligence bij het Financieele Dagblad. Hij praat ons bij over de nieuwste ontwikkelingen op het gebied van data science en advanced analytics bij het FD. Welke weg heeft het FD al afgelegd? En waar wil het meer dan 100-jarige bedrijf naartoe?

Hoe ver is het FD eigenlijk met data science?

“We hebben onlangs twee extra data scientists aangetrokken, omdat we van Google een bijdrage ontvangen vanuit hun Digital News Initiative (DNI). Hiermee steunt Google dataprojecten binnen nieuwsorganisaties. We werken voornamelijk aan het geautomatiseerd samenvatten van artikelen om op basis daarvan aanbevelingen te doen naar onze klanten. Niet alleen voor FD.nl, maar ook voor BNR. We knippen audiofragmenten uit uitzendingen en we doen luisteraars aanbevelingen op basis van wat ze eerder hebben geluisterd. Het idee daarbij is dat je bijvoorbeeld in de auto gaat zitten en dan naar de meest interessante content voor 20 minuten kunt vragen. En dat er dan geautomatiseerd een aflevering speciaal voor jou wordt gemaakt. Daar zijn momenteel flink wat data scientists, developers en data engineers mee bezig.”

Magnus-BI-FD-Media-interview-LucMeys

Interessant! Klopt het dat jullie dankzij Google aan data science zijn begonnen?

“Nee, we hadden al twee data scientists voor het maken van een nieuwsbrief met voorgestelde artikelen, een zogenaamde ‘recommendation engine’ en voor het verbeteren van de Company.info producten. Ook met het voorspellen van de customer journey (de weg die een klant aflegt om tot een handeling over te gaan, red.) zijn we al een tijd bezig. Dat kan zowel een abonnee van het FD, een luisteraar van BNR als een adverteerder zijn.”

Wat is er veranderd sinds jouw komst 2,5 jaar geleden?

“We hebben ons datawarehouse veel stabieler gemaakt en meer bronnen ontsloten. Zo kunnen we met één gestructureerd datawarehouse – en op een veilige en versleutelde manier – een totaalbeeld krijgen van de klant. We brengen – onder meer met Tableau – het gebruik van onze grootzakelijke klanten in beeld. Hoeveel bedrijven loggen er nu in? Hoe goed worden de producten gebruikt? Daar kunnen onze accountmanagers goed op inspringen. Ook voor journalisten hebben we interessante informatie. Welke artikelen hebben goed gescoord en waarom hebben die goed gescoord? Persoonsgegevens zijn daar niet interessant en wenselijk, trends zie je alleen op grote aantallen. Daarom hebben we er ook hard aan gewerkt ISO en GDPR compliant te zijn en werkt mijn team voor het overgrote deel met geanonimiseerde data.”

En hoe reageren de journalisten op deze informatie?

“De eerste keer dat ze dat inzicht kregen, was dat best hard voor ze. We proberen daarom echt samen met hen te kijken naar wat zij interessant vinden om te weten. De best-scorende artikelen vonden zij eigenlijk niet zo interessant, dat wisten ze wel vanuit hun dagelijkse inzichten. Zij wilden juist weten welke artikelen heel slecht worden gelezen. Want die heb je eigenlijk voor niemand zitten schrijven en daarin valt er heel concreet iets te verbeteren.”

Dus na zo’n honderd jaar weten journalisten eindelijk hoe hun artikelen worden gelezen?

“Ja, het was altijd al heel lastig om erachter te komen wat men in de krant leest. Als je surveys houdt, zeggen mensen gemiddeld 20 minuten per dag de krant te lezen. Dat is puur op gevoel. Nu kun je zien hoe lang mensen echt bij een artikel blijven hangen.”

En is dat het doel: meer leestijd van abonnees?

“Jazeker, engagement is een belangrijk doel. Je wilt dat je lezers betrokken zijn bij je product. Journalisten worden daarop gestuurd, bijvoorbeeld door in een artikel te verwijzen naar andere artikelen. Bij de historie over Bugaboo hadden we bijvoorbeeld een mooi drieluik: je las een artikel over Bugaboo en dat linkte weer door naar een volgend artikel over Bugaboo en zo verder terug in de historie. Dan raak je ook de longtail aan, het recyclen van artikelen. Want normaal is een artikel maar heel kort qua relevantie en nieuwswaarde. Dat is natuurlijk best zonde.” 

Dus meer doen met bestaande content?

“Ja, daarom zijn we ook met dossiers gaan werken. Bijvoorbeeld een dossier over Tesla, waarin je alle artikelen over Tesla kunt zien. Journalisten zijn begonnen om content te taggen, waardoor artikelen goed te groeperen zijn. Lezers kunnen die tag volgen. Stel je wilt de woningmarkt volgen, dan krijg je automatisch nieuwe artikelen over dat onderwerp in ‘mijn nieuws’. Zo kun je nieuws ook recyclen of aanbieden naast de voorpagina. Maar je ziet wel dat het mensenwerk is en als je daar BI op gaat toepassen is dat soms lastig. De ene persoon heeft net een andere interpretatie bij zo’n tag dan een ander. Overigens willen we het taggen via het Google project gaan automatiseren, zodat je met data science automatisch tags kunt toevoegen.”

Hoe zit het, naast data science, eigenlijk met advanced analytics?
Hoe zetten jullie dat in?

“We gebruiken dat vooral om een integraal beeld te krijgen van onze business. Dat we op alle fronten weten welke kanalen converteren en welke delen van de online omgevingen goed presteren. We hebben dagelijkse dashboards, waarin we zien hoeveel abonnees erbij zijn gekomen, hoeveel mensen zich hebben geregistreerd op FD.nl, wat het aantal bezoekers zijn en wat de best gelezen artikelen van gisteren waren. Zo kun je grote trends inzien en weet je of je goed op weg bent. Hiermee zien we in één keer hoe gisteren was en hoe dat komt. Dat is wel echt het gaafste.”

Zeker gaaf! Wat is eigenlijk je grootste uitdaging?

“Om de organisatie datagestuurd te laten werken. We hebben een redelijk team (7 mensen, red.), maar binnen de hele organisatie zijn we vrij klein. Onze missie is dat mensen uit zichzelf de data in gaan duiken. Dus via SAP BO rapportages of via Tableau dashboards, waar ze ook zelf op door kunnen klikken. Zodat ze zelf inzichten creëren en onze afdeling alleen maar de faciliterende partij is die advies geeft en zorgt dat de dashboards steeds beter en specifieker worden. Aan de andere kant staat privacy ook hoog in het vaandel, wat betekent dat we altijd een gezonde keuze tussen details en privacy maken.”

Waar wil je de komende jaren naartoe?

“We hebben onze hele BI-strategie bepaald met behulp van het BI Maturity Model. Eerst heb je de ad hoc fase, vervolgens ga je naar het standaardiseren van rapportages, dan ga je naar BI self-service. Dat is waar we nu zijn. Uiteindelijk wil je dat het predictive wordt, dat BI al gaat voorspellen wat de volgende stap is. Bijvoorbeeld: welke klantgroepen gaan weg, welke klantgroepen moet je gaan converteren, en welke zijn niet betrokken bij ons product. Dat is het walhalla waar ik naartoe wil. Maar ik denk dat BI selfservice, waarbij mensen zelf echt enthousiast worden over de data en op basis daarvan gaan beslissen, ook al heel mooi is. Echt data gedreven werken kost heel veel tijd en moeite, om mensen daarin mee te krijgen.” BI-business-intelligence-maturity-modelBI Maturity Model

Hoe werk je daar concreet naartoe?

“Aan het begin van het jaar bepaal ik met onze CFO waar we globaal naartoe willen als BI organisatie. Vervolgens zet ik dat samen met het team om naar deelgebieden. Wat is daarin SAP, wat is online, wat is marketing? En dat vertalen we vervolgens naar kwartaaldoelen. Het hele team werkt met kwartaaldoelen. Expres niet naar een jaar toe, dat is vaak te abstract en te ver weg. Kwartaaldoelen zijn behoorlijk concreet. Iedereen werkt ernaar toe om ze te halen. Vervolgens worden de kwartaaldoelen vertaald in wekelijkse sprints in Jira. Op deze manier blijf je constant met z’n allen in beweging.”

Heb je tenslotte nog een tip voor andere BI organisaties?

“Probeer aan de ene kant te zorgen voor structuur (qua data), maar zorg ook dat je naar de organisatie treedt met wat je wel hebt. Veel analisten hebben het in zich om gesloten te blijven en pas iets op te leveren als het helemaal perfect is, maar dan krijg je de business niet meer mee. Dus kom liever, en dat doen we bij dashboards steeds meer, met een dashboard met twee grafieken. En probeer op basis daarvan, samen met de business owner, om het steeds beter en mooier te maken. Anders lever je eerst een hele Mercedes op om er vervolgens achter te komen dat ze eigenlijk iets anders nodig hebben. Begin dus liever met een prototype, zodat je iets kunt laten zien. En als het niet werkt, kill het dan ook. Als een dashboard niet genoeg pageviews heeft, dan gaat de stekker eruit en proberen we iets anders.”

Over FD Mediagroep

FD Mediagroep is het toonaangevende informatiebedrijf in het financieel-economische domein. FD Mediagroep biedt ondernemers, bestuurders en beslissers toegang tot actuele, onafhankelijke en relevante informatie en het bijbehorende netwerk.

Magnus & het FD

Het FD is al sinds 2002 een belangrijke opdrachtgever van Magnus. Wat begon met SAP Media projecten, is uitgegroeid tot een vaste plaats voor Ton van Velzen in het BI team bij het FD.

“Voor alle gave data science projecten die we doen is het belangrijk dat het datawarehouse op orde is en dat er structuur is. Dat regelt Magnus. Ton zorgt voor de hardcore BI en waarborgt de stabiliteit en continuïteit van het BW en Business Objects systeem, de core. En hij is een grote kennisbank voor alles wat uit SAP gehaald wordt. Daar zit een behoorlijke complexiteit in en er moeten regelmatig aanpassingen in worden gemaakt. Het fijne van Ton is dat hij ons op scherp zet en een andere kijk op zaken heeft, ook omdat hij als consultant bij meerdere organisaties zit. Ton heeft net wat diepere expertise dan we intern hebben. En natuurlijk vinden we de flexibiliteit ook fijn. Mooie gerealiseerde trajecten zijn het sales dashboard en het oplage dashboard die Ton heeft geïmplementeerd. Beiden worden nu door de organisatie ook echt als de ‘version of the truth’ gezien.” FD-LucMeysLuc Meys

Waar werken jullie op dit moment samen aan?

“In de afgelopen jaren is er een hele wildgroei ontstaan aan rapportages en hebben we een stukje datawarehouse waarin complexiteit en logica in allerlei lagen zit. We maken goede stappen om de rapportagestructuur te versimpelen en het systeem agiler maken. Daarbij zijn simpel en transparant de key words. Vooral het versimpelen van de logica die wordt gebruikt voor de extractie van de data vanuit de bronsystemen, zodat je zo min mogelijk discussie krijgt. Daar zijn analisten namelijk heel veel tijd aan kwijt en je krijgt bovendien steeds andere uitkomsten. Het moeten gewoon klinkklare definities zijn, zodat je weet wat de waarheid is. Daar is Ton in SAP mee bezig en ik in ons eigen Amazon datawarehouse. En zo draagt Magnus bij om het FD een stukje hoger in het BI maturity model neer te zetten.”