Blog Steven Groot | Eerder dit jaar hebben we al een artikel geplaatst over de nieuwste tool van SAP: Datawarehouse Cloud (DWC) als onderdeel van de SAP HANA Cloud Services. Met een release cycle van twee weken komen er regelmatig nieuwe features bij. Enkele verbeteringen of nieuwe functionaliteiten die direct in het oog springen zijn:

Deze zullen we hieronder kort toelichten.

Transformaties van CSV-bestanden

Voor de demo die we in het eerste artikel hadden opgezet, hebben we verschillende CSV-bestanden ingeladen. Het viel ons op dat alle kolommen toen standaard op String(5000) werden ingesteld. Dit vonden wij niet wenselijk.

Gelukkig is een van de recente toevoegingen de ‘Data Wrangler’ voor CSV-bestanden. Deze optie biedt de mogelijkheid om de te importeren data van te voren aan te passen. Zo herkent DWC inmiddels automatisch verschillende data typen, maar kunnen deze ook zelf nog gekozen worden. Ook kunnen er transformaties zoals Split, Extract, Replace of Filter op de kolommen worden toegepast.

Dit is een soortgelijke functie was al beschikbaar was voor DataModels in Analytics Cloud (SAC) die op een CSV waren gebaseerd. Dit is zeker een uitkomst en een welkome toevoeging!

Brondata

Er worden steeds meer verschillende soorten bronnen beschikbaar gesteld voor DWC. Natuurlijk de on-premise connecties via ABAP en HANA (met behulp van Data Provisioning Agent), maar nu ook de Microsoft SQL Server en Oracle databases. De meest flexibele connectie is de OData connectie. Dit is ook de enige connectie die beschikbaar is in de trial-versie.

Voor de bovenstaande bronnen is ook de Data Integration Monitor toegevoegd. Zo is in één overzicht eenvoudig te zien welke tabellen gerepliceerd worden en welke tabellen real-time zijn. Per tabel is ook zichtbaar hoeveel disk-space en memory-space in gebruik is.

Real-time tabellen nemen uiteraard weinig ruimte in beslag (de data blijft op het bronsysteem), maar dit kan in het gebruik van een SAC model wel zorgen voor een verminderde performance door netwerkverkeer.

In dat geval is de keuze tussen betere performance of meer cloud storage mogelijk door een real-time tabel te behouden of om deze te gaan repliceren.

3rd-Party data integratie

Naast de standaard connectoren die SAP in DWC beschikbaar heeft, zal er de mogelijkheid zijn om data van elke bron in DWC te laden via een algemene SQL interface. In dat geval kan een SQL-client gebruikt worden die integratie mogelijkheden met de bron heeft. Deze “pulled” de data uit de bron waarna het naar DWC “gepushed” wordt.

Eveneens zal er een SQL-interface beschikbaar komen voor het consumeren van data door 3rd-Party tools zoals Tablaeu of PowerBI. Mocht je een andere reportage tool gebruiken dan Analytics Cloud en je wilt toch gebruik maken van DWC, dan is het niet per se nodig om SAC te gebruiken.

Integratie van Analytics Cloud

SAP DWC bevat een volledig functionele versie van Analytics Cloud. Het is niet zo dat bepaalde functies vanuit DWC worden gedeactiveerd. Via de App Switcher is het mogelijk om tussen DWC en SAC te wisselen.

Het is echter wel zo dat bepaalde functionaliteit in de SAC versie van DWC nog niet werkt, omdat dit nog niet door DWC (als databron) word ondersteund. Dan valt te denken aan bijvoorbeeld het toevoegen van Variances op een Trend-chart.

Daarnaast is er nog een nieuwe functionaliteit beschikbaar voor bedrijven die al Analytics Cloud gebruiken: DWC kan nu als bron gekoppeld worden aan SAC in een andere Tenant (Cross-Tenant support). Hiervoor moet de SAC Tenant-URL worden ‘geautoriseerd’ in DWC via Systeem → Beheer → Appintegratie→ Vertrouwde herkomst toevoegen.

Let wel: ook in deze situatie zijn nog niet alle functionaliteiten van SAC volledig beschikbaar. In SAP Note 2932606 staat uitgelegd welke beperkingen er gelden.

Herkomst van data in analytische modellen

Wanneer er verschillende tabellen en analytical views zijn opgebouwd, kan het onoverzichtelijk worden waar bepaalde gegevens vandaan komen. Er kunnen bijvoorbeeld in een view tussentijdse berekeningen of joins zijn toegevoegd.
De nieuwe Lineage van een Analytical View laat dan exact zien waar de gegevens binnen de view vandaan komen. Wanneer een veld in de view wordt aangeklikt, dan lichten de gerelateerde knooppunten op:

MSALESQTY in de output is zo direct herleidbaar naar de bron tabel.
Ook in de business catalog in een lineage aanwezig. Daarvan worden de relaties getoond tussen de objecten die in de Data Builder beschikbaar zijn. Dus welke tabellen/views er gebruikt worden in een Analytical Data Set:

Conclusie

In de afgelopen maanden zijn er wederom grote stappen gemaakt met DWC. De tool begint echt vorm te krijgen en dat is veelbelovend.

Er ontbreekt nog wel de nodige functionaliteit (bijvoorbeeld een ingebouwde tijdsdimensie) om een volwaardig datawarehouse te zijn, maar met de tweewekelijkse release-cycle die SAP hanteert kunnen snel weer nieuwe functies bij komen.

Vanuit de roadmap van SAP is er nog wel een punt van aandacht te plaatsen. Hierin spreekt SAP van een drietal scenario’s qua data warehousing: On-Premise, Hybrid en Cloud.

DWC is goed in te zetten als volledige cloud oplossing (greenfield), maar ook als een Hybride scenario in combinatie met een bestaand On-Premise Data Warehouse. Veel bedrijven hebben in de afgelopen jaren hebben geïnvesteerd in een centrale data warehouse met een ’Single Point of Truth’. Via dit Hybride scenario is het nu mogelijk om deze gegeven uit te breiden met afdelingsspecifieke gegevens.

SAP zag namelijk dat afzonderlijke afdelingen data uit het centrale datawarehouse laden naar lokale schijven of andere platforms (zoals Azure en Amazon Web Services). Vervolgens werd die data verrijkt met externe gegevens, waarna de data buiten de governance van het centrale data warehouse valt en niet meer vanuit het centrale data warehouse geüpdatet wordt. De oplossing van SAP hiervoor is het gebruik van Spaces binnen DWC voor verschillende LoBs (Line of Business of Afdelingen). Zo kan men een virtuele omgeving gebruiken om de data in DWC te verreiken met externe data. Hierdoor blijft de data wel up-to-date en blijft de governance en security van DWC behouden.

SAP nodigt afdelingen dan ook uit om zelf met DWC aan de slag te gaan om zo het bestaande centrale data warehouse uit te breiden met de gegevens die men wenst, maar zonder de afhankelijkheid van de centrale IT afdeling.

Dit zou een scenario kunnen worden waarbij weer volop ‘gecowboyd’ kan gaan worden door afzonderlijke afdelingen binnen het DWC. Iets wat misschien niet zo wenselijk lijkt, maar wel overzichtelijker is dan het gebruik van meerdere platforms met allemaal hun eigen werkelijkheid.

Gebruikte bron: saphanacloudservices.com

Veel potentie dus, maar ook noodzaak om goed aandacht te besteden aan architectuur en governance. Meer weten? Neem Contact op met Vincent Beumer

10 + 5 =