Process Mining en bezoekersgedrag

Het analyseren van het bezoekersgedrag op een website is een van de fundamenten van content-marketing en content-targeting. Daarvoor zijn verschillende tools beschikbaar zoals Google Analytics. Een softwaretool die misschien niet voor de hand ligt maar wel goed toepasbaar is, is de Process Mining tool Disco van Fluxicon. Disco is een applicatie waarmee processen geanalyseerd kunnen worden. We kunnen het gedrag van een bezoeker zien als een proces. Immers tijdens een sessie voert hij verschillende acties uit, namelijk het bezoeken van pagina’s op een website. Voor een ‘process-mining’ analyse heb je drie elementen nodig: Cases, Events en Timestamps. En al deze elementen hebben we tot onze beschikking wanneer we het klikgedrag van een bezoeker vastleggen, namelijk de bezoekerssessie als Case, de bezochte pagina’s als Events en de bezoektijd als Timestamp. Hieronder staat een voorbeeld van dergelijke data.

Importeren we deze data in Disco dan kunnen we een ‘process map’ maken. Hierin zien we het verloop van de bezoeken aan de website. De donker gekleurde pagina’s worden veel bezocht. Ook zie je in dit overzicht langs welke paden de bezoeker de pagina’s bezoekt.

Met Disco kun je Case varianten analyseren. Een Case variant is in onze web toepassing een typisch klik-pad dat door een aantal bezoekers is afgelopen. Disco laat zien welke Case varianten er zijn, welke pagina’s er per Case worden bezocht en door hoeveel bezoekers de Case variant wordt bewandeld. Ook de verdeling in de tijd wordt getoond. Zie de afbeelding hieronder.

Case varianten zijn interessant omdat je hiermee het klikgedrag van bezoekers classificeert in verschillende ‘type klikpaden’. Elke variant stelt in feite de uitvoering van een taak/transactie voor die een groep bezoekers heeft uitgevoerd. Met de filter-functie kun je Case varianten filteren. Bijvoorbeeld dat een pagina of groep van pagina’s altijd voorkomt in het klikpad. Op deze manier kun je succesvolle taken/transacties eruit filteren. Of juist de niet-geslaagde taken/transacties. Een voordeel van het toepassen van een process-mining tool als Disco is dat je het individuele gedrag van bezoekers aan de hand van uitgevoerde ‘Cases’ (lees klik-gedrag)  in kaart brengt en kunt analyseren. Meer weten? Stuur een e-mail naar Info CMEdge.

Process Mining

Process-mining is een recente loot aan de Big Data boom. Met process-mining proberen we een link te leggen tussen data georiënteerde analyse technieken en de business-model processen.

Belangrijk verschil met data-mining is dat process-mining gebaseerd is op het registreren en analyseren van events. Zo’n verzameling events kan bijvoorbeeld de afhandeling van een schade bij een verzekeraar zijn, het behandelingsprotocol van een specifieke aandoening in een ziekenhuis of de afhandeling van reparatieverzoeken bij een woningbouw corporatie.

Vanuit de business worden processen vastgelegd. Als je bij de uitvoering van het proces een aantal zaken registreert (denk aan rollen en uitgevoerde handelingen), dan is de kunst van process-mining om uit de event data het werkelijke business proces te ontdekken (discovery). Vanuit het vastgestelde werkelijke gedrag kunnen we vervolgens kijken in hoeverre het ‘theoretische’ business proces ook in werkelijkheid wordt uitgevoerd: conformance. Zitten er verschillen tussen  de theorie en de praktijk, dan kun je vervolgens verbetermaatregelen (enhancement) opstellen en uitvoeren.

Voor process-mining heb je een eventlog nodig waarin feitelijk maar drie basisgegevens hoeven te staan: een case, een actie en een timestamp. Met deze drie gegevens kun je een analyse maken van het proces. Hiervoor zijn verschillende softwaretools beschikbaar. Bijvoorbeeld Disco van Fluxicon. Dit programma is ontstaan uit onderzoek aan de Technische Universiteit in Eindhoven (TU/e) en is zeer geschikt als ‘instap’ voor process-mining. De grote broer van Disco is ProM. ProM is ook ontwikkeld aan de TU/e en is beschikbaar als ‘open source’.

Bij het analyseren van processen kunnen verschillende onderzoeksvragen van belang zijn. Hieronder staat een greep uit mogelijke vragen die gesteld kunnen worden:

  • – Wat is de minimale/maximale doorlooptijd van een case;
  • – Langs welke ‘knooppunten’ neemt een case teveel tijd in beslag;
  • – Wat is de gemiddelde afhandeltijd van een case;
  • – Waar liggen de knelpunt paden bij het doorlopen van een case;
  • – Verloopt de afhandeling wel volgens het afgesproken protocol;
  • – Welke maatregelen kunnen we nemen om knelpunten in de afhandeling op te lossen.

Softwarepakketten zoals hierboven genoemd kunnen deze vragen beantwoorden. Voorwaarde is wel dat je een ‘goede’ eventlog hebt die minimaal cases, acties en timestamps bevat.

Hieronder enkele voorbeelden van een process-mining analyse met Disco van Fluxicon.

    ProcessMining1  ProcessMining4
 ProcessMining2  ProcessMining3