Concept searching en gevoelige content

PII
Veel bedrijven, organisaties en overheden beschikken over content die privacy gevoelig is. In de VS noemen ze dat PII oftewel Personal Identifiable Information. PII is content waarmee je de identiteit van personen, eventueel in combinatie met andere content, kunt achterhalen. En daarmee zou je personen kunnen benaderen, benadelen of andere goede of slechte dingen meedoen.

Dit geldt niet alleen voor content in het publieke domein zoals het internet, maar zeker ook, en misschien wel vooral binnen een organisatie. Denk aan een intranet of CRM omgeving. Het probleem is echter dat veel van die content ongestructureerd is en daarom moeilijk te classificeren als PII.

Voorbeeld
Callcenters ontvangen veel content van hun klanten, leveranciers, medewerkers. Vaak in de vorm van e-mailberichten, documenten, social media updates en ge-scripte voicemail berichten. De inhoud bevat informatie over personen, producten of bedrijven in de vorm van vragen, complimenten maar ook klachten en bedreigingen. Meestal onschuldig, maar mogelijk ook vallend in de categorie PII.

In het kader van information governance zal een bedrijf of organisatie, zeker in de VS, zich hierom moeten bekommeren. Maar wie gaat al die content doorspitten en classificeren als PII of mogelijk PII? In veel gevallen is dat niet te doen en het wordt dan ook niet of halfslachtig gedaan.

Bestaande oplossingen voor dit probleem richten zich op het redigeren van de content alvorens die te publiceren of op het opsporen van PII content aan de hand van bijvoorbeeld reguliere expressies. Denk bij dat laatste aan het zoeken naar persoonsnamen, e-mail- en fysieke adressen, telefoonnummers, sentiment van de tekst. Een mogelijk alternatief is om Concept Searching in te zetten. Als onderdeel van Content Engineering kan Concept Searching een prima aanpak zijn om te bepalen of content wel of niet privacy gevoelig is.

Hoe werkt het
Door een gestructureerde thesaurus met samenhangende termen te definiëren kun je een netwerk van termen construeren waarmee je concepten kunt presenteren die een relatie hebben met gevoelige of privacy begrippen. Zo’n netwerk wordt ook wel een Concept Map genoemd. Binnen een Concept Map worden relaties gedefinieerd tussen begrippen en termen. Vind je een of meer specifieke termen, dan kun je via de Concept Map de verwante concepten bepalen. Op deze manier bepaal je in hoeverre content PII gevoelig is en op grond daarvan kun je besluiten de toegankelijkheid tot de betreffende content te beperken.

Voorbeeld van een Concept Map

Stel onderstaande tekst is de te onderzoeken content:
Ook dit jaar zal de man met de mijter op een wit paard weer rijden met zijn knecht. Deze laatste heeft vrijwel altijd een zak en roe bij zich. In de zak zitten kadootjes die hij door de schoorstenen gooit.

ConceptMap2

Concept Map Sinterklaasfeest

Met de Concept Map aanpak kunnen we met bovenstaande map achterhalen dat het om Sinterklaas en Zwarte Piet gaat, dat er Discussie rondom hun persoon is en dat ze in Spanje wonen. Verrassend niet?

Zwangerschap in Ghana App

Zwanger in Ghana
In een ver verleden hebben we ons in het kader van MVO bezig gehouden met een project rondom het begeleiden van zwangerschap op het platteland in het noorden van Ghana. Het idee was om een app te ontwikkelen waarmee zowel moeder- als geboortesterfte sterk gereduceerd zou worden. De bedoeling was dat deze app door lokale vroedvrouwen (Traditional Birth Attendants, TBA) gebruikt zou worden.

Traditional
Met de app zou de kennis bij het begeleiden van zwangerschap en geboorte op een hoger peil gebracht worden. Achterliggende gedachte was dat er minder beroep gedaan zou worden op de traditionele methoden van zwangerschapsbegeleiding. Deze methoden botsten nogal eens met de huidige gezondheidsinzichten. De relatief hoge sterftecijfers onder moeders en pasgeborenen waren vermoedelijk voor een belangrijk deel te wijten aan die traditional methoden.

Zwangerschap App Ghana Traditional Birth Attendant TBA CMEdge  Zwangerschap App Ghana Traditional Birth Attendant CMEdge  Zwangerschap App Ghana Traditional Birth Attendant CMEdge

Diagnose TBApp
Het resultaat van het project was een gedegen businessplan en een opzet voor de app. De app was gebaseerd op een diagnostische aanpak van mogelijke zwangerschapsproblemen. Praktisch probleem is dat er in het noorden van Ghana een paar honderd talen gesproken wordt en daarmee verviel het gebruik van teksten als navigatiemiddel.

Interface
Door gebruik te maken van beelden en slide-controles hebben we de interface maximaal ingericht op universele herkenning van begrippen, symbolen en het intuïtief invoeren van waarden (schuifregelaar). Voor een specifieke diagnose is een mock-up gemaakt. In de video hieronder kun je het resultaat zien.
Qua interface is het een prachtige oplossing die zeker ook in andere diagnostische app’s bruikbaar is.

Zo zie je maar weer dat een MVO project ook prachtige zaken kan opleveren.

Fuzzy metadata

Metadata worden steeds belangrijker bij het ontwerpen van een website. We willen geen navigatie meer die één op één een afspiegeling is van de manier waarop we de content aan de achterkant (manager) hebben georganiseerd. Daarom willen we metadata gebruiken om over de content heen een nieuwe  structuur aan te brengen die  beter aansluit op de verwachtingen en het jargon van de bezoeker.

Probleem is vaak het toekennen van metadata. Met welke metadata moeten we content nu precies categoriseren? Gaat het over Economie, gaat het over Politiek, gaat het over Sport? Vragen waarmee een redacteur kan worstelen en waarop niet zomaar 123 een antwoord is te geven.

Mix

In veel gevallen gaat het om onderwerpen die bijvoorbeeld een mix zijn van Economie en Politiek of Economie, Sport en Politiek, enzovoort. De voor de hand liggende oplossing is de redacteur de mogelijkheid te geven om meer dan één smaak toe te kennen aan het onderwerp. Met gevolg dat het onderwerp de categorieën Economie, Politiek en Sport krijgt toegekend en alle categorieën even zwaar meetellen. En dat willen we eigenlijk niet.

Formule 1 sponsoring

Stel je hebt een onderwerp in het sporthoekje dat gaat over het sponsoren van Formule I races. Het onderwerp heeft te maken met Economie (sponsoren van evenementen kan voor bedrijven economisch interessant zijn). Het heeft uiteraard te maken met Sport en Vermaak en ook met Politiek omdat in het artikel aandacht wordt besteed aan het voorstel van de regering om de fiscale aftrekbaarheid van de sponsorgelden te verruimen. Met de standaard aanpak worden de metadata categorieën Economie, Politiek en Sport in gelijke mate toegekend. Terwijl we eigenlijk een flink portie Sport, wat Economie en een snuf Politiek willen toekennen aan het onderwerp.

Fuzzy Metadata

De meeste CMS systemen (bijvoorbeeld Smartsite) kennen een slider-control functionaliteit. Hieronder ziet u hem.

FuzzySlider

Hiermee kan een redacteur precies aangeven welke categorieën en in welke mate die van toepassing zijn op het onderwerp. De redacteur kan nu eindelijk de nuance aanbrengen die goede content verdient: met fuzzy metadata.

Regenboog- en stemmingsnavigatie

Stel we nemen in plaats van categorieën zoals Economie, Politiek, Sport en Entertainment, kleuren. Bijvoorbeeld de RGB kleuren. Je kunt dan content een kleurtje geven. Rood voor hot-nieuws, Blauw voor zakelijk nieuws, Groen voor projectinformatie en uiteraard allerlei andere kleurcombinaties. Hiermee kan de redacteur naar believen of volgens afspraak de content kleuren.

Aan de voorkant van de site, geven we de bezoeker ook de slider-control. De bezoeker bepaalt dan zelf wat hij of zij wilt zien. Koppel je de kleur aan een stemming dan kan de bezoeker afhankelijk van zijn stemming de site doorkruisen. Is de bezoeker een beetje geagiteerd, dan kan de slider naar rood en komen alle hot-items te voorschijn. Is de bezoeker op zoek naar zakelijk informatie dan gaat de slider naar blauw en wordt alleen zakelijke informatie getoond.

Het aardige is dat we hiermee alternatieven voor websitenavigatie hebben. Weer eens wat anders dan al die menu’s en buttons waarop we moeten klikken. Zo ziet u maar weer: er zijn meer dingen mogelijk om te navigeren dan we dachten. Nu nog wachten op een opdrachtgever die dit helemaal ziet zitten.