In november 2021 bleek uit een rapport van McKinsey dat 71% van de gebruikers een gepersonaliseerde ervaring verwacht als ze op internet surfen.1. Zij verwachten met name de juiste inhoud op het juiste moment. Het bereiken van deze doelstelling vormt de basis van contextuele handel en marketing, die tot doel hebben de conversie te verhogen. Hiervoor moet echter een indrukwekkende hoeveelheid gegevens worden verzameld om de juiste gepersonaliseerde inhoud of het juiste product op het juiste moment te kunnen voorstellen. Dit is de sleutelrol van recommendation engines, die steunen op kunstmatige intelligentie en machine learning.
Wat is een aanbevelingsmotor?
Een recommendation engine is een instrument dat gebruik maakt van kunstmatige intelligentie en machinaal leren om automatisch inhoud of producten voor te stellen aan internetgebruikers. De aanbevelingen zijn niet alleen automatisch, maar ook dynamisch en gepersonaliseerd, dankzij de dagelijkse of zelfs real-time invoer van een grote hoeveelheid gebruikersgegevens. De prestaties van aanbevelingsmachines hangen dus af van hun vermogen om deze gegevens te verwerken.
Lees onze White Paper over Contextual Commerce
Hoe werkt een aanbevelingsmotor?
Het proces voor het aanbevelen van online inhoud is gebaseerd op een reeks stappen.
Gegevensverzameling
Een aanbevelingsmotor verzamelt 2 soorten relevante gegevens om gebruikersprofielen te definiëren:
- impliciete gegevens: dit zijn gegevens die de gebruiker niet opzettelijk verstrekt en die tijdens zijn internetactiviteiten worden verzameld. Voorbeelden zijn geraadpleegde pagina's, kliks, gebruikte woorden bij een zoekopdracht of aankoopgeschiedenis.
- expliciete gegevens: dit is informatie die door de gebruiker wordt doorgegeven. Het kan gaan om "likes" op sociale netwerken, meningen gepubliceerd naar aanleiding van aankopen, inhoud gepubliceerd door de gebruiker zelf op het internet, of uitwisselingen met andere gebruikers.
Gegevensopslag
De prestaties van een aanbevelingenmotor hangen gedeeltelijk af van zijn vermogen om de verzamelde gegevens op te slaan. Recommendation engines steunen op uiterst krachtige technologische bouwstenen, de enige die de 3 dimensies van Big Data aankunnen2 :
- volume: aanbevelingsmachines slaan gigantische hoeveelheden digitale gegevens op
- snelheid: ze kunnen omgaan met de enorme snelheid waarmee gegevens worden gegenereerd
- verscheidenheid: zij slaan een groeiende verscheidenheid aan gegevens op
Volume, snelheid en verscheidenheid zijn de 3 essentiële aspecten van Big Data
Gegevensanalyse
De aanbevelingsmachines analyseren vervolgens de verzamelde en opgeslagen gegevens. Zij volgen een methodologie, d.w.z. een reeks vooraf vastgestelde regels, aangepast aan de strategie van de onderneming waarvan de website afhangt. De benaderingen verschillen naar gelang van een groot aantal parameters: de doelstellingen van de aanbeveling, de aard van de site, het soort informatie dat wordt verzameld en geanalyseerd, enz.
Er zijn 3 gangbare benaderingen, ook wel "filters" genoemd:
- collaboratief filter
- inhoudelijk filter
- hybride filter
Collaboratief filter: een methode waarbij wordt gezocht naar overeenkomsten tussen de gegevens van een panel van gebruikers uit het verleden en die van de huidige gebruiker. Deze aanpak is gebaseerd op de hypothese dat als er overeenkomsten zijn in de voorkeur voor bepaalde elementen tussen het panel van gebruikers en de beoogde gebruiker, er een grote waarschijnlijkheid is dat deze laatste andere elementen die hij heeft geselecteerd, leuk zal vinden. Deze aanbevelingen zijn gebaseerd op automatisch verzamelde gegevens zonder analyse van hun kenmerken.
Inhoudelijk filter: deze benadering analyseert de kenmerken van de gegevens. Deze gegevens kunnen bijvoorbeeld de kenmerken zijn van de producten in de catalogus voor een e-commerce site, of de inhoudsthema's voor een informatiemedium. Vervolgens wordt het profiel van de beoogde gebruiker uitgedrukt door zijn voorkeuren voor de kenmerken van de sitegegevens op te sommen. Hier zijn de aanbevelingen gebaseerd op de vastgestelde overeenkomsten tussen de kenmerken van de gegevens waarnaar wordt verwezen en de voorkeuren van de gebruiker. Deze methode is gebaseerd op de veronderstelling dat de kans groot is dat de beoogde gebruiker kenmerken leuk vindt die lijken op die welke hij in het verleden leuk vond. Deze aanbevelingen zijn gebaseerd op het gedrag van de gebruiker in het verleden, zonder dat men zich zorgen hoeft te maken over gegevens van andere bezoekers.
Hybride filter: strategie die de twee vorige typen filtering combineert. Zij combineren de voorkeuren van de beoogde bezoeker met gegevens uit de gemeenschap, de kenmerken van catalogusitems en andere aanbevelingsmodellen.
Filterbellen en serendipiteit
Een filterbubbel is een verschijnsel dat optreedt wanneer een algoritme alleen items voorlegt die overeenkomen met de smaak van de gebruiker. Hierdoor ontstaat het risico dat de gebruiker wordt opgesloten in een omgeving zonder andere gebieden te verkennen. Vandaar de noodzaak om willekeurige inhoud te introduceren, of anders gezegd, om een zekere mate van serendipiteit te introduceren in algoritmen van aanbevelingsmachines.
Serendipiteit is "het bij toeval doen van een onverwachte ontdekking die vervolgens vruchten afwerpt, met name in de wetenschappen".3 ".
Algoritmen kunnen ook ruimte laten voor toeval door opzettelijk willekeurige inhoud voor te stellen die buiten het gebied valt waarin de gebruiker zich bevindt of waarvan hij weet waar zijn interesses liggen.
De combinatie van deze 2 praktijken zorgt ervoor dat aanbevelingsmachines optimaal en ethisch verantwoord werken.
Algoritmes voor aanbevelingen introduceren regelmatig willekeurige inhoud om filterbubbels voor gebruikers te voorkomen.
Op welke gegevens is een aanbevelingsmachine gebaseerd?
Socio-demografische gegevens
Het verzamelen van sociaal-demografische gegevens over consumenten is een essentiële stap voor aanbevelingsmachines. Leeftijd, geslacht, herkomst, taal en gezins- en beroepssituatie beïnvloeden niet alleen het surfgedrag, maar ook het koopgedrag. In de elektronische handel bijvoorbeeld doet 30% van de mannen ten minste één aankoop per week, tegenover 24% van de vrouwen. Evenzo nemen millennials bijna 35% van de e-handel voor hun rekening, tegenover 30% voor generatie X en slechts 15% voor babyboomers.4. Deze sociaal-demografische gegevens zijn ook van invloed op de interesses en categorieën van gekochte artikelen. Uit een studie van Eurostat blijkt dat 16-24-jarigen de leeftijdsgroep vormen die het meest online kleding koopt, op de voet gevolgd door 25-54-jarigen. Daarentegen behoren 55-plussers tot de grootste kopers van meubels en decoratieve accessoires voor in huis.5.
Persoonlijke gegevens
Naast sociaal-demografische gegevens zijn - zowel impliciete als expliciete - persoonsgegevens essentieel voor de profilering van consumenten. Het verzamelen en vergelijken van deze twee soorten gegevens beperkt en specificeert dus de omvang van de voor te stellen inhoud, alsook het juiste tijdstip en de juiste plaats voor de verspreiding ervan. Zo werkt bijvoorbeeld de productaanbeveling van Amazon. De algoritmen analyseren de verlanglijstjes van de gebruikers, de producten die zij zoeken, de tijd die zij op elke productpagina doorbrengen en hun eerdere aankopen. De productaanbevelingen van het platform zijn daarom vaak relevant.
Maar het is op sociale netwerken dat aanbevelingsmachines toegang hebben tot een uitzonderlijke hoeveelheid, verscheidenheid en nauwkeurigheid van gegevens over gebruikers.6. De gegevens worden gevoed door de door internetgebruikers geraadpleegde en gedeelde inhoud, maar ook door interacties en uitwisselingen met andere gebruikers. Algoritmen van sociale netwerken bepalen nauwkeurig de interesses en demografische profielen van elke bezoeker. Daardoor zijn aanbevelingen op het gebied van social commerce uiterst nauwkeurig en performant.
Databanken en transacties
Databases en transactiehistories worden geanalyseerd en geclassificeerd om inhoudsuggesties te optimaliseren. Productkenmerken die in CRM-, PIM- of DMP-databases zijn ingevoerd, worden gebruikt door e-commercesites of marktplaatsen. Deze productkenmerken stellen de algoritmen in staat relevante associaties te maken tijdens het aanbevelingsproces. Een e-commercesite voor keukengerei zal een gebruiker die een productpagina van een koffiezetapparaat raadpleegt bijvoorbeeld een melkopschuimer voorstellen. Bovendien worden deze productkenmerken aangevuld met de geschiedenis van transacties, zoals hun populariteit bij webgebruikers, huidige bestsellers, bijkomende verkopen door andere gebruikers en klantenbeoordelingen. Op dezelfde manier analyseert een contentplatform de interacties van zijn lezers met zijn content: de raadplegings- en interactiepercentages van webgebruikers, de ingediende meningen, de leestijd, enz.