Data uit je database ontdubbelen

door Jeroen Groenhart Borja Sanz

Data uit je database ontdubbelen Hoofdpijn krijgt elke marketeer ervan: een database met niet goed ontdubbelde data. Hoe moet ik mijn database ontdubbelen? Dit komt in de praktijk vaker voor dan wenselijk en behoort dan ook tot een van de meestgestelde vragen door marketeers. In dit artikel lees je tips en best practices over hoe je hier in combinatie met Copernica tot het beste resultaat kunt komen.

Data in de regel

Vooropgesteld is de meest ideale situatie dat je data(base), of dat nou in je CMS/CRM of webshop staat, goed ontdubbeld is. Is dit niet het geval dan is er iets misgegaan op een bepaald moment, of zelfs vanaf het begin dat deze database is opgebouwd. Laten we deze database voor het gemak vanaf hier "moederdatabase" noemen. We raden dan ook altijd ten zeerste aan om de data in je moederdatabase op te schonen. Vaak makkelijker gezegd dan gedaan, en waarschijnlijk vaak duurder dan het budget toelaat. We zullen je daarom de preek hierover sparen, want je bent zeer waarschijnlijk bij dit artikel beland omdat het ontdubbelen van de data in je moederdatabase om welke reden dan ook gewoon niet mogelijk is op dit moment. Een gouden recept die generiek toepasbaar is voor de data van elk bedrijf is er helaas niet. Wel leer je verderop in dit artikel hoe je gemakkelijk zelf in Copernica data kunt ontdubbelen.

Ontdubbelen van data uit mijn moederdatabase, bij het importeren in Copernica

Ga je voor het eerst een database in Copernica aanmaken en importeren? Lees dan het artikel uit de helpdocumentatie over het importeren met sleutelvelden. In het verlengde van dit artikel, kan het waardevol zijn om het artikel "Hoe kan ik dubbele e-mailadressen voorkomen in mijn database" te lezen. Heb je én dubbele data in je moederdatabase, én dubbele data in Copernica? Dan zijn er in het verleden meerdere keren processen verkeerd uitgevoerd. Lees hieronder hoe je in dit laatste geval te werk kunt gaan.

Hoe ga ik te werk, en waar begin ik?

Begin altijd bij het evalueren van je data door te kijken of er een logische consistentie in zit. Is die consistentie niet al te ingewikkeld? Dan kun je de data met behulp van Copernica vrij makkelijk opschonen. Om het simpel te houden schetsen we twee scenarios die het meest gangbaar zijn. Laten we voor het gemak de relaties uit je database, of dat nou B2B of B2C relaties zijn, "profielen" noemen:
  1. Mijn oudste profielen hebben de meeste campagnehistorie en deze wil ik behouden. Tegelijk hebben mijn nieuwste profielen de meest recente NAW-gegevens. De nieuwste profielen wil ik verwijderen maar met behoud van hun juiste NAW-gegevens.
  2. Het maakt niet uit of ik de oudste of de nieuwste profielen verwijder. Ik wil het gewoon ontdubbeld hebben.
Voor scenario 1 tref je hieronder een stappenplan om te ontdubbelen in Copernica. Hoewel je zou denken dat scenario 2 veel simpeler zou zijn, dien je er in beide gevallen rekening mee te houden dat de combinatie van afmelders uit je campagnes/nieuwsbrieven in combinatie met dubbele profielen extra aandacht behoeft. Een risico is bijvoorbeeld dat je een dubbel profiel, met het zelfde e-mailadres ontdubbelt waarvan er eentje afgemeld was. Zoals je begrijpt kan dit tot ongewenste reputatieproblemen leiden. In het geval van scenario 2 hoef je enkel stap 6 hieronder niet uit te voeren.

Stappenplan om te ontdubbelen in Copernica

In dit stappenplan gaan we er vanuit dat je al een selectie hebt met alle afmelders in je database. De stappen hieronder dien je alleen uit te voeren als je zeker weet wat je doet. Bij twijfel kun je je database kopiëren en onderstaande testen in de kopie van je database.
  1. Exporteer eerst alle afmelders. Dit zodat je na het ontdubbelen, alle afgemelde e-mailadressen nog ter beschikking hebt.
  2. Maak een selectie met alle dubbelen (meestal zul je dit op basis van e-mailadres doen, instelling "Selecteer alle dubbele profielen"). Let op dat je deze profielen nog niet verwijdert!
  3. Maak hieronder een selectie met de laatst aangemaakte dubbele profielen (kies instelling "Selecteer alle dubbele profielen met uitzondering van het profiel met het laagste ID")
  4. Exporteer de selectie met de profielen uit stap 3 en sla het bestand op waar je het terug kunt vinden.
  5. Klik op de selectie uit stap 3 en verwijder de profielen via “Huidige weergave” --> “Meerdere (sub)profielen wijzigen/verwijderen”.
  6. Importeer nu het bestand uit stap 4 met de juiste instellingen (sleutelveld(en) instellen en aangeven dat gevonden profielen moeten worden bijgewerkt, ontbrekende profielen worden aangemaakt).
  7. Importeer nu het bestand uit stap 1 met de juiste instellingen (sleutelveld(en) instellen en aangeven dat gevonden profielen moeten worden bijgewerkt, ontbrekende profielen worden aangemaakt).
Hierna heb je een ontdubbeld bestand met behoud van de campagnehistorie, waarbij de N.A.W. gegevens van de nieuwere profielen, de oudere profielen hebben bijgewerkt EN waarna je zeker weet dat iedereen die zich afgemeld had (dubbel of niet dubbel) ook echt afgemeld is gebleven.

Liever uitbesteden?

Heb je geen tijd hiervoor of geen kennis van data, databases en ontdubbelen? Zit er geen logische consistentie in de dubbelen, of heb je een complex ontdubbelalgoritme nodig? Dan kan het interessant zijn om dit uit te besteden aan een Copernicapartner met ervaring. Kijk in dat geval in het partneroverzicht. Je kunt de partners filteren op expertise. De meeste partners die programmeerwerkzaamheden als expertise hebben, kunnen je hierbij ondersteunen.

Heb je vragen of aanvullingen? Schroom dan niet om je reactie hieronder achter te laten.

Gerelateerde artikelen

database
ontdubbelen
database ontdubbelen
dubbele
dubbele profielen