voorbeeldnamen-database

Vroeger stonden er rolodexen op het bureau van de secretaresse met alle gegevens van diverse bedrijven en personen. Tegenwoordig zit dat allemaal in computer-databases.
Als je een lange lijst met namen en adresgegevens wilt hebben om software te testen, dan kun je een telefoonboek (bestaan die papieren versies nog?) overtypen maar je kunt ook gebruik maken van voorbeeldgegevens. Er is zelf software en er zijn website voor om dit te genereren. Maar meestal met engelse namen en adressen en niet voor de nederlandse taal.
Daarom een lijst gemaakt die de waarheid redelijk benaderd. Zie hieronder wat in de lijst staat en hoe het opgebouwd is.

De tabel bevat de volgende fictieve gegevens:

  • Voornaam en geslacht

  • Achternaam

  • Geboortedatum

  • Straat, huisnummer (geen toevoegingen), postcode cijfers en letters, plaats, gemeente, provincie en telefoonnummer

  • Mobiel nummer

  • Email-adres

En mijn bestand genereert elke keer opnieuw een nieuwe combinatie van deze gegevens.

De voornamen komen uit een lijst die gevonden is op internet. Daar stond bij hoevaak de naam voor kwam in een bepaald jaartal. Op basis van deze gegevens heb ik een tabel  met 100.000 voornamen met geslacht gemaakt.
Zo ook de achternamen.
De geboortedatum is samengesteld uit een lijst waarin stond op welke dag er hoeveel mensen jarig zijn en een lijst waarin stond hoeveel mensen er in een bepaald jaar geboren waren.

De adresgegevens komen uit een 10 jaar oude postcode tabel. Adressen waarvan de minimale huisnummer en maximale huisnummer meer dan 100 nummers uit elkaar lagen en alle postbusadressen heb ik verwijderd en bij elke postcode heb ik een huisnummer gekozen die op die postcode beschikbaar is.

Bij telefoonnummers met een netnummer moet het netnummer natuurlijk wel met de plaats overeen komen. Daarom heb ik de netnummers er bij gezocht en op basis van de 3- of 4-cijferige netnummer heb ik middels een aselecttussen-formule de overige cijfers er bij berekend. Omdat ik ergens las dat slechts 33% nog een vaste telefoon heeft, heb ik daarna 2 op de 3 nummers weer verwijderd.
Zo heb ik ook mobiele nummers "berekend" en daar is 10% weer van verwijderd.

Bij de emailadressen heb ik van een groot bedrijf met 170.000 klanten de emailproviders er uit gefilterd en alle bedrijfsemailadres en buitenlandse emailadressen verwijderd. Daarna heb ik uitgerekend hoevaak een provider voor komt en op basis daarvan een lijst met 100.000 emailadres berekend. Het gedeelte voor het @-teken is standaard een combinatie van voorletter en achternaam.

Met een macro-button sorteer ik elke keer elke tabel met behulp van een Aselect-functie de data. Daarna voeg ik de gegevens samen tot één nieuwe tabel.

Het bestand kun je HIER downloaden. 
Het bestand bevat macro's en daarom is het opgeslagen als een zip-bestand. Bij het uitpakken moet het opgeslagen worden in een map waarin macro's zijn toegestaan, en misschien moet je de macro-beveiliging van Excel aanpassen. Heb je hier vragen over, stuur ze maar op via het contactformulier.