Generating Realistic Synthetic Customer Datasets

dataset

Being able to create and use synthetic data in projects has become a must-have skill for data scientists.

I have written in the past about using the Python library Faker for creating your own synthetic datasets. Instead of repeating anything in that article, let’s treat this as the second in a series of generating synthetic data for your own data science projects. This time around, let’s generate some fake customer order data.

If you don’t know anything about Faker, how it is used, or what you can do with it, I suggest that you check out the previous article first.

The plan is to synthesize a scaled-down version of a set of tables that would be used in the real-world business case of a customer order system.

Aside from items for purchase, let’s think about what is called for in such a scenario.

Customers – in what is not much of a surprise, if you are going to build a system to track customer orders, you are going to need customers
Credit cards – customers need to pay for things, and in our simplified scenario they can only do so with credit cards
Orders – an order will consist of a customer, a cost, and a credit card for payment

That’s the data we need, so that’s the data we will make. After you go through this, you will probably find ways to make it more robust, more detailed, and more like the real world, which you should be able to go ahead and do on your own.

Veille-cyber

Next Google accepte de payer un règlement record pour atteinte à la vie privée »

Previous « DACH Insurtech Industry Has Grown 45% Over the Past Year

Published by

Veille-cyber

3 ans ago

Les 7 menaces cyber les plus fréquentes en entreprise

Introduction La cybersécurité est devenue une priorité stratégique pour toutes les entreprises, grandes ou petites.…

3 mois ago

cybersécurité

Cybersécurité : Vers une montée en compétence des établissements de santé grâce aux exercices de crise

Cybersécurité : les établissements de santé renforcent leur défense grâce aux exercices de crise Face…

3 mois ago

Règlementation

Règlement DORA : implications contractuelles pour les entités financières et les prestataires informatiques

La transformation numérique du secteur financier n'a pas que du bon : elle augmente aussi…

3 mois ago

cybersécurité

L’IA : opportunité ou menace ? Les DSI de la finance s’interrogent

L'IA : opportunité ou menace ? Les DSI de la finance s'interrogent Alors que l'intelligence…

4 mois ago

cybersécurité

Telegram menace de quitter la France : le chiffrement de bout en bout en ligne de mire

Telegram envisage de quitter la France : le chiffrement de bout en bout au cœur…

4 mois ago

cybersécurité

Sécurité des identités : un pilier essentiel pour la conformité au règlement DORA dans le secteur financier

Sécurité des identités : un pilier essentiel pour la conformité au règlement DORA dans le…

4 mois ago

This website uses cookies.

Generating Realistic Synthetic Customer Datasets

Recent Posts

Les 7 menaces cyber les plus fréquentes en entreprise

Cybersécurité : Vers une montée en compétence des établissements de santé grâce aux exercices de crise

Règlement DORA : implications contractuelles pour les entités financières et les prestataires informatiques

L’IA : opportunité ou menace ? Les DSI de la finance s’interrogent

Telegram menace de quitter la France : le chiffrement de bout en bout en ligne de mire

Sécurité des identités : un pilier essentiel pour la conformité au règlement DORA dans le secteur financier