Accueil

Portails

 BLOG

 À nuancer

 Liens Utiles

 Articles

 Télécharger

 Contact

Tout sur les systèmes ETL, la modélisation dimensionnelle et le data warehousing

 

Nos portails

ETL

Modélisation dimensionnelle

Data warehousing

Applications analytiques

Emploi [Nouveau]

 
Nos Contributions

À Nuancer

Articles

QFP (FAQ)

Télécharger

Posez votre question
 
Divers

Articles des experts

Livres

Forums

Liens utiles

Glossaire décisionnel

A propos du site

 
 
 
       

Précédent Accueil Suivant

Imprimer   Envoyer à un ami

Les fonctionnalités détaillées d'un système ETL

 

EXTRACTION


- Gérer les connexions (Native, ODBC, Connecteur spécial...)

- Détecter les changements (Change Data Capture, CRC, log miner)

- Analyser les données (propriété des colonnes, clés primaires,règles de gestion)

- Appliquer les tests à la volée à tous les flux de données pour déceler des problèmes de qualité de données;

- Faire appel au système de nettoyage de données si le cas se présente;

- Alimenter le système de gestions des erreurs;

- Surveiller et détecter les erreurs en temps réel;

- Automatiser la reprise après erreur ;

- Traiter les messages reçus du système de gestion de la qualité de données.

- Produire des tableaux de bord et des rapports d’audit pour tous les processus ETL en exécution incluant les horodates, les nombres d’enregistrements traités, les erreurs, les actions réalisées par le moteur ETL

-Gérer les erreurs;

-Aviser les personnes concernées;

-Journaliser les erreurs

 

TRANSFORMATION


- Analyser les données (propriété des colonnes, clés primaires,règles de gestion)

- Analyser les noms et adresse des personnes et organisation;

- Dé dupliquer les données (Le même client peut provenir de plusieurs systèmes);
- Utiliser les techniques de logique floue (peut-être vrai, probablement vrai, peut-être faux, probablement faux);

- Utiliser les techniques de fusion (Merge);

- Gérer les clés d’affaires au niveau des systèmes source;

- Identifier et renforcer les attributs des dimensions conformes;

- Identifier et renforcer les attributs des faits conformes;

- Assembler le metadata concernant le chargement de chaque table de fait dans une dimension d’audit;

- Attacher la dimension d’audit à la table de fait comme une dimension normale.

- Surveiller et détecter les erreurs en temps réel;

- Automatiser la reprise après erreur ;

- Traiter les messages reçus du système de gestion de la qualité de données.

- Produire et gérer d’une façon centralisée les clés de substitution (dimension et fait) ;

- Être indépendant de la base de données.

- Gérer les trois types de Slowly changing dimension (SCD) (Type1 : Écraser, Type 2 : Nouvel enregistrement, Type 3 : Nouvelle colonne) 

- Insérer et mettre à jour des données associées (fait ou dimension) à une dimension que l’on reçoit en retard

- Créer et gérer les dimensions à hiérarchie fixe

- Créer est gérer les dimensions à hiérarchie variables

- Créer et gérer les tables associatives utilisées pour décrire les relations many-to-many entre les dimensions ou entre les faits et les dimensions

- Créer et gérer les junk dimension

- Remplacer les clés d’affaires par les clés de substitution

- Insérer et mettre à jour des enregistrements de fait qui arrivent en retard

- Créer et maintenir des structures d’agrégation qui sont utilisées conjointement avec le mécanisme du Query-Rewrite;

- Inclure les vues matérialisées

- Maintenir en mémoire seulement les partitions des données des faits qui arrivent depuis la dernière mise à jour

- Répliquer les dimensions conformes à partir d’un emplacement centralisé vers le fournisseur des tables de fait. 

- Utiliser les dimensions conformes transmises par le système de gestion des dimensions .

- Substituer les clés étrangères;

- Vérifier les versions des dimensions

-Gérer les erreurs;

-Aviser les personnes concernées;

-Journaliser les erreurs

CHARGEMENT


- Surveiller et détecter les erreurs en temps réel;

- Automatiser la reprise après erreur ;

- Traiter les messages reçus du système de gestion de la qualité de données.

- Insérer et mettre à jour les tables de faits au niveau du grain;

- Manipuler les indexes et les partitions;

- Utiliser le gestionnaire des lookup

- Insérer et mettre à jour d’une façon périodique les tables de fait dans le détail du niveau de grain.

- Mettre à jour des tables de faits cumulatives

- Créer et gérer la fondation du schéma en étoile pour alimenter les cubes dimensionnels (Cubes OLAP);

- Préparer les hiérarchies pour alimenter les cubes selon la suite BI utilisée.

- Produire des tableaux de bord et des rapports d’audit pour tous les processus ETL en exécution incluant les horodates, les nombres d’enregistrements traités, les erreurs, les actions réalisées par le moteur ETL

-Gérer les erreurs;

-Aviser les personnes concernées;

-Journaliser les erreurs

DÉVELOPPEMENT/OPÉRATION et MAINTENANCE


- Ordonnancer et lancer les processus ETL;

- Être capable de coordonner les processus en tenant compte de différentes conditions de succès ou d’échec de processus;

- Produire des alertes et envoyer des messages

- Produire des tableaux de bord et des rapports d’audit pour tous les processus ETL en exécution incluant les horodates, les nombres d’enregistrements traités, les erreurs, les actions réalisées par le moteur ETL

- Reprendre l’exécution d’un processus au même endroit que celui-ci a planté;

- Offrir la possibilité d’arrêter (selon une condition) un processus ETL et le ré-exécuter.

- Offrir les avantages d’utiliser des processeurs multiples ou l’informatique en grille (Grid computing);

- Offrir la possibilité de transmission continue de données (pipeline);

- Offrir le parallélisme automatique et conditionnel des processus ETL.

-Gérer les erreurs;

-Aviser les personnes concernées;

-Journaliser les erreurs

- Gérer les versions du projet ETL;

- Réserver et replacer les composantes du projet ETL ( Chekc-out, ckeck-in...);

- Comparaison des différentes versions d’un projet ETL.

- Migration de l’environnement de développement vers celui de test et de production;

- S’intégrer ou intégrer le système de contrôle de version;

- Configurer les connexions pour la version;

- Offrir la possibilité d’exécuter les processus ETL en mode vérification ( Check-only)

- Afficher les sources de données et les transformations subies par un élément de données spécifique (une colonne);

- Analyser l’impact de changer un élément de données

- Prouver que les données et les transformations n’ont pas changé et sont conformes aux règles établies;

- Surveiller les accès et les modifications aux données pour prouver que les données et les transformations n’ont pas changées.

- Administrer la sécurité sur les données et les méta données des processus ETL;

- Offrir la possibilité de prouver que la version d’un processus ETL n’a pas changé;

- Afficher qui a effectué les changements

- Sauvegarder les données et les méta données pour le recouvrement, la sécurité et les besoins de conformité.

- Collecter et maintenir les méta-données concernant le projet ETL, incluant les processus ETL, les transformations...

- Surveiller toutes les activités de développement, de test du projet ETL

 
Portail ETL
 

Accueil

 

Définition - ETL

 

ETL Vs ELT

 

Back Room & Front Room

 

Data In & Infos Out

 

Composantes ETL

 

38 sous-systèmes ETL

 

Fonctionnalités ETL

 

Acheter/développer ?

 

Choix d'outils ETL 

 

Plan de projet ETL

 

Rôles & responsabilités ETL

 

Principales suites ETL

 

Retour aux portails

 

 

 

 

 SystemeETL.com © Copyright 2004-2006 Tout droit réservé. Ce site éducatif concerne les systèmes ETL, la modélisation dimensionnelle et les entrepôts de données. Le contenu est tiré à partir de notre expérience dans le domaine. Pour contacter l'auteur Webmester@systemeetl.com