Accueil   >   Formations   >   Data Avant Garde

Ref: DDC-DAG

Data Avant Garde

Présentiel - 30h

Formation Eligible CPF

Objectifs

Maîtriser les techniques de traitement de données avancé.

Connaître les clés du langage Python et du module Pandas appliqués à la data et les méthodes de préparation efficace.

Savoir comment appliquer algorithmes et visualisation avec pertinence.

Acquérir confiance, autonomie et performance pour être en mesure de s'attaquer sans hésitation et avec pragmatisme aux challenges métiers complexes.

Développer des processus analytiques avancés efficaces, élégants et durables et créer des passerelles avec la data science.

Syllabus

1. La Capture de la donnée

Accéder à tout type de sources

• Les fichiers plats

• Les bases de données

• Les données non structurées, les pages web et documents

Focus sur le "data scraping"

• Récupérer des données sur les sites d'information

• Les techniques avancées de scraping de documents PDF

2. Le Profilage des données

Les étapes du profilage

• L'examen des types et de la structure des données

• L'analyse de la cohérence des information

• Les rapports de synthèse

Les outils du profilage

• Les astuces pythons

• Les commande Pandas

• Les conseils de Data Officers

3. La Préparation des données

La préparation des données

• Eliminer le superflux ou l'inutilisable

• Traiter les doublons ou les manquants

• Ajuster les formats et les types de données

• Nettoyer les chaines de caractères

• Inférer les valeurs manquantes

4. Faire parler la data

• Filtrer vos données

• Hierarchiser

• Grouper et Calculer

• Joindre

5. La visualisation des données

Les techniques de visualisation

• Pourquoi visualiser ?

• Programmer simplement ses visualisations

Les grandes familles de visualisation

• Les visualisations simples: avantages et limites

• Les visualisations avancées

• La visualisation des données géographiques

Les bonnes pratiques

6. Les règles d'Or du Data Wrangling

• Le code vient en dernier

• Toujours s'inspirer des bibliothèques existantes

• Coder le moins possible

• Commenter et respecter le formalisme

• Suivre le process de la donnée: charger-transformer-visualiser

• Ecrire du code que l'on peut comprendre

7. Pour aller plus loin

Des concepts complémentaires

• Listes

• Tuples

• Sets

• Dictionnaires

• Lire et écrire du texte

Les librairies pythons

8. L'application du Machine Learning

Les grandes familles d'algorithmes

• Régressions

• Classifications

• Clustering

L'utilisation des librairies

9. Les Responsabilités de l'Avant garde

La collaboration

• Data Science

• Informatique

• Métiers

La transparence

• Documenter

• Expliquer

• Former

Comment ?

Méthodes pédagogiques

1 poste par stagiaire

Remise d'un support pédagogique (numérique ou papier) pendant la formation

La formation est constituée d'apports théoriques, d'exercices pratiques, de réflexions et de retours d'expérience

 

********************

Formation distancielle, synchrone, avec le formateur en visioconférence

Partage d'écran formateur et stagiaire pour les présentations, démonstrations et vérification des mises en application

Un support technique accompagne la préparation et le suivi du parcours d'apprentissage

Séquençage pédagogique construit et adapté au mode d'organisation distanciel

Remise d'une documentation pédagogique numérique pendant le stage

La formation est constituée d'apports théoriques, d'exercices pratiques, de réflexions et de retours d'expérience

Évaluation

Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne

Attestation de fin de stage remise au stagiaire

 

***************

Évaluation du formateur au fil des séquences pédagogiques.

Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne

Attestation de fin de stage remise au stagiaire

Participez à la prochaine session !

S'inscrire

Admission

A qui s’adresse cette formation

Cette formation s'adresse aux analystes qui souhaitent travailler sur des questions métiers requérant l'analyse de jeux de données volumineux et complexes.

Prérequis

Pour suivre cette formation il est nécessaire de maîtriser un outil de reporting et connaître SQL et des techniques avancées de capture, préparation, analyse et visualisation.

Coût de la formation

Frais pédagogiques

6000€ HT

Tarif Inter-entreprise par personne

7200€ TTC

Tarif CPF pour particulier

Aides au financement

Formation finançable via votre Compte Personnel d e Formation (CPF)

Pour les demandeurs d'emploi, dirigeants d'entreprise, freelances, travailleurs indépendants et étudiants, de nombreuses structures de financement (Pôle emploi, votre région, AGEFIPH, etc.) et des dispositifs variés (AIF, FAF, etc.) existent.*

En savoir plus sur les dispositifs de financement.

Le Pont Learning