
Cours
Vous trouverez ici un aperçu de la prestation pédagogique proposée. Les maquettes pédagogiques servent à titre d’exemple et peuvent être adaptées selon les besoins de la formation.
-
-
Introduction à la statistique descriptive
Notions de population, échantillon, variables
Mesures de tendance centrale (moyenne, médiane, mode)
Mesures de dispersion (étendue, variance, écart-type)
Représentations graphiques : histogrammes, boxplots, nuages de points
Notions de population, échantillon, variables
Mesures de tendance centrale (moyenne, médiane, mode)
Mesures de dispersion (étendue, variance, écart-type)
Représentations graphiques : histogrammes, boxplots, nuages de points
-
Probabilités fondamentales
Expériences aléatoires, événements, espace probabilisable
Règles de calcul des probabilités
Probabilité conditionnelle, indépendance
Loi de probabilité (uniforme, binomiale)
Expériences aléatoires, événements, espace probabilisable
Règles de calcul des probabilités
Probabilité conditionnelle, indépendance
Loi de probabilité (uniforme, binomiale)
-
Lois de probabilité usuelles
Loi binomiale
Loi de Poisson
Loi normale
Approximation et modélisation de phénomènes
Loi binomiale
Loi de Poisson
Loi normale
Approximation et modélisation de phénomènes
-
Échantillonnage et estimation
Techniques d’échantillonnage
Estimateurs et biais
Intervalles de confiance
Techniques d’échantillonnage
Estimateurs et biais
Intervalles de confiance
-
Tests statistiques
Hypothèses nulle et alternative
Tests paramétriques (t-test, z-test)
Erreurs de type I et II
Valeur p et interprétation
Hypothèses nulle et alternative
Tests paramétriques (t-test, z-test)
Erreurs de type I et II
Valeur p et interprétation
-
-
-
Introduction à l'analyse de données
Rôle du data analyst
Cycle de vie d’un projet data
Types de données : structurées, semi-structurées
Rôle du data analyst
Cycle de vie d’un projet data
Types de données : structurées, semi-structurées
-
Manipulation des données avec Python
Introduction à Pandas et NumPy
Importation, nettoyage et transformation de données
Gestion des valeurs manquantes, encodage, types de données
Introduction à Pandas et NumPy
Importation, nettoyage et transformation de données
Gestion des valeurs manquantes, encodage, types de données
-
Visualisation des données
Matplotlib, Seaborn, Plotly (bases)
Choix des graphiques en fonction des données
Création de dashboards simples
Matplotlib, Seaborn, Plotly (bases)
Choix des graphiques en fonction des données
Création de dashboards simples
-
Statistiques appliquées à la données
Corrélation, covariance
Tests statistiques pour l’analyse exploratoire
Régressions linéaires simples
Corrélation, covariance
Tests statistiques pour l’analyse exploratoire
Régressions linéaires simples
-
Analyse exploratoire (EDA)
Méthodologie d’analyse
Détection d’anomalies, outliers
Réduction de dimensions (PCA)
Méthodologie d’analyse
Détection d’anomalies, outliers
Réduction de dimensions (PCA)
-
Initiation au machine learning supervisé
Notions de classification et de régression
Modèles simples : k-NN, régression logistique, arbres de décision
Évaluation de modèle (accuracy, recall, F1)
Notions de classification et de régression
Modèles simples : k-NN, régression logistique, arbres de décision
Évaluation de modèle (accuracy, recall, F1)
-
-
-
Introduction au data engineering
Rôle et missions du data engineer
Différences entre data analyst, scientist, engineer
Rôle et missions du data engineer
Différences entre data analyst, scientist, engineer
-
Modélisation des données
Modèles relationnels et schémas en étoile/flocon
Conception de bases de données (normalisation)
SQL avancé (jointures, vues, index, requêtes complexes)
Modèles relationnels et schémas en étoile/flocon
Conception de bases de données (normalisation)
SQL avancé (jointures, vues, index, requêtes complexes)
-
Gestion des bases de données
SGBD : PostgreSQL, MySQL
Bases NoSQL : MongoDB (introduction)
Sauvegarde, performance, sécurité
SGBD : PostgreSQL, MySQL
Bases NoSQL : MongoDB (introduction)
Sauvegarde, performance, sécurité
-
Pipeline de données
Extraction, Transformation, Chargement (ETL)
Outils : Apache Airflow, dbt (introduction)
Structuration d’un workflow automatisé
Extraction, Transformation, Chargement (ETL)
Outils : Apache Airflow, dbt (introduction)
Structuration d’un workflow automatisé
-
Stockage et traitement distribué
Introduction à Hadoop, Spark
Concepts de batch vs temps réel
Architecture data lake, data warehouse
Introduction à Hadoop, Spark
Concepts de batch vs temps réel
Architecture data lake, data warehouse
-
Déploiement et industrialisation
Conteneurisation (Docker)
Notions de CI/CD pour la data
Surveillance et logs
Conteneurisation (Docker)
Notions de CI/CD pour la data
Surveillance et logs
-