Formations


Office 365 et Power BI : (2 jours 1250$)

Office 365 et Power BI : (2 jours 1250$)

Office 365 et Power BI : (2 jours 1250$)


Inscription


Introduction

A. Power BI, la Business Intelligence en libre-service

1. Introduction

2. Les systèmes décisionnels

3. La modélisation OLAP

4. Les composants d’une suite de Business Intelligence

B. Les enjeux de la BI Libre-Service

1. Définition de la BI Libre-Service

2. Les objectifs d’une BI Libre-Service

3. Big Data et données non structurées

C. L’offre Power BI de Microsoft

1. Présentation de l’offre Power BI

2. Le modèle de licence Power BI

3. Installer les composants Power BI

a. Power Pivot

b. Power Query

c. Power View

d. Power Map

e. Office 365 On-line et Sites Power BI

f. Installation d’une instance SQL et de la base de démonstration


Power Query, l'ETL Libre-Service pour intégrer et préparer ses données

A. Introduction

1. Définition de l’ETL

a. Extract - Extraire

b. Transform - Transformer

c. Load ou Charger

2. Le concept Power Query

3. Comprendre Power Query à travers un exemple

B. Extraire l’information

1. À partir d’une base de données relationnelle

2. À partir d’un fichier CSV

3. À partir d’un fichier texte

4. À partir d’un classeur Excel

5. À partir d’un dossier

6. À partir d’une liste SharePoint et flux OData

7. À partir du Web

8. À partir de Microsoft Exchange

9. À partir de données internes - table Excel

C. Transformer ses données avec l’interface graphique

1. Introduction

2. Les étapes et les requêtes

3. Travailler avec les colonnes

a. Fractionner les colonnes

b. Renommer les colonnes

c. Déplacer les colonnes

d. Supprimer une colonne

e. Fusionner les colonnes

f. Modifier le type d’une colonne

g. Ajouter une colonne

h. Ajouter une colonne personnalisée

i. Ajouter une colonne d’index

j. Dupliquer une colonne

k. Ajouter une colonne avec une fonction

4. Travailler avec les lignes

a. Filtrer les lignes

b. Supprimer les lignes

c. Remplir les lignes

d. Remplacer les valeurs

e. Agréger des lignes

f. Supprimer le tableau croisé dynamique

g. Cumuler des sources de données

h. Fusionner des sources de données

D. Découvrir la puissance du langage M

1. Introduction au langage M

2. L’éditeur de requête

3. Les concepts du langage M

4. La logique conditionnelle

5. La logique itérative

6. Quelques exemples de fonctions Power Query

7. Créer ses propres fonctions

E. Application à notre scénario

1. Créer une table calendrier

2. Préparer la table Budget


Avec Power Pivot, analysez et modélisez vos données facilement

A. La puissance de Power Pivot

1. Introduction

2. Les avantages de Power Pivot

3. Comprendre Power Pivot à travers un exemple

B. Importer des données dans Power Pivot

1. Préparer ses données

2. Importer à partir d’une base relationnelle

3. Importer à partir d’un fichier texte ou csv

4. Importer à partir d’un fichier Excel

5. Importer à partir de données internes - table Excel

6. Mettre à jour ses données

C. Créer son modèle de données

1. Préparer son modèle de données

2. Créer des relations

3. Créer un tableau croisé dynamique

D. Créer des colonnes calculées

1. Présentation du langage Dax

2. Créer des colonnes calculées

3. Quelques exemples de fonctions Power Pivot

E. Créer des mesures avec le langage Dax

1. Introduction aux mesures ou champs calculés

2. La notion de filtre et contexte

3. Les fonctions de base

F. Application à notre scénario et Patterns Métiers

1. Introduction

2. Analyse des écarts

3. Classement ou Ranking

4. Analyse ABC

5. Moyenne mobile

6. Écart Réel/Budget


Avec Power View, créez des graphiques et tableaux de bord interactifs

A. Présentation

1. Introduction

2. Les éléments Power View

a. Les éléments de visualisation

b. Les éléments de sélection et navigation

c. Les éléments de conception

B. Préparer ses données pour Power View

1. Adapter son modèle de données

2. Intégrer des photos

C. Analyser ses données

1. Les tables de données

2. Les tableaux croisés dynamiques ou matrices

3. Le format carte de visite

D. Créer des graphiques dynamiques

1. Les différents types de graphiques

2. Les cartes géographiques

E. Faciliter l’analyse avec l’interactivité

1. Découverte de l’interactivité

2. Filtrer les données

3. Utiliser le drill-down

F. Améliorer l’impact de vos vues Power View

1. Ajouter une image de fond

2. Ajouter des images

3. Choisir son thème

4. Ajouter une zone de texte

G. Exemple appliqué à notre scénario

1. Évolution 2012/2011

2. Analyse des ventes par produit

3. Analyse géographique des ventes

4. Analyse de l’écart Réel/Budget


Avec Power Map, explorez vos données avec des cartes géospatiales

A. Présentation

1. Introduction

2. Un exemple pour comprendre

B. Préparer ses données pour Power Map

1. Adapter le modèle de données

2. Gérer les informations de localisation

C. Découvrir les différents types de visualisation

1. Les différents types de visualisation

2. Gérer les chronologies

3. Ajouter des calques, scènes et visites guidées

4. Ajouter une carte personnalisée

D. Augmenter l’impact de ses présentations : interactivité et vidéo

1. Ajouter des photos et des commentaires

2. Ajouter un graphique 2D connecté

3. Rechercher un emplacement

4. Modifier l’apparence de votre fond de carte

5. Créer une vidéo


Avec Power BI pour Office 365, partagez vos données online

A. Introduction aux sites Power BI

1. Introduction

2. BI Libre-Service et gouvernance

B. Partager vos données avec les sites Power BI

1. Publier et partager vos classeurs Excel online

2. Partager des requêtes Power Query

3. Partager des sources de données

C. Gérer les sites Power BI

1. Manager les sites Power BI

a. Étape 1 : Création d’une bibliothèque SharePoint

b. Étape 2 : Associer les droits d’accès à la bibliothèque

c. Étape 3 : Activer les documents de la bibliothèque pour qu’ils soient gérés par Power BI

d. Étape 4 : Ajouter un document aux favoris Power BI ou aux rapports proposés

e. Étape 5 : Ajouter un document à Q&A, l’interrogation en langage naturel

f. Administrer les sites Power BI

2. Automatiser la mise à jour des données


Avec Power BI Q&A, posez vos questions en langage naturel

A. Présentation

1. Introduction

2. Un exemple pour comprendre

B. Posez des questions efficacement

1. Adapter le modèle de données

a. Renommer les tables et les colonnes

b. Définir un ensemble de colonnes par défaut

c. Associer aux dimensions une étiquette par défaut

d. Vérifier les types de données

e. Préparer les informations géographiques

f. Gérer le tri de vos colonnes

Data Scientist : (3 jours 3000$)

Data Scientist : (3 jours 3000$)

Data Scientist : (3 jours 3000$)


Inscription


Introduction

5. Data-sciences

5.1 Les fondamentaux

5.1.1 Apprentissage et classification

5.1.2 Petit vocabulaire graphique du machine learning

5.1.3 Régression

5.1.4 Régression linéaire généralisée

5.1.5 Arbres de décision, prune, élagage

5.1.6 Clustering, k-means

5.1.7 k-NN

5.1.8 Modèles paramétriques

5.1.9 Lazy algorithm (algorithme paresseux)

5.1.10 Overfitting : sur-détermination, sur-apprentissage

5.1.11 Validation croisée, régularisation, bagging

5.1.12 Optimisation, méthode du gradient

5.1.13 Algorithme glouton (greedy algorithm)

5.1.14 Programmation linéaire, simplexe, point intérieur

5.1.15 Estimation via la méthode de Monte-Carlo

5.1.16 Entropie, indépendance et information mutuelle

5.1.17 Discrétisation

5.2 Méthodes "ensemble"

5.2.1 Random forest

5.2.2 AdaBoost (adaptative boosting)

5.3 Lois de probabilité et distribution

5.3.1 Généralités

5.3.2 Petit bestiaire des lois de probabilité

5.4 Les graphes

5.4.1 Vocabulaire de base

5.4.2 Conversion d'un tableau d'observations en graphe, similarité

6. Informatique professionnelle et data-sciences

6.1 La technologie

6.2 Business Intelligence versus Big Data

6.2.1 Différences en termes d'architecture

6.2.2 Différences en termes d'usage

6.2.3 En synthèse


Premiers pas avec R

1. Installation des composants

1.1 Installation et lancement de R

1.2 Installation et lancement de RStudio

1.3 Installation de nouveaux packages

1.4 Installation de packages : compléments

2. Prise en main de R

2.1 R, une calculatrice efficace

2.2 R, un langage vectorisé

2.3 Fonctions agissant sur des vectors

2.3.1 Une première analyse rapide des données

2.3.2 Quelques statistiques simples sur les vectors

2.3.3 Trier un vector

2.3.4 Diverses fonctions avec somme, produit, min et max

2.4 Types de données simples

2.4.1 Les booléens

2.4.2 Les ensembles

2.4.3 Les listes

2.4.4 Les facteurs

2.4.5 Les tableaux

2.5 Les fonctions

2.5.1 Création et utilisation d'une fonction simple

2.5.2 Création d'un opérateur à partir d'une fonction de deux variables

2.5.3 Usage des fonctions et portée des variables

2.5.4 Application des fonctions sur les matrices : apply

2.5.5 Les fonctions : compléments utiles

2.6 Structures de contrôle

2.6.1 Des instructions communes avec d'autres langages

2.6.2 Parcourir une matrice via des boucles for

2.7 Les chaînes de caractères

2.8 Le formatage des nombres

2.9 Les dates et les temps

2.10 Mesure de la durée d'un algorithme

2.11 Les nombres complexes

2.11.1 Manipulations de base des nombres complexes

2.11.2 Visualisation de nombres complexes

2.12 Programmation orientée objet

2.12.1 Classes et objets, en bref

2.12.2 Constructeurs

2.12.3 Héritage

2.12.4 Objets mutables

2.12.5 Gestion de pile : implémentation Orientée Objet avec RC

3. Manipulation des données

3.1 Lecture des données : les bases

3.2 Manipulation des colonnes d'un data.frame

3.3 Calculs simples sur un data.frame

3.3.1 Calculs sur les colonnes et les lignes

3.3.2 Manipulation des lignes

3.3.3 Application : comparaison effectifs de classes et Khi-2

3.3.4 Création de colonnes calculées

3.3.5 Tri d'un data.frame via order()

3.4 Analyse visuelle des données

3.4.1 Visualisation simple des données

3.4.2 Visualisation des variables numériques 2 à 2 avec mention des classes

3.4.3 Corrélations entre variables numériques

3.4.4 Séparation par classe, ggplot2, qplot

3.4.5 Visualisation 3D, relation entre trois variables numériques

3.4.6 Graphiques par paires

3.4.7 Boîtes à moustaches et tentative d'élimination des outliers

3.4.8 Création d'un modèle par arbre de décision


Maîtriser les bases

1. Se mettre en harmonie avec les données

1.1 Quelques notions fondatrices

1.1.1 Phénomène aléatoire

1.1.2 Probabilité, variable aléatoire et distribution

1.1.3 Un peu de mathématiques : notations et définitions utiles

1.1.4 Moments d'une variable aléatoire discrète X

1.1.5 Premières considérations sur les erreurs et estimations

1.2 Se familiariser avec ses données

1.2.1 R Commander

1.2.2 Rattle

2. Matrices et vecteurs

2.1 Conventions, notations, utilisations basiques

2.2 Matrices, vecteurs : vers une introduction à la notion d'apprentissage supervisé

2.3 Plus loin dans la manipulation des matrices avec R

2.3.1 Opérations basiques

2.3.2 Quelques savoir-faire utiles sur les matrices de R

2.3.3 Normes de vecteurs et normes de matrices

2.3.4 Matrices et vecteurs : diverses syntaxes utiles

3. Estimations

3.1 Positionnement du problème d'estimation

3.1.1 Formulation générale du problème

3.1.2 Application et reformulation du problème d'estimation

3.2 Les indicateurs d'écart utilisés en machine learning

3.2.1 MSE, RMSE, SSE, SST

3.2.2 MAE, ME

3.2.3 NRMSE/NRMSD, CV_MRSE

3.2.4 SDR

3.2.5 Accuracy, R2

4. Mise en pratique : apprentissage supervisé

4.1 Préparation

4.2 Tester des hypothèses, p_value

4.2.1 Analyse graphique interactive avec iplots

4.2.2 Test de Breush-Pagan et zoom sur p_value

4.3 Création d'un modèle (régression linéaire multiple)

4.4 Établissement d'une prédiction

4.5 Étude des résultats et représentations graphiques

4.6 Indicateurs courants - calculs

4.7 Étude du modèle linéaire généré

4.8 Conclusion sur le modèle linéaire

4.9 Utilisation d'un modèle "Random Forest"


Techniques et algorithmes incontournables

1. Constituer sa boîte à outils

2. Représentation graphique des données

2.1 Un graphique "simple"

2.2 Histogrammes évolués

2.2.1 Distribution multiclasse

2.2.2 Mixture de plusieurs distributions par classe

2.2.3 Visualisation de la densité d'une distribution

2.2.4 Une autre mixture par classe

2.2.5 Une variable, mais un histogramme pour chaque classe

2.2.6 Graphique avec une densité par classe

2.3 Diagramme par paires et à facettes

2.3.1 Diagramme par paires, version simple

2.3.2 Classes en configuration XOR

2.3.3 Diagramme par paires avec "factors"

2.3.4 Facettes et échelle logarithmique

3. Machine learning : pratiques courantes

3.1 Parcours théorique accéléré

3.1.1 Linéarité

3.1.2 Erreurs in et out, notion de VC dimension

3.1.3 Hyperplans, séparabilité avec marges

3.1.4 Kernel Trick, noyaux, transformations, feature space

3.1.5 Problèmes de la régression : introduction à la régularisation

3.2 Pratique par pratique

3.2.1 Cross validation : k-fold CV

3.2.2 Naive Bayes

3.2.3 C4.5 et C5.0

3.2.4 Support Vector Machines (SVM)

3.2.5 Clusterisation, k-means

4. Où en sommes-nous dans notre apprentissage ?

4.1 Vos acquis opérationnels

4.2 Les lacunes éventuelles à combler maintenant


Cadre méthodologique du data scientist

1. Le problème méthodologique au niveau du projet

1.1 L'expression du besoin

1.2 La gestion du projet

2. Le cycle interne des data-sciences

2.1 Revue de détail du problème posé

2.2 Travaux préliminaires sur les données

2.2.1 Exigences sur les données

2.2.2 Collecte, nettoyage et compréhension des données

2.3 Le cycle de modélisation

2.3.1 Feature engineering

2.3.2 Modélisation et évaluation

2.3.3 Choix du meilleur modèle

2.3.4 Test, interprétation et confrontation avec le métier

2.4 Préparation de l'industrialisation et déploiement

2.5 Préparation des itérations suivantes

2.5.1 Éléments à prendre en compte

2.5.2 Documentation gérée par les data scientists

3. Compléments méthodologiques

3.1 Classifier vos objectifs

3.2 Trucs et astuces


Traitement du langage naturel

1. Positionnement du problème

2. Analyse sémantique latente et SVD

2.1 Aspects théoriques

2.1.1 SVD : généralités

2.1.2 Une justification de la décomposition SVD

2.1.3 SVD dans le contexte LSA

2.1.4 Interprétation

2.1.5 Alternative non linéaire, Isomap (MDS, géodésique, variété, manifold)

2.2 Mise en pratique

2.2.1 Initialisation

2.2.2 Au cœur de LSA

2.2.3 Résultats

2.2.4 Manipulations, interprétations récréatives et non fondées


Graphes et réseaux

1. Introduction

2. Premiers pas

2.1 Quelques notions et notations complémentaires basiques

2.2 Manipulations simples de graphes avec R

2.3 Structure des graphes

3. Graphes et réseaux (sociaux)

3.1 Analyse des réseaux sociaux : concepts de base

3.2 Mise en pratique

3.3 Détection de communautés


Autres problèmes, autres solutions

1. Séries temporelles

1.1 Introduction

1.2 Modèle stationnaire

1.2.1 Processus stationnaire : les bases

1.2.2 Processus autorégressif AR : aller plus loin

1.2.3 Considérations (très) utiles

1.3 Processus non stationnaires

1.3.1 Le modèle ARIMA

1.3.2 Processus saisonniers : SARIMA

1.3.3 Modèles ARCH et GARCH

1.3.4 Convolution et filtres linéaires

1.4 Mise en pratique

1.4.1 Les bases de la manipulation des séries temporelles en R

1.4.2 Étude de séries temporelles

1.4.3 Prédictions sur ARIMA (AR MA SARIMA)

1.5 Mini bestiaire ARIMA

2. Systèmes flous

3. Essaim (swarm)

3.1 Swarm et optimisation : l'algorithme PSO

3.1.1 Présentation de PSO

3.1.2 Description de PSO

3.2 Mise en pratique de PSO


Feature Engineering

1. Feature Engineering, les bases

1.1 Positionnement du problème

1.2 Ce sur quoi il faut être très attentif

1.2.1 La qualité de la distribution

1.2.2 La nature des features

1.3 Maîtriser la dimensionnalité

1.4 Une solution éprouvée : la PCA

1.5 Un exemple simple d'utilisation de la PCA

1.6 Les valeurs inconnues et les features mal conditionnées

1.7 Création de nouvelles features

1.8 En guise de conclusion

2. PCA classique, éléments mathématiques

3. Réduction des données (data reduction)

4. Réduction de la dimensionnalité et entropie

4.1 Description théorique du problème

4.2 Implémentation en R