Accueil Formations Python pour la data science : Le langage Python

Python pour la data science : Le langage Python

Intéressé.e par la formation ?
Contactez-nous

Description

Cette formation est la première d’une série de formations intitulée Python pour la Data Science. Elle a pour objectif de présenter les bases du langage Python dans l’optique de préparer les participants au suivi des autres formations de la série (Exploration de données, Apprentissage automatique Niv. 1 et 2.). Elle peut en oûtre, constituer un bon point de départ pour les personnes voulant s’initier au Python pour leur usage professionnel.

La formation est articulée autour d’un projet fil rouge de détection de SPAM. Le détecteur est implémenté uniquement à partir des bibliothèques de la librairies standard (seules les démonstrations de déploiement utilisent des bibliothèques externes).

Intra-entreprise : Sur devis

Objectifs de la formation
  • Connaitrel es bases du langage Python (variables, fonctions, boucles, conditions)
  • Connaitre les principales structures de données en Python (listes, dictionnaires, tuples, ensembles)
  • Comprendre les étapes d’un projet d’analyse de données
  • Comprendre les principes d’organisation du code dans un projet data science (Notebooks, Fonctions/classes, Bibliothèques)
  • Comprendre les modalités de déploiement d’une bibliothèque dans différents types d’applications

Profil des béneficiaires

Pour qui

  • Personnes sachant programmer dans un autre langage et voulant s’initier au langage Python
  • Personnes souhaitant se former à l’usage de Python en data science

Prérequis

  • Connaitre les bases de la programmation (variables, fonctions, boucles, etc…)
  • Une expérience pratique de la programmation est souhaitable.
  • Lecture de l’anglais technique

Contenu de la formation

  • 1. Découvertes des notebooks Jupyter

    • Les différents types de cellules
    • Markdown et formatage de texte
    • Les cellules de codes et les type d’exécution
  • 2. Premiers par en Python

    • Les types de données de bases
    • Les structures de base du langage (variables, conditions, fonctions)
  • 3. Les collections Python

    • Listes, tuples, dictionnaires et ensembles
    • Iterations
  • 4. Chaînes de caractères et fichiers

    • Ouverture de fichiers
    • Manipulation des chaînes de caractères
    • Encodages de caractères
  • 5. Cas d’études : la chaîne de prétraitement

    • Présentation du cas d’étude
    • Tokenisation
    • Normalisation
    • Comptage des mots
  • 6. Modules et packages

    • Organisation du code
    • Modules et scripts python
    • Packages
  • 7. Organisation du code et Notebooks

    • Factorisation progressive
    • Autoreload
  • 8. Exception et formatage de chaînes

    • Gestion des erreurs
    • Exceptions
    • Les différents types de formatage de chaîne
  • 9. Cas d’étude : L’algorithme de détection de Spam

    • Le classifieurs Bayésien Naif
    • Mise en place des comptages avec les dictionnaires
  • 10. Classes et persistance

    • Les classes en Python
    • Les fonctionnalités de sérialisation
  • 11. L’objet SpamDetector

    • Intégration de l’algorithme sous forme d’objet
    • Fonctionnement fit/predict
    • Sauvegarde et recharge
  • 12. Scripts Python et analyse d’arguments

    • Scripts exécutables en Python
    • La bibliothèque argparse et exécution en ligne de commande
  • 13. Les modes de déploiement (en fonction du temps disponible et des préférences des participants)

    • Script en ligne de commande
    • API REST
    • Application Web

Équipe pédagogique

  • Conception:
    • David Raulo

    • Alexis Mignon

  • Formateurs:
    • Camille BIGNET

    • Maël CAYREFOURCQ

    • Ann’Sophie Martin-Tissier

    • Gaétan VINCENT

Suivi de l’exécution et évaluation des résultats
  • Questionnaire de satisfaction

Ressources techniques et pédagogiques

  • Serveur JupyterHub pendant la formation
  • Notebooks Jupyter (version élève et formateur)
  • Données d’exemple
  • Capacité d’accueil

    12 personnes

Accessibilité

  • Description contenu

Prochaines dates

Aucune session à venir pour l’instant.