​​​​​​​Certificat Data Processing

Certificat Data Processing

Présentation

Durant les 5 dernières années, nous avons créé autant de données que depuis les débuts de l’humanité. Au regard de ces données présentes en grande quantité, les entreprises souhaitent les valoriser pour en extraire des éléments propices leur permettant de mieux piloter leur activité, d’assoir leur positionnement concurrentiel ou d’élargir leur domaine de prédilection.

Avant de pouvoir transformer ces données brutes en éléments de valeur pour l’entreprise, il est nécessaire d’effectuer des traitements. Il faut au préalable les valider, les organiser en les réduisant les agrégeant et les classifiant afin d’en permettre l’interprétation ainsi que l’analyse.

Le « DATA Processing » est un maillon primordial pour la préparation des données en amont de toute analyse sans quoi les résultats obtenus n’en seraient que peu pertinents. Il est largement rapporté que les « Data Scientists» consacrent environ 80% de leur temps à la préparation de données.

C’est dans ce contexte qu’il est envisagé de proposer un certificat « DATA Processing » avec pour vocation de faire monter en compétences les « DATA Engineer » et les experts Business Intelligence (BI) impliqués, ou susceptible de l’être, dans des projets de préparation des données massives.

Objectifs

  • Connaitre les spécificités, la complexité et les problématiques liées à la gestion des données massives
  • Comprendre les concepts nécessaires pour manipuler les données massives
  • Découvrir les solutions et les applications existantes pour la gestion des données massives
  • Etre capable de proposer et d’auditer des architectures BIG DATA
  • Etre capable de mettre en place et/ou faire évoluer le « Pipeline » de traitement des données massives.

Publics visés

Le certificat cible plusieurs publics :

  • Les « Data Scientist »
  • Les « Data Analyst »
  • Les développeurs et les concepteurs de logiciel
  • Les consultants Business Intelligence (BI).
  • Les « Data Stuart » et les chefs de projets avec des solides connaissances en informatique

Et aussi des informaticiens, mathématiciens ou autres qui souhaitent une reconversion professionnelle vers les métiers du numérique et particulièrement le domaine de la « Data science », moyennant la validation des modules de mise à niveau recommandés pour ce certificat.

Thématique / Enseignement :

Pour la validation de ce certificat, l’apprenant devra suivre et valider les quatre modules de spécialisation suivants :

  1. Data Wrangling, Data Quality 
  2. Algorithmique et programmation en Spark
  3. Data Lake / Lakehouse / Spark Delta Lake
  4. Projet « DATA Processing »

Les modules de mise à niveau recommandés pour le certificat

Pour ceux et celles qui souhaitent acquérir ou approfondir les prérequis nécessaires à ce certificat, peuvent suivre un ou plusieurs des modules de mise à niveau suivants : 

  1. Programmation Python
  2. Programmation Python avancée
  3. Programmation SQL
  4. Les Systèmes de Gestion de Bases de Données (SGBD) classique
  5. Environnements de développement et Framework : Linux (script Shell), Docker, Hadoop et Spark.
  6. Programmation JAVA
  7. Introduction à la programmation Scala.

Conditions d’admission

Peuvent être admis au certificat « DATA Processing », les candidats qui ont validé le test technique d’évaluation proposé par ce certificat au niveau de la procédure d’inscription.

Sont admis d’office les candidats qui ont validé, au minimum, les 3 modules de mise à niveau suivants :

  1. Programmation Python avancée
  2. Introduction à la programmation Scala
  3. Environnements de développement et Framework : Linux (script Shell), Docker, Hadoop et Spark