Domaines d’enseignement
Business Intelligence & Data Visualization
• Architecture et conception du Data Warehouse,
• OLAP multidimensionnel,
• Intégration de données (ETL), Outils Talend :
- Rediriger des données mono-source ou multi-source avec tMap
- Transformer les données (variables, jointures, expressions…)
- Gestion des itérations, logs et erreurs
- Fonctions avancées : Créer et gérer les variables contextuelles, Créer des routines
• Reporting et tableaux de bord, Outils Power BI
- Power BI Query : Prétraitement, filtrage, transformation de données
- Langage DAX,
- Power BI et Script Python
- Power BI et Web Scraping
Data Science & Data mining
• Data science avec Python : Bibliothèques pandas, plotgraph, seaborn, ….
• Gestion de données manquantes et aberrantes,
• Réduction de la dimensionnalité : Feature selection, Feature extraction
• Règles d’association
• Social Media Analysis
• Forecasting Models
Architectures logicielles distribuées & DevOps
• Services web et API REST avec Java EE
• Hibernante, JPA Spring MVC pour le développement web
• Persistance des données avec Spring Data
• Couche de présentation JSF
• Maven project
• MicroServices Architecture
• DevOps: Git, GitHub, Docker, Jenkins, Ansible, CICD…
Machine Learning
• Machine Learning ?
• Régression linéaire, Régression logistique,
• Apprentissage supervisée : Arbre de décision, K-NN, NB, SVM, Random Forest...,
• Apprentissage non supervisée : Kmeans, HAC, DBScan, ...,
• Optimisation des paramètres d’apprentissage
Deep Learning & Intelligence Artificielle
• Les enjeux de l’apprentissage profond
• Réseaux de neurones perceptron multicouches (PMC)
• Réseaux de neurones à convolution (CNN)
• Réseaux de neurones récurrents (RNN-LSTM)
• Encoder-Decoder
• Réseaux autoencoders – Transformers
Transfert learning, Reinforced learning
• Cas d’utilisation en Python : classification d’images, Computer Vision et Natural Language Processing,
Natural Language processing (NLP) et IA Generative
• Techniques de base du NLP
• Modèles de langage et embeddings
• Intelligence artificielle générative
• Modèles de langage génératifs : GPT-2 et GPT-3 : architecture et entraînement
• Génération de texte, de code et d'images
• Contrôle et guidage de la génération
• Applications de l'IA générative
Big Data & Big Data Analytics
• Ecosystème Hadoop, HDFS, MapReduce, YARN
• Hive, Flux de données dans Hive
• Apache Pig, création de script
• HBase en mode distribué
• Sqoop et Flume
• Framework distribue Spark
• Langage Scala
• Interactive Data Analysis avec Spark
• Spark Streaming, Kafka
Base de données avancées Oracle
• SQL sous Oracle, PL/SQL, Oracle Apex
• DBA1 Oracle :
- Architecture du Serveur Oracle
- Gestion de la sécurité et des ressources (Privilège, Role, Profil)
- Gestion de l’espace physique d’une base
- Gestion d’une base de données : Création, démarrage et arrêt
- Transfert de données (export/import)
- Chargement de données (SqlLoader)
• DBA2 Oracle :
- Gestion des fichiers de contrôle, et de journalisation (Redo logs)
- Sauvegarde et restauration
- Audit de base de données
• Optimisation
- Plan d’exécution de requêtes, Index, Cluster, ….
• Bases de données réparties,
Agile Management de projet Informatique
• Processus de développement de projet informatique
• Les modèles de développement
• Planification et Estimation
• Méthode agile SCRUM :
- Cycle du Scrum
- Acteurs du Scrum: Product Owner, Scrum Master, Scrum Team
- Planification: Sprint, Daily Scrum, Revue de sprint, Rétrospective
- Outils: Product-backlog, User stories, Burndown chart, Task board, Roadmap
Génie logiciel et Système d’information
• Architecture et urbanisation du SI
• Cycle de développement du logiciel
• Ingénierie dirigée par les modèles
• Design Patterns
• UML
• Merise
• ERP (Progiciel de gestion intégré)