Science des données (IFT3700/IFT6758)

Alain Tapp
alain.tapp@gmail.com
AA3345
Disponibilité: les mardis de 14h30 à 16h00.




Examen INTRA (30%)
  • 10/30/2018
  • Ma 12:30 - 14:29
  • N-515 Pav. Roger-Gaudry

Examen FINAL (40%)
  • Préparation pour le final
  • Plan de l'examen
  • 12/17/2018
  • Lun 09:30 - 12:29
  • N-615 Pav. Roger-Gaudry
  • EXEMPLES DE QUESTIONS
Travail 1 
Travail 2 
Plan de cours


  1. Les données
    1. Audio et vidéo 
    2. Text
    3. Données structurées
    4. Collecte de données
    5. Nettoyage de données
    6. Bases de données relationnelles
  2. Méthodologie (English)
    1. Méthode scientifique
    2. Jeu de données
    3. Modéliser (paramètres)
    4. Probabilité bayésienne
    5. Test d'hypothèse (p-values)
    6. Rappel statistique et Corrélation
    7. Relations causales
  3. Partitionnement de données (English)
    1. Distance et similarité
    2. Regroupement hiérarchique
    3. Algorithme espérance-maximisation
      1. k-moyenne
      2. GMM
    4. DBSCAN
  4. Réduction de dimensionnalité (English)
    1. PCA
    2. PCoA
    3. ISOMAP
  5. Prédiction (English)
    1. KNN
    2. Arbres de décision
    3. Méthode d'ensemble (Forest aléatoire)
    4. Inférence bayésienne
      1. GMM pour la classification
      2. Réseau bayésien général
      3. Réseau naïf
      4. HMM
    5. SVM avec ou sans noyau
  6. Réseau de neurones (English)
    1. Mise en contexte
    2. Apprentissage
    3. Applications
  7. Recherche d'information (English)
    1. Recherche par mot clé (tf * idf)
    2. Hachage et filtre de Bloom
    3. Localy sensitive hashing
  8. Données massives (English)
    1. MapReduce
    2. Hadoop
  9. Recherche de patrons (English)
    1. Modèle du sac d'épicerie
    2. Patrons fréquents
    3. Règles d'associations  
    4. Algorithme Apriori
    5. Algorithme FP-trees
  10. Éthique 
    1. Vie privée
    2. Justice et biais
    3. Transparence et reddition de compte
    4. Risques existentiels
    5. Minage de données confidentielles

TPs

Outils


Youtube

    Ouvrages pertinants

    • WIKIPEDIA
    • Mining of Massive Datasets (Jure Leskovec, Anand Rajaraman, Jeff Ullman) (PDF)
    • Techniques d'apprentissage (Hugo Larochelle)
    • Factfulness: Ten Reasons We're Wrong About the World – and Why Things Are Better Than You Think, Hans Rosling, 2018.
    • Thinking, Fast and Slow, Daniel Kahneman, 2012.
    • Nudge: Improving Decisions About Health, Wealth, and Happiness, Richard H. Thaler, 2009.
    Assistant d'enseignement

    • Philippe Brouillard (philippebrouillard@gmail.com)
    • Arnaud L'Heureux (arnaud.heureux500@gmail.com)

    Évaluation
    Travail 1: 15%
    Travail 2: 15%
    Intra: 30%
    Final: 40%




    Comments