Introduction to big data tools

Introduction to big data tools (In French) @ University of South Brittany, 2018-2019

2019-03-13

Introduction, Linux, parallélisme en R

Travaux pratiques Linux

2019-03-20

Parallélisme et descente de gradient stochastique

Travaux pratiques parallélisme

code du slide 50

Travaux pratiques descente de gradient stochastique, fichiers associés

2019-03-27

Hadoop MapReduce

Travaux pratiques

2019-04-03

Spark

Travaux pratiques

2019-04-24

Introduction à l'apprentissage par renforcement

Travaux pratiques: suite exercice précédent ou préparation du rapport

Travaux 2018-2019: remise par email pour le 10 mai

Bases de données déjà choisies:

- Intervention service d'incendie à Montreal

- Open Payments Dataset:

- 2016

- 2017

- Open Damir : base complète sur les dépenses d'assurance maladie interrégimes Janvier 2018

- 1400 livres de la littérature française (Bibliothèque Québec)

- Taxis

- chicago

- NY

- Crimes

- Washington

- Montréal

- rapports de Police San Francisco

- Infraction parking

- NY

- Los Angeles

- Philadelphie

- Requêtes citoyennes à Montréal

- KDD Cup 1999 Data network intrusion detector

- horodateurs Paris

- temps-de-parole-des-hommes-et-des-femmes-a-la-television-et-a-la-radio

- consommation d'électricité pour des groupes de foyer

- taux de changes de Janvier 2018 à Mars 2019

- livres bibliothèques de Paris

- Acquire Valued Shoppers Challenge

- Yahoo! muser User ratings of Musical Artists.

Introduction to big data tools (In French) @ University of South Brittany, 2017-2018

2018-03-28

Introduction, Linux, parallélisme en R

Travaux pratiques Linux

Travaux pratiques parallélisme

code du slide 50

2018-04-04

Stochastic gradient descent

Travaux pratiques, fichiers associés

solutions

2018-04-11

Hadoop MapReduce

Travaux pratiques

2018-04-18

Spark

Travaux pratiques

solutions

Travaux 2017-2018: remise le 16 mai par email

Bases de données déjà choisies:

    • Classe / lvl / wow

    • connections hotspots Paris

    • prix maisons UK

    • call for assistance NY

    • aéroports US

    • crimes LA

    • crimes Londres

    • plaintes à New York

  • données médicale artificielles EMRBOTS

    • contravention parking NY

  • demandes de visa H-1B

    • bombardements au Vietnam

    • contraventions électroniques Montgomery County Maryland

    • radiations (données Safecast)

    • paiements aux médecins (US)

    • ensoleillement US

    • attaques terroristes dans le monde

    • crimes Seattle

    • call for assistance Austin

    • niveau CO2 1990-2017

Introduction to big data tools (In French) @ University of South Brittany, 2016-2017

2017-03-06

Introduction, Linux, parallelism in R

Travaux pratiques

2017-03-13

Stochastic gradient descent

Travaux pratiques, fichiers associés

2017-03-20

Hadoop MapReduce

Travaux pratiques

2017-03-27

Introduction à python

notebook associé

2017-04-02

Introduction à Spark

Travaux pratiques

fichiers

During my PhD, I contributed to teaching two courses: "Introduction to stochastic processes" and "Information and coding theory". I was also involved in the setup of the course "Elements of probability theory". I really enjoyed this experience, in particular the student projects I created for "Information and coding theory". Students involvement was high, and some of them even did a PhD in my lab!

More details can be found on my former website (in French).