Course 6 : Ensemble methods
Lecture 6: Lecture 6.pdf.
Notebooks of Lecture 6 : Lecture6a.ipynb, Lecture6b.ipynb.
Datasets : PimaDiabets.csv
Quantiles : site de Piketty
Données tabulaires
McElfresh, Duncan, et al. When do neural nets outperform boosted trees on tabular data?. Advances in Neural Information Processing Systems 36 (2024). pdf
Kim, Myung Jun, Léo Grinsztajn, and Gaël Varoquaux. CARTE: pretraining and transfer for tabular learning. arXiv preprint arXiv:2402.16785 (2024). pdf
Course 5 : Linear regression
Lecture 5 : Lecture5.pdf
Notebooks : Lecture5a.ipynb, Lecture5b.ipynb
Practical session : Lab5_empty.ipynb
Course 4 : Optimisation
Backgroud on derivatives and partial derivatives : Lecture4a.ipynb and Lecture4b.ipynb
Lecture 4 : Lecture4.pdf
Companion notebooks : Lecture4c.ipynb
Programme du partiel du 7 Novembre 2025 : ici
Sujet partiel 2024-2025 : ici.
Attention le clustering avait été vu l'an dernier et n'est pas au programme
Lab 1
Dataset : mamals.csv
Course 3 : PCA
Lecture 3 : PCA.pdf. Notebooks : ForLoops.ipynb, PCA_Breast.ipynb, PCA.ipynb
Datasets : GES5325_markers.csv, leaf.csv, rs.csv
Lab 3 : Lab3.pdf. Dataset : mamals.csv. Visualize with Python here
Course 2 : Matrices
Lecture 2 : Matrices.pdf, Eigenvalues.pdf
Notebooks : Vectors.ipynb, Matrices.ipynb, Eigenvalues.ipynb
Course 1 : Basics on Random Variables and Exploratory Data Analysis
Lecture 1 : Lecture1.pdf. Exploratory Data Analysis : EDA1.pdf
The dataset Ames House : AmesHouseDataset.csv
Course 0 : Basics on Python
Introduction to Python : IntroductionPython.ipynb
Introduction to the Numpy library: IntroductionNumpy.ipynb
Introduction to the Pandas library : IntroductionPandas.ipynb. The dataset president_heights.csv
Complements to Pandas : ComplementsPandas.ipynb. Datasets cereal.csv
Introduction to the Seaborn library : IntroductionSeaborn.ipynb