Exercice de compréhension élémentaire de la séparation linéaire et des plus proches voisins.
L'objectif de cet exercice élémentaire est de faire comprendre que la distance euclidienne est sensible aux échelles de valeurs des attributs et que, pour toute méthode d'apprentissage basée sur une distance euclidienne, il est conseillé de normaliser les attributs.
L'objectif de cet exercice est de montrer qu'il existe différentes distances et différentes géométries. Par exemple, la distance de la vie courante est la distance euclidienne que vous avez vu en mathématique. Mais, dans la vie courante, il existe d'autres distances comme la distance entre deux villes qui est la somme des distances entre des étapes sur le graphe des routes ou la distance à vol d'oiseau qui est une distance sur une sphère (la terre). Ici, nous voyons les principales distances de base utilisées en apprentissage machine.
L'objectif de cet exercice est d'introduire une similarité (et une distance) très utilisée en recherche d'information qu'est la similarité cosinus. Vous pouvez par exemple consulter le cours suivant sur mon site pour comprendre l'intérêt de cette similarité pour la recherche d'information mais de nombreuses autres sources sont disponibles.