Machine Learning(機械学習)

Programmingの公式: ルール + データ = 解答

Machine Learningの公式: 解答 + データ = ルール

正則化:過学習を抑制するための手法

標準化:データの平均を0に、標準偏差を1に変換すること

正規化:データを0から1に収まるようにスケーリングすること

転移学習:学習済みモデルの重みは固定し、出力層だけを付け替えて学習します。

例:犬と猫と人間を分類するモデル → 犬と猫を分類するモデル(犬と猫のデータで再学習)

ファインチューニング:学習済みモデルの重みを初期値とし、全部の層を再度学習することによって微調整します。

例:犬と猫と人間を分類するモデル → 柴犬と秋田犬を分類するモデル、人間を年代毎に分類するモデル (全く異なるモデルへ)

Data Mining Map

Supervised Learning :

Unsupervised Learning :

scikit-learn

http://scikit-learn.org/stable/

基本的にやるべきことが三つ

# Collect data

features = [[160,30],[170,15],...]

labels = [0,1,...]

# Training classifier

from sklearn import tree

clf = tree.DecisionTreeClassifier()

clf.fit(features,labels)

# Predict data

print(clf.predict([[180, 10]]))