これはいまだによくわかっていない。↓


# 正規化
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
scaler.fit(X_train)

X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)



なので、1つの定義として覚えた。


この正規化をする定義の効果
「これをやると人工知能の精度が上がる。」



調べると


正規化と標準化と2種類があるらしい。

  1. StandardScaler
  2. MinMaxScaler


このサンプルコードでは、正規化とコメントしてるけど、


StandardScalerというのは標準化のことらしい。


確認はしてない。とりあえず、ソースコードに沿って書く。



コードの中身


この行↓

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()

「今から標準化するよ!」っていう宣言みたいなもん。


これをしないとエラー。


これで、scalarという関数が使える。



で次の行。

scaler.fit(X_train)


ここでは、scalarのfitという計算をX_trainにしている。


X_trainとは、トレーニング用のデータ。


fitっていうのは、パラメータの計算しなさいという命令らしい。


パラメーターっていうのは、平均とか標準偏差とか難しい数字。


で、そのパラメータを出したら、

X_train = scaler.transform(X_train)

これで、X_trainに、さっきのパラメータを元にX_trainをデータ変換する。


ついでに、X_test(テスト用データ)も変換。
X_test = scaler.transform(X_test)


ここはそんな感じで覚えた。