前回の続きから次の段へ

def read_temp(filename):
    df_temp = pd.read_csv(filename,encoding="Shift_JIS",skiprows=4)
    df_temp.columns = ["DATETIME","TEMP","品質情報","均質番号"]
    df_temp.DATETIME = df_temp.DATETIME.map(lambda _: pd.to_datetime(_))
    return df_temp

# 岡山
df_temp_okym = read_temp("data_okayama-2016.csv")
df_temp_okym.rename(columns = {'TEMP':'TEMP_okym'}, inplace=True)

# 広島
df_temp_hrsm = read_temp("data_hiroshima-2016.csv")
df_temp_hrsm.rename(columns = {'TEMP':'TEMP_hrsm'}, inplace=True)

# 可視化
df_temp_okym.TEMP_okym.plot(figsize=(15,4))
df_temp_hrsm.TEMP_hrsm.plot(figsize=(15,4))


これは、3つに分けて考える。


一番上にあるdefって書いてあるところ。

あれは、関数のこと。defと宣言して関数の名前を書けば
それを実行することが出来る。何度も同じ作業をするようなことがある場合は
関数にしておくと便利。


今回の関数は、名前は、read_temp、動く条件としては、ファイルの名です。

まぁ、これはCSVを読み込む関数ですね。

中を1つずつ見てみましょう。

df_temp = pd.read_csv(filename,encoding="Shift_JIS",skiprows=4)

前回と同じで、CSV読込です。

このCSVファイルの最初を4行飛ばして読み込んでます。

CSVファイルの中身は、こう↓


5行目から欲しいので、4行飛ばしてます。

この段階では中身はこう↓



次の行
df_temp.columns = ["DATETIME","TEMP","品質情報","均質番号"]


これは、カラム名を設定してます。

中身はこう↓



次。

df_temp.DATETIME = df_temp.DATETIME.map(lambda _: pd.to_datetime(_))

これは、前回と同じく、日時の認識。中身はこう↓


ちなみにさっきのは、

df_temp.[カラム名] = df_temp.[カラム名].map(lambda _: pd.to_datetime(_))

という構成。


関数は、CSVファイルを読込。整理するという関数になっている。


次の#岡山と#広島のところ。これはCSVを読込するだけなので、関数を呼び出してる。

df_temp_okym = read_temp("data_okayama-2016.csv")



次の
df_temp_okym.rename(columns = {'TEMP':'TEMP_okym'}, inplace=True)

カラムの名前の変更です。

TEMPをTEMP_okymに変更。中身はこう。



#広島も#岡山と同様の処理です。

一旦ここまで。