matplotlib: 超単純なデータの可視化

  •  適当なデータをCSV形式で持っているものとする
  • そのデータをグラフ上で示す
インストール
pip install matplotlib pandas 

例えば以下のようなヘッダ付きのCSVファイルがあるとする。ファイル名を data.csv としておく。適当なデータです。
id,value
1,0.5
2,2.8
3,4.9
4,8.6
5,10.9
プロット
import pandas as pd
import matplotlib.pyplot as plt
# 1行目に各列の説明が書かれているので header=0
# 1列目がインデックスに相当するので index_col=0
df= pd.read_csv('data.csv', header=0, index_col=0)
# プロットの実施。x, y として使うデータを指定し、〇で表示する
# インデックスは .index でアクセスし、それ以外の列は見出し名でアクセス
plt.plot(df.index, df['value'], marker='o')
# 表示。表示コマンドが分かれているのは、グラフの見た目調整などを別途実施できるため。
plt.show()
環境によりますが、Windowsでは以下のようなグラフが表示されます。表示されたグラフは移動したりズームしたりすることが可能。

matplotlib シンプルなグラフ



ちなみに、df (DataFrameの略、pandasでCSVデータを読んだときに作成されるクラス)の中身を見るには普通に print をしてみるとわかります。
>>> print(df)
    value
id
1     0.5
2     2.8
3     4.9
4     8.6
5    10.9
これ以外のアクセス方やPandas側の機能を利用したPlotもありますのでご確認ください。

コメント

このブログの人気の投稿

gnuplot: グラフの色を変更する

[Linux] rsyncで進捗を確認する

gnuplotで縦線を引きたい