読者です 読者をやめる 読者になる 読者になる

goodbyegangsterのブログ

備忘録的な

csvファイルをpandasに取り込む

分析したいcsvデータをpandasに取り込んでみます。

例として、ドル円の日足データを取り込みます。実際のデータは以下で、m2jのサイトからダウンロードしてきました。

日付,始値,高値,安値,終値
2016/01/04,120.21,120.44,118.69,119.43
2016/01/05,119.33,119.66,118.78,119.04
2016/01/06,119.03,119.14,118.22,118.46
2016/01/07,118.45,118.71,117.31,117.64
2016/01/08,117.63,118.74,117.35,117.39
2016/01/11,116.9,117.99,116.65,117.75
2016/01/12,117.76,118.04,117.22,117.63
(以下略)

read_csvという関数が用意されているので、それを使います。データフレーム形式にしてくれます。

pandas.read_csv — pandas 0.19.1 documentation

>>> import pandas
>>> df = pandas.read_csv("./USDJPY.csv")
>>>
>>> df.head()
           日付      始値      高値      安値      終値
0  2016/01/04  120.21  120.44  118.69  119.43
1  2016/01/05  119.33  119.66  118.78  119.04
2  2016/01/06  119.03  119.14  118.22  118.46
3  2016/01/07  118.45  118.71  117.31  117.64
4  2016/01/08  117.63  118.74  117.35  117.39
>>>
>>> df.query('日付 == "2016/01/29"')
            日付     始値      高値      安値      終値
19  2016/01/29  118.8  121.66  118.38  121.02

1行目の値を、自動的にcolumnsにしてくれてます。いい感じですね。