【python】時系列データの扱い方｜parse_dates=True

pythonで時系列データを扱うには、pandasを使います。pd.read（）でCSVファイルを読み込みますが、

時系列分析であることを示すこと
ｃｓｖファイルで読み込んだ日付の列をインデックスにすること

を示すことが必要です。

経済統計の使い方では、統計データの入手法から分析法まで解説しています。

【python】pythonのまとめ経済統計の使い方では、統計データの入手法から分析法まで解説しています。 https://officekaisuiyoku.com...

pythonで時系列データの扱う方法を説明します。パッケージはpandasを使います。以下のCSVファイルをデータとして使います。

通常のデータフレームでは、行番号を示すインデックスは、ゼロから順に番号が振られますが、インデックスを日付に変えて、時系列データとして使います。そのためには、

時系列分析であることを示すこと
ｃｓｖファイルで読み込んだ日付の列をインデックスにすること

が必要になります。

import pandas as pd
cp=pd.read_csv("cp.csv",parse_dates=True,index_col='year')

parse_dates=True で時系列分析にできます。

index_col=’year’　で’year’の列をインデックスとして使うことを指定します。日付の書式のデフォルトは「yyyy-mm-dd」です。csvファイルは年のデータなので、1980など4桁だけいれてあります。

これを実行すると以下のようにデータが読み込まれます。yearの列が日付データとなっています。

cp.plot()でグラフで書くと以下のようになります。

エクセルばかり使ってたので、2022/04/05のような書式がデフォルトなのかと思っていましたが、2002-04-05の書式がデフォルトでした。

1980と入力しても1980-01-01に変換してくれます。

python

【python】時系列データの扱い方｜parse_dates=True

【EViews】推計結果の保存｜保存できるものをすべて紹介

【python】pythonをダウンロードして使う場合

【回帰分析】課題３　相関係数

COMMENT コメントをキャンセル

Recent Posts

【python】pythonのまとめ

【統計学】【エクセル】相関係数、相関係数行列の計算法　｜CORREL関数と分析ツール

【経済学】長期費用曲線と短期費用曲線の違いのまとめ－総費用、平均費用と限界費用

【R】データフレームの中身を確かめる｜class ,head ,tail,dim ,str

【R】　table関数

【gretl】gretlのまとめ｜インストールから回帰分析まで

【R】ディレクトリーの確認、移動｜getwdとsetwd

【計量経済学】最小二乗法の推定誤差|標準誤差とｔ値

【計量経済学】シグマ（和記法）の公式のまとめ｜知っておくと便利

【計量経済学】説明変数の内生性と操作変数｜説明変数が誤差項の影響を受ける場合

【計量経済学】BLUEとは｜最良線形不偏推定量について徹底解説