【python】csvファイルの読み込み｜pandasを利用

pythonでcsvファイルを読み込む方法を説明します。

pandasをインポートして、pd.read_csv(“ファイル名”)で読み込むことができます。

経済統計の使い方では、統計データの入手法から分析法まで解説しています。

【python】pythonのまとめ経済統計の使い方では、統計データの入手法から分析法まで解説しています。 https://officekaisuiyoku.com...

pandasを使用

pythonの修得について、通常は、NumPyを使った配列などの練習から始まるところだと思いますが、そこで習得することが長いとなかなか先に進めません。そこで、データの読み込みから始めます。とりあえずデータが読み込めれば、自分でいろいろと試行錯誤できて、楽しいからです。

統計による分析を前提にすると、データフレームの形で読み込むと様々な加工ができます。パッケージのpandasを使ってcsvファイルを読み込むことにします。

データがカレントディレクトリーにある場合は、ファイル名を指定すれば読み込めます。グーグルドライブにあるデータを使う場合は「グーグルドライブの利用」を参照してください。

データフレーム名＝pd.read_csv(“ファイル名”)

import pandas as pd
cp=pd.read_csv("cp.csv")
cp

これで、データが読み込めます。pythonで色々データ加工もできますが、エクセルでそれらをすませておけば、読み込んだ後、すぐ分析ができます。

ｃｓｖファイルの第1行が変数名になります。

グーグルドライブにあるファイルを読み込む場合は以下を参照してください。

【python】グーグルドライブ（google drive)の利用 Google colaboratory(略してColab）を使ってpythonを使う例を説明します。Colabだけでpythonは使...

ヘッダーの読み込み

オプションを指定しないと、1行目がヘッダーとなり、2行目からがデータとなります。オプションとしてheader=2とすると、3行目がヘッダーとなり、それ以外の行（1行目、2行目も含む）がデータとなります。1行目と2行目を読み込みたくないときは、skiprows=2とすると、上から2行分読み込まず、その次の行をヘッダーとみなします。

目的	オプション
1～2行目を読み込まない	skiprows=2
1～2行目を読み込まず、3行目をヘッダーにする	skiprows=2,header=0（header=0は省略可）
ヘッダーなしで読み込む	skiprows=2,header=None