Python 実践 データ加工/可視化 100本ノック に挑戦 ノック1

Python 実践 データ加工/可視化 100本ノック」を購入したので、やり遂げる!

 

ノック1:法人情報データを読み込んでみよう

 

ノック1はcsvファイルを読み込むと文字コードエラーが発生するという話です。

記述内容は以下です。エラー原因はSJISコード指定せずにcsvファイルを読み込んだため、エラーとなりました。文字コードのデフォルトはUTF-8であるためです。

import pandas as pd

data = pd.read_csv('data/22_shizuoka_all_20210331.csv')

 

エラーメッセージ:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x90 in position 0: invalid start byte

 

csvファイルを読み込むときに文字コードの指定をするとエラーは消えました。

 

headerも存在しないのでheader=Noneも追加します。

 

import pandas as pd

data = pd.read_csv('data/22_shizuoka_all_20210331.csv',
                   encoding="shift-jis",header=None)

#先頭5行表示
print(data.head())
#データ件数の表示
print(len(data))

 

/* -----codeの行番号----- */