Python 実践 データ加工/可視化 100本ノック」を購入したので、
一通りやっているところです。今日はノック58を行います。
資料は以下から入手できます。
Python実践 データ加工/可視化 100本ノック|サポート|秀和システム
ノック58 : 単語の使用状況をグラフで可視化しよう
グラフ化するためのデータを用意します。
名詞の使用回数上位10を表示します。
count = me01.groupby('原形').size().sort_values(ascending=False)
count.name = 'count'
count = count.reset_index().head(10)
print(count)
実行結果
原形 count
0 * 155
1 の 78
2 私 76
3 人 30
4 おまえ 20
5 王 19
6 友 18
7 事 15
8 君 13
9 妹 12
この情報をグラフ化します。
import matplotlib.pyplot as plt
plt.figure(figsize=(10,5))
plt.show()
実行結果
名詞+動詞でも見てみます。
count = me02.groupby('原形').size().sort_values(ascending=False)
count.name = 'count'
count = count.reset_index().head(10)
print(count)
plt.figure(figsize=(10,5))
plt.show()
実行結果
原形 count
0 * 155
1 の 78
2 私 76
3 人 30
4 来る 29
5 走る 23
6 くれる 21
7 おまえ 20
8 王 19
9 友 18
来る、走る、くれるなどの動詞が多く使用されていることがわかります。
グラフ化すると、