Python 実践 データ加工/可視化 100本ノック に挑戦 ノック58

Python 実践 データ加工/可視化 100本ノック」を購入したので、

一通りやっているところです。今日はノック58を行います。

資料は以下から入手できます。

Python実践 データ加工/可視化 100本ノック|サポート|秀和システム

 

ノック58 : 単語の使用状況をグラフで可視化しよう

 

グラフ化するためのデータを用意します。

名詞の使用回数上位10を表示します。

count = me01.groupby('原形').size().sort_values(ascending=False)
count.name = 'count'
count = count.reset_index().head(10)
print(count)

 

 

実行結果

   原形  count
0    *    155
1    の     78
2    私     76
3    人     30
4  おまえ     20
5    王     19
6    友     18
7    事     15
8    君     13
9    妹     12

 

この情報をグラフ化します。

import matplotlib.pyplot as plt
import seaborn as sns
import japanize_matplotlib
plt.figure(figsize=(10,5))
sns.barplot(x=count['count'],y=count['原形'])
plt.show()

 

実行結果

名詞 上位10件

 

 

名詞+動詞でも見てみます。

count = me02.groupby('原形').size().sort_values(ascending=False)
count.name = 'count'
count = count.reset_index().head(10)
print(count)
plt.figure(figsize=(10,5))
sns.barplot(x=count['count'],y=count['原形'])
plt.show()

実行結果

   原形  count
0    *    155
1    の     78
2    私     76
3    人     30
4   来る     29
5   走る     23
6  くれる     21
7  おまえ     20
8    王     19
9    友     18

 

来る、走る、くれるなどの動詞が多く使用されていることがわかります。

グラフ化すると、

名詞+動詞 上位10件

 

/* -----codeの行番号----- */