Pythonでデータを美しく見せるSeabornは活用していますか?たまに利用しようとしてもグラフの種類やコードがぱっと思い浮かばないこともあるかと思います。
この記事では、Seabornの基本的なグラフ描画方法を、特にboxplotやbarplotなどのメソッドを中心に、わかりやすくまとめてみました。メソッドの名前を忘れてしまった時にも、サッと参照できるように簡潔にしています。
目次
Seabornのインポート
まずはじめに、Seabornとpyblotのライブラリのインポートを行います。
import seaborn as sns
import matplotlib.pyplot as plt
この一行でSeabornの機能が利用可能になります。
Seaborn(sns)のグラフの種類とコード例
棒グラフ (Bar Plot)
棒グラフは、カテゴリ別のデータ比較に適しています。
# Seabornで棒グラフを作成
# Seabornのサンプルデータセット 'tips' を読み込む
# このデータセットはレストランのチップに関するデータを含んでいる
tips = sns.load_dataset("tips")
# 棒グラフの例: 日別の合計請求額を表示
sns.barplot(x="day", y="total_bill", data=tips)
plt.show() # グラフの表示
散布図 (Scatter Plot)
散布図は、2変数間の関係を視覚的に捉えるのに役立ちます。
# 散布図の例: 請求額とチップの関係を表示
sns.scatterplot(x="total_bill", y="tip", data=tips)
plt.show()
折れ線グラフ (Line Plot)
折れ線グラフは、時間経過に伴うデータの変化や異なるカテゴリ間での数値の比較に適しています。
# 折れ線グラフの例: 曜日別の合計請求額の平均を性別で分けて表示
sns.lineplot(x="day", y="total_bill", hue="sex", data=tips)
plt.show()
ヒストグラム (Histogram)
ヒストグラムはデータの分布を視覚化するのに適しています。
# ヒストグラムの例: 請求額の分布を表示
sns.histplot(tips["total_bill"], kde=True) #kdeで曲線を追加
plt.show()
箱ひげ図 (Box Plot)
箱ひげ図は、データの分布と外れ値を確認するのに有用です。
# 箱ひげ図の例: 日別の請求額の分布と外れ値を表示
sns.boxplot(x="day", y="total_bill", data=tips)
plt.show() # グラフの表示
ヒートマップ (Heatmap)
ヒートマップは、変数間の相関関係を視覚的に表現します。
# ヒートマップの例: 変数間の相関関係を表示
corr = tips.corr()
sns.heatmap(corr, annot=True) #annotで数値を表記
plt.show()
以上、SeabornはPythonにおけるデータの視覚化において非常に有力なツールです。今回紹介したグラフの種類を把握しておき、利用頻度が高いものはメソッド部分も覚えておくとよいと思います。そしてこの記事はリファレンスとして参照できるよう、ぜひブックマークしておいてください。