7
Most read
11
Most read
統計の基礎を楽しく学ぼう
-箱ひげ図編-
アサヒビジネスソリューションズ
百足山 実花
自己紹介
1
名前:百足山 実花
所属:アサヒビジネスソリューションズ株式会社
好きなお酒:ビール、シードル
趣味:映画&海外ドラマ鑑賞
(Prime、Hulu、Netflix入会済み)
2017年入社。大学において深層学習を研究テーマとしていたことも
あり、入社早々に機械学習および深層学習を用いたプロジェクトに
参画。AIコミュニティ「AI×Analytics×女子部」の主催者でもある。
突然ですが、箱ひげ図ってなんでしょう
2
株価チャート
箱ひげ図
株価チャート
箱ひげ図は、データの特長を捉えるために重要な5つの基本統計量(分布の特長を要約する値)を表現したもの
です。最小値、第1四分位点、中央値、第3四分位点と最大値が以下の図に表現されています。また、外れ値がど
の程度存在するのかを確認するにも有効です。
最大値
第3四分位点
中央値
外れ値
第1四分位点
最小値
※「×」で平均値を表現する場合もあります。
ひげ
四分位範囲
中央値、第1四分位、第3四分位
4
10 11 12 13 10 25 28 31 33 37 41 56 70 87 90
50%50%
「中央値」
中央値はデータを降順か昇順で並び替えて真ん中に位置する値(50パーセンタイル値)を意味し、以下のケースで
は31が中央値にあたります。 4分の1に位置する値(25パーセンタイル値)を第1四分位、4分の3 (75パーセンタイ
ル値)に位置する値を第3四分位といいます。
「第1四分位」 「第3四分位」
箱ひげ図
株価チャート
箱ひげ図は、データの特長を捉えるために重要な5つの基本統計量(分布の特長を要約する値)を表現したもの
です。最小値、第1四分位点、中央値、第3四分位点と最大値が以下の図に表現されています。また、外れ値がど
の程度存在するのかを確認するにも有効です。
理論最大値:第3四分位点 +(1.5 × 四分位範囲)
理論最小値:第1四分位点 -(1.5 × 四分位範囲)
最大値
第3四分位点
中央値
外れ値
第1四分位点
最小値
※「×」で平均値を表現する場合もあります。
ひげ
四分位範囲
箱ひげ図を見てみよう
6
都道府県別統計とランキングで見る県民性:https://todo-ran.com/t/categ/10043
東京都
東京都
大分県 東京都
鹿児島県
新潟県
山梨県
沖縄県
宮城県
秋田県
(ℓ)
SNS分析+統計:箱ひげ図をSNS分析に利用しよう①
キーワード出現数時系列分析
キーワードがどの程度出現
(つぶやかれているか)し
ているかを時間の流れと共
に可視化します。
新商品やサービスの販売時
などにおいて、評価指標の
ひとつとなります。
SNS分析+統計:箱ひげ図をSNS分析に利用しよう②
ある施策を打った際、その施策がSNS上でどの程度響いているのか確認することも重要なのですが、
「響いた(バズった)」「響いてない(バズってない)」
を人の目で確認するのは、見る人によってバイアスがかかってしまうので問題ではないか?
バズってない?バズった?
SNS分析+統計:箱ひげ図をSNS分析に利用しよう③
下記の2016年7月29日のTweet数上昇を「異常値なのか?否か?」を判断できればいいわけです。
単なる
揺らぎなのか?
異常値なのか?
SNS分析+統計:箱ひげ図をSNS分析に利用しよう④
最大値
第3四分位点
中央値
異常値(外れ値)
第1四分位点
最小値
お
!
な
ん
だ
か
応
用
で
き
る
気
が
す
る
平均値: 1220
中央値: 939.5
第1四分位点: 323
第3四分位点: 939.5
四分位範囲: 616.5
理論最大値: 1826.25
この理論最大値を閾値にしよう!
※理論最大値
第3四分位点 +(1.5 × 四分位範囲)
SNS分析+統計:箱ひげ図をSNS分析に利用しよう⑤
経験を重ねながら、理論最大値の計算式(第3四分位点 +(1.5 × 四分位範囲))における、係数部
分(1.5)を調整しながら、適切な検知を学んでゆく。
異常値である
デジタルに
判断できる
終わり
12
ご清聴いただきありがとうございました。

More Related Content

PDF
20181114 r
PDF
20181114_AI×Analytics×女子部 オープニング
PPTX
Excelを使って学ぶ、統計の基礎
PDF
『AI入門』初めての人工知能 〜人とAIの適材適所〜 #お多福勉強会01 「AIってナニ?」
PDF
BtoBマーケティングにおけるML/NLPの活用
PDF
NewsPicksにおける記事の推薦
PDF
AIによる経済情報の活用
PDF
2018年度地域フィールドラボ募集説明会資料 神戸市①
20181114 r
20181114_AI×Analytics×女子部 オープニング
Excelを使って学ぶ、統計の基礎
『AI入門』初めての人工知能 〜人とAIの適材適所〜 #お多福勉強会01 「AIってナニ?」
BtoBマーケティングにおけるML/NLPの活用
NewsPicksにおける記事の推薦
AIによる経済情報の活用
2018年度地域フィールドラボ募集説明会資料 神戸市①

More from Yutaka Terasawa (12)

PDF
20190306オープニング
PDF
時系列データの扱い方
PDF
転移学習やってみた!
PDF
Google Colaboratoryを使って、MNISTでディープラニング!
PDF
20181114 TDAを使ったタイタニック生存者分析
PDF
20180717 grid
PDF
20180717 unsupervised learning
PDF
20180717 zeal
PDF
20180717 the average
PDF
20180717 opening
PDF
Wg for ai_dev_ops_20180713
PDF
Wg for edu_20180713
20190306オープニング
時系列データの扱い方
転移学習やってみた!
Google Colaboratoryを使って、MNISTでディープラニング!
20181114 TDAを使ったタイタニック生存者分析
20180717 grid
20180717 unsupervised learning
20180717 zeal
20180717 the average
20180717 opening
Wg for ai_dev_ops_20180713
Wg for edu_20180713
Ad

統計の基礎を楽しく学ぼうー箱ひげ図編ー