SlideShare a Scribd company logo
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
福成毅
Amazon SageMakerの紹介 + デモ
〜機械学習初心者でも動かせました〜
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
福成毅(@Fukunari_T)
• 新潟県十日町市出身
• レコチョク 事業システム部 アプリケーション開発G
– 新卒2年目
– iOS・macOS アプリの開発(2016/11 〜 2017/10)
– dミュージック月額コースシステム担当(2017/11 〜)
• AWS初心者
• re:Inventをきっかけに機械学習に興味を抱くようになり、色々と
調べてみました (超初心者)
自己紹介
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 人工知能の領域の一つ
– 人間の知能の一部(計算する・予測する・識別する・分類する)を機械で実現
する
機械学習
人工知能 機械学習
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 大量の過去のデータから反復的に学習し、そこに潜むパターン
(特徴)を見つけ出したり、未来予測したりする
機械学習
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 学習データを例題(先生からの助言)とみなして正解を与えておく
教師あり学習
ネコ
イヌ
イヌ
ネコ
ネコ
?
学習データ群
学習モデル
イヌゥゥゥ!!!
予測データ
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 学習データに予め正解を与えずに分類・傾向を導き出す
教師なし学習
学習データ群
学習モデル
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• ニューラルネットワーク
– 脳内の神経細胞(ニューロンの働きを模した計算アルゴリズム
• ディープラーニング
– ニューラルネットワークを多層化
ニューラルネットワーク・ディープラーニング
人工知能 機械学習
ニューラル
ネットワーク ディープラーニング
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
機械学習が簡単に扱える時代に
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 教師あり学習に対応(二項分類・多項分類・回帰分析)
• 基本的にGUIでポチポチ(お手軽!)
• S3にあるCSVファイルを取り込んで学習を行う
• チューニング
• 訓練済みのモデルに対してバッチ予測とリアルタイム予測が可能
Amazon Machine Learning
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 環境構築からエンドポイントの提供までをクラウドで(お手軽!)
• 外部のフレームワークも使える
• Jupyter Notebookで操作
• 教師なし学習にも対応
– 今までだとAWS Deep Learning AMIを用いてEC2を立てその中にPythonで
ごにょごにょ
• 学習データはCSV以外にも対応
Amazon SageMaker
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
k-平均法を用いた手書き文字の分類(教師なし学習)
デモ
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• S3にバケットを予め用意
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• Amazon SageMaker -> Dashboard -> ノートブックインスタンス
作成
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• インスタンスの設定
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 作成したNotebookを開く
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• sample-notebooksをクリック
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• /sample-notebooks/sagemaker-python-
sdk/1P_kmeans_highlevel/kmeans_mnist.ipynb
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 入力するデータ群を格納するバケット名を入力して実行
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 実行結果
出典:http://yann.lecun.com/exdb/mnist/
© RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
• 教師あり学習(雨が降るか降らないか)であればAmazon Machine
Learningで十分
• 教師なし学習(画像分類や法則性の発見)ならAmazon SageMaker
• Amazon Machine Learnigのお手軽感を残しつつ、自由にカスタマ
イズ可能(できることがぐっと増えている!)
• 手軽に便利になったけどやっぱり理論や数学の知識は欠かせない
まとめ

More Related Content

PPTX
Amazon Kinesis Streams デモ
recotech
 
PPTX
Aws導入時にまず考える〇〇のこと
recotech
 
PPTX
#reco_tech Cloud searchでレコチョク検索の実現に向けて
recotech
 
PDF
Git hubenterpriseを導入してみて
recotech
 
PPTX
#reco_tech AWSへ全面移行した今を話ます。
recotech
 
PPTX
Mackerel x Twilio ~レコチョクの場合~
recotech
 
PDF
Swift losf
NorioSuda
 
PDF
さばわのわ#2 AWS SDK for PHP で学ぶAthena
Takaki Sugitani
 
Amazon Kinesis Streams デモ
recotech
 
Aws導入時にまず考える〇〇のこと
recotech
 
#reco_tech Cloud searchでレコチョク検索の実現に向けて
recotech
 
Git hubenterpriseを導入してみて
recotech
 
#reco_tech AWSへ全面移行した今を話ます。
recotech
 
Mackerel x Twilio ~レコチョクの場合~
recotech
 
Swift losf
NorioSuda
 
さばわのわ#2 AWS SDK for PHP で学ぶAthena
Takaki Sugitani
 

What's hot (20)

PDF
20210925_jazug_azure_what_to_do_first
TomoakiOno
 
PDF
BIGIP作業サービス化してみた
kotasaegusa
 
PDF
#recotech_WIZY開発の裏側
recotech
 
PDF
フロントエンドエンジニアとしてAWS re:invent に行ってきました
Toshiro Shimizu
 
PPTX
Ansibleの限界を超えてファイアウォールの プロビをした話
shomahirao
 
PPTX
JAZUG 9周年イベント 懇親会ライトニングトーク
Dai Iwai
 
PPTX
AWS認定クラウドプラクティショナー 書くときに意識してたこととか
Mitsuhiro Yamashita
 
PPTX
ケガしないためのAws新サービスとre inventの過ごし方 株式会社アイディーエス_外木場さま
ABEJA, inc.
 
PDF
Bicep 入門 MySQL編
Takekazu Omi
 
PPTX
Snipe itで始めるit資産管理
Nozue Tomohiko
 
PPTX
怒涛のAWS入門! クラウドプラクティショナー! 知ってました? あなた、クラウドプラクティショナーなんですよ。
Mitsuhiro Yamashita
 
PDF
Unityゲームにオンラインランキングとゴースト機能を追加しよう!
史識 川原
 
PDF
第5回資料
ニフクラ mobile backend
 
PDF
Azure FunctionsでPowerShellを使ってみた
kimura50
 
PPTX
『Zerto7.5』新機能全貌紹介! 統合/分析機能強化で、より最適なレプリケーションが可能に!
株式会社クライム
 
PDF
【Code for向け】保育園・消火栓mapを作れるアプリを作ろう!
史識 川原
 
PDF
小出塾Fin-JAWSバージョン
Junji Koide
 
PPTX
AAIから君へ
Mitsuhiro Yamashita
 
PPTX
SeleniumとPhantomJSで自動化サーバーレス(RPALT vol.1 LT)
Mitsuhiro Yamashita
 
PPTX
#reco_tech OracleからAuroraへ feat. 開発しかやってこなかったエンジニア
recotech
 
20210925_jazug_azure_what_to_do_first
TomoakiOno
 
BIGIP作業サービス化してみた
kotasaegusa
 
#recotech_WIZY開発の裏側
recotech
 
フロントエンドエンジニアとしてAWS re:invent に行ってきました
Toshiro Shimizu
 
Ansibleの限界を超えてファイアウォールの プロビをした話
shomahirao
 
JAZUG 9周年イベント 懇親会ライトニングトーク
Dai Iwai
 
AWS認定クラウドプラクティショナー 書くときに意識してたこととか
Mitsuhiro Yamashita
 
ケガしないためのAws新サービスとre inventの過ごし方 株式会社アイディーエス_外木場さま
ABEJA, inc.
 
Bicep 入門 MySQL編
Takekazu Omi
 
Snipe itで始めるit資産管理
Nozue Tomohiko
 
怒涛のAWS入門! クラウドプラクティショナー! 知ってました? あなた、クラウドプラクティショナーなんですよ。
Mitsuhiro Yamashita
 
Unityゲームにオンラインランキングとゴースト機能を追加しよう!
史識 川原
 
Azure FunctionsでPowerShellを使ってみた
kimura50
 
『Zerto7.5』新機能全貌紹介! 統合/分析機能強化で、より最適なレプリケーションが可能に!
株式会社クライム
 
【Code for向け】保育園・消火栓mapを作れるアプリを作ろう!
史識 川原
 
小出塾Fin-JAWSバージョン
Junji Koide
 
AAIから君へ
Mitsuhiro Yamashita
 
SeleniumとPhantomJSで自動化サーバーレス(RPALT vol.1 LT)
Mitsuhiro Yamashita
 
#reco_tech OracleからAuroraへ feat. 開発しかやってこなかったエンジニア
recotech
 
Ad

Similar to Amazon SageMaker の紹介 + デモ (20)

PDF
[CTO Night & Day 2019] ML services: MLOps #ctonight
Amazon Web Services Japan
 
PDF
Spath for enterprise
Koichiro Sumi
 
PDF
2014年を振り返る 今年の技術トレンドとDockerについて
Masahito Zembutsu
 
PDF
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Cloudera Japan
 
PDF
JNSA西日本支部 技術研究WG AWSを使ったセキュアなシステム構築
Tomo-o Kubo
 
PDF
SORACOM Harvest + AWS Lambdaでウィンドウ処理をやってみた
Haruka Yamashita
 
PDF
[CTO Night & Day 2019] よくある課題を一気に解説!御社の技術レベルがアップする 2019 秋期講習 #ctonight
Amazon Web Services Japan
 
PPTX
Device Farm を使ったスマホアプリの自動テスト
Kenichi Tatsuhama
 
PPTX
AWSでGPUも安く大量に使い倒せ
Yasuhiro Matsuo
 
PDF
2020/06/16 tsjp-azure-staticwebapps-vs_codespaces
Issei Hiraoka
 
PDF
Talk 1「データインテグレーションとは何か」
Takeshi Akutsu
 
PDF
おすすめインフラ! for スタートアップ
Koichiro Sumi
 
PDF
[AWSマイスターシリーズ] AWS SDK for PHP / Ruby / boto(Python) / JavaScript in Node.js
Amazon Web Services Japan
 
PDF
【17-E-4】GitHub Enterpriseユーザ企業登壇!企業文化にイノベーションを起こすモダンなソフトウェア開発環境とは?
Developers Summit
 
PDF
Amazon SageMaker Unified Studioを触ってみた (20250129)
NTTDOCOMO-ServiceInnovation
 
PDF
TypeScript製フレームワーク「Nest」のご紹介
bitbank, Inc. Tokyo, Japan
 
PPTX
SphinxのCIの続き Azure DevOpsでのビルド結果を、認証付きAzure App Serviceに公開するところまで
Study Group by SciencePark Corp.
 
PDF
JAWSDAYS2016 Technical Deep DIVE
陽平 山口
 
PDF
Swaggerを利用した新規サービス開発
recotech
 
PPTX
20190319 xtech recochoku_15m_pub
Dai Fujikawa
 
[CTO Night & Day 2019] ML services: MLOps #ctonight
Amazon Web Services Japan
 
Spath for enterprise
Koichiro Sumi
 
2014年を振り返る 今年の技術トレンドとDockerについて
Masahito Zembutsu
 
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Cloudera Japan
 
JNSA西日本支部 技術研究WG AWSを使ったセキュアなシステム構築
Tomo-o Kubo
 
SORACOM Harvest + AWS Lambdaでウィンドウ処理をやってみた
Haruka Yamashita
 
[CTO Night & Day 2019] よくある課題を一気に解説!御社の技術レベルがアップする 2019 秋期講習 #ctonight
Amazon Web Services Japan
 
Device Farm を使ったスマホアプリの自動テスト
Kenichi Tatsuhama
 
AWSでGPUも安く大量に使い倒せ
Yasuhiro Matsuo
 
2020/06/16 tsjp-azure-staticwebapps-vs_codespaces
Issei Hiraoka
 
Talk 1「データインテグレーションとは何か」
Takeshi Akutsu
 
おすすめインフラ! for スタートアップ
Koichiro Sumi
 
[AWSマイスターシリーズ] AWS SDK for PHP / Ruby / boto(Python) / JavaScript in Node.js
Amazon Web Services Japan
 
【17-E-4】GitHub Enterpriseユーザ企業登壇!企業文化にイノベーションを起こすモダンなソフトウェア開発環境とは?
Developers Summit
 
Amazon SageMaker Unified Studioを触ってみた (20250129)
NTTDOCOMO-ServiceInnovation
 
TypeScript製フレームワーク「Nest」のご紹介
bitbank, Inc. Tokyo, Japan
 
SphinxのCIの続き Azure DevOpsでのビルド結果を、認証付きAzure App Serviceに公開するところまで
Study Group by SciencePark Corp.
 
JAWSDAYS2016 Technical Deep DIVE
陽平 山口
 
Swaggerを利用した新規サービス開発
recotech
 
20190319 xtech recochoku_15m_pub
Dai Fujikawa
 
Ad

More from recotech (10)

PPT
RecoChoku tech night #09 -reinvent2018報告会- オープニング
recotech
 
PDF
Reco choku tech night #09 -reinvent2018報告会-
recotech
 
PPTX
業界あるある Music偏
recotech
 
PPTX
レコチョク・ラボが考える人工知能
recotech
 
PPTX
Oracle racからaurora my sqlへの移行
recotech
 
PDF
レコチョクのサービス群を支えるApiたち
recotech
 
PDF
そうだApi公開しよう feat. 有志のエンジニア
recotech
 
PPTX
WIZY企画の裏側
recotech
 
PDF
#recotech_AWS移行してみたけどぶっちゃけどうよ。
recotech
 
PPTX
#recotech_レガシーなシステムから立て直すためにしたこと
recotech
 
RecoChoku tech night #09 -reinvent2018報告会- オープニング
recotech
 
Reco choku tech night #09 -reinvent2018報告会-
recotech
 
業界あるある Music偏
recotech
 
レコチョク・ラボが考える人工知能
recotech
 
Oracle racからaurora my sqlへの移行
recotech
 
レコチョクのサービス群を支えるApiたち
recotech
 
そうだApi公開しよう feat. 有志のエンジニア
recotech
 
WIZY企画の裏側
recotech
 
#recotech_AWS移行してみたけどぶっちゃけどうよ。
recotech
 
#recotech_レガシーなシステムから立て直すためにしたこと
recotech
 

Recently uploaded (11)

PDF
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
PPTX
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
PDF
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
 
PDF
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
PDF
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
 
PDF
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
 
PPTX
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 
PDF
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
PDF
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 
PDF
20250730_QiitaBash_LT登壇資料_PDC_Kurashina.pdf
pdckurashina
 
PDF
20250729_Devin-for-Enterprise
Masaki Yamakawa
 
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
 
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
 
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
 
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 
20250730_QiitaBash_LT登壇資料_PDC_Kurashina.pdf
pdckurashina
 
20250729_Devin-for-Enterprise
Masaki Yamakawa
 

Amazon SageMaker の紹介 + デモ

  • 1. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential 福成毅 Amazon SageMakerの紹介 + デモ 〜機械学習初心者でも動かせました〜
  • 2. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential 福成毅(@Fukunari_T) • 新潟県十日町市出身 • レコチョク 事業システム部 アプリケーション開発G – 新卒2年目 – iOS・macOS アプリの開発(2016/11 〜 2017/10) – dミュージック月額コースシステム担当(2017/11 〜) • AWS初心者 • re:Inventをきっかけに機械学習に興味を抱くようになり、色々と 調べてみました (超初心者) 自己紹介
  • 3. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 人工知能の領域の一つ – 人間の知能の一部(計算する・予測する・識別する・分類する)を機械で実現 する 機械学習 人工知能 機械学習
  • 4. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 大量の過去のデータから反復的に学習し、そこに潜むパターン (特徴)を見つけ出したり、未来予測したりする 機械学習
  • 5. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 学習データを例題(先生からの助言)とみなして正解を与えておく 教師あり学習 ネコ イヌ イヌ ネコ ネコ ? 学習データ群 学習モデル イヌゥゥゥ!!! 予測データ
  • 6. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 学習データに予め正解を与えずに分類・傾向を導き出す 教師なし学習 学習データ群 学習モデル
  • 7. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • ニューラルネットワーク – 脳内の神経細胞(ニューロンの働きを模した計算アルゴリズム • ディープラーニング – ニューラルネットワークを多層化 ニューラルネットワーク・ディープラーニング 人工知能 機械学習 ニューラル ネットワーク ディープラーニング
  • 8. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential
  • 9. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential 機械学習が簡単に扱える時代に
  • 10. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 教師あり学習に対応(二項分類・多項分類・回帰分析) • 基本的にGUIでポチポチ(お手軽!) • S3にあるCSVファイルを取り込んで学習を行う • チューニング • 訓練済みのモデルに対してバッチ予測とリアルタイム予測が可能 Amazon Machine Learning
  • 11. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 環境構築からエンドポイントの提供までをクラウドで(お手軽!) • 外部のフレームワークも使える • Jupyter Notebookで操作 • 教師なし学習にも対応 – 今までだとAWS Deep Learning AMIを用いてEC2を立てその中にPythonで ごにょごにょ • 学習データはCSV以外にも対応 Amazon SageMaker
  • 12. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential k-平均法を用いた手書き文字の分類(教師なし学習) デモ
  • 13. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • S3にバケットを予め用意
  • 14. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • Amazon SageMaker -> Dashboard -> ノートブックインスタンス 作成
  • 15. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • インスタンスの設定
  • 16. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 作成したNotebookを開く
  • 17. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • sample-notebooksをクリック
  • 18. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • /sample-notebooks/sagemaker-python- sdk/1P_kmeans_highlevel/kmeans_mnist.ipynb
  • 19. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 入力するデータ群を格納するバケット名を入力して実行
  • 20. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 実行結果 出典:http://yann.lecun.com/exdb/mnist/
  • 21. © RecoChoku Co.,Ltd. Proprietary and Confidential© RecoChoku Co.,Ltd. Proprietary and Confidential • 教師あり学習(雨が降るか降らないか)であればAmazon Machine Learningで十分 • 教師なし学習(画像分類や法則性の発見)ならAmazon SageMaker • Amazon Machine Learnigのお手軽感を残しつつ、自由にカスタマ イズ可能(できることがぐっと増えている!) • 手軽に便利になったけどやっぱり理論や数学の知識は欠かせない まとめ

Editor's Notes

  • #3: re:Inventで機械学習関連のサービスがたくさん登場したのを目の当たりにして、機械学習に興味を抱くようになり、 色々と調べてみました (超初心者)
  • #4: まずそもそも機械学習とはなにかがわからなかったので、ド素人ながら調べてみました。 機械学習とは 人工知能(人間の知能の一部(計算する・予測する・識別する・分類する)を実現する)の領域の一つ
  • #5: もう少し掘り下げてみますと、 たくさんデータをモデルに反復的に学習させることで、未知のデータが来ても予測・識別・分類する そこに潜むパターン(特徴)を見つけ出すもの 例えば 人間はふだん目でみた視覚的な情報を脳で瞬時に処理をしています。 例えば、猫を見たらすぐに猫と分かりますし、犬を見たら犬と分かります。 同じ4本足の似ている動物ですが、姿、形、大きさ、色、鳴き声などの特徴(パターン)から判断できます。 しかし、デジタルな情報しか扱えないコンピューターにとって、特徴を見つけ出すことはとても難しいです。 どうしても数字で表す必要があるので、「猫は体長が◯◯cm~◯◯cm程度で、足の長さは◯◯cm~◯◯cm程度で…」などと定義しないといけないからです。 でも、数字には個体差が大きいため、どうしてもあいまいな定義しかできません。 そこで大量のデータから分析や解析をして、ある一定の特徴を見つけ出す技術や手法が必要になってきます。 データ -(学習)-> 機械学習モデル -> 分類・予測などデータをもとに学習し、予測モデルを作りあげていく。 分析したいデータを食わせて分類や判断を行う
  • #6: 教師あり学習は訓練させるデータを例題とみなすやりかたです、あらかじめこれは犬これは猫と正解を与えておいたデータを学習させ、未知のデータが来てもこれは犬だ!と識別できるような手法です。 被写体の判別やスパムメールの判定にも使われていたりもします。 (画像はわかりやすくするためのイメージで、 実際は眼と眼の距離や体長、耳の長さなどの数値パラメータの集まりだと思ってください)
  • #7: 対して教師なし学習はデータに正解すら与えずに学習させ、 未知のデータに対しても だいたいこれとこれは同じだろうとグループ分けをするやりかたです。 グーグルの類似画像の検索とかまさにこれじゃないでしょうか
  • #8: 他にもゲームAIに用いられる強化学習やニューラルネットワーク、 そして最近話題のディープラーニングなどありますが、 これらは機械学習の中の手法の一つとなっております。 要は機械学習は人工知能の一種で、その中にも色々やり方があるんだということですね、
  • #9: 一昔まえだと難解な数学を理解し、ハイスペックなPCを持っていないと扱えなかった機械学習ですが、 機械学習にはデータサイエンティストのような専門家と推論学習用のPCが必要 興味はあるんだけどなかなかとっつきづらく 敷居が高いものでありました
  • #10: 今やクラウドにより膨大な計算を手軽に扱えるようになったり CaffeやTensolFlowなどの便利なフレームワークが登場したことで 機械学習は専門家でない私達でも身近な存在になりました。 AWSに限っても機械学習をベースとしたたくさんのサービスやプラットフォームが存在し、 今回の発表でも、Amazon Rekognition Videoや Amazon Comprehendなど 機械学習ベースの新サービスが怒涛の如く登場してきました。 今回はその中の一つ、機械学習プラットフォームAmazon SageMakerについて調べました その前に、元々存在していていたプラットフォームAmazon MLについてどういうものかも触っていなかったので、使ってみながら少し調べてみました。
  • #11: 二項分類 このメールはスパムかどうか? 明日は雨が降るか? 多項分類 イヌかネコかネズミかその他か? 今なっている和音は何か? 回帰分析 売上予測 気温予測 バッチ予測 S3にアップされた予測対象データ群に対してまとめて予測を実施 リアルタイム予測 このデータはこういう予測だ!というのをAPIを用いて実施 まとめると 一行もコードを書かずにお手軽には扱える本当にスゴイツールであるものの、 対象が教師あり学習に限定される・入力はCSVファイルに限られるところ のは機械学習の全体感からすると柔軟性としては高くない印象でした。 このことを踏まえてAmazon SageMakerを触ってみました
  • #12: 環境を構築してモデルをトレーニングし、訓練済みのモデルを利用するためのエンドポイント作成までをクラウド上で行うことができるというもの 基本的にGUIで全てのことを行うことができますが、 一環の流れをジュパイターというノートブックをつかってブラウザ上でパイソンを書くことで、S3上のデータを取り込んだり、好きなフレームワークを選んだりといった凝ったこともできます。 個人的にAMLと比べてこれはでかいと思ったことは、教師なし学習にも対応しているというところでしたりCSV以外の画像などのデータも学習データとして扱うことができるところが大きいと思いました。 データ処理・学習・エンドポイント作成をAWS上のJupyter Notebookを用いて行うことができる Jupyter このJupyter Notebookというのは ブラウザで動くプログラムの対話型実行環境らしく 、ノートブックと呼ばれるドキュメントを作成し、プログラムを書いて実行するだけでなく、その中にメモを挿入したり、保存と共有などをブラウザ上で行うことができるものだそうです。 そのなかにサンプルコードがたくさんあり、Teonsol FlowにしようかCaffeにしようかといった どのようなフレームワークやアルゴリズムを使うかを選ぶことができる (ブラウザ上からSageMaker APIを用いて) ただ必ずしもJupyterを使う必要もなく、JobからでもGUIをポチポチすることで学習を行うことができる 個人的に大きいと思ったことは、教師なし学習にも対応しているので、画像分類とか規則性発見とかAmazon MLよりもイロイロできる ↓↓どう話そうか? ただ必ずしもJupyter NoteBook Jobというもの オーサリング: いわゆるデータセットの前処理の工程のことです。機械学習の9割はデータセットの前処理だ、と言われているほど重要な工程ですよね。すでに多くの機械学習エンジニアの方が、iPythonやJupyter Notebookなど、セルコーディングを利用されているかと思います。AWS SageMakerでは、Jupyter NotebookをCPUベースやGPUベースなど、クラウド上で利用状況に合わせて簡単にセットアップ&利用が可能です。(これは既存のAWS Machine Learningでは無いサービスでした) モデルトレーニング: モデル構築や学習、さらには評価もクラウドで行えます。すでに多数の学習アルゴリズムが組み込まれているのも大きな特徴の一つですが、加えて、多数のフレームワークやDockerコンテナなどを利用して独自の学習環境を構築もできます。また、大きなメリットとして、学習データなどのをAWS S3が簡単に使えます。(これは既存のAWS Machine Learningでも同様です) モデルホスティング: 構築したモデルをリアルタイムで使えるように、HTTPSエンドポイントが提供されます。さらにスケールをすることも容易にできて、複数モデルでのA/Bテストも行うことが可能のようです(これは使って見たいですね!)。
  • #13: 今回のデモではジュパイターのサンプルコードをつかってK平均法と呼ばれる教師なし学習を使って手書きの0〜9の数字を分類するというところまでやってみたいと思います。
  • #17: インスタンスが立ち上がるまで少し時間がかかる https://sagemaker-sample.notebook.us-east-1.sagemaker.aws/notebooks/sample-notebooks/sagemaker-python-sdk/1P_kmeans_highlevel/kmeans_mnist.ipynb
  • #20: メモ付のソースコードが チュートリアル形式で実行できる
  • #21: 1とか6は優秀
  • #22: 他にもできること Dockerコンテナを使用して独自にトレーニングデータを作成することも可能。 ワンクリックでトレーニングデータを作成し実行がすることが出来ます。 機械学習モデルをコピーして、並列処理でパラメータ実行させることも可能。 Amazon S3に保存されたトレーニングデータを視覚化することもできます。 S3に直接接続することも、AWS Glueを使ってAmazon RDS、Amazon DynamoDB、Amazon Redshiftから S3にデータを格納し解析することもできます。 値段: 稼働時間と通信料、ストレージサイズで計算される Googleの機械学習API やAzure Machine LearningはAPIを呼んだ回数や処理時間で課金されるので通信量が少なく軽い処理であればSageMakerの方が安くなりそう