トピックモデルシリーズ 1 概要 - StatModeling Memorandum

テクノロジーカテゴリーの変更を依頼記事元:

statmodeling.hatenablog.com

2users がブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

s-feng sLDA , LDA , topic model

2020/07/02 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

トピックモデルシリーズ 1 概要 - StatModeling Memorandum

Stanでトピックモデルを実装するメリット・デメリットについて簡単に触れたいと思います。メリット実... Stanでトピックモデルを実装するメリット・デメリットについて簡単に触れたいと思います。メリット実装がラク。LDAでも30行ぐらいややこしい推論部分は一切実装しなくてOK。全部Stanのサンプリングにお任せモデルの拡張が簡単デメリット計算が遅い。文書x単語種類が1000x1500・総単語数12000のケースではトピック数が20, iter=1000で9時間, iter=10000で35時間でしたデータが少ないと収束しない。特に単語種類が多いのに1文書あたりに含まれる単語数が少ない場合はダメ。僕の経験ではそのような場合はiteration増やしてもほとんどダメでしたこれらのデメリットはStan2.9.0でリリースされた変分ベイズ（ADVI）を使って推定することでいくらか緩和されます。速度はモデルにもよりますがおおよそ50倍速ぐらいです。ただし、現状は推定が少し不安定のようで

ブックマークしたユーザー

s-feng2020/07/02
phare2017/02/21

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx