広告
| 募集内容 |
聴講枠 無料
参加者数
|
|---|---|
| 申込者 | 申込者一覧を見る |
| 開催日時 |
2024/07/10(水) 19:30 ~ 21:50
|
| 募集期間 |
2024/06/19(水) 09:01
〜 |
| 会場 |
オンライン |
| 参加者への情報 |
(参加者と発表者のみに公開されます)
|
| 出席登録 |
(イベント開始時間の2時間前から終了時間まで、参加者のみに公開されます)
|
イベントの説明
概要
株式会社サイバーエージェントの研究機関AI Lab が主催するICML2024の採択論文発表会です。
機械学習に関するトップ国際会議 International Conference on Machine Learning (ICML2024)において、本年度は「AI Lab」として過去最多となる5本の主著論文が採択されました。
本会ではそれぞれの論文に関して、著者が論文の背景や内容を共有します。
実施方法
ZOOMを使用します。各自インストールをお願いします。 URLは7月10日(水)15:00に、connpassのメッセージ機能で登録者に事前にお送りいたします。 また参加者への情報にも記載を行います。
一つの発表時間は約25分です。
質疑応答は、sli.do を使用して行います。 使用方法は以下の通りです。
- connpassのメッセージ機能でお知らせしたURLにアクセスしてください
- 発表者に質問があれば、都度ここに書き込んでください(匿名可)。
- 質問は他の方も閲覧可能です。自分も聞きたいという質問があれば「いいね」ができます。
- 発表終了後時間が許す限り、発表者が「いいね」が多いものから優先して回答していきます。
注意事項
技術交流が目的の勉強会ですので、知識の共有および、参加者同士の交流を目的としない参加はお断りしています。 参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。
タイムテーブル
| 時間 | 内容 |
|---|---|
| 19:30 - 19:35 | 挨拶・諸連絡 |
| 19:35 - 20:00 | 発表①:Adaptively Perturbed Mirror Descent for Learning in Games |
| 20:00 - 20:25 | 発表②:Model-Based Minimum Bayes Risk Decoding for Text Generation |
| 20:25 - 20:50 | 発表③:Estimating Distributional Treatment Effects in Randomized Experiments: Machine Learning for Variance Reduction |
| 20:50 - 21:00 | 休憩 |
| 21:00 - 21:25 | 発表④:On Universally Optimal Algorithms for A/B Testing |
| 21:25 - 21:50 | 発表⑤:Matroid Semi-Bandits in Sublinear Time |
※ 適宜休憩を取ります。当日予告なく時間配分、内容が変更になる可能性がございます。
発表の詳細
発表①:Adaptively Perturbed Mirror Descent for Learning in Games
発表者:阿部 拳之
プロフィール:2017年に東京工業大学大学院総合理工学研究科を修了後、株式会社ハル研究所でゲーム開発に携わる。2018年にサイバーエージェント入社。AI Labでは強化学習、アルゴリズム的ゲーム理論、凸最適化に関する研究に従事。Twitter: @bakanaouji
発表概要:敵対的生成ネットワークや大規模言語モデルの学習をはじめとした多くの機械学習タスクでは、複数の意思決定モデルを同時に学習することが求められます。これら複数のモデルを同時に学習させる問題は、「マルチエージェント環境での学習」として知られ、単一のモデルの学習と比較して、さまざまな研究上の課題が存在します。本研究では、各意思決定モデルの更新方向を特定の方向にシフトさせることで、学習の安定化を実現する新たなアルゴリズムを提案しました。さらに、シフトする方向を適応的に調整することで、最適な意思決定モデルへの収束を、理論的な分析と実験の両方から示しました。
<論文リンク> https://arxiv.org/abs/2305.16610
発表②:Model-Based Minimum Bayes Risk Decoding for Text Generation
発表者:陣内 佑
プロフィール:2023年にサイバーエージェント入社。強化学習・プランニングなどの逐次的意思決定問題の研究開発に従事。Twitter: @DINDIN92
発表概要: Minimum Bayes Risk Decodingはテキスト生成モデルから品質の高いテキストを生成する手法です。2000年の論文で提案された手法でしたが2022年に改良され、機械翻訳において非常に有効であることが知られるようになり、近年活発に研究がされています。本研究ではその2000年の論文のアイディアを最新の手法に組み合わせて更に品質の高いテキストを生成する手法を開発しました。
<論文リンク> https://arxiv.org/abs/2311.05263
発表③:Estimating Distributional Treatment Effects in Randomized Experiments: Machine Learning for Variance Reduction
プロフィール:2021年にボストン大学で経済学のPhDを取得。スタンフォード大学ポスドクを経て、2023年にサイバーエージェント入社。AI Labにて計量経済学の理論と応用の研究に従事。研究分野は因果推論、機械学習、政策評価、バンディットなど。Twitter: @undara21
発表概要: ビジネスにおいて、広告や販促などの施策の効果検証を行い、サービスやユーザーの理解を促進することは非常に重要です。しかし、因果推論や計量経済学を用いる効果検証では、平均的な効果が推定されることがほとんどです。本研究では、効果の分布を表すDistributional Treatment Effectに着目し、A/Bテストが行われている状況において利用可能な推定手法を提案しました。提案手法は従来の手法に対しておよそ20%程度精度が改善されました。
効果を分布で表す場合、広告や販促などの施策が具体的にどの程度の売り上げのユーザーを増加させたかといった情報を得ることが可能となります。これにより、施策の影響の理解が向上することでより良い意思決定につながるだけでなく、次の施策への示唆がもたらされることになります。
<論文リンク> https://openreview.net/forum?id=RDofzHLuX4
発表④:On Universally Optimal Algorithms for A/B Testing
発表者:Po-An Wang
プロフィール:スウェーデン王立工科大学の博士課程に在籍。Alexandre Proutiere教授の指導の下でマルチエージェント強化学習、オンライン最適化、テンソル分解について研究している。2023年6月からサイバーエージェントのリサーチインターンシップに参加。
発表概要: A/Bテストのデータを活用して、各施策への観測割り当て量を適応的に調整するという考え方が存在します。これまでの研究では、このような適応的な割り当ての効果は明らかになっていませんでした。本研究では、特定の状況での適応的な割り当てがA/Bテストのパフォーマンスを向上させないことを、理論と実験の両面から示しました。これにより、A/Bテストの設計に関する新たな指針がビジネスの現場に示されました。
<論文リンク> https://arxiv.org/abs/2308.12000
発表⑤:Matroid Semi-Bandits in Sublinear Time
発表者:Ruo-Chun Tzeng
プロフィール:スウェーデン王立工科大学の博士課程に在籍。Aristides Gionis教授、Alexandre Proutiere教授の指導の下でグラフマイニング、グラフバンディッドについて研究している。2023年6月からサイバーエージェントのリサーチインターンシップに参加。Twitter: @RuochunT
発表概要: 「多腕バンディット問題」とは、不確実な環境における最適な逐次的意思決定を目指すオンライン最適化の問題です。本研究では、マトロイドという組合せ的な構造を持つ設定において、意思決定の最適性を損なわない、選択肢数に関する劣線形時間アルゴリズムを開発しました。
<論文リンク> https://arxiv.org/abs/2405.17968
資料 資料をもっと見る/編集する
資料が投稿されると、最新の3件が表示されます。
広告

エンジニアをつなぐ
connpass は株式会社ビープラウドが開発・運営しています