広告
イベントの説明
SUMO.aiについて
「SUMO.ai」(Society for Uniting Multimodal and Open Artificial Intelligence)」は、多彩な専門領域の研究者やエンジニアが集い、AI技術の可能性を幅広く探求する場です。
本イベントでは、自然言語・音声・画像・機械学習など、複数の情報源を統合するマルチモーダルAIに注目し、学術研究からビジネス応用まで多角的に議論を行います。最先端の事例紹介やオープンな知見共有を通じて、参加者同士が高度な知識を深め合うことを目指します。
また本コミュニティは、AI技術のさらなる発展と社会実装への貢献を念頭に、国内外より幅広いバックグラウンドの方々の参加を歓迎いたします。コミュニティを通じて、新たな研究テーマの発掘や事業連携の機会創出、所属組織や専門領域を跨いだネットワーキングにも力を入れたいと考えています。
登壇いただける有識者や、多方面からの参加者も大募集中です。ぜひご専門の分野や経験を活かし、最先端の知見を共に築いていきましょう。
※本イベントはオフラインのみの開催となります。オンライン配信は予定しておりませんのでご注意ください。
※Xアカウントのフォローを是非お願いします! @sumo_ai_jp
こんな方におすすめ
- 自然言語処理・音声・画像など、マルチモーダルAIに取り組む研究者の方
- 機械学習・深層学習・データサイエンス領域のエンジニアの方
- 大学・研究機関に所属するAI関連分野の教員・学生・ポスドクの方
- AI技術を活用したサービス開発・事業創出に関心のある企業・スタートアップの方
- その他、最先端のAI知見を学び、共有し、組織や領域を越えたネットワークを築きたい方
公募LTについて
- 公募LTを最大2枠募集します。
- 登壇時間:5分
- 発表テーマは、ご専門に基づき自由にご設定ください。
- 自然言語処理、音声処理、画像処理、機械学習、その他マルチモーダル関連技術に該当する研究または開発内容でお願いします。
- 宣伝事項はご自由に含めていただいて構いません。(イベント情報、採用告知など)
- あくまで技術的な知見共有を目的とした会ですので、過度に所属組織の宣伝色が強い内容はお控えください。
- 当落に関わらず、LTお申し込みいただいた方は、当日のご参加が可能です。
応募方法
- 以下のフォームから必要事項をご入力ください。希望者多数の場合は抽選とさせていただきます。
- 公募LT申し込みフォーム:https://forms.gle/LBwvMt1rMsndDUrNA
- Connpassの「公募LT枠」での参加登録も併せてお願いします。
- 1月8日(木)18時〆切
- 1月9日(金)に抽選結果をメールにてご連絡いたします。
会場について
ソニーシティ大崎 BRIDGE TERMINAL
住所: 東京都品川区大崎2-10-1 24F(地図)
JR大崎駅南改札口、新西口より徒歩2分
(お断り)会場セキュリティの都合上、入館者の氏名・所属・メールアドレスが必要になります。
大変お手数ですが、参加申し込み時のアンケートに記載いただくようにお願いいたします。
入館方法
- 2Fエントランスロビーに受付を設置します。Connpassの受付表をご提示ください。
- 18:30より受付を開始します。19:30には撤収しますので、お時間に余裕を持ってご来場ください。
タイムテーブル
※予定/予告なく順番の入れ替えやタイトルの変更が発生する場合がございます
| 時間 | 項目 | 登壇者 |
|---|---|---|
| 18:30 | 開場 | 19:30には受付撤収します |
| 18:55-19:00 | オープニング | |
| 19:00-19:30 | [セッション1] AVSRの世界と日本語特化モデル開発の裏側 |
佐々木裕多(Reazon Human Interaction Lab) |
| 19:30-19:35 | [公募LT1] | |
| 19:35-19:40 | [公募LT2] | |
| 19:40-20:10 | [セッション2] 安全で秘密を守れるAIの実現を目指して |
高橋翼(Acompany) |
| 20:10-20:15 | [スポンサートーク] | 株式会社ソニー・インタラクティブエンタテインメント グーグル合同会社 |
| 20:15-20:20 | クロージング、アンケートのお願い | |
| 20:20-21:30 | 懇親会 |
内容のご紹介
[セッション1] AVSRの世界と日本語特化モデル開発の裏側
Audio Visual Speech Recognition (以下AVSR)は、音声と合わせて、口唇の動きも入力とする音声認識タスクです。AVSRでは、様々なノイズに頑健になり、音声だけでは判別が難しいような環境でのターゲット話者の認識性能が向上します。しかし、大規模な公開コーパスが少ないため、特にマイナー言語でのモデル開発には難しさもあります。本日は、AVSRの開発コミュニティや実運用の場が広がることを願って、AVSRの世界と日本語特化モデル開発の裏側をお話しします!
佐々木裕多(Reazon Human Interaction Lab)

Reazon Human Interaction Lab Research Fellow / Kotoba Technologies ML Engineer(現職)/ 東京科学大 修士課程学生(休学中)
現在はKotoba Technologiesにてフルスタックにエンジニアリングを行っています。マルチモーダル的な観点でいうと、マルチモーダル対話システムをライブ形式で評価するコンペティションのオーガナイザを務めたり、Reazonにて本トーク内容でもあるAVSRモデル開発に従事しています。よもやま話だとお笑いが好きです。
[セッション2] 安全で秘密を守れるAIの実現を目指して
大規模言語モデルを中心とする生成AIの社会浸透に加え、現実世界で行動するフィジカルAIの開発が急速に進んでいる。これに伴い、AIはこれまで以上に私生活や業務領域の深い文脈データを扱うようになり、その安全性と信頼性をどのように確保するかが重要な課題となっている。今後は、個人情報や業務データの秘密をいかに守りつつ高度なAI活用を実現するかが、社会全体の焦点となるだろう。本講演ではまず、マルチモーダルAIの安全性向上や信頼性獲得に向けた研究動向を概観する。続いて、AIをTEE(Trusted Execution Environment)と呼ばれる信頼領域で実行するConfidential AIを紹介する。Confidential AIは、End-to-End秘匿化によりプロンプト入力から推論出力までのプロセスを保護し、機密性を担保しながらAIの活用を可能にする。一方で、秘匿化が進むほど透明性・真正性・可用性といった新たな課題も顕在化する。本講演では、これらのトレードオフをどのように乗り越え、信頼できるAI基盤を構築するかという未来の方向性を提示する。
高橋翼(株式会社Acompany プリンシパルリサーチャー)

NEC、LINE、Turing等で研究員、カーネギーメロン大学で客員研究員を経て、2026年よりAcomapnyにジョイン。専門はプライバシー保護機械学習、AIセキュリティ。生成AIの安全な活用を目指すR&D組織の立ち上げをしています。博士(工学)
質疑応答
Slidoで行います。質疑応答の時間は、各セッション時間に含まれます。
https://app.sli.do/event/eESb2cs9jimvwHXzzf3YEv
スポンサー企業
会場スポンサー:株式会社ソニー・インタラクティブエンタテインメント
懇親会スポンサー:グーグル合同会社
※SUMO.aiでは開催のご支援をいただける企業・団体を募集しております。ご興味のある方は、会場で運営にお声がけいただくか、sumo.ai.team(at)gmail.comまでお知らせください。
行動規範
本イベントは、AI関連技術に関する情報交換や交流を行うための場所です。 そのため、参加者に対して以下のようなハラスメント行為は許容しません。
- 言葉による性別、性的指向、障害の有無、外見、身体の大きさ、人種、宗教に関する攻撃的なコメント
- 公的空間での性的な映像表現
- 意図的な威力行為、ストーキング、つきまとい
- 写真撮影や録音によるいやがらせ
- トークやその他の会議イベントに対して繰り返して中断しようとする行為
- 望まれない性的な注意を引きつける行為
ハラスメント行為に遭った、目撃した場合には、スタッフの誰かに連絡していただくようお願いします。 ハラスメント行為を止めるように言われた参加者は、直ちに従ってください。
懇親会は、イベントの内容や技術情報に関する交流が目的ですので、知識の共有および、参加者同士の交流を目的としないような参加は控え下さい。
資料 資料をもっと見る/編集する
資料が投稿されると、最新の3件が表示されます。
広告

エンジニアをつなぐ
connpass は株式会社ビープラウドが開発・運営しています