LLM勉強会

Join

趣旨にご賛同いただける方のご参加をお待ちしております。
勉強会での議論・過程・成果・失敗などすべてオープンにすることをポリシーに活動しています。
参加する大学研究室・企業チームなどをひとつのグループとして、グループごとに代表者(研究室 PI など)を設け、グループ代表者が所属のメンバーの参加を管理します。

※参加申請をもって、アンチハラスメントポリシーを遵守し、勉強会の活動を阻害するような行為はしないこと、またそのような行為があったと運営委員会が判断した場合に退会をお願いする場合があることに同意いただいたとみなします。


勉強会スケジュール

勉強会の開催は以下の予定です。

2025年度催予定

2月24日(火)
14:30-18:00
● 終了
3月17日(火)
14:30-18:00
● 終了

2026年度催予定

4月21日(火)
14:30-18:00
● 開催予定
5月19日(火)
14:30-18:00
● 開催予定
6月16日(火)
14:30-18:00
● 開催予定
7月21日(火)
14:30-18:00
● 開催予定
9月15日(火)
14:30-18:00
● 開催予定
10月20日(火)
14:30-18:00
● 開催予定
11月17日(火)
14:30-18:00
● 開催予定
12月15日(火)
14:30-18:00
● 開催予定
1月19日(火)
14:30-18:00
● 開催予定
2月16日(火)
14:30-18:00
● 開催予定
3月16日(火)
14:30-18:00
● 開催予定

趣旨説明

問題意識

  • 大規模言語モデル (LLM) の飛躍的な進展によって技術の「相転移」が起こり、社会変革を引き起こしつつあります。モデルの高機能性・汎用性に支えられて変革は全産業に波及し、幅広い科学技術研究にとっても必須の基盤となると期待されます。
  • この進展において真に健全な試行錯誤を促し、イノベーションを喚起するには、次の課題を解決する必要があります:
    • LLMに関する技術課題:学習原理の数理的解明(創発や汎用性がどのように学習されるか)、効率性(データ/モデル効率、グリーン)
    • LLMに関する社会課題:説明性・解釈性(ブラックボックス問題)、公平性(バイアス問題)、安全性(誤情報・ハルシネーション、個人情報、著作権問題、コンプライアンス)、信頼性(どう保証するか)
    • LLMの多分野展開:医療・法律・教育等への展開、マルチモーダル情報・ロボット制御などとの結合
  • そのためには、完全にオープンで商用利用可能なモデルを継続的に構築し、課題解決の研究開発を進める必要があります。日本語の情報を十分にカバーし、使用のルール・入力情報の機密性が明確にコントロールできる等の要件も経済安全保障的な観点から必須と言えます。
  • 現状では学習データまで含めて完全にオープンなモデルは限られており、加えて、海外では生成AIに関して大規模な投資が行われていますが、日本は大きく後れをとっています。

今後の方針

  • LLM の研究開発は日進月歩であり、日本においても世界の最新動向を踏まえながら上述の諸課題の解決に利用できるスケールのモデルを構築し、原理解明や透明性・信頼性の確保に継続的に取り組んでいく必要があります。
  • LLM 研究進捗のスピード感を考えると、研究開発プログラムのトップダウンな設計は必ずしも最適ではありません。最も重要なことは土壌を作ること、すなわち、計算基盤と言語モデル構築基盤(エンジニア等の人材を含む)を整備し、国内外の研究者が様々な試行錯誤を行う環境を構築することです。
  • 2024年からは、文部科学省の「生成AIモデルの透明性・信頼性確保に向けた研究開発拠点形成」事業によりご支援をいただいて、上述の取組を進めています。