弊社は「汎用型マルチエージェント深層強化学習ライブラリの開発」という研究テーマで総務省主催の令和7年度のICTスタートアップリーグに採択されています。
「チームプレー型AI」の発展に不可欠なマルチエージェント深層強化学習のアルゴリズムをオープンソースのソフトウェアとして提供していきます。


ライブラリの概要
「チームプレーができるAI」を実現するためのマルチエージェント深層強化学習(Multi-Agent Deep Reinforcement Learning, MARL)汎用ライブラリを開発しています。本ライブラリは、国内外の最先端研究の知見を取り入れつつ、実務の現場でそのまま活用できることを重視したエンジニア向けの開発基盤です。
単一エージェントの意思決定では扱いきれない、
- 多数のロボット・車両・デバイスが同時に動く環境
- 需給バランスや制約条件が複雑に絡み合う制御問題
- 多数のユーザー・プレーヤーが相互に影響し合うサービス運用
といった状況において、複数のエージェントが協調しながら最適な行動を学習できるよう設計されています。
特徴
最先端アルゴリズムの実装
マルチエージェント深層強化学習の最新の研究動向を踏まえたアルゴリズム群を順次実装しています。研究用途だけでなく、実サービス・実ロボットへの組み込みを想定した設計を行っています。
産業横断で使える汎用性
特定の業界に閉じない抽象化レイヤーを採用しており、さまざまな分野のエンジニアの方にご利用いただけます。以下のような例があります。
- 物流・倉庫内ロボットの動作計画
- エネルギーマネジメント・VPP(仮想発電所)の分散制御
- 製造ライン・工場内設備の協調制御
- モビリティ・交通システムの協調最適化
- ゲーム・シミュレーション環境におけるマルチエージェント実験
エンジニアフレンドリーな設計
PythonベースのAPI設計、シミュレーション環境との連携、ログ・可視化機能など、日々の開発・検証サイクルを高速に回せるよう配慮しています。既存の機械学習基盤(PyTorch等)との統合も容易です。
産業界における活用イメージ
本ライブラリを用いることで、各産業のエンジニアは、
- 従来は手作業で調整していたルールベース制御を、学習型の協調制御に置き換える
- シミュレーション環境上で多様なシナリオを高速に検証し、現場投入前にリスクと効果を評価する
- マルチエージェントAIの研究成果を、自社プロダクト・サービスの「チームプレー型AI」機能として組み込む
といった取り組みを、より短期間で実現できるようになります。
EfficiNet Xは、今後もマルチエージェントAI・深層強化学習の研究開発を進めるとともに、
「どの産業のエンジニアでも使えるチームプレーAIの基盤」
として本汎用ライブラリを継続的に発展させてまいります。
