研究内容

強化学習・マルチエージェントシステム


工学システムを取り巻く環境の複雑化・多様化に対応できる柔軟性を持つことが, 現在のシステムには必要となってきている. そこで,明示的な環境のモデルや教師を与えられず,試行錯誤の経験から報酬や罰という強化信号を得ることのみによって学習を行なう強化学習が, 機械学習の一分野として行われている. これは,自律システムを実現するためのものとして期待されるものである. しかし,実システムへの応用に際して,試行錯誤に要する回数が非常に多くなるという問題をかかえている.

我々は,少ない試行回数でうまく状態空間を扱う方法や,現実的枠組みで利用可能になるような方法に関する研究を行っている. 応用例としては,経路計画問題,倒立振子制御問題,振り上げ倒立振子問題,非ホロノミック移動ロボットの車庫入れ問題, マルチエージェントシステム,小型へリコプタの自律飛行などである. 今後はさらに現実的な問題に適用していく予定である.


関連発表論文

学術論文,解説記事,国際会議論文
  1. 深尾 隆則,大村 亮祐,足立 紀彦: Q-learning における状態空間の適応的分割法,
    計測自動制御学会論文集, Vol.37, No.3, pp.242-249 (2001)

  2. 深尾 隆則,稲山 典克,足立 紀彦: 正則化理論を用いた連続的状態と行動を扱う強化学習,
    システム制御情報学会論文誌,Vol.11,No.11,pp. 593-599 (1998)

  3. T. Fukao, T. Sumitomo, N. Ineyama and N. Adachi: Q-learning Based on Regularization Theory to Treat the Continuous States and Actions,
    In Proc. of 1998 IEEE International Joint Conference on Neural Networks, pp. 1057-1062 (1998/5)

国内学会講演会,シンポジウム発表論文
  1. 稲山 典克,深尾 隆則,足立 紀彦: 正則化理論を用いた連続的な入力空間を扱う強化学習に関する研究, 第41回システム制御情報学会研究発表講演会, pp. 423-424 (1997/5)

  2. 住友 高明,深尾 隆則,足立 紀彦: 正則化理論を用いた強化学習, 第25回知能システムシンポジウム, pp. 131-136 (1998/3)

  3. 大村 亮祐,深尾 隆則,足立 紀彦: 正則化理論を用いた強化学習の移動ロボット制御への応用, 第42回システム制御情報学会研究発表講演会, pp. 33-34 (1998/5)

  4. 青木 保繁,深尾 隆則,足立 紀彦: 正則化理論を用いた強化学習の振り上げ倒立振子への適用, 第43回システム制御情報学会研究発表講演会 (1999/5)

  5. 加藤 幹生,深尾 隆則,足立 紀彦: 連続空間におけるマルチエージェント強化学習, 第43回システム制御情報学会研究発表講演会 (1999/5)

  6. 大村,深尾,足立: Q-learning における状態空間の適応的分割, 第27回知能システムシンポジウム (2000/3)

  7. 陳,深尾,足立: マルチステップのマクロ行動による強化学習, 第14回人工知能学会全国大会(2000/7)

  8. 秋山,深尾,荻野,足立: 選好を考慮した交渉シミュレーションシステム, 第14回人工知能学会全国大会(2000/7)

  9. D.Aliaga, T.Fukao and N.Adachi: Emergence of Cooperation among Self-interested Agents, 社会組織のマルチエージェントシステム分析研究会 (2001/3)

  10. 秋山,深尾,足立: 目的選択型学習エージェントを用いた交渉システム, 知能システムシンポジウム (2001/3)

  11. Yu Chen, Takanori Fukao, and Norihiko Adachi: Automatic generation of macro actions, 第17回人工知能学会全国大会,(2003/6)



最終更新:平成27年5月