その他の論文等
2022
恐神貴行, オフライン強化学習の進展, 人工知能, 37(4): 464-471, 2022.
2019
恐神貴行, 人工知能における多様性の考慮, 数理科学, No.672: 58-64, 2019.
2017
恐神貴行, 拡がる人工ニューラル・ネットワークの可能性:スパイク時間依存可塑性と動的ボルツマンマシン, ProVISION, No. 92, 2017.
恐神貴行・大塚誠, 「スパイク時間依存シナプス可塑性により文字画像の列を記憶する7つの神経細胞」, 月刊「画像ラボ」, 2017年1月号, pp. 41-48, 2017.
2016
恐神貴行, 大塚誠, "時系列データを認識するニューラルネットワーク「動的ボルツマンマシン」", 機能材料, 2016年3月号, 36(3):51-58, 2016.
Abstract 従来の人工ニューラルネットワークはヘブ則に基づいて学習するが,近年の生物実験においてはヘブ則をより精緻にするスパイク時間依存可塑性(STDP)が神経細胞の学習則として確認されている。本稿では,STDP に基づいて学習する新しい人工ニューラルネットワーク「動的ボルツマンマシン」を紹介する。
2015
恐神貴行, 大塚誠, "人の選択行動を学習する制限ボルツマンマシン," 機関誌「オペレーションズ・リサーチ」, 60(4):221-226, 2015. PDF
Abstract 人が選択肢集合の中から最も魅力的な選択肢を選ぶときに,各選択肢の魅力は他の選択肢に何があるかに強く影響を受ける.特に,魅力効果,妥協効果,類似効果は,人の選択に影響を与える代表的な効果として知られている.ところが,標準的な選択モデルである多項ロジットモデルは,これらの効果を表現することはできず,人の選択を予測する目的において,その予測精度が問題になることがある.これらの効果を定量的にデータから学習するために,制限ボルツマンマシンを用いた選択モデル(RBM 選択モデル)が最近提案された.本稿では,このRBM 選択モデルをわかりやすく解説する.
2014
恐神貴行, "リスクを考慮した逐次的意思決定," 機関誌「オペレーションズ・リサーチ」, 59(7):364-369, 2014. PDF
Abstract 確率的な環境下での逐次的意思決定は,期待累積コストの最小化を目的として,動的計画法に基づいて行動の戦略を決めるのが標準的である.ところが,大きな損失を避けるようにリスクを考慮する逐次的意思決定では,しばしば動的計画法が適用できない.動的計画法が適用できることと,首尾一貫した逐次的意思決定ができることとは密接な関係があり,リスクを考慮した逐次的意思決定においても動的計画法が適用できることが望ましい.本稿では,反復的リスク指標を用いることで動的計画法が適用できることを示し,逐次的意思決定における反復的リスク指標の意味をロバスト最適化の観点から議論する.
2013
鈴村豊太郎, 水田秀行, 恐神貴行, "スマーター・シティーを支える大規模社会シミュレーション基盤," ProVISION, 78:52-57, Summer 2013. PDF
Abstract オープンデータの普及によって、交通、環境、災害など都市のさまざまな問題を解決する上で必要なデータが、リアルタイムかつ膨大に取れる時代が到来しています。本稿では、これらのビッグデータ解析の基盤技術とスマーター・シティーを支える基盤技術の一つとして、高いスケーラビリティーを持つシミュレーション基盤、XAXIS (X10-based Agents eXecutive Infrastructure for Simulation)を解説します。
[MPS13] 飯田紘士, 勝木孝行, 恐神貴行, 中川裕志, "ベイズ推定を用いた指数忘却型自己回帰モデルによるトレンド、季節性を含むデータの予測," 研究報告数理モデル化と問題解決(MPS)、2013-MPS-92, 17:1-6, 2012.
Abstract 電力需要予測問題のようなトレンドと季節性を含むデータの予測には,単純指数平滑化法を発展させ,データの指数的な忘却を表現できる Holt-Winters 法や discounted least squares を中心に様々な方法が提案されてきた.一方で,モデルが複雑になるに従い,そのパラメータの最適化は,過学習を起こしやすい多変数の同時推定となるため,精度や安定性に問題があることが知られている.特に,従来手法はいくつかのパラメータで過学習の危険の大きい点推定を用いていることが多く,それが精度や安定性の劣化要因となっていた.提案手法ではAR model と discounted least squares を組み合わせた表現力の高いモデルを使い,かつ,過学習を適切に防げるよう全てのパラメータをベイズ推定を用いて推定することで,従来手法を上回る予測精度を得ることに成功した.その際効率的な推定と変数の分布の適切な設定のために変分ベイズ法と Taylor 近似を組み合わせた近似を行った.
2011
恐神貴行, "特集にあたって," 日本オペレーションズ・リサーチ学会機関誌(特集「クラウドとアナリティクス」), 56(6):304, 2011.
恐神貴行, "第29回 2010年度 待ち行列シンポジウム ルポ," 日本オペレーションズ・リサーチ学会機関誌, 56(4):244-245, 2011.
[ORSJ11] 恐神貴行, ルディーレイモンド, "過渡状態の待ち行列に対する簡単な上下界," 日本オペレーションズ・リサーチ学会2011年春季研究発表会, 東京, 2011年3月.
[Q11a] 恐神貴行, "反復的リスク指標による最適化," 待ち行列シンポジウム「確率モデルとその応用」, 京都, 2011年1月.
Abstract ある反復的リスク指標が期待効用では表現できないことを示し,その反復的リスク指標に従った意思決定が合理的だと思われる例を示す.合理的な意思決定者の好みが必ずしも期待効用では表現できないと言える.次に,反復的リスク指標がある性質,強単調性,を満たす場合には,その反復的リスク指標を最大化または最小化することを目的とするマルコフ決定過程に対する最適施策が動的計画法によって効率的に求められることを示す.
[Q11b] 平出涼, 恐神貴行, 三好直人, "流体極限におけるキャッシュアルゴリズムの解析," 待ち行列シンポジウム「確率モデルとその応用」, 京都, 2011年1月.
Abstract 2Q (Two Queue) アルゴリズムは,リクエストの頻度と新しさを捉えるためにバッファを分割するという手法を取り入れた原点とも言えるキャッシュアルゴリズムである.しかしながら,2Qは時間的な局所性を持つリクエストに対しては有効ではなく,その欠点を改良すべくFull 2Qアルゴリズムが提案された.Full 2Qは,バッファを3つに分割しており,1つがFIFO (First In First Out) アルゴリズムによって管理され,残りは2Qによって管理されている.2Qの2つのバッファはLRU (Least Recently Used) アルゴリズムによって管理される.本稿では,Full 2Qのヒット率に対する流体解析を行い,その準備として,LRU,FIFO,2Qの流体解析を行う.流体極限においては,アイテム数はn倍され,アイテムサイズは1/n倍され,nは無限大に近づく.LRUと2Qの流体解析は既に行われているが,本稿では流体極限における偏微分方程式を解くことで解析を行う.
2010
恐神貴行, "日本アイ・ビー・エム(株)東京基礎研究所(<連載>ORを活用する企業(7))," 日本オペレーションズ・リサーチ学会機関誌, 55(7):425, 2010.
恐神貴行, "第28回 2009年度 待ち行列シンポジウム ルポ," 日本オペレーションズ・リサーチ学会機関誌, 55(3):199-200, 2010.
[ORSJ10] 恐神貴行, ルディーレイモンド, "半正定値計画による確率モデルの解析," 日本オペレーションズ・リサーチ学会2010年春季研究発表会, 東京, 2010年3月.
[Q10a] 恐神貴行, ルディーレイモンド, "半正定値計画による閉形式での解析," 待ち行列シンポジウム「確率モデルとその応用」, 広島, 2010年1月.
Abstract 過渡状態のGI/GI/1待ち行列における待ち時間の裾分布の上限を, サービス時間と到着間隔の最初の2次のモーメントを用いて, 閉形式で導出する. また裾分布の上限を積分し, 期待値の上限も閉形式で導出する. 裾分布の上限は以下の手法で得られる: まず目的関数値が裾分布の上限を与える半正定値計画(SDP)を定式化し, そのSDPの双対問題の実行可能解を構築し, その実行可能解の目的関数値を閉形式で得る. 得られた閉形式が裾分布の上限に対応する. 最初の稼動期間における最大待ち時間に関する上限も導出する.
[Q10b] 平出涼, 恐神貴行, 三好直人, "流体極限におけるキャッシュアルゴリズムの過渡解析," 待ち行列シンポジウム「確率モデルとその応用」, 広島, 2010年1月.
2009
[Q09b] 恐神貴行, "システムの性能を識別する時に信頼できる指標," 待ち行列シンポジウム「確率モデルとその応用」, 松本, 2009年1月.
[Q09a] 平出涼, 恐神貴行, 三好直人, "2Qアルゴリズムのヒット率最大化," 待ち行列シンポジウム「確率モデルとその応用」, 松本, 2009年1月.
Abstract Web システムやストレージシステムの性能は,キャッシュアルゴリズムに大きく依存している.そのアルゴリズムの一つにTwo Queue (2Q) アルゴリズムがある.2Q アルゴリズムは,リクエストの最新性と最頻性を両方捉えるために,2 本のバッファを用いる.ヒット率,つまり,リクエストしたアイテムがバッファで見つかる確率は,2 本のバッファサイズの比率に依存している.本論文では,流体極限における2Q に対して,ヒット率最大となるバッファサイズの比率を求める.また,そのとき,アイテムを連続化すると,最大のヒット率が,理論的な上限である最適静的配置のヒット率に近づくことを示す.
2008
[ORSJ08] 恐神貴行, "流体極限におけるLRUキャッシュアルゴリズム," 日本オペレーションズ・リサーチ学会2008年秋季研究発表会, 札幌, 2008年9月.
[Q08b] 恐神貴行, 平出涼, "2Qキャッシュアルゴリズムの流体解析," 待ち行列シンポジウム「確率モデルとその応用」, 京都, 2008年1月.
[Q08a] 平出涼 and 恐神貴行, "依存する無効化を考慮したLRUアルゴリズムの流体解析", 待ち行列シンポジウム「確率モデルとその応用」, 京都, 2008年1月.
Abstract Webシステムでは, 応答時間の短縮, ネットワークトラフィックの軽減, サーバ負荷軽減のために, キャッシュがさまざまな層で使われている. 代表的なキャッシュアルゴリズムの一つがLRU (Least Recently Used)アルゴリズムである. キャッシュの性能は, リクエストされたときに, そのアイテムがキャッシュ内で見つかる確率(ヒット率)によって評価できる. 本研究では, LRUアルゴリズムのヒット率を流体極限において厳密に解析する. 流体極限においては, アイテムの数がn倍に, アイテムのサイズが1/n倍にスケールされ, nが無限に近づく. 一方, Webシステムにおけるキャッシュの特徴は, アイテムの無効化(キャッシュから除去すること)である. リクエストと無効化に依存関係があるときのヒット率の流体解析を行う.
2006
J. Spohrer, P. P. Maglio, J. T. Kreulen, S. Srinivasan (翻訳 恐神貴行, 鹿島久嗣, 加納真, 水田秀行), "サービス・サイエンスの出現:Becoming a Service Scientist," 情報処理, 47(5): 461-466, 2006年5月.
1999
[SIGAL99] 恐神貴行, 岡野裕之, "ビン・パッキング問題における局所探索法と構築法との関係," 第69回アルゴリズム研究会, 札幌; 情報処理学会研究報告, 99-AL-69-5, pp. 33-40, 1999年9月.
Abstract 実問題に現れるビン・パッキング問題(BPP)に応用することを目的に, 各種構築法と局所探索法の組み合わせについて, 解の質と探索数のトレードオフに着目して比較する. 既存のものを含む7種類の構築法に, ベスト改善, ファースト改善, および本稿で提案する優先改善の3つの局所探索法を適用した. 計算実験の結果, BPPに対してはアイテム数のバランスした初期解から始め, ランダムな順序で探索するファースト改善が優れているが, 制約の付いたBPPに対しては, 優先改善が優れていることが明らかになった.