11月9日(水)
D-101:一般化乗算に基づくNMFの拡張と判別問題への応用
藤本 悠(青山学院大学),村田 昇(早稲田大学)
NMF(Nonnegative Matrix Factorization)は非負値行列データの解析,特に次元圧縮や特徴量抽出のための数学的な道具立てとして様々な場面で広く利用されている.本発表では非負値の乗算を指数関数,対数関数を用いて定義し,これらをパラメトリックに記述される関数族で置き換えることで乗算の一般化を行い,NMFを拡張することを試みる.これは非負の基底行列,係数行列の間に一種非線形な関係を仮定した上で元の行列を分解していることに相当し,分解結果の基底,係数はそれぞれ通常のNMFとは異なる性質を持つことが確認できる.発表ではこれらの性質に着目しながら判別問題等の具体的なタスクにおける本手法の特徴について議論を行う.
D-102:CDMAにおけるマルチユーザ検出のセルフコンシステントなS/N解析
加藤 弘之(関西大学大学院),岡田 真人(東京大学大学院),三好 誠司(関西大学)
CDMA における多ユーザ検出での並列干渉除去法(parallel interference canceller: PIC)による信号復調を大システム極限において解析する.並列干渉除去法による復調アルゴリズムはホップフィールドモデルにおける連想記憶モデルの想起過程と類似の構造をもつ.そこで連想記憶モデルの解析手法の1つであるSelf-Consistent Signal-to-Noise Analysis(SCSNA) を用いて解析を行う.SCSNA による解析結果はPIC のふるまいを定量的に説明する.
D-103:ROC曲線を考慮した記憶容量を超えた場合のパーセプトロンの学習
桑原 昭之(筑波大学大学院)
ニューラルネットの最も基本的なモデルである単純パーセプトロンに,記憶容量を超える学習データを与えて誤り訂正学習を行うと,学習が収束しないことが古くから知られている.このような記憶容量を超える学習データが与えられた場合の動作不良の原因は,与えられた全ての学習データを等しく学習しようとすることにあると考えられる.その対策として,これまでは主に忘却を用いる方法(新しいデータを優先する方法)が提案されてきた.それに対し本研究では,学習器にとって学習し易いデータを優先する方法を提案する.この方法では,学習困難なデータは無視される(学習も識別もされない)ため,識別されるデータ数は減るが,その分,正解率は高くなる.このようなトレードオフはROC(受信者操作特性)曲線を用いて適切に捉えることができる.ROC曲線を考慮したニューラルネットの学習として,既に遺伝的アルゴリズムを用いた研究が複数行われているが,ニューラルネットの複製を多数使用するため,計算コストのかかる方法となっている.本研究では,次のシンプルな方法で単純パーセプトロンの学習を行うことによりROC曲線を局所的に改善することを検討する.(1)閾値以上の場合のみ正例と識別する(負例の識別はしない).(2)学習は閾値付近のデータを中心に行う.(3)True Positive,False Positiveの比をもとに閾値を逐次的に調節する.
D-104:文書情報を考慮した無限関係モデルによるネットワーク推定
鈴木 知彦(早稲田大学),井田 安俊(早稲田大学),松本 隆(早稲田大学)
これまで無限関係モデルによるネットワーク解析においては、関係が”ある・ない”の二値による情報のみが用いられてきた。しかしある種の実問題においては関係のある・なしのみならずどのようなタイプの関係があるのかという情報が、与えられたデータに内在する場合がある。そのようなデータのひとつであるエンロンコーパスについて、文書情報を付与した提案モデルと文書情報を用いない既存モデルとの間で、どのようにネットワークのクラスタリング結果が異なるのか分析し、バイナリの情報以外の情報も同時に用いることの意義について検討を行う。
D-105:半教師あり学習を用いたノンパラメトリックトピックモデルによるweb文書の評判分析
井田 安俊(早稲田大学),鈴木 知彦(早稲田大学),松本 隆(早稲田大学)
不正な文法やスラングが含まれているweb文書を対象とした評判分析に対して、トピックモデル、ノンパラメトリックベイズ、半教師あり学習によるアプローチの有効性を検討する。
D-106:特徴の出現頻度に応じたL1正則化を実現するDual Averaging
大岩 秀和(東京大学),松島 慎(東京大学),中川 裕志(東京大学)
L1正則化とオンライン学習を組み合わせた学習手法が近年注目を浴びている.オンライン学習は,データを1つ受け取るたびに,そのデータのみを用いてパラメータを更新する手法である.全データを一度に処理する必要がないため,大規模なデータから学習を行う際にもメモリ消費量を1データ中に含まれる量で抑えることが可能になる.L1正則化は,解くべき最適化問題にパラメータのL1ノルムを導入し罰則を与えることで,学習の際に不必要なパラメータをモデルから動的に排除する事が可能となる.パラメータの値を零化しモデルを簡易にすることで,メモリ消費量を抑えると共に学習・予測時の高速な演算を可能にする.これまで複数のL1正則化付きのオンライン学習手法が提案されている.主な手法として,RDAやFOBOSが存在する.しかし,これらの手法は対象となるデータの各特徴の出現頻度が不均一な場合,低頻度の特徴を予測に用いることが困難となる.これは,低頻度の特徴がL1正則化によって優先的に排除されてしまうためである.バッチ学習の場合,各特徴の出現頻度を事前にカウントし,出現頻度に応じた重み付けを行うことで,上記の問題を解決可能である.しかし,データを動的に読み込みながら学習を行うオンライン学習では,これらの前処理を適用することが出来ない.本発表では,オンライン学習の一手法であるDual Averagingに対して,各特徴に対応するパラメータの更新頻度に応じたL1正則化を導入する方法について議論する.更新頻度が低いパラメータが零化されにくくなるように自動的に調節する改良をL1正則化項に加えることで,学習上有用だが低頻度な特徴を予測に用いることを可能にする.また,提案手法が,計算量・最適解への収束速度の面で既存手法と同等の性能を示す事を証明した.また、実データを用いた実験を行い、提案手法の性能を評価した。実験の結果、精度・モデルの簡潔さの両面で、提案手法は既存手法を上回る学習が可能になることを確認した。
D-107:予測分布を考慮したマルチタスク学習
成田 敦博(東京大学),佐藤 一誠(東京大学),中川 裕志(東京大学)
マルチタスク学習では、複数のタスクが共通する潜在変数を持つと仮定することによって、関連したタスクの同時学習を行う。得られるデータが少ない時に有効な手法であるが、一方で、本来似ていないタスク同士で情報を共有した場合に精度が悪化する「負の転移」が問題となる。この研究では、モデルの予測分布からパラメータが従うべき距離を推定し、適切な正則化項を作ることによって、負の転移を抑えつつ複数のタスクを同時に学習するための手法を提案する。また、同じ枠組みで転移学習にも自然に拡張できることを示す。
D-108:ベータダイバージェンスを用いた動的システムの状態推定
福永 修一(東京都立産業技術高等専門学校),赤穂 昭太郎(産業技術総合研究所)
動的システムの状態推定には,カルマンフィルタが広く用いられている.カルマンフィルタの導出にはいくつかの方法があるが,本研究では最尤推定に基づく導出に着目する.最尤推定は,Kullback-Leibler ダイバージェンスを最小化していることと等価である.そして,推定のロバスト化には,Kullback-Leiblerダイバージェンスを拡張したベータダイバージェンスが用いられ,さまざまな問題へ応用されている.そこで本研究では,ベータダイバージェンスの最小化により最適フィルタを導出する.さらに,そのフィルタがある条件のもとでは,システム制御工学の分野で提案されたH∞フィルタと一致することを示す.
D-109:情報理論的規準に基づく新しいバースト検知アルゴリズムのクラスについて
金澤 宏紀(東京大学大学院),山西 健司(東京大学大学院)
本稿では,データストリームのバーストな状態(例: e-mail 受信頻度の急激な増加)を検知する問題を考える.Kleinberg は,この問題に対して状態オートマトンを用いる変化点検出アルゴリズムを提案した.その中で指数分布の 1 次元連続値パラ メータ空間を可算無限個の状態に量子化して状態間の変化の有無の判定規準を提案していたが,その量子化法および判定規準はアドホックなものであった.本研究では,Kleinberg のアルゴリズムを情報理論に基づくデータ圧縮の観点からの解釈を与えることによりその一般化を行い,変化点検出アルゴリズムの新しいクラスを提案する.提案アルゴリズムの目的は,1)連続値パラメータの可算状態への量子化,および,状態遷移に伴うペナルティを記述長最小化原理の下で統一的に評価すること,2)この考え方を一般のパラメトリックな確率モデルの変化点検出に拡張すること,である.本稿では,提案アルゴリズムのクラスにおいて.量子化手法と状態遷移ペナルティの与え方を変えながらいくつかの確率モデルに適用し,実験を行い比較する.
D-110:動的方策計画法によるモジュール学習制御
植野 剛(科学技術振興機構),河原 吉伸(大阪大学),鷲尾 隆(大阪大学)
タスク空間を複数の部分空間に分割し、その分割した各部分空間に配置した局所的な制御器を組み合わせることで実現されるモジュール学習制御は、非線形、非定常環境、マルチタスク環境などの複雑な環境での最適制御問題の解法として期待される。しかし、これまで提案されているモジュール学習制御の学習アルゴリズムは、多くのヒューリスティックによって成り立っており、学習メカニズムに対する理論的な裏付けはなく、かつ拡張性が乏しい。本研究では、銅谷らが提案したモジュール学習制御の1種であるマルチモデル強化学習(Multi Model Reinforcement Learning: MMRL)を動的方策計画法により再定式化し、統計的に蓋然性のある学習が可能で、かつ拡張性に富むモジュール学習制御法を提案する。MMRLは1つのモジュールとして局所的な予測器と制御器(行動価値関数)を持つ。そして各モジュールから出力される制御信号を予測器の予測精度によって決定される責任信号により重み付けする。本研究では、このMMRLの各モジュールの局所予測器を線形動的システムとして、予測器全体を混合線形動的システムとして統計モデル化する。そして動的方策計画法に従い、この統計モデル下での累積報酬を最大にする制御器の関数形を変分法により導出し、これにより最適な制御関数は最適行動参照関数の指数混合として得ることができることを明らかにする。最後に最適行動参照関数を獲得する反復学習アルゴリズムを提案し、計算機実験でその性能を検証する。
D-111: ポテンシャルガイディング関数を用いた 条件付き状態遷移軌跡分布のモンテカルロ計算
松田 衆治(大阪大学大学院),iba yukito(統計数理研究所),鷲尾 隆(大阪大学)
標準的なモンテカルロシミュレーションでは、初期状態から始めて状態遷移確率に基づいて時間発展に沿う系の状態遷移軌跡の分布を導く。これに対して、特定の初期状態から別の特定の最終状態に至る系の条件付き状態遷移軌跡分布を得たい場合は多い。例えば、化学においては、分子がある初期状態から別の最終状態に至る反応の状態遷移軌跡分布を得たいというニーズがある。分子運動には確率的な揺らぎがあるため、この場合モンテカルロシミュレーションによる条件付き状態遷移軌跡分布を導出する必要がある。しかし、単純に時間発展を追う標準的なモンテカルロシミュレーションにより、初期条件と最終条件を結ぶ経路や軌跡を得るのは極めて非効率である。そこで、このような経路や軌跡を効率的に得る手法として、パスサンプリングの研究が行われてきた。代表的なものとして、初期状態と最終状態の間に複数の曲面を定義し、その曲面間を往来する状態遷移軌跡の組合せから初期状態と最終状態を結ぶ全体の軌跡分布を得る手法がある[1]。他に、初期状態と最終状態を結ぶ既知の軌跡から、隣接する状態空間上に軌跡を分岐させて同様に初期状態と最終状態を結ぶ新たな軌跡を効率的に作成し、全体の軌跡分布を探索的に得る手法もある[2]。前者は効率と精度の両面から適切に曲面を定義する体系的な方法が確立されておらず、また高次元状態空間上でそれらを定義する事が難しい場合が多い。後者は既知の状態軌跡の周辺にのみ新たな軌跡が作成される傾向が強く、状態空間上の局所的な部分空間に状態遷移軌跡が集中し全体の軌跡分布を得ることは難しい。これらパスサンプリング手法以外に、通常の状態遷移確率に加えて目的とする条件に沿って状態遷移を確率的に誘導するガイディング関数を導入し、効率的に状態遷移軌跡分布を導く手法が提案されている[3]が、この手法ではガイディング関数によって歪んだ状態遷移確率によるシミュレーション結果となってしまう。そこで、本研究では状態遷移の途中経路について不変なポテンシャル関数の性質を有するガイディング関数を用い、状態遷移確率を保持する新たなモンテカルロシミュレーション法を提案する。この手法により、効率的に正しい状態遷移確率によるシミュレーションを行う事ができると期待される。
D-112:イベント系列データからの生活コンテキスト推定のための確率的生成モデルの検討
黒川 茂莉(株式会社KDDI研究所),村松 茂樹(株式会社KDDI研究所),横山 浩之(株式会社KDDI研究所),吉井 和佳(産業技術総合研究所),麻生 英樹(産業技術総合研究所)
筆者らは,携帯電話の利用に基づいて発生するイベント系列データを元に利用者の生活コンテキスト(たとえば,職場で打ち合わせ,自宅で食事,外出先でウィンドウショッピング,など)を推定し,利用者に対し生活コンテキストに応じた情報提供を行うサービスを検討している.ユーザが能動的に携帯電話のサービス(例えば,発話・発信など)を利用したタイミングで生成されるイベント系列データは,定期的に発生するデータではないが,その発生パターンにユーザの生活コンテキストが反映されている可能性が高い.本発表では,イベント系列データが生成されるタイミングやイベントの種別の情報を利用してユーザの生活コンテキストを推定するための確率的生成モデルについて述べる.
D-113:マルチタイプ混合メンバーシップ・ブロックモデルを用いた情報推薦
横峯 樹(神戸大学),江口 浩二(神戸大学)
ユーザ・アイテム間の関係だけでなくユーザ間の関係やアイテム間の関係などの補助情報を考慮することでより的確な情報推薦を実現できると考えられる.グラフデータから頂点の潜在グループを抽出する手段として混合メンバーシップ・ブロックモデルが知られているが,本研究では辺の種類を区別できるよう拡張したマルチモード混合メンバーシップ・ブロックモデルを提案し,情報推薦に適用する.Top-N推薦の実験において提案モデルの有効性を示す.
D-114:Symmetric Correspondence Topic Modelsによる多言語トピック抽出
福増 康佑(神戸大学),松浦 愛美(東京大学),江口 浩二(神戸大学)
多言語比較可能コーパスから潜在トピックを抽出する問題に着目する.種々のトピックモデルを比較評価し,とりわけCorrespondence Latent Dirichlet Allocation(CorrLDA)として知られるモデルが有効であることを示す.さらに,CorrLDAの非対称性の問題を解決する新たなモデルとしてSymmetric Correspondence Topic Modelsを提案し,Wikipediaを多言語比較可能コーパスとして用いた実験によって提案モデルの有効性を示す.
D-115: 曲線あてはめにおける特徴空間の特性について
赤穂 昭太郎(産業技術総合研究所),藤木 淳(産業技術総合研究所)
空間中の点集合に曲線をあてはめる際、高次元の特徴空間に写像し、超平面をあてはめる手法を用いることができる。 これは形式的にはカーネル主成分分析と同じ固有値問題を解き、最小固有値に相当する固有ベクトルを取り出すというカーネル劣成分分析と等価となる。しかしながら、カーネル劣成分分析では一般にリプレゼンター定理が成立しないため、特徴空間の次元が高くなるにつれて解の挙動が不安定になるなどの問題がある。一方、リプレゼンター定理が成立するカーネル主成分分析から得られる主成分を用いて曲線をあてはめるというアプローチが考えられるが、入力空間全体は特徴空間中の低次元多様体となっているため、主成分に対応する入力空間上の点は必ずしも存在せず、preimage で近似するなどの処理が必要だが、その性質は十分にわかっていなかった。そこで本発表では、特に2次元空間中の点集合に2次曲線をあてはめる場合についてこれらの挙動を調べ議論する。
D-116: ガウス過程を用いたネットワークのノード分類法
江原 遥(東京大学),佐藤 一誠(東京大学),中川 裕志(東京大学)
近年,自然言語処理(NLP)における半教師あり学習法としては,テキストから,例えば単語をノードとするネットワークを構築し,単語の分類問題を,ネットワーク上のノードの分類問題として解くアプローチが注目されている.ラプラシアンラベル伝搬法は,このようなアプローチにおける代表的な手法である.しかし,この方法はネットワークに新しいノードを追加したい場合に,その新しいノードを分類することが計算量が大きく難しいという問題があった.このため,例えば,扱いたい単語の種類を増やすことが難しく,応用上の課題となっていた.本発表では,ラプラシアンラベル伝搬法が,ガウス過程の MAP推定の平均ベクトルを計算することと等価であることを示す.加えて,MAP推定の代わりにガウス過程の予測分布を用いることによって,応用上の課題であった新しいノードを分類する問題がをベイズの枠組みで自然に行えるようになること,また,ベイズ推定による分類性能の向上が見込めることを説明する.また,予測分布では,平均ベクトルだけではなく分散共分散行列も求められるため,これを信頼度とみなして活用する方法も議論したい.
D-117:階層的発話生成モデルを用いた話者クラスタリングのためのフルベイズモデル推定手法の比較
俵 直弘(早稲田大学),小川 哲司(早稲田大学),渡部 晋治(NTT),小林 哲則(早稲田大学)
階層的なフルベイズ型生成モデルを用いて発話の構造を推定することで,話者クラスタリングを行う手法が提案されている[1,2].これら手法では,発話音声に含まれる変動を,発話毎に生じる話者に起因する変動と,発話内容に起因するフレームレベルの変動に分解できると仮定する.そして,このような階層的な発話構造を表現するためのモデルとして,話者の分布を混合要素としてもつ階層的な混合モデルを導入し,このモデルの構造を推定することにより話者クラスタリングを行う.本発表では,各話者分布を単峰のガウス分布で近似し,ノンパラメトリックベイズモデルを適用することにより,話者数を推定しながらクラスタリングを行う枠組みとして,発話を単位としたディリクレ過程混合モデル(UO-DPMM)[3]を紹介する.また,このようなフルベイズ型の生成モデルの推定方法として,サンプリング法に基づく方式[1]と変分ベイズ法に基づく方式[2]が提案されているが,その話者クラスタリング性能に対する有効性は明らかになっていない.そこで本発表では,話者数を固定した階層的発話生成モデルについて,TIMITとCSJという異なる音声データベースを用いて,サンプリング法と変分ベイズ法というモデル推定法の違いが話者クラスタリング精度に与える影響を調査した.その結果,発話数が十分に多い場合においてはほぼ同程度の精度が得られるのに対し,発話数が少ない場合ではサンプリング手法の方が高い精度が得られることを確認した.また,話者数を推定可能なノンパラメトリックベイズモデリングの必要性についても実験より明らかになった.[1] F. Valente and C. Wellekens, Proc. ODYSSEY, May, 2004.[2] S. Watanabe and et al., Proc. ICASSP, May, 2011.[3] N.Tawara and et al., Proc. Interspeech, Aug., 2011.
D-118:マルチモーダル情報を用いたトピックモデルによる映像分類
梶野 洸(東京大学大学院),木村 昭悟(NTT),石黒 勝彦(日本電信電話株式会社)
本研究では,映像のカテゴリ分類の一実現手法として,トピックモデルの一つであるLatent Dirichlet Allocation (LDA) を,マルチモーダル情報を考慮した形に拡張した生成モデルとその推定方法を提案する.まず,マルチモーダル情報を用いたモデルの性質を考察するために,画像信号のみを用いたモデル,音響信号のみを用いたモデル,双方ともに用いたモデルの三つについて,TRECVID Semantic indexing taskのデータを用いて,比較検証を行った.この検証結果から得られた知見を基に,画像信号・音声信号それぞれに対するトピックを考慮したモデル,及び二つの信号の相関の有無を潜在変数として新たに導入したモデルを構築する.また,それぞれのモデルについて,パラメータ学習及びカテゴリ分類のためのアルゴリズムを,変分法を用いて導出する.
D-119:ループありネットワークの混合ループなしネットワークへの変換による推論・学習
前田 新一(京都大学),石井 信(京都大学)
離散変数の分布をグラフィカル表現した際、ループをもつネットワークとなっている場合、その分布を周辺化表現(Marginal Representation)することができないため、周辺分布の統計量の計算が困難となり、その推論や学習が難しくなる。そこで、ループをもつネットワークを有限個のループのないネットワークの和で表現することを考える。ループのないネットワークは、周辺分布の計算が容易であり、その分布の和の周辺分布もそれぞれのループのないネットワークの周辺分布の和として計算される。その結果、推論や学習も実行可能となる。このような変換を用いて、離散変数の分布の学習・推論を行う際の計算量は、変換に必要な計算量と、必要となるループのないネットワークの個数(混合数)に比例した計算量の和となる。我々は、2つのバイナリー変数からなるクリークによって構成される離散分布は、ループのないネットワークへの変換が解析的な線形演算によって得られ、その混合数は2^|クリークの数|で与えられることを示し、少数のクリークからなるスパースなネットワークにおいてループのないネットワークの混合和による表現がその推論や学習に有効になることを提案する。
D-120:アクティブ計測とパッシブ計測を用いたネットワークトモグラフィ
宮本 敦史(奈良先端科学技術大学院大学),渡辺 一帆(奈良先端科学技術大学院大学),池田 和司(奈良先端科学技術大学院大学)
通信ネットワークのパスごとのパケットロス率を用いて、リンクごとのパケットロス率を推定する逆問題は、ネットワークトモグラフィと呼ばれる。パケットロス率を計測する手法としてプローブパケットを用いたアクティブ計測と、流れているパケットからパケットロス率を推定するパッ シブ計測がある。一般的にネットワークトモグラフィでは、パスごとのパケットロス率を知る必要があるため、コストの高いアクティブ計測が用いられており、パケットの通過パスを指定できないパッシブ計測は用いられてこなかった。 本稿では、パッシブ計測で用いたパケットの通過パスを推定することで、パッシブ計測とアクティブ計測を用いたネットワークトモグラフィを提案する。数値実験により、少ないアクティブ計測の回数で同程度の推定精度を実現できることを示す。
D-121:混合整数計画による正則化 0/1 損失最小化
加藤 毅(群馬大学)
2クラス問題は機械学習分野において最も基本的な問題で,数十年にわたって研究されてきた.2クラス分類では,しばしば誤分類率を最小にすることが目標となる.対応する理想的な損失関数は 0/1 損失となるが,扱いづらい関数となるため,しばしばヒンジロスなどほかの損失関数に置き換えられてきた.0/1 損失のままとり扱った事例の中に新村の方法があるが,正則化が施されていなかった.本発表では,正則化を施した 0/1 損失を最小にする学習算法を混合整数計画によって定式化し,既存の方法との予測性能の比較を行う.
D-122:ラージマージンなアンカーグラフハッシング
得居 誠也(東京大学),佐藤 一誠(東京大学),中川 裕志(東京大学)
大規模なデータを解析する際に、与えられたデータ点に対して何らかの尺度に基づいて近いデータ点の集合を求める近傍探索の技術は、幅広い応用を持つ基本的なタスクである。近傍探索はデータ数が多い場合に特に有効となるが、大規模データを扱う技術はメモリや速度の面でデータ数に対してスケールする必要がある。高速かつ省メモリで近傍探索を行う技術として、近傍構造を保存しながらデータ点を二値ベクトルに変換するハッシング法が研究されている。特に機械学習の分野では、データが分布する多様体に沿って類似度を測るために、多様体学習に基づいたハッシング法が提案されている。このようなハッシュ関数を学習するアルゴリズムの中でも、今年になって提案されたアンカーグラフハッシングが、学習アルゴリズムとハッシュ関数の双方において高速かつ省メモリで動作する手法として注目されている。アンカーグラフハッシングで用いられる連続緩和された最適化問題では、連続ハッシュ値が二値化の境界となるゼロ付近の値を取ることが多く、二値化によるエラーが起こりやすいという問題がある。本発表ではハッシュ値最適化問題にマージンを大きく取るような項を追加することで、速度や省メモリ性を保ったままゼロ付近のエラーを軽減する手法を提案する。また、提案手法を現実のデータに対して適用することで、大域的なハッシュ性能を向上させられることを示す。
11月10日(木)
D-123:相関のあるイベント時系列に対するヒストグラムの最適化
近江 崇宏(京都大学),篠本 滋(京都大学)
大規模なデータを解析する際に、与えられたデータ点に対して何らかの尺度に基づいて近いデータ点の集合を求める近傍探索の技術は、幅広い応用を持つ基本的なタスクである。近傍探索はデータ数が多い場合に特に有効となるが、大規模データを扱う技術はメモリや速度の面でデータ数に対してスケールする必要がある。高速かつ省メモリで近傍探索を行う技術として、近傍構造を保存しながらデータ点を二値ベクトルに変換するハッシング法が研究されている。特に機械学習の分野では、データが分布する多様体に沿って類似度を測るために、多様体学習に基づいたハッシング法が提案されている。このようなハッシュ関数を学習するアルゴリズムの中でも、今年になって提案されたアンカーグラフハッシングが、学習アルゴリズムとハッシュ関数の双方において高速かつ省メモリで動作する手法として注目されている。アンカーグラフハッシングで用いられる連続緩和された最適化問題では、連続ハッシュ値が二値化の境界となるゼロ付近の値を取ることが多く、二値化によるエラーが起こりやすいという問題がある。本発表ではハッシュ値最適化問題にマージンを大きく取るような項を追加することで、速度や省メモリ性を保ったままゼロ付近のエラーを軽減する手法を提案する。また、提案手法を現実のデータに対して適用することで、大域的なハッシュ性能を向上させられることを示す。
D-124:非一様ポアソン点過程のレート変動検出限界
新谷 俊了(京都大学),篠本 滋(京都大学)
観測データから内部状態を推定する問題において,微弱な信号は観測ノイズに埋もれて検出されないということが起こる.本研究では,神経スパイクや地震のように一瞬のうちにおこる点事象が,背後の頻度,すなわちレートからランダムに生成されるとモデル化したポアソン過程を考え,観測された点事象時系列から背後のレート変動を推定する問題を扱う.この推定問題においては,変動するレートが信号であり,点事象がランダムに発生するという条件がノイズに相当する.ここではレートが高と低の2状態の間を与えられた時間スケールでランダムに遷移するランダムテレグラフ過程に従うケースを議論する.このランダムテレグラフ過程で生成されたレートから,点事象はポアソン過程に従ってランダムに生成される.生成された点事象時系列から3種類の方法を用いて背後のレートを推定した.まず,ヒストグラムにより経験的レートを数値化する.ここでレート推定はビン幅の選択に大きく依存するので,背後のレートとヒストグラムの間の平均二乗誤差 (MISE) を最小化するビン幅を選択する方法を用いる.この手法では,レート変動の振幅を下げるとあるところから最適ビン幅が発散する相転移を起こすことが分かった.次に,ベイズ法によるレート推定を用いる.ここでベイズの事前分布にはレート変動の平坦さを導入し,その平坦さのハイパーパラメータ決定に経験ベイズ法を用いる.変動が十分小さい場合の公式に従って計算すると,MISE最小化の場合と同じ条件で二次相転移を示すことが分かった.さらに,隠れマルコフモデル(HMM)に変分ベイズ法を用い,背後のレート変動を推定する.HMMによるレート変動解析は,モデル選択問題を数値計算実験することで行った.状態数1から5のどのモデルが最適かを適当なパラメータ設定において計算したところ,選択される状態数が1から2へと変化する平均滞在時間の臨界値が存在することが分かった.3手法共に,頻繁に遷移するレートからはレート変動が検出できないということが確かめられた.ビン幅選択と経験ベイズ法のレート変化検出限界の条件は共通しているが,HMMによる臨界値は,上記2手法での臨界値を下回っており,レート変動の検出限界は推定手法によって異なると考えられる.レート変動の検出限界の定義や,普遍的な限界値の存在についての問題はこれからの課題と考えている.
D-125:改良Expert Advice を用いた時系列予測
森野 佳生(東京大学大学院),平田 祥人(東京大学),冨岡 亮太(東京大学),鹿島 久嗣(東京大学),山西 健司(東京大学大学院),合原 一幸(東京大学)
現在観測されている時系列データを用いて将来の時系列データを予測することは天気予報,株価の予測等に代表されるように現実的に非常に重要な問題であり,これまで様々な研究が行なわれてきた. これらの研究の中にはカオス的な時系列を対象とした時系列予測の研究も存在している.カオスは乱流等に代表されるように自然界に多々存在しており,数学的には比較的単純な系であってもカオスは現れうることが知られている.しかし,特にそのモデルが明らかではない場合にカオス的な時系列を予測することは大変難しいことが古くから知られている.これはカオスが持つ初期値鋭敏性と軌道不安定性という性質によるものであり,初期の僅かな観測誤差が時間と共に指数的に拡大していくことで,カオス系では過去の状態が現在の様相と相関がなくなることが知られている.このことは予測という面からみると,長期的な予測が本質的に不可能ということを意味している.今回の発表ではカオス的時系列を予測できる機械学習を用いたオンライン予測アルゴリズムを構築することを目的とする.具体的には expert advice を採用する.カオス的な時系列では,その軌道不安定性から生まれる効果によって過去の記憶が失われていくという性質を持つことが知られている.その為,従来の expert advice の手法をそのまま適用したのでは過去の記憶を等価に扱う為に時系列の予測が上手くいかない.この問題を解決する為には,過去の記憶を失うような効果を入れた学習アルゴリズムが必要となる.これまでに過去の学習の効果を直接減衰させていくアルゴリズムに関して様々な文脈で研究が行なわれている. 今回,我々が提案する手法は遠い過去の学習の効果は近い過去のそれに比べて相対的に小さい影響を持つようにするという点では従来の研究と同等である.しかし,我々の手法と従来の研究とで大きく異なる点はその比重の与え方であり,我々の手法では過去の記憶を直接減衰させるのではなく,現在の記憶を更に強く重み付けすることで過去の記憶の効果を相対的に小さくさせている.今回の発表では理論的な部分及び,幾つかの数理モデルと実際の時系列データに対してこの手法を適用した予測結果を示す.
D-126:Compressed Sensing を利用した欠損画素補完による仮想視点画像の画質改善
保坂 忠明(東京理科大学),浜本 隆之(東京理科大学)
近年,複数の視点で撮影された画像を基に任意視点の画像を合成する技術が活発に研究されている.任意視点画像合成の代表的な手法のひとつは,ステレオマッチング等により推定した被写体の空間位置と空間幾何を基にして仮想視点の各画素に投影される像を求めることである.しかし,ステレオマッチングにおける距離推定においては,ある視点から観測できる被写体が他の視点からは観測できない場合やテクスチャの少ない領域においては画素対応を密に正確に求めることが難しくなる.結果として,仮想視点の全ての画素を推定することはできずに任意視点画像には欠損画素が生じることとなる.これらの欠損画素を補完する最も単純な方法は,周囲に存在する色の確定した画素を用いたフィルタによる補間処理である. それを発展させたものとして拡散方程式を利用した研究も知られるが,いずれにせよこれらは一種の平滑化であるため,高周波成分が失われる傾向にある. 一方で,欠損画素を含む小領域に注目し,欠損画素以外の部分が類似した領域を対象の画像や周辺実カメラから探索する方法(テクスチャ合成と呼ばれる)がある. 一般にこの方法は,高周波成分は再現されうるものの,輝度値やRGB 値の連続性が保たれにくいという問題がある.本研究では,テクスチャ合成の考え方を基に高周波成分を保存しつつ,輝度値の連続性も保つ欠損画素補完の方法を検討する. そのために,情報理論の分野で注目され,様々な応用もされているCompressed Sensing (CS) を利用する.これまでにもCSによるテクスチャ合成の研究は知られているが,そこに被写体の距離情報の要素を取り入れることで,任意視点画像合成にふさわしい方法を提案する.実画像を用いたシミュレーションによりその有効性を検証する.
D-127:トップ k リストのオンライン予測
安武 翔太(九州大学),畑埜 晃平(九州大学),瀧本 英二(九州大学),竹田 正幸(九州大学)
近年,インターネット上での情報検索の発達や,オンラインショッピング,推薦システムの発展により,ランキングの研究が注目されている.本研究では,固定のn要素上のトップkリストオンライン予測問題を考える.各時刻tのプロトコルを以下に示す.1.アルゴリズムは順列を予測する.2.環境は固定のn要素上のトップkリストを返す.3. 順列とトップkリスト間の距離を損失として被る.アルゴリズムの目的は,T個のトップkリストが予め全て与えられたと仮定したときのオフライン最適解に匹敵する予測を行うことである.本研究ではトップkリストのオンライン予測を行うアルゴリズムを提案し,アルゴリズムの累積損失の期待値を評価する.また,実データを用いた計算機実験を行い,提案手法の性能を評価する.
D-128:センシングと符号化とクラメールの定理
村山 立人(日本電信電話株式会社),デイビス ピーター(株式会社テレコグニックス)
デバイスとセンサーのネットワークが私たちの社会の隅々にまで浸透し、その重要性が増加してきている。例えば、このようなネットワークには農地管理、生産工程制御、犯罪防止、そして軍事利用に至るまで広範な応用範囲が想定されている。センサーネットワークは、未来での市場価値が潜在的に大きい有望な先端技術であることに間違いはない。しかし、そのような状況にも関わらず、ネットワークに接続されている要素技術を効率的に制御していくある種の原理のようなものを発見するのは難しい。たしかに、ハードウェア、ソフトウェア、電源管理、といった要素技術レベルでは劇的な進展があったが、ネットワークを全体として理解し、そして賢く制御していく理論的基盤はまだ発展途上であるといわざるを得ない。少し大げさな言い方をすれば「何を見るべきか」という基本的な分析のフレームワークを少し変更していく必要もあるのだろう。特に、個々の要素の振る舞いからは直ちに予想ができないシステムレベルで創発される協同現象と、その結果として利用者が考慮しなければならないトレードオフの発見ができれば、今後のデザイン原理として採用できる可能性がある。本発表では、単一の情報源から出力される系列を、複数のセンサーで計測するという状況設定を分析する。そして、計測時のノイズレベルに対応した最適なデータ圧縮率が存在することを、確率論におけるクラメールの定理を適用して明らかにする。
D-129:圧縮センシングによる神経軸索の伸長を制御する因子の同定に関する検討
丸野 由希(奈良先端科学技術大学院大学),宮本 敦史(奈良先端科学技術大学院大学),Hassan Al-Ali(University of Miami),Lemmon Vance(University of Miami),作村 諭一(奈良先端科学技術大学院大学),池田 和司(奈良先端科学技術大学院大学)
近年、生命科学における実験・計測技術の進展に伴い、実験データが大量に生成されるようになり、これら大規模データから有用な知見(特徴)を抽出することが重要な課題となっている。本発表では、圧縮センシングを用いた特徴抽出を提案する。圧縮センシングは、スパース性や圧縮可能性を持つ信号を少数の観測から復元する技術である。本研究では、分子的な操作(入力)に対する軸索の伸長具合(出力)に関する膨大なデータから、どのような分子の組み合わせが軸索をよく伸ばすのかを同定することを試みる。
D-130:多様なタイムラグを含む時系列予測のための変数選択法
比戸 将平(IBM)
過去の時系列データを用いて目的変数の未来の値を推定する時系列予測は金融や医療,機械系監視など様々な応用がある.それら観測対象の多くは,多くの時系列が異なるタイムラグや時間幅によって影響し合う複雑なダイナミズムを有している.しかしながら,予測を回帰問題に帰着して時系列データを説明変数に変換する場合,各時系列を様々なタイムラグと時間幅において独立な説明変数として列挙すると,変数の数が膨大となってしまう.本発表では効率よく変数選択を行う手法を提案し,詳細を説明する.
D-131:仮想クラス生成に基づく正準相関分析への特徴追加
大橋 司(同志社大学),木村 昭悟(NTT),坂野 鋭(NTT),澤田 宏(日本電信電話(株))
画像におけるマルチラベル分類問題において,正準相関分析の有用性が知られている.マルチラベル分類への正準相関分析の適用は,画像の特徴ベクトルと2値マルチラベルベクトルの相関を求める意味で自然な発想である.その一方で,特徴ベクトルは高度に複雑な分布を持ちうるにもかかわらず,正準相関分析では高々クラス数-1次元の線形判別問題としてしか扱うことができない.この問題に対処するために,正準相関分析の特殊例である判別分析に対しては,従来より様々な特徴追加手法が考案されてきた.例えば,Gram-Schmidt正規直交化を適用する方法,判別空間の補空間をさらに判別分析する方法などが知られている.本研究では,従来とは異なる形での特徴追加方法を提案する.提案手法の基本的なアイディアは,特徴そのものではなく,「仮想クラス」という形で新しいクラスを追加することにある.これにより,クラス間の相関をより明示的に扱いうる複雑な識別面を構成することが可能となる.発表では,具体的な仮想クラスの生成方法を提案すると共に,画像のマルチラベル分類データを用いて実験的に評価を行った結果を議論する.
D-131:Just-In-Timeモデリングを用いた太陽光発電将来出力予測
藤原 幸一(NTTコミュニケーション科学基礎研究所),須山 敬之(NTTコミュニケーション科学基礎研究所)
現在,太陽光発電,風力発電をはじめとする再生可能エネルギーに注目が集まっている.しかしながら,発電設備に要する場所やその発電コストの問題から,普及は必ずしも進んでいない.さらに再生可能エネルギーは発電量が不安定であり,効率的に電力を使用できないことも大きな問題である.特に太陽光発電は,日射量やその入射角,気温など季節変動があること,また天候が急激に変化することなどによって発電量が大きく変動する.そこで太陽光発電による発電電力をより効率的に利用するために,太陽光発電の将来発電量を予測するモデルが望まれる.従来,物理モデルを用いた発電量予測モデルが使われているが,モデルに同定すべき多くのパラメータを含み,その利用は容易ではない.一方,より簡易な統計モデルも使われているが,必ずしも高い精度が達成できるわけではない.また,これら従来のモデルは天候の変化など急激な発電条件の変化に追従することが困難であった.そこで,本研究ではJust-In-Time(JIT)モデリングを用いた太陽光発電の将来発電量予測モデルを開発する.JITモデリングは,予測のリクエストがあったときに限り,クエリ周辺のサンプルから局所モデルを構築して予測を行い,予測終了後に局所モデルを破棄する.これによって,時間的な変動に対応することができる.さらに,太陽光発電の場合は季節変動が大きいため,これを考慮することで予測性能を改善することができる.そこで本研究ではサンプル測定の時間情報を,局所モデル構築サンプルの選択に利用する手法を提案し,これを時間情報考慮型JITモデリングと呼ぶ.これによって,クエリとの距離のみならず季節的に近いサンプルを局所モデル構築サンプルとして選択できる.提案法を愛知県の愛・地球博会場に設置された太陽光発電システムの将来発電量予測に適用し,1,2,4時間先の発電量を予測したところ,いずれの時間においても従来法より良好な結果を得た.
D-133:圧縮センシングに基づく非線形モデリング及び弱制限等長性との関連
井上 寛(九州大学)
画像などの信号データは,非常にサイズが大きいため圧縮されることがしばしばある.その圧縮データから原信号の情報を抽出できるのであれば,ユーザーにとって理想的だと考えられる.近年,このようなことを可能にする圧縮センシングという手法が注目されている.本報告は圧縮センシングの考え方を基に回帰問題に適用する.特に,曲線フィッティングに着目し,不良設定問題から生じる推定の不安定性や推定精度の向上を試みる.また,提案手法の数学的背景において非常に重要である制限等長性(restricted isometry property; RIP)の条件を緩めた,弱制限等長性(Weak RIP)という概念を明確に定義し,新しく得られた結果を紹介する.
D-134:確率的生成モデルによる位相保存写像のアルゴリズム導出
松下 聡史(九州工業大学),中野 将秀(九州工業大学),古川 徹生(九州工業大学)
本研究の目的はSelf-Organizing Maps(SOM)やGenerative Topographic Mapping(GTM)をはじめとした位相保存写像群のための包括的なアルゴリズムを確立することである。このアルゴリズムは確率的生成モデルを仮定し、変分ベイズ法を用いて導出する。本研究で提案するモデルはGTMの生成モデルを基にし、データ空間上でのノイズのみならず、潜在空間上でのノイズも考慮する。このモデルをダブルノイズモデルとする。ダブルノイズモデルを用いることにより従来GTMにヒューリスティックに導入されていた正則化項を自然にアルゴリズムに組み込むことができた。また、このモデルにより、従来のSOMとGTMの関係性を明確にすることができた。
D-135:強度と位相を変化させる結合によるネットワークの提案
城 真範(産業技術総合研究所),赤穂 昭太郎(産業技術総合研究所)
ニューラルネットワークにおいてはリンク(シナプス)において信号強度の変更を行い、ノード(ニューロン)においてそれら加算と非線形変換を行うものが広く知られているが、今回、リンクにおいて信号強度の変更のみならず、微小波形の位相も変化させ、ノードにおいては単にリンクからの信号を加算するだけのモデルを提案する。このモデルは主に非線形の決定論的波形の学習をターゲットとしている。学習則は誤差逆伝搬を拡張し、強度方向と位相方向の微小変量から作られるgradによって状態を更新する。今回はモデルの挙動を調べるため、簡単な二層のネットワークを仮定し、低次のカオス時系列を学習させた結果を報告する。
D-136:統計力学的手法による適応信号処理の解析
三好 誠司(関西大学),梶川 嘉延(関西大学)
Filtered-X LMSアルゴリズムを用いるアクティブノイズコントロールの動的ふるまい(学習曲線)を統計力学的手法を用いて理論的に明らかにする.適応フィルタの係数ベクトル,それを要素方向にずらしたベクトル,および未知システム係数ベクトルの方向余弦を巨視的変数とし,それらの動的ふるまいを記述する連立微分方程式をフィルタのタップ長が十分長いという条件の下で決定論的な形で導き,解析的に解く.解析においては独立仮定,入力が周期的である条件,小ステップサイズ条件,タップ長が短い条件等はいずれも用いない.二次経路の推定に誤差がある場合や未知システムが適応フィルタよりも長いタップ長を有する場合においても,導出された理論は計算機実験の結果を定量的によく説明する.また,収束のためにステップサイズが満たすべき条件についても述べる.
D-137:不完全Gibbs sampling
高畠 一哉(産業技術総合研究所)
Gibbs sampling において個々のノードを更新する際には他の全てのノードが参照される.これを他の一部のノードしか参照しないようにしたものが不完全Gibbs samplingである.一部しか参照しないことにより本来の完全Gibbs samplingにより達成される目標分布への収束は望めなくなるが,各ノードが参照するノードをうまく選べば目標分布に近い分布に収束するようなものが作れる.本発表では以上のことを情報幾何的観点から考察する.完全Gibbs sampling,不完全Gibbs samplingのどちらにおいてもノード X_i の発火はそのノードに固有のあるe-flat多様体 E_i にm射影を落とすことを意味している.完全Gibbs samplingではどの E_i も目標分布を通るが不完全Gibbs samplingではそうはならない.このとき E_i と目標分布間のカルバックダイバージェンスは X_i が参照するノードに関わるある条件付相互情報量で表されることが分かる.これを小さくすることにより不完全Gibbs samplingの場合も目標分布に比較的近い分布への収束が期待できる.不完全Gibbs samplingを用いることにより与えられた経験分布を学習する多変数離散確率モデルを構造から自動的に構築することができる.
D-138:ベイズ推定に基づくX線CT再構成でのビームハードニング低減
牧野 貴樹(東京大学),水谷 治央(東京大学),小塚 淳(大阪大学),佐藤 一誠(東京大学)
1組のX線投影像から断面像の各画素における波長による透過率の差異を推定する技術を提案する。X線によるコンピュータ断層撮影(CT)において、X線管から放出されるX線の中には、さまざまなエネルギー (波長) の光線が連続的に分布しているが、低エネルギーのX線のほうが物質によく吸収されるため、物質を透過するにつれてX線のエネルギー分布は高エネルギー側にシフトする (ビームハードニング)。従来は、投影像に単純なフィルタを適用することで吸収率を補正する方法が主であったが、人体のように構成元素比の異なる複数の物質で対象が構成されている場合には、光線エネルギーに対応する吸収率の比が異なるため、補正が不完全となり、アーティファクトが発生する原因となっていた。本研究では、断面像の各画素における透過率の差異を推定する問題として定式化することで、この問題を解決することを目指す。具体的には、X線のエネルギー分布から代表エネルギー値 (波長) をC個選び、その光線エネルギー値に対応するC個の吸収率の組を断面像の各画素が持つと考える。その吸収率を推定する問題に変分ベイズ法に基づく解法を適用することで、アーティファクトを低減させる効果について検討する。
D-139:マハラノビス距離における主成分展開の研究
小林 靖之(帝京大学)
マハラノビス距離は異常度指標として現在も活用されている。異なる群ごとに分散共分散行列を定義したマハラノビス距離を用いる判別分析と異なり、特に品質工学では基準データだけの分散共分散行列を用いてマハラノビス距離を計算する特徴があり、簡便さから異常検出に広く利用されている。またマハラノビス距離は多次元正規分布に基づく異常度指標であり、様々な機械学習アルゴリズムの基礎となる。分散共分散行列をなす標本の主成分分析によってマハラノビス距離は主成分座標系の球面化距離として定義されるが、標本の主成分方向の分散が小さい主成分を除かないと数値的に安定化しない場合がある。標本数50程度ではマハラノビス距離の検出力が最大になる変数個数は標本数の半分以下となるため(若木,「統計データ科学事典」494頁)、マハラノビス距離の異常度指標性能を向上するには標本主成分の選択指針を検討する必要がある。さらに、永田らによれば、変数個数=標本数-1の場合に定義に用いた標本自身のマハラノビス距離は変数個数に収束するが、標本と同じ分布だが定義に用いなかった標本のマハラノビス距離の平均は変数個数よりも大きな値になる。これは過学習に対応すると考えられ、マハラノビス距離の主成分変数には適切な選択が必要である。発表者はマハラノビス距離の定義に用いる標本主成分の選択指針の検討を進めてきた。まず、変数個数が標本数に近づく場合の定義に用いた標本自身のマハラノビス距離の挙動を等分散の主成分を発生させるシミュレーションで検討した。変数個数が標本数に近づくにつれ、定義に用いた標本自身のマハラノビス距離の分散が減少して変数個数に収束するが、定義に用いた標本のマハラノビス距離の分布が定義に用いなかった標本のマハラノビス距離の従うF分布に最もを近づくのは変数個数が標本数の半分程度であることを見出した。これは前述の検出力最大条件と類似している。よって標本数が小さく変数個数に近い場合には、定義に用いた標本自身のマハラノビス距離は標本の従う分布を忠実に再現しないため、標本数の半分程度の主成分だけを選択したマハラノビス距離を用いる必要があると考えられる。実際には、標本の主成分の分散で球面化した座標系でマハラノビス距離を定義するので、前段階として標本の主成分の分散がマハラノビス距離に与える影響を考慮する必要がある。
D-140:位相保存写像を用いた関係データの非線形テンソル分解
岩崎 亘(九州工業大学大学院),和田 沙織(九州工業大学大学院),古川 徹生(九州工業大学)
本研究の目的は,非線形テンソル分解のアルゴリズムを開発する事である.このアルゴリズムでは位相保存写像を拡張し,関係データを視点別に可視化することで,多視点の分析を行えるようにした.これを実現するためのキーアイデアは,位相保存写像のテンソル分解である.本研究では,位相保存写像に自己組織化マップ(SOM)を用いて,テンソル分解SOM(TD-SOM)を開発した.今回のディスカッショントラックでは,TD-SOMのアルゴリズムを提示する.また,アンケートデータを用いたモデル化・可視化を行うことで動作と有効性を確認したため,その結果を報告する.
D-141:ユニット数に上限を持つカーネルマシンの重要度重みつき追記学習
山内 康一郎(中部大学)
カーネルマシンを使ったアプリケーションを組み込み機器などに実装を行う場合、必ず考慮しなければならないのが組み込み機器の記憶容量の制限である。本研究では記憶容量制限下におけるカーネルマシンの追加学習に際して、各学習サンプルの重要度重みを考慮する学習法とそのハイパーパラメータ設定法を考察する。筆者は既に容量の制限があるカーネルマシンでの追記学習法(limited general regression neural network LGRNN)を提案した。LGRNNは新しいサンプルを逐次的に学習するが、新しいサンプルの学習に際して、それを学習したと仮定したときの予測汎化誤差が最も小さくなるように複数の学習オプションの中から最も適切なものを選択して実行する手法である。たとえば、新規サンプルの学習によって、過去の記憶を大きく破壊し、かえって誤差が増えると予測される場合には学習を行わない(ignore)オプションを選択する。LGRNNはi.i.d.サンプルでは良好な結果が得られるものの、非独立分布から発生するサンプルに対しては、場合によっては、学習が不完全になるケースがあることが判明している。これはLGRNNが過去の記憶を保持しようとするあまり、入力分布が変化したときに新しいサンプルの学習を拒否するために生ずる。そこで、新規サンプルを学習する価値を重要度重みとして算出し、これを勘案する学習手法を提案するとともに、LGRNNのハイパーパラメータ決定法も併せて考察する。
D-142:関数データに対する回帰分析における収束レート
綾野 孝則(大阪大学)
説明変数Xと目的変数Yに対して、Xが観測されたとき対応するYを予測することが回帰分析の目的である。従来の回帰分析において、説明変数は数ベクトルとして与えられていた。しかし多種多様なデータを扱うことが必要になった現代社会において、例えば音声認識などの分野では、入力データを数ベクトルではなく、時刻を変数とする関数と見なした方が有効であることがある。このようなデータの解析方法として、Ramsay, Silvermanらにより関数データ解析法が提案された。現在、関数データ解析は理論、応用の両面から活発に研究されている。本発表では説明変数が関数データとして与えられた場合の回帰分析における汎化誤差ついて考察する。Biau et al. (2010)では説明変数がSobolev空間、Besov空間、再生核Hilbert空間の元として与えられる場合の汎化誤差の上界の収束レートを導出している。しかし、そのレートはデータ数に対する対数オーダーと遅く、下界も導出されていない。本発表ではその下界について考察する。
D-143:1クラスラベルに注目したt統計量とそのLassoへの応用
小森 理(統計数理研究所)
品質管理や故障検出の問題では,均質性のある集団(正常群)とさまざまな異質なものの集合体である群(異常群)を区別し,正常群を基礎として判別方法を構築することが行われている.また医療データの判別解析でも患者群と健常群とを質の異なる集合として考え,1クラスラベルに注目した判別解析が実際に行われている.今回我々は均質性のある集団(正常群)をもとに,多変量を組み合わせたt統計量を考え,その統計的性質を議論する.またt統計量を生成関数Uを用い拡張し,その一致性と漸近正規性を議論する.最後にこのUを用いたt統計量にL1ペナルティを付け加えて,Lassoタイプの判別法も提案する.シミュレーションと実データを用い,その有用性を検証する.
D-144:動的サブセットクラスタリング
石黒 勝彦(日本電信電話株式会社),上田 修功(日本電信電話株式会社),澤田 宏(日本電信電話(株))
本研究の目的は、高次元観測量の時間発展する時系列データが与えられたときに、各時刻ステップを少数の潜在状態クラスタへ分離・クラスタリングしてモデル化することである。購買履歴データや日々更新されるブログの文書データなど、時間発展する高次元観測量の時系列データの解析が近年注目されている。一般の時系列データ解析においては、HMMが良く利用される。HMMを利用すると時間ステップを少数の潜在状態クラスタへとクラスタリングし、潜在クラスタ間の遷移として表現することができる。しかし、観測量が高次元になると、その特徴量の大部分は潜在クラスタの区別に役立たない「ノイズ」特徴であることが考えられる。たとえば文書データや購買データは高次元ながらスパースであり、ほとんどの特徴量次元はデータのモデル化に役立たない。そこで、観測される特徴量を、潜在クラスタを特徴づける真の特徴量とクラスタリングに役立たないノイズ特徴量へと明示的に分離することができれば、データのモデリング精度を向上することができると考えられる。本研究では、このように特徴選択とクラスタリングを同時に行う「サブセットクラスタリング」を、特に時系列データに対して実施する場合の新しい手法を提案する。提案法はノンパラメトリックベイズモデルである無限HMMモデルと、特徴量の選別を行う隠れ変数を組み合わせて、最適なクラスタ数を自動的に決定しながら、各クラスタを特徴づける真の特徴量とそれ以外のノイズ特徴量を同時に推定する。特徴選択を行わない場合と比較した実験結果を報告する。
D-145:ロバスト最適化による判別モデル
武田 朗子(慶應義塾大学),参木 裕之(慶應義塾大学),金森 敬文(名古屋大学)
二値判別問題に対して、SVM, minimax probability machine(MPM),フィッシャーの線形判別(FDA)等の判別モデルが知られている。本研究では、ロバスト最適化法に基づくロバスト判別モデルを提案する。このモデルがSVM、MPM、FDAを含む、より広いクラスの判別モデルであること、また、確率分布の不確実性を考慮した期待損失最小化の近似になっていることを示したい。また、本提案モデルは入力パラメータによっては非凸な最適化モデルとなるため、非凸最適化解法が必要になる。局所最適解を求めるための解法を提案し、非凸なMPMモデルが既存のMPMに比べて精度のよい判別を行った実験結果を報告する。
D-146:頑健なスパースカーネル分類器の学習
マチューブロンデル、関和広、上原邦昭(神戸大学大学院システム情報学研究科)
カーネル分類器が多くのデータセットに対して優れた精度を示している.しかし、カーネル分類器のサポートベクトル数は訓練事例数に比例するため,訓練時間と予測時間が事例数と共に増加してしまう.本研究では、サポートベクトル数を制限できるスパースカーネル分類器の学習方法を提案する。提案手法は任意の損失関数を利用でき,ラベルノイズに頑健である.複数のデータセットで実験を行ったところ,従来手法よりも高い精度を示した.