P4-1 |
進化を生みだすデジタル情報: デジタル復調・情報源符号化・通信路符号化によって構成されるオートマトンのデジタル・ネットワーク・メカニズム [資料][論文] |
テクニカル |
得丸公明(システム・エンジニア) |
|
筆者は遺伝子情報システムとヒト話し言葉はともにデジタル通信であるということについて検討を続けてきた.すなわちともに核酸や音節というデジタル符号をコドンや単語に組み合わせて送る一方,回線の反対側で行なわれる受信はアミノ酸や単語単位の音響符号である.このデジタル送信・アナログ受信によるエントロピー格差が,オートマトンとしての遺伝システムや言語メカニズムを生む. |
|
|
P4-2 |
Methods of Cross-Domain Object Matching [資料][論文] |
テクニカル |
Makoto Yamada, Masashi Sugiyama(Tokyo Tech) |
|
The goal of \emph{cross-domain object matching} (CDOM) is to find correspondence between two sets of objects in different domains in an unsupervised way. Photo album summarization is a typical application of CDOM, where photos are automatically aligned into a designed frame expressed in the Cartesian coordinate system. CDOM is usually formulated as finding a mapping from objects in one domain (photos) to objects in the other domain (frame) so that the pairwise dependency is maximized. A state-of-the-art CDOM method employs a kernel-based dependency measure, but it has a drawback that the kernel parameter such as Gaussian kernel width needs to be determined manually. In this paper, we propose an alternative CDOM method that uses an estimator of squared-loss mutual information (SMI) as a dependency measure. Since cross-validation is possible for the proposed method, all tuning parameters can be objectively optimized with respect to the SMI criterion. Through experiments on photo album summarization, image matching, clustering, and unpaired voice conversion tasks, we show that proposed method compares favorably with the existing CDOM method. |
|
|
P4-3 |
語彙ネットワークからの単語の感情極性抽出: 統計力学的視点からの精度改善法 [資料][論文] |
テクニカル |
後藤拓馬, 樺島祥介, 高村大也(東工大) |
|
スピンモデルを用いた評価表現辞書の構築における精度的改善法を提案する.この手法では語釈文,シソーラス,コーパスによって語彙ネットワークを構築する.その上で,語彙ネットワークを一種のスピンシステムとしてモデル化し,適当な温度の熱平衡状態における各スピンの熱平均値を求めることによって各単語の感情極性を評価し,評価表現辞書を構築する.既存のモデルでは温度を十分に高温から下げていった場合,感情極性の精度はある臨界的な温度までは単調に改善されるが,それ以下の温度に下げるとシステムが強磁性相に転移し精度が急激に悪化する.そこで,提案手法では相互作用行列の固有値解析に基づき低温でシステムを強磁性相に転移させる要因をモデルから取り除く工夫を導入した.その結果,同程度の計算コストで既存の手法より高い精度で評価表現辞書を構築することが可能となった. |
|
|
P4-4 |
混合ベルヌーイ分布による変分ベイズ学習の相転移構造 [資料][論文] |
テクニカル |
梶大介(東工大), 渡辺一帆(奈良先端大), 渡辺澄夫(東工大) |
|
変分ベイズ法は事後分布に対して平均場近似の手法を用いることでベイズ学習を高速に行う学習法として幅広い範囲で応用されている。そのアルゴリズムは変分自由エネルギーの最小化により達成されるが、変分自由エネルギーの上界および下界の漸近解析に基づいて、混合比のハイパーパラメータによる相転移の存在が報告されている。本発表では混合ベルヌーイ分布を用いた場合の変分自由エネルギーの漸近式を理論的に導き、混合比およびベルヌーイ分布の双方のハイパーパラメータによって引き起こされる相転移の構造を明らかにする。 |
|
|
P4-5 |
A Unified Framework of Density Ratio Estimation under Bregman Divergence [資料][論文] |
テクニカル |
Masashi Sugiyama(Tokyo Tech), Taiji Suzuki(Univ. Tokyo), Takafumi Kanamori(Nagoya Univ.) |
|
Estimation of the ratio of probability densities has attracted a great deal of attention since it can be used for addressing various statistical paradigms such as non-stationarity adaptation, two-sample test, outlier detection, mutual information estimation, dimensionality reduction, independent component analysis, causal inference, conditional density estimation, and probabilistic classification. A naive approach to density ratio approximation is to first estimates numerator and denominator densities separately and
then take their ratio. However, this two-step approach does not perform well in practice,
and methods for directly estimating the density ratio without going through density estimation have been explored, including methods based on moment matching,
probabilistic classification, density matching, and density-ratio fitting.
The contributions of this paper are three folds: First, we give a comprehensive review
of existing density ratio estimation methods and discuss their pros and cons. The second contribution is that we propose a new framework of density ratio estimation in which a density-ratio model is fitted to the true density-ratio under the Bregman divergence. Our new framework includes all the above existing approaches as special cases, and is substantially more general. Thus, it provides a unified view of various density ratio estimation methods. Finally, we develop a robust density ratio estimation method under the power divergence, which is a novel instance in our framework. |
|
|
P4-6 |
疎な位置情報履歴からの有意位置抽出方式に関する検討 [資料][論文] |
テクニカル |
黒川茂莉, 横山浩之(KDDI研), 吉井和佳, 麻生英樹(産総研) |
|
本研究では,携帯電話による通話・通信時に取得されるような,空間的粒度が粗く,時間間隔が一定ではない位置情報履歴から個人の有意位置を抽出する手法について検討した.時間的に近接するデータ区間を文書,データ区間に含まれる通信基地局IDを単語とみなして,HDP-LDAと呼ばれるトピックモデルを適用する手法を提案し,実データに適用した結果,精度よく個人の有意位置を抽出することができることがわかった. |
|
|
P4-7 |
CCCPを用いたTRW自由エネルギー最小化に基づく確率推論 [資料][論文] |
テクニカル |
西山悠(理研), Xingyao Ye, Alan Yuille(UCLA) |
|
本稿ではWainwrightのTRW自由エネルギーを,CCCPによって最小化する確率推論アルゴリズムTRW-CCCPを開発する.TRW-CCCPは大域的最小値への収束が保証される.TRW自由エネルギーをパラメトリックに凸自由エネルギーの差の形に表わし,無限個の分解に基づくCCCPを適用することでTRW-CCCPを導出する.TRW-CCCPは高次元の自由度を表わすフリーベクトルを含み,高次元上の確率推論アルゴリズムの集合を与える.フリーベクトルは,予稿内で定義される(CCCPが定める)集合の任意ベクトル,またはその系列について,収束が保証される.フリーベクトルはステップサイズの役割を持ち.収束の速さをコントロールする.TRW-CCCPを二次元格子イジングスピンモデルに適用した結果,TRW自由エネルギーは単調減少し,TRW-BPと同じ近似周辺確率分布を計算した.マルコフ確率場の重みが大きく,frustrationが大きい場合と,TRW-BPが収束しない場合に,TRW-CCCPの有効性が期待される. |
|
|
P4-8 |
Advanced Susceptibility Propagation [資料][論文] |
テクニカル |
Muneki Yasuda, Kazuyuki Tanaka(Tohoku Univ.) |
|
感受率伝搬法は高精度の近似推定量を与えることができるため,例えばボルツマンマシンの学習問題・推定問題などをはじめ,幅広い応用がなされている.本研究で我々は感受率伝搬法に改良を加え,よりよい推定量を得るための新しい枠組みを提案し,いくつかの例題に対する数値実験を通して提案手法の妥当性を示す.我々の提案手法は従来法と同等の計算量でより高性能な推定結果を与えることのできる方法となっている. |
|
|
P4-9 |
推薦システムにおける一般化線形モデルの応用: 主効果モデルによる評価得点推定 [資料][論文] |
テクニカル |
藤本悠(青学大) |
|
未評価アイテムに対するユーザ評価値の推定は推薦システムの基礎的な課題の1つであるが,本稿では一般化線形モデルの視点からのユーザ評価値推定について議論を行う.特に1パラメタの関数族をリンク関数に用いることで,ユーザ群とアイテム群の間に独立性を仮定した対数線形モデルと通常の線形回帰モデルの中間的なモデルの表現を試み,スパースな評価データを扱う時の振る舞いなどについて議論を行う. |
|
|
P4-10 |
Uロス関数に基づく密度推定のためのブースティング [資料][論文] |
テクニカル |
小森理(統数研), 内藤貫太(島根大), 江口真透(統数研) |
|
本論文では通常のロバストネの観点を越えた内容で,新たな密度推定の手法を提案する.具体的にはある単調増加で凸な実数値関数Uを考え,そこから導かれるUロス関数に基づき,機会学習で用いられるブースティングのクラスを考えて適切なUを選択したい.Uとしてβのべき関数を考えると,β=1のときUロス関数の最小化はL2ロスの最小化と同値となる.また,β=0の極限を考えると,Uロス関数は負の対数尤度関数となる.それゆえ,今回の提案手法はL2ロスや尤度関数を含んだより柔軟な推定法と言える.また,ブースティングのアルゴリズムにおいて,Uロス関数の更新式中に現れるペナルティが常に正となる性質ことを利用し,ブースティングの各ステップが随時更新されることを示す.最後に,シミュレーションを行い,今回の提案手法の有用性を検証する. |
|
|
P4-11 |
混合ノルム正則化を用いたコスト考慮型学習の同時変数選択に関する研究 [資料][論文] |
テクニカル |
杉浦徹, 小出和諒, 本郷辰哉, 烏山昌幸, 竹内一郎(名工大) |
|
誤分類コストの異なる分類問題においてはコスト考慮型学習を用いることが有用である. 本研究では, 同一のデータに対して異なるコスト考慮型分類器を学習しその特徴選択を行う問題を考える. すべてのコスト考慮型分類器において同一の特徴が選択されるようにするため混合ノルム正則化を用いたアプローチを導入する. さらにその区分定数正則化パス追跡アルゴリズムについても述べる. |
|
|
P4-12 |
領域ベースの隠れ変数と確率伝搬法を用いた画像領域分割 [資料][論文] |
テクニカル |
長谷川亮太, 三好誠司(関西大), 岡田真人(東大) |
|
ベイズ推定の枠組みで画像の修復と領域分割を行う.特に,領域ベースの隠れ変数を用いた結合マルコフ確率場モデルに基づき,確率伝搬法の一種であるビリーフプロパゲーションと変分推論法を組み合わせた手法を提案する.人工画像や自然画像を用いた実験の結果について述べる.その際,原画像の滑らかさを制御するパラメータや重畳するノイズの大きさなどのハイパーパラメータの推定やモデル選択も行う. |
|
|
P4-13 |
超矩形による貪欲被覆学習の効率的実装と実データによる性能評価 [資料][論文] |
テクニカル |
大内康治, 中村篤祥, 工藤峰一(北大) |
|
固定された自然数dに対し,軸に平行な有限個のd次元超矩形の和集合で表現される概念が多項式時間PAC学習可能であることはBlumerらにより示されている.証明に用いられたアルゴリズムは,概念に含まれる事例(正例)全体を被覆する超矩形の集合を,貪欲手続きで求めるというものである.本稿では,Blumer らのアルゴリズムの効率的な実装について検討する.また,このアルゴリズムを実際のnクラス識別問題(n >= 2)に適用し,同じく超矩形の和集合を用いる確率的サブクラス法との比較を行う.UCI 機械学習レポジトリのデータセットを用いた実験では,ほぼ同等の識別性能となりながらも,確率的サブクラス法よりも超矩形の数が少なくなり,多くのデータで7割以上の削減がみられた, |
|
|
P4-14 |
モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索 [資料][論文] |
テクニカル |
中野拓帆(東大), 木村昭悟, 亀岡弘和(NTT), 宮部滋樹, 嵯峨山茂樹, 小野順貴(東大), 柏野邦夫(NTT), 西本卓也(東大) |
|
本報告では,与えられた映像に適合するメタ情報を提示する映像認識 (automatic video annotation) と,与えられたメタ情報に適合する映像を提示する映像検索(video retrieval) とを,統一的な枠組で取り扱う映像認識検索問題を取り上げ,そのための統計モデルである階層的トピック軌跡モデルHTTMを提案する.提案モデルは,各モダリティー及びクロスモーダルの共起関係を考慮したトピックモデルと,その時空間的ダイナミクスを表現する状態空間モデルとによって構成され,映像におけるインスタンス・シーン・コンセプトを階層的に表現する.このモデルに基づき,モデル推定・映像認識・映像検索それぞれを非常に簡易に実現することが可能である.それと共に,音響信号や地理情報など他の要素を新規に導入する拡張も極めて容易である.本稿では,人手によりラベル付けされた動画データセットに対してこのモデルを用いた認識実験を行い,精度向上の結果とともに報告する. |
|
|
P4-15 |
SVMによるバイパータイトランキング学習を用いたコンピュータ将棋における評価関数の学習 [資料][論文] |
テクニカル |
末廣大貴, 畑埜晃平, 坂内英夫, 瀧本英二, 竹田正幸(九大) |
|
本研究では,コンピュータ将棋における評価関数の学習を,バイパータイトランキング問題ととらえ,SVMを用いて解く新しい方式を提案する.学習においては、駒の配置などの盤面の基本的な情報から,駒同士の位置関係などの複雑な特徴を自動抽出するため,多項式カーネルを用いる.また,領域計算量を抑えるため,オンライン型アルゴリズムPegasosを用いる.実験の結果,序盤において人間らしい局面評価を実現できた. |
|
|
P4-16 |
系列ラベリングの多層化 [資料][論文] |
テクニカル |
東藍, 松本裕治(奈良先端大) |
|
系列ラベリングには自然言語処理を始めとして幅広い応用分野がある.実用的なタスクにおいては,複数の系列ラベリングを段階的に適用する必要が生じる場合が多い.本発表では,各段階の系列ラベリングにおける素性に前段階の系列ラベリングの解析結果の周辺尤度を反映させると同時に,各段階の確率モデルの最適化において前段階のモデルパラメタを同時に最適化する手法を提案し,実用的なタスクにおける性能実験を紹介する. |
|
|
P4-17 |
Anomaly Detection of Sequence Data Based on T-information [資料][論文] |
テクニカル |
Ulrich Speidel(Univ. Auckland), Stefan Jan Skudlarek, Hirosuke Yamamoto(Univ. Tokyo) |
|
Because of the increasing complexity of technical systems, the application of anomaly detection to malfunction detection is an area of intense research, especially with respect to non-numerical sequence data. Dependence on normal training data in this approach is a feature one would like to do without, thus spawning the problem of unsupervised anomaly detection. Data distance measures used for this problem are usually based on dot-product kernel functions. In this paper, however, we use T-information to define a distance-measure of two strings. T-information is a linearised measure based on the T-complexity of a string, which in turn is the weighted number of steps taken by the T-decomposition string parsing algorithm based on the variable-length T-codes. We propose simple clustering algorithms for both unsupervised and supervised anomaly detection, and validate the method using a network intrusion data set. |
|
|
P4-18 |
Quantum Error Correction with Non-Binary LDPC Codes [資料][論文] |
テクニカル |
Kenta Kasai(Tokyo Tech), Manabu Hagiwara(AIST), Hideki Imai(Chuo Univ.), Kohichi Sakaniwa(Tokyo Tech) |
|
量子誤り訂正は,量子状態を確実に保存し高信頼度で通信すること,つまり量子計算および量子通信を実現するために必要な技術である.量子LDPC符号は,疎なパリティ検査方程式によって定義された,古典LDPC符号に対応する量子誤り訂正符号である.CSS (Calderbank, Shor and Steane)符号は,量子誤り訂正符号の重要な符号クラスである.本研究では,有限体上で定義されたLDPC符号を用いたCSS符号を提案している.この提案符号は,従来知られている最良の量子誤り訂正符号に比べて,2倍の誤りを訂正することが可能である. |
|
|
P4-20 |
自己組織化マップによる索引型全文検索支援システム [資料][論文] |
テクニカル |
國吉尭人, 尾関智子(東海大) |
|
This study is aimed for imprevent of the search efficiency by performing a dynamic classification for matched pages by query. When there exists a difference for a classification between machine and users, I propose learning mechanism to incorporate the user’s into the result. |
|
|
P4-21 |
ネットワーク上の経路に対する回帰問題について [資料][論文] |
テクニカル |
井手剛(IBM) |
|
空間を時系列的に移動する物体の軌跡、すなわちトラジェクトリに対するデータマイニングの問題は、実用的にも理論的にも興味深い研究テーマである。本稿では、ネットワーク上のトラジェクトリ(経路)のコスト予測問題を、経路に対する回帰問題として定式化する。この回帰問題はカーネル回帰の枠組みで扱うことが可能であるが、本稿では、その双対問題としての新しい定式化を導き、両者の関係を論ずる。 |
|
|
P4-22 |
ヒトと運動アシストロボットにおける共通の状態空間の抽出: 外骨格ロボット制御への応用 [資料][論文] |
テクニカル |
森本淳, 野田智之, 玄相昊(ATR) |
|
本論文では,ヒトから計測される信号を用いたヒトの運動アシストを行うロボットの制御問題を考える.これまでの装着型の運動アシストロボットでは,できるだけ装着するユーザーの体型に合うようにロボットのハードウェアがデザインされてきた.しかし,そもそもヒトの関節構造は複雑な上に,ハードウェアを個々人の体型に適合させなければならないという問題があった.本論文では,ロボットを装着中のユーザーの状態とロボットの状態を同時に計測し,ユーザーとロボットにおける共通の状態空間を正準相関分析により抽出,ロボット制御に応用することを提案する. |
|
|
P4-23 |
フォン・ミーゼス分布を用いた新しい形の記述子 [資料] |
ディスカッション |
上青木勝利, 岩田一貴, 末松伸朗, 林朗(広島市大) |
|
形の局所記述子の多くはスケール不変でないため,形の認識を行う前に,スケールの正規化により画像データベース内の線画(または物体の輪郭)を同じスケールにしておく必要がある.元の線画の全体の形状が相似な場合,スケールの正規化により,スケール不変でない形の記述子は形の整合に適当な特徴を表すようになる.しかし,それぞれの線画の部分が異なるスケールで描かれている場合は,必ずしもそのようにはならない.そのような問題を解決するために,本論文では,そもそもスケールの正規化を必要としない新しい形の記述子を提案する.提案する記述子はフォン・ミーゼス分布の混合分布により定義される.また,形の整合と検索に関する計算機実験において,いくつかの従来の記述子と比較することにより,提案する記述子が実際に有効であることを示す. |
|
|
P4-24 |
階層型方策勾配法の学習則 [資料] |
ディスカッション |
五十嵐治一(芝浦工大) |
|
学習の高速化を目的に状態や行動を抽象化した階層型強化学習が研究されている.しかし,殆どはQ学習などの価値ベースの学習であり,方策関数を直接学習する方策勾配法を用いた階層型モデルの学習方式はまだ少ない.また,従来法の多くは状態と行動が完全に階層化されておらず,一般性やn層への拡張性の点に不安がある.本方式では一般的な写像によるn層モデルにおいて各層における強化学習が可能である.したがって,戦略レベルの学習も可能である. 本発表では,まず,2層に階層化した離散的状態行動モデルに対して方策勾配法を用いた階層型強化学習モデルを提示する.このモデルにおいては,下層は通常の状態空間であり,上層は写像により下層の状態を粗視化した状態空間である.方策勾配法は必ずしも方策や環境モデルのマルコフ性を要求しないので,下層から上層への写像を設計する際の自由度を高めている.具体的な例題として,格子空間上での経路計画問題や追跡問題を対象とする.方策勾配法を本モデルへ適用した結果,単層モデルの場合と同様,各層の方策中のパラメータの学習則は報酬と特徴的適正度の積の期待値により表されることがわかった.この結果を,一般のn層の階層化モデルへ拡張した場合の学習則も導出することができた. このモデルと学習則を用いると,格子サイズの大きい巨大な格子空間であっても,上層で巨視的な方策を先に学習することにより,その学習結果を用いて下層での学習を高速化できる可能性がある.逆に,下層における小さな部分問題を先に学習しておき,その結果を上層の環境ダイナミクスに反映させ,上層の方策パラメータの学習(戦略の学習)へ貢献させることも可能である.本モデル,学習則に関する妥当性や,応用について会場でディスカッションしたい. |
|
|
P4-25 |
トピック画像モデルによるデータの画像化 [資料] |
ディスカッション |
石黒勝彦, 持橋大地, 岩田具治, 澤田宏, 上田修功(NTT) |
|
本発表では,データの「画像化」に関する新しい手法を提案する.提案法は高次元・離散データを小さな画像パターンへと変換することで,一目でデータの特性を捉えることを可能にするものである.通常の可視化手法では,各データを2次元あるいは3次元空間内の1点へ写像するため,可視化できる情報量が少なくなってしまう.これに対し,提案法では,各データを一つの画像に変換することで,ピクセル数次元の複雑な情報を,画像上のパターンとして一目で理解できる.画像への変換過程にはガウシアンプロセスを利用した.これによって内容の類似したデータが同じような画像パターンとして変換されるように学習されるため,データ間の関連性も可視化して理解可能である.提案手法はガウシアンプロセスを含む確率的生成モデルとして定式化される.このモデルは複雑な学習則を必要とせず,スタンダードな非線形最適化手法を用いてMAP解を探索することでモデルの学習が完了する.複数の実データを用いて,LDAなどのトピックモデルと比較した実験結果を報告する. |
|
|
P4-26 |
未知クラスの存在を許容する半教師あり学習 [資料] |
ディスカッション |
藤野昭典, 上田修功, 永田昌明(NTT) |
|
従来の半教師あり学習では,ラベルなしデータはラベルありデータが帰属するクラス(既知クラス)のいずれかに帰属する事を前提としている.それ故,既知クラスと異なるクラス(未知クラス)に帰属するラベルなしデータが混在している場合,半教師あり学習の効果が十分発揮できないという問題がある.本発表では,そのような場合でも適用可能な半教師あり学習法を提案し,実データを用いた評価実験結果について報告する. |
|
|
P4-27 |
大標本仮定を必要としない半教師付き回帰のモデル選択 [資料] |
ディスカッション |
川喜田雅則, 竹内純一(九大) |
|
ラベル付きデータが小標本でも有効な半教師付き回帰のモデル選択法を提案する。近年様々な半教師付き学習が盛んに提案されている。しかし多くの方法ではモデル選択については,ラベル付きデータのみを用いた情報量基準やクロスバリデーションを行っている.半教師付き学習ではラベル付きデータは少数であると想定するため、これらのモデル選択の妥当性には疑問がある.本研究では半教師付き回帰についてラベル付きデータが少数でも有効に働くモデル選択基準を提案する。本手法は,著者が以前に提案した密度比推定に基づく半教師付き回帰法の拡張であり,ノイズの正規性及び分散の推定を必要としないという特徴をもつ.発表ではシミュレーションによる性能評価についても述べる. |
|
|
P4-28 |
大規模データのための指数族テンソル因子化法 [資料] |
ディスカッション |
林浩平, 竹之内高志, 柴田智広, 池田和司(奈良先端大) |
|
テンソル因子化法は構造データのモデリング手法として近年注目されている.特にそのノイズモデルを指数型分布族に一般化した指数族テンソル因子化法(exponential family tensor factorization; ETF)は離散値と実数値を合わせ持つデータテンソルにも適用でき,その応用範囲は広い.本発表ではETFの効率的なパラメータ推定アルゴリズムを提案する.ブロック座標降下法(blockcoordinate descent)を確率的最適化(stochastic optimization)で解き,大規模データの解析を現実的な時間で行う.計算機実験では本アルゴリズムを実データに適用し,パラメータの推定精度と計算速度を比較・検証する. |
|
|
P4-29 |
カーネル予測成分分析による大自由度力学系の縮約表現 [資料] |
ディスカッション |
末谷大道(鹿児島大), 赤穂昭太郎(産総研) |
|
化学反応や流体、神経活動、概日リズム、歩行運動など、現実の動的なシステムを定量的に記述するためには多くの状態変数を必要とし、結果として大自由度力学系として数理モデル化される。一方、これらの系において実際に実現するダイナミクス(アトラクタ)は、リミットサイクルや少数自由度のカオスなど高次元の状態空間の(非線形構造を持った)部分空間に制約されることがしばしば見られる。よって、この部分空間に適切な座標系を再設定することによって、少数の変数による大自由度力学系のロバストな予測や制御が可能となることが期待される。 高次元空間に分布するデータの自由度を縮約する方法として、主成分分析や多次元尺度構成法などが古くから知られており、最近ではカーネル法による非線形データ解析への拡張が注目を集めている。しかしながら、(非線形の)主成分分析的アプローチでは力学系から得られるデータのようなサンプルの時間的因果性を露に取り扱うことは出来ない。 そこで、本研究では、主成分分析で考慮される射影した空間でのデータの分散最大化と、現時点と次の時点でのサンプル間の条件付き分散の最小化を実現する射影を求める最適化問題を考える。特に、射影としてカーネル法に基づく非線形関数を考えたとき、この問題が一般化固有値問題として定式化されることを示す。そして、Kuramoto-Sivashinsky方程式などの代表的な大自由度力学系のがカオス現象に対して適用した結果について報告する。 |
|
|
P4-30 |
最小平均費用クラスタリング [資料] |
ディスカッション |
永野清仁(東大), 河原吉伸(阪大), 岩田覚(京大) |
|
クラスタリングを組合せ最適化問題として定式化したとき,多くの場合において目的関数は劣モジュラ関数を用いて記述可能である.本研究では最小平均費用クラスタリングという概念を導入し,劣モジュラ関数の関連した問題に対し,最適なクラスタリングを求めるのに交差劣モジュラ関数の理論が有用であることを示す.提案手法では事前にクラスタ数を決める必要はなく,データ集合の性質から自然と決定される.最小平均費用クラスタリング問題は1つの実数を用いてパラメータ化されているが,本研究ではすべてのパラメータに対応する最適なクラスタリングに関するすべての情報を,全体として多項式時間で求めるアルゴリズムを与える.さらに計算機実験を通じて提案手法のパフォーマンスを評価する. |
|
|
P4-31 |
HMMにおけるアンサンブル学習 [資料] |
ディスカッション |
黒澤雅人, 佐藤一誠, 松島慎(東大), 二宮崇(愛媛大), 中川裕志(東大) |
|
教師なし学習では局所解が多く存在することがあり,初期値に依存して異なる局所解に収束することがある.そこで従来取られてきた手法は,並列に複数の初期状態で学習を行い,その中で与えられたデータの尤度を最大にする学習器のみを使う手法であった.しかし, この手法では得られた学習器の大部分が無駄になる,過学習に陥りやすいなどの問題がある. 本研究では,複数の学習器を組み合わせてより良い学習器を作るアンサンブル学習の手法を教師なし学習であるHMMに対して適用し,この教師なし学習の問題を解決する.また, 適用の際に生じる状態ラベルの対応付けについて提案手法を示す. |
|
|
P4-32 |
変分ベイズ学習に基づく複数ネットワークのクラスタリング [資料] |
ディスカッション |
志賀元紀, 馬見塚拓(京大) |
|
ネットワーク構造に基づく機械学習法やデータマイニング法は、ウェブページ解析、学術文書解析、生命情報解析のように多くの応用問題において重要である。本研究では、ネットワーク上のノードのクラスタリング問題を取り扱う。特に、1つのノード集合に対して、複数の種類のエッジ集合が与えられる状況、つまり、複数のネットワークが与えられる状況を仮定する。さらに、ネットワーク毎の性質の違いや観測ノイズのため、全てのクラスタ構造(密に結合するノード集合)が全てのネットワークに現れないことを仮定する。我々は、これらの事象を表現できる新たな確率モデルを設計し、変分ベイズ学習に基づくクラスタリング法を開発した。そして、人工データを用いた数値実験およびゲノム情報を用いた数値実験によって、開発手法の有効性を検証した。【参考文献】Motoki Shiga, Hiroshi Mamitsuka, "Variational Bayes Learning over Multiple Graphs," Proc. on the IEEE International Workshop on Machine Learning for Signal Processing, pp.166-171, Kittila, Finland, August 2010. |
|
|
P4-33 |
大規模化合物のスケッチ表現によるクラスタリング法 [資料] |
ディスカッション |
田部井靖生(JST), 津田宏治(産総研/JST) |
|
近年、化合物データーベースは大規模化しつつある。 化合物のクラスタリングは、ドラッグディスカバリーのための重要なタスクであり、効率的なクラスタリング法が求められている。 化合物は部分構造の有無に基づきビットベクトル(フィンガープリント)として表現される。 2つのフィンガープリント間の類似度はJaccard-Tanimoto係数が使われている。 提案手法は、はじめに、入力フィンガープリント集合は、Min-Wise Independent Permutationsにより 2つのフィンガープリント間のJaccard-Tanimoto係数をハミング距離として保存したまま短い文字列(スケッチ)へ射影する。 次に、スケッチをブロックに分割して、ブロックの組み合わせをソートすることにより、ハミング距離における近傍を高速に求める。 PubChemデーターベースからの約2000万の化合物を用いた実験により、提案手法は他の手法よりも高速に化合物をクラスタリングできることを示す。 |
|
|
P4-34 |
クラス間距離に基づく判別分析と年齢推定システムへの適用 [資料] |
ディスカッション |
小川哲司, 小林哲則(早大) |
|
顔画像を用いた自動年齢推定に適した次元削減方式を提案する.教師あり次元削減方式としては,フィッシャー判別分析(FDA)や局所フィッシャー判別分析(LFDA)の有効性が明らかにされている.これらの方式は,基本的にはデータをクラスごとに分離するように次元削減を行う枠組みであり,推定値が正解か不正解かで性能を評価できるシステムに適用するのには適している.一方,年齢推定システムは,順序関係を持つ整数値である年齢をクラスとして扱うことから,推定結果が正解か不正解かだけで性能が評価されるのではなく,推定結果が誤っていたとしても,推定値が正解年齢に近いほど性能が良く,推定値が正解年齢から遠いほど性能が悪いと評価されるべきである.つまり,単純にデータをクラスごとに分離するのではなく,クラス間の距離(年齢差)に応じてデータを分離するような次元削減の枠組みが重要である.そこで本発表では,クラス間の距離を考慮しながら年齢クラスに対して識別的な特徴量を抽出することを目指し,2つのデータの年齢が近いほど(クラス間距離が小さいほど)特徴空間におけるデータも近づき,2つのデータの年齢が遠いほど(クラス間距離が大きいほど)特徴空間におけるデータも離れるような写像を求めることを目指す.我々はこの方式をclass-distance-based discriminant analysis (CDDA)と呼ぶ.顔画像を用いた年齢推定実験により,LPP,FDA,LFDA を始めとする種々の次元削減手法と比較してCDDAが有効であることを示す. |
|
|
P4-35 |
動径ロジスティック回帰による多重検定 [資料] |
ディスカッション |
Oba Shigeyuki(Kyoto Univ./JST) |
|
超多重検定の検出力を増すために、高次元(数次元から数百次元程度)の検定統計量に基づく経験ベイズ検定を行いたい。このとき必要となるのは、帰無分布・対立分布の確率密度比推定である。しかし、一般に高次元における密度比推定を精度よく行うことは難しい。本研究では、密度比推定の目的が統計的検定のためであるという特殊事情を考慮することで精度を高める新たな密度比推定手法を提案する。多くの統計的検定問題では、統計量空間に原点を設定することができ、原点に近いほど帰無分布に従う可能性が高いことを仮定できる。また、帰無分布・対立分布の裾において高い推定精度が要求される。そこで提案法では、座標を原点から見た動径方向ベクトルと原点からの距離の組み合わせで表し、動径方向を定めたときの密度比を距離の関数としてロジスティック回帰によって求める。これを動径ロジスティック回帰法と呼ぶ。さらに、原点側と裾側とで漸近的な指数型減衰の係数が異なる場合を考慮した一般化を適用し、一般化動径ロジスティック回帰法と呼ぶ。デモとして、バイオインフォマティクスでの利用を想定した性能比較をおこない、新手法の挙動を示すとともに、旧来手法との性能比較を行う。 |
|
|
P4-36 |
Limited General Regression Neural Networkによる追記学習 [資料] |
ディスカッション |
山内康一郎(中部大) |
|
General Regression Neural Network(GRNN)はone-pass learning が可能なニューラルネットワークとして知られている。本来GRNNは新しいサンプルが与えられる度に新しい核関数を加えて憶えていく。しかしこのままでは細胞数が増加しすぎるため、様々な方法で細胞数を必要最小限度に抑える研究が行われている。 しかし組み込み機器への導入を考えた場合、細胞数に上限を設定することが望ましい。そこで細胞数の上限が設定されたLimited General Regression Neural Network(LGRNN)を提案する。これを実現するため、追記学習による汎化能力を最大限改善する観点から、追記学習によって改善される能力と、追記学習により生ずる忘却による損失とのトレードオフをカーネル法を用いて評価する手法を開発した。これにより、中間細胞数が上限に達した際の最適な再配置アルゴリズムを与えるだけでなく、新規サンプルを本当に学習するべきか否かの判断も行うことができる。実験の結果、LGRNNは、細胞数に上限が設定されているにもかかわらず、細胞数以上のサンプルがが次々と入力されても誤差を確実に減少させることを確認した。 |
|
|
P4-37 |
隠れ木を用いたループをもつグラフィカルモデルの近似周辺分布の導出 [資料] |
ディスカッション |
前田新一, 石井信(京大) |
|
ループをもつ離散変数のグラフィカルモデルは、変数間の相互依存関係により周辺分布の近似計算は容易ではない。本研究では、ループをもつ離散変数のグラフィカルモデルの周辺分布を近似計算する新たな方法を提案する。グラフィカルモデルの同時分布を周辺分布計算の容易な試験分布によって近似することで、近似周辺分布を得る。近似の尺度としてKullback?Leibler 距離(KL距離)を用いるため、収束が保証される。 このようなアプローチの代表例として、ナイーブ平均場近似があるが、本研究の特徴はナイーブ平均場近似のように変数間の完全な独立性が課された試験分布を用いるのではなく、変数間に互いに相関をもつ分布で近似する点にある。 一般には、ループをもつグラフィカルモデルを試験分布に用いると、KL距離の最小化が行えなくなるが、本研究では、隠れ木と呼ばれる隠れ変数を介した相関構造をもつ分布を試験分布として利用し、その隠れ変数を含めたKL距離を最小化することで、計算困難性の問題を解決しつつ、高精度な近似を行う。 |
|
|
P4-38 |
価値関数推定におけるMSE解析 [資料] |
ディスカッション |
植野剛(京大) |
|
強化学習の理論の発展は,様々な複雑な実問題における最適制御ならびに意思決定の方法論をもたらし, 大きな成果をあげている.たとえば,ジョブスケジューリング問題,ゲームAI戦略の獲得,ロボット制御問題などである.これらのタスク環境は非常に複雑なダイナミクスを有するにも関わらず,ヒトの専門家をしのぐ性能を示している.これは,モデルフリーの方策評価法,つまり, タスク環境をモデル化せず価値関数のみをモデル化し,サンプル系列から直接価値を推定することによってもたらされる.一般に行動方策はこの推定された価値関数に基づいて更新されるため,価値関数の推定の良さは方策改善の性能に直結する.したがって効果的な価値推定法を確立することは強化学習において重要な課題である. この課題を解決するため,近年,我々はセミパラメトリック統計推論手法を利用した新しい枠組み,“セミパラメトリック方策評価法”を提案した.この枠組みは,セミパラメトリックモデル(興味のあるパラメータと無限次元の自由度を持つことが可能な撹乱パラメータの両方を持つモデル)とその推定手法,推定関数を用いて,全ての価値関数の一致性を持つ推定量の集合を特定している.また漸近解析を通して,これら推定量の“パラメータの漸近推定分散”を評価し,推定量間の比較を可能にしている.この枠組みは興味深い考察を含んでおり,様々な拡張の可能性を持つが,解析は価値関数のモデルが正しい場合,つまりモデル化誤差を含まない場合しか考慮しておらず,モデルが正しくない場合については触れていない. 本研究では,価値の予測に着目し,モデルに基づく予測と真の価値の平均二乗誤差(MSE)の漸近的な挙動の解析が可能にする.具体的にセミパラメトリック方策評価のパラメータの漸近解析の結果をモデルが間違っている場合に拡張し,より一般的な状況でのパラメータの漸近推定分散を求める.そして, MSEを推定誤差と近似誤差の2つに分割し,それらを別々に解析する.さらに,MSEの解析を元に価値推定の代表的なアルゴリズム, LSTD, LSTD(λ), そしてgLSTD法の推定量に着目し,これらの推定量を1) モデル正しい場合,2)モデルが正しくない場合,それぞれにおいて比較する |
|
|
P4-39 |
選択の能動モデリング [資料] |
ディスカッション |
下斗米貴之(玉川大) |
|
検査や実験には金額や時間、人的資源など様々なコストが発生しうるが、それらが無視できない場合が存在する。このような状況において、精度を保証しつつ実験数や検査数を効率化することは非常に重要となる。これまでも分散分析の枠組みで実験計画法として、直行計画などにより実験を行う前に効率よく実験を行う手法が用いられているが、これでは実験の過程での変更ができず、実験で得られた情報を利用できない。近年、得られたデータの情報を利用して次のサンプリングを決める能動学習法が多く提案され研究が進んでいる。、 感性工学や工業検査などの分野で、絶対的な評価が難しい対象でも、比較による相対評価が有効な場合が多く存在し、一対比較法(Scheffe1952など)が頻繁に使用されている。しかし、より大きな規模の実験設定では組合せ数が増加し、全探索的な実験が不可能となる。そこで、本研究では実現可能な実験回数を設定、または信頼性を一定に保ちつつ実験を設定することを目指し、確率モデルによる能動的サンプリングアルゴリズムを提案する。選択に関する確率モデルとしてBradly and Terry(1952)のモデルを用いて定式化する。また、対の比較だけではなく順位測定データを扱うことができるよう拡張する。近年、能動学習としてや、Bootstrap法を用いた方法やBayes推定により能動的な対戦システムの構築法(Glickman and Jensen 2005)が提案されており、これらを一対比較実験の設定として拡張し、シミュレーションによる比較評価を行う。 |
|
|
P5-1 |
分位点に基づく重み付きデータの情報量推定手法とその応用 [資料][論文] |
テクニカル |
日野英逸, 三浦和起, 村田 昇(早大) |
|
情報量とは, 観測した事象に対する “価値” の尺度である. 情報量は非常に基本的な量であり, その推定は統計学, 情報理論, 機械学習を初め, 多くの分野で重要な問題である. 本稿では, データの距離に関する分位点に基づき, 各点に重みが与えられたデータに対する情報量の推定手法を提案する. 提案する情報量の推定量から, 重み付きデー タのクロスエントロピー及びエントロピーの推定量を導出する. 提案した重み付きデータの情報量とクロスエントロ ピー推定手法を, 正例のみからの学習問題と, 時系列データの変化点検出問題に応用する. |
|
|
P5-2 |
ダミーデータ付加によるバイオメトリクス認証の精度向上 [資料][論文] |
テクニカル |
中島章裕, 尾関智子(東海大) |
|
In this paper, we propose a new method to improve the accuracy in biometrics authentication by adding the dummy data. Because it is difficult for a biometrics authentication that uses the behavioral characteristics to obtain a stable input, the accuracy tends to be low. Both FRR and FAR were improved by using the proposed method. |
|
|
P5-3 |
相関信号下での圧縮センシングの性能解析 [資料][論文] |
テクニカル |
竹田晃人, 樺島祥介(東工大) |
|
圧縮センシングは信号疎性を利用した新しいデータ圧縮法であるが, ランダム圧縮過程の下で信号の完全復元の為の圧縮限界が統計力学の手法であるレプリカ法を用いて議論出来ることが最近示された. ここではその方法を拡張し相関を持つ信号に対する圧縮センシングの圧縮限界を調べる一般的な手法を提示する. この手法の適用例として, 疎性付き自己回帰モデルにより生成された時系列信号の圧縮センシングを考え, 圧縮限界が提案手法で実際に求められること, またその結果が計算機実験により得られた圧縮限界とも一致することを示す. |
|
|
P5-4 |
混合正規分布におけるベイズ法と変分ベイズ法の相違について [資料][論文] |
テクニカル |
山田哲太郎, 渡辺澄夫(東工大) |
|
変分ベイズ法は、事後分布の平均場近似を用いて少ない演算量で精度の良い予測を実現する方法として広く用いられているが、真のベイズ法との相違の度合いや平均場近似の局所解の影響については明らかにされていなかった。これまでの研究で我々は混合正規分布の厳密な自由エネルギーを求める方法を提案したが、本研究では変分自由エネルギーとの相違を求めることによりベイズ法と変分ベイズ法の差がどの程度であるかを明らかにする。また、真の分布の学習モデルに対する特異性とハイパーパラメータの設計がその相違に及ぼす影響について明らかにする。 |
|
|
P5-5 |
2クラス識別のためのMAP推定に基づく二次制約評価基準 [資料][論文] |
テクニカル |
横田達也, 山下幸彦(東工大) |
|
本論文では、事後確率の計算をせずにMAP推定に基づいた2値識別を実現するため、MAP推定に基づく識別関数の評価基準を定義し、その基準に基づいた新しい識別器の構成法を提案する.この評価基準を用いることによって、従来の手法よりも、MAP推定の際に与えるモデルの自由度を広げることができる. |
|
|
P5-6 |
音楽音響信号解析のための階層ディリクレ過程に基づく無限潜在的調波配分法 [資料][論文] |
テクニカル |
吉井和佳, 後藤真孝(産総研) |
|
本研究では、従来のようにあらかじめ音源数や倍音数を仮定する必要がない、ノンパラメトリックベイズ理論に基づいた新しい複数周波数解析法を提案する。我々は、複数の調波構造が重畳した観測スペクトルに対して、階層ディリクレ過程とベータ2パラメータ過程に基づくネスト型無限混合モデルを定式化し、周辺化変分ベイズ法の適用を試みた。 |
|
|
P5-7 |
特徴量に基づく確率的行列分解 [資料][論文] |
テクニカル |
関野正志(ソニー) |
|
確率的行列分解(PMF)において、行列とは別の付加的な特徴量を反映させる確率的行列分解回帰(PMFR)を提案する。PMFRはPMFと縮小ランク回帰を特別な場合として含み、ベイズ推定により両者の特性を適切に反映させることができる。あわせて、変分ベイズ推定の新たな初期化方法も提案する。推薦システムにおける評価値予測問題に適用した結果、PMFRはPMFよりも高精度であり、特にコールドスタート問題に有効であることがわかった。 |
|
|
P5-8 |
MSTに基づくSVMパス追跡を用いた多重多変量2標本検定による遺伝子群解析に関する一考察 [資料][論文] |
テクニカル |
石川勇太, 磯部浩太, 烏山昌幸, 泉泰介, 竹内一郎(名工大) |
|
マイクロアレイ技術により多くの遺伝子発現量を同時に計測できるようになった.本研究では, マイクロアレイデータ解析の重要なタスクの一つである遺伝子群解析と呼ばれる問題を扱う.遺伝子群解析の代表的な手法としてGSEAがあるが, この手法では遺伝子群の発現量を多変量データとして捉えることができない.そこで我々は, SVMの汎化誤差を検定統計量として用いる多変量検定を遺伝子群解析へ適用する.しかし, このアプローチにおいては, 検定統計量の帰無分布をラベル並べ替え演算により推定しなければならないため, SVMの学習を多数回行わなければならず, 計算コストが膨大になる.本研究では, ラベルを並べ替えた際のSVM の学習に, 最小全域木(MST)に基づいてスケジューリングされたパス追跡を用いることで効率化する. |
|
|
P5-9 |
近似解のパス追跡に関する一考察 [資料][論文] |
テクニカル |
烏山昌幸, 竹内一郎(名工大) |
|
本稿では,ある与えられた近似精度を保つパス追跡アルゴリズムを提案する.機械学習におけるパス追跡は解の区分線形性を利用し,最適化問題の厳密解を追跡する.しかし,(a)大きなデータセットでは解の変化点(ブレイクポイント)が多くなり計算コストが増加する,(b)常に厳密解を保つ必要があるため他のアルゴリズムと併用しにくい,といった問題点がある.そこで,最適性条件に対して許容する誤差を明示的に与え,近似解を追跡するアルゴリズムを考える.通常,パス追跡ではブレイクポイントにおいてある1組の不等式条件の活性と非活性を切り替えるが,提案法では複数組の不等式条件の活性と非活性を一度に切り替えることによってブレイクポイントの削減を試みる.また,複数条件が同時に活性・非活性の境界にいることは最適化において退化と呼ばれる状況であるが,解の微小変化を考慮することで巡回の可能性を完全に回避する方法に関しても考察する.最後に,数値実験により提案法の有効性を検証する. |
|
|
P5-10 |
統計力学的手法に基づく階層的ランダム符号の性能解析 [資料][論文] |
テクニカル |
竹田晃人(東工大), 小渕智之(阪大), 高橋和孝(東工大) |
|
情報理論と物理学における統計力学の関係はこれまでに数多く指摘されているが, 本研究では階層構造を持つランダム符号を対象とする統計力学的性能解析法を議論する. 統計力学的見地では, ランダム符号はランダムエネルギー模型と呼ばれる可解なスピングラスの模型として捉えられることが知られている. それを踏まえ, 本研究では前述の階層的ランダム符号が一般化離散ランダムエネルギー模型という可解なスピングラスの模型と完全に対応することを述べ, かつこの対応関係を利用することでデータ圧縮(情報源符号化)・通信路符号化における階層的ランダム符号の性能を直接かつ系統的に調べることが可能であることを示す. |
|
|
P5-11 |
入力が相関を有するオンライン学習の統計力学 [資料][論文] |
テクニカル |
中尾健人(関西大), 鳴川雄太(ダイヘン), 三好誠司(関西大) |
|
学習機械が単純パーセプトロンであり,入力が相関を有する場合のオンライン学習について統計力学的手法を用いて解析する.ヘブ学習とアダトロン学習では入力の相関が大きいほど学習が遅くなるのに対し,パーセプトロン学習では入力の相関の影響を受けないことが明らかになった. |
|
|
P5-12 |
適応型荷重摂動学習の統計力学 [資料][論文] |
テクニカル |
三好亮介, 前田裕, 三好誠司(関西大) |
|
学習機械の可変パラメータに摂動を加える荷重摂動学習が提案されている。本稿ではパーセプトロン学習とアダトロン学習の違いについて考察することにより適応型の荷重摂動学習を提案する。統計力学的手法を用いて解析を行った結果、提案する学習則がすぐれた漸近特性を有することが明らかになった。 |
|
|
P5-13 |
規範軌道の多様性を考慮した非線形力学系による運動記述の学習法: ロボットによる見まね学習への応用 [資料][論文] |
テクニカル |
松原崇充(奈良先端大/ATR), 玄相昊(立命館大/ATR), 森本 淳(ATR) |
|
本論文では,多様性を含む多数の運動軌道から,汎用性・一般性の高い運動記述を獲得するための学習アルゴリズムを提案する.提案法では,Ijspeert らによって提案された非線形力学系に基づく運動の記述法を拡張し,多数の規範軌道に含まれる多様性を考慮し,多数の規範軌道の特徴を捉える低次元のパラメータを有する非線形力学系を運動記述として学習する.このパラメータの調節によって,力学系の時間発展による多様な運動軌道の生成が可能となる.到達運動および周期運動について,モーションキャプチャと双腕ロボットを用いた運動スキルの見まね学習課題に対して提案する学習法を適用し,提案法の有用性を実証する. |
|
|
P5-14 |
ポートフォリオ最適化問題の情報統計力学 [資料][論文] |
テクニカル |
新里隆(秋田県立大), 安田宗樹(東北大) |
|
我々はポートフォリオ最適化問題の最適解を導出する高速なアルゴリズムを確率伝搬法に基づいて提案する.さらにCilibertiらのポートフォリオ最適化問題に対するレプリカ解析とKonnoらの結果を用いてBPアルゴリズムの有効性を確認する. |
|
|
P5-15 |
標本点ごとにカーネルパラメータを選択するサポートベクターマシン [資料][論文] |
テクニカル |
井之上直矢, 山下幸彦(東工大) |
|
非対称カーネルSVM においては,内積の中の高次元ヒルベルト空間への2つの写像を異なるものにすることにより,未知パターンの特徴空間への写像は固定し,学習パターンの写像を標本点ごとに変化させることができる.部分空間制約SVM によって,学習アルゴリズムに交差検定の原理を導入することが可能である.そこで両者を組み合わせることにより標本点ごとに異なるカーネルパラメータに対する重みを自動的に学習するSVM を構成する. |
|
|
P5-16 |
Fisherの正確確率検定の正確多重検定: 保守的でない多重検定アルゴリズム [資料][論文] |
テクニカル |
宮城浩彰, 井上真郷(早大) |
|
今日、ゲノムデータの統計的解析により疾患の原因となる遺伝的変異が多々発見されている。この解析手法としてFisherの正確確率検定の多重検定のBonferroni補正が挙げられるが、この方法は過剰に保守的であり本来検出すべき遺伝的変異を見逃している。この問題に対し、本手法では多重性を考慮したP値の正確計算を実現し、安全かつ検出力の高い多重検定アルゴリズムを提案する。 |
|
|
P5-17 |
ラベル付きグラフに対するプライバシを保護した半教師付き学習法 [資料][論文] |
テクニカル |
荒井ひろみ, 佐久間淳(筑波大) |
|
ラベル付きネットワーク構造データにおける既存のノードラベル推定手法は,ネットワーク構造及び教師ラベルが解析者にvisibleであるのが前提である.しかし実社会のネットワーク情報においては多くの場合リンク構造やラベルが秘密情報であり, 公開できない.本研究では,ラベル付きネットワーク構造データにおける典型的なプライバシーモデルのもとで,リンク構造やラベルなどの秘密情報を開示せずにラベル予測を実現する半教師付き学習法を提案する. |
|
|
P5-18 |
動的計画法によるリターン分布推定 [資料][論文] |
テクニカル |
森村哲郎(IBM), 杉山将(東工大), 鹿島久嗣(東大), 八谷大岳(東工大), 田中利幸(京大) |
|
リターン(累積報酬値)の分布推定により、分布から規定される任意の特徴量を指標とした意思決定策を考えることができる。そのため、リターン分布推定によって、期待値以外にバリュー・アット・リスク等のリスク指標も考慮した強化学習法の実現が期待できる。また、近年、リターン分布の推定法として、分布Bellman方程式を動的計画法に基づいて近似的に解く手法が提案された。しかしながら、その収束性に関する解析は十分でない。そこで本報告では、動的計画法により分布Bellman方程式を解いた場合の収束性を解析する。動的計画法により、リターンの初期推定分布に依存せず真のリターン分布に収束することや、真の分布のモーメントへの収束率を報告する。また、解析結果から、既存のリターン分布推定法の改善策についても議論する。 |
|
|
P5-19 |
Global Analytic Solution for Variational Bayesian Matrix Factorization and its Model-induced Regularization [資料][論文] |
テクニカル |
Shinichi Nakajima(Nikon), Masashi Sugiyama(Tokyo Tech), Ryota Tomioka(Univ. Tokyo) |
|
行列分解にベイズ推定を適用する方法が近活発に研究されている.本稿ではまず,変分ベイズ行列分解の大域解が,その非凸性にもかかわらず4次方程式を解くことによって解析的に得られることを示す.標準的な繰り返しアルゴリズムと比較して,解析解の計算は高速かつ確実に実行できるため,提案法は実用上有利である.同様に,ハイパーパラメータをデータに基づいて学習する経験変分ベイズ行列分解に対しても解析的に大域解を導出し,実用上の利点を実験により示す.また,上記の解析解の導出により,識別不能モデルにベイズ推定を適用した場合に強く現れる「意図しない正則化」(我々はこれをモデル起因正則化と呼ぶ)の詳細が明らかになる.本稿では,変分ベイズ行列分解のモデル起因正則化が縮小推定の形で現れることを示し,その発現機構を図解する. |
|
|
P5-20 |
Regularization Strategies and Empirical Bayesian Learning for MKL [資料][論文] |
テクニカル |
Ryota Tomioka, Taiji Suzuki(Univ. Tokyo) |
|
Multiple kernel learning (MKL) has received considerable attention recently. In this paper, we show how different MKL algorithms can be understood as applications of different types of regularization on the kernel weights. We show that many algorithms based on Ivanov regularization, have their corresponding Tikhonov regularization formulations. In addition, we show that the two regularization strategies are connected by the block-norm formulation. The Tikhonov-regularization-based formulation of MKL allows us to consider a generative probabilistic model behind MKL. Based on this model, we propose learning algorithms for the kernel weights through the maximization of marginalized likelihood. |
|
|
P5-21 |
Loss Functions for Multiclass Boosting [資料][論文] |
テクニカル |
Takafumi Kanamori(Nagoya Univ.) |
|
The purpose of this paper is to study loss functions in multiclass classification. In classification problems, decision function is estimated by minimizing an empirical loss function, and then, output label is predicted by using the estimated decision function.
We propose a class of loss functions which are obtained by a deformation of log-likelihood loss function. There are four main reasons that we focus on the deformed log-likelihood loss function: (1) this is a class of loss functions which are not deeply investigated so far, (2) in terms of computation, boosting algorithm with pseudo-loss is available to minimize the proposed loss function, (3) the proposed loss functions provide clear correspondence between decision functions and conditional probabilities of output labels, (4) the proposed loss functions satisfy the statistical consistency of classification error rate which is a desirable property in classification problems.
Based on (3), we show that the deformed log-likelihood loss provides the model of mislabeling which is useful as a statistical model of medical diagnostics. We also propose a robust loss function against outliers in multiclass classification based on our approach.
The robust loss function is a natural extension of the existing robust loss function for binary classification. Model of mislabeling and robust loss function are useful to cope with noisy data. Some numerical studies are presented to show the robustness of the proposed loss function. A mathematical characterization of the deformed log-likelihood loss function is also presented. |
|
|
P5-22 |
半定値計画緩和による多項式コスト関数の大域的最適化 [資料][論文] |
テクニカル |
赤穂昭太郎, 藤木 淳(産総研) |
|
データ解析において最適化すべきコスト関数が多項式で表される場合を考える.多項式のデータ解析において最適化すべきコスト関数が多項式で表される場合を考える. 多項式の次数が高くなるとローカルミニマムの数が増え,最急降下法などの手法では大域的最適解を求めることが困難となる. 近年,多項式関数の最適化を半定値計画問題で緩和することにより大域的最適解が得られる保証のある多項式最適化法と呼ばれる手法が開発された. 本稿では,画像の歪み補正問題と独立成分分析に対して多項式最適化法を適用し,大域的最適解が得られることを実験的に示す. |
|
|
P5-23 |
ガウス混合分布の正規化最尤符号の効率的計算方法とモデル選択 [資料][論文] |
テクニカル |
平井聡, 山西健司(東大) |
|
本論文ではガウス混合分布に対して正規化最尤(NML)符号長を効率的に計算する方法を新しく提案する。NML符号長はモデルに対するデータの最短記述長(確率的コンプレキシティ)としての意味をもつが、一般に連続値データに対してNML符号長を計算すると正規化項が無限に発散してしまうという問題がある。本論文ではこの問題を克服し、O(n^2)(nはデータ数)でNML符号長を計算する効率アルゴリズムを提案する。また、本手法を混合数の選択問題に適用し、既存のAICやBICといった基準と比較することでその有効性を検証する。 |
|
|
P5-24 |
連続型best expertの追跡と動的モデル選択への応用 [資料] |
ディスカッション |
櫻井瑛一, 山西健司(東大) |
|
本論文では、データが逐次的に入力される下でexpertを用いたオンライン予測の問題を考える。従来、expert集合が有限の場合に、累積予測損失を最小化するbest expertが時間と共に変わるとして、その系列を追跡し、損失をできるだけ小さくするようなアルゴリズムが提案されてきた。本論文では、その議論をexpert集合が連続集合の場合に拡張し、best expertの系列を追跡するアルゴリズムを提案する。また、そこで得られたアルゴリズムの累積予測損失の限界を導く。さらに、非定常データに対する「動的モデル選択」という問題設定の中で、本アルゴリズムを従来のアルゴリズムと組み合わせることにより、新しい動的モデル選択アルゴリズムの設計と解析を行う。 |
|
|
P5-25 |
グラフィカルモデルの構造変化検出とマーケティングの応用 [資料] |
ディスカッション |
早矢仕裕, 山西健司(東大) |
|
本論文では、与えられた多次元時系列データからグラフィカルモデルを学習し、構造変化を追跡する手法を提案する。同様な手法に、Graphical LASSOを用いて多次元系列の相関関係を抽出する手法があるが、得られた確率モデルの構造が明確ではなかった。本論文では、多次元時系列データの因果関係をグラフィカルモデルとして確率構造を明確に定義し、「動的モデル選択」を行うことによって、その時間的構造変化を追跡する。さらに本手法をマーケティングの効果測定に適用した結果を報告する。この実例をもとに、本手法とGraphical LASSOを実験的に比較する。 |
|
|
P5-26 |
ラベルノイズに頑健なトピックモデル [資料] |
ディスカッション |
岩田具治, 山田武士, 上田修功(NTT) |
|
ソーシャルアノテーションサービスでは,ユーザが任意にラベル(アノテーション)を付与できるため,しばしば内容に関連しないラベルがデータに含まれる.本発表では,このようなラベルノイズを含むデータに対しても頑健なトピックモデルを提案する.提案法では,コンテンツとラベルが生成される過程をモデル化し,確率的EMアルゴリズムを用いてモデルを学習することにより,各ラベルがコンテンツに関係するか否かを推定する.また,学習データとしてラベルノイズがないことが既知のサンプルを含む,半教師あり学習への拡張,さらに、他の識別器の前処理として用いる場合への拡張を提案する.人工データ,および,Webページと画像を対象とするソーシャルアノテーションサービスの実データを用いて提案法の有効性を示す. |
|
|
P5-27 |
半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索 [資料] |
ディスカッション |
高木潤(東工大), 大石康智, 木村昭悟(NTT), 杉山将(東工大), 亀岡弘和(NTT) |
|
近年、インターネットの急速な普及に伴い、ネットワーク上に多種多様な音楽・画像・映像などのメディア情報が大量に蓄積・流通されるようになっている。これらメディア情報へのアクセスを容易にするために、あらかじめメディア情報を適切に解析し、問い合わせに柔軟かつ高速に対応する必要性が高まっている。メディア情報へアクセスする方法として最も一般的な方法は、それらにあらかじめ付与されたメタデータ・キーワードなどのテキストタグを活用する方法である。しかし、タグが付与されていないメディア情報は未だに膨大に存在し、一方でこれらメディア情報に的確なタグを手動で付与することは膨大な手間を要する。上記の背景に基づき、少量のタグ付きメディア情報と多量のタグなしメディア情報とから、タグなしメディア情報に付与されるべきタグを統計的に推測しつつ、これらのメディア情報をユーザの問い合わせに応じて提示・検索する、「半教師型」のメディア情報認識検索技術について検討する。本研究では、対象とするメディア情報として音響信号を想定し、与えられた音響信号に対するタグを自動的に推定する問題、及びその双対問題である、与えられたテキストタグに適合する音響信号を検索する問題を同時に解決する方法を提案する。音響信号から音色情報を表すMFCCとその時間変化を表す�MFCCを特徴抽出し、信号全体にわたるこれらの特徴量のヒストグラムを音響信号の特徴表現(Bag-of-features)として、これに付与されるべきタグとの関係を半教師型で学習する。従来法では、音響特徴量とタグとを一対一に教師あり学習するものが主流であったが、正準相関分析(CCA)とカーネル密度推定を組み合わせたトピックモデル推定を行うことにより、タグ間の共起関係をも考慮できることが本研究の特徴でもある。約2000曲の音響信号に対して手動でタグ付けされた音楽データベースを用いて評価実験を行ったところ、音響特徴量とタグとの関係を半教師型で学習する提案法が、全て教師ありで学習する従来法と同等以上の自動タグ付け性能をもつことを確認した(F値による評価では、従来法0.344、提案法0.472が得られた)。また、これまで我々が提案した半教師型の学習法「SemiCCA」に比べて、さらにカーネル密度推定を組み合わせた提案法が、自動タグ付け性能を向上させることを確認した。 |
|
|
P5-28 |
音声生成過程の確率モデル [資料] |
ディスカッション |
亀岡弘和(NTT) |
|
音声は,肺から供給された空気が声帯振動によって周期的な疎密波となり,さらにその音波が声道で共振されることによって「声」となり,口から発せられる。人は音声対話において,声帯の固有振動数を制御しながら音声に適当な抑揚を与え,同時に,声道の形状を巧みに変化させながら異なる種類の母音を発することで,聴き手に意図した情報を伝達している。音声情報処理研究の歴史で生まれた音声生成過程に関する重要な数理モデルとして,声帯振動の制御機構を模した藤崎モデルと,縦続連結した等長音響管で声道断面積関数をモデル化したことと等価な全極型声道モデルが有名である。本発表では,ある特定条件のウェーブレット変換のスペクトル領域において,これら両生成過程モデルを同時に内包する確率モデルが立てられることを示し,そのパラメータの変分推論法について述べる。提案法は,全極型声道モデルと藤崎モデルのパラメータをスペクトルからダイレクトに同時推定することが可能な初めての音声分析手法であり,様々な興味深い応用展開が期待される。 |
|
|
P5-29 |
地震発生予測に最適な観察時間 [資料] |
ディスカッション |
近江崇宏, 篠本滋(京大) |
|
地震の複雑な時間的発生パターンを理解することは地震学における大きな問題のひとつである。地震発生にはいくつかの統計則が成り立つことがよく知られている。地震の発生率については、本震からの発生時間に対して余震の発生率が冪的に減衰するという大森則が古くから確立されてきた[1]。近年、地震の発生間隔分布がスケーリング則を満たすことが明らかになり[2]、地震の発生タイミングがどのような法則に支配されているのかということに注目が集まっている。このスケーリング則の発見以降、発生間隔の統計性は経験的にも理論的にもよく調べられてきている。もし発生間隔が独立で独立な確率分布に従うならば、地震発生は直前の地震の発生時刻のみに依存するということになる。しかしいくつかの研究から、前後の発生間隔の間には正の相関が存在する、つまり短い(長い)間隔の次には短い(長い)間隔が起こりやすいということが報告されている。これは,直前とそのもう一つ前の地震間間隔を知ることによって、次に起こる地震の発生時刻の予測を改善する事が出来るということを意味する。本研究では我々は、直前の地震間の間隔よりもさらに効率的に地震発生の予測を高めることの出来る要因を探求した。今回は、最新の地震発生率を要因として採用し、発生率と次の間隔との統計的依存度を相互情報量により評価し、発生率を算定する時間幅を最適化した。さまざまな地域でこの最適時間幅を求めたところ、それは領域の大きさやマグニチュードの閾値にあまり依存せず、10時間程度であるということが明らかになった。参考文献:[1]F. Omori, J. Coll. Sci. Univ. Tokyo 7, 111 (1895).[2]A. Corral, Phys. Rev. Lett. 92, 108501 (2004).[3]V. N. Livina, S. Havlin and A. Bunde, Phys. Rev. Lett. 95, 208501 (2005). |
|
|
P5-30 |
Sparse and low-rank estimation of time-varying Markov networks [資料] |
ディスカッション |
平山淳一郎(京大), Hyvarinen Aapo(Univ. Helsinki), 石井信(京大) |
|
Several authors have recently proposed sparse estimation techniques for time-varying Markov networks, in which both graph structures and model parameters may change with time. Although the previous studies basically assumed the local smoothness of the changing networks, this may not be enough to recover the original network since the parameter space often has quite a high dimensionality in practice. To improve this, in this study, we introduce the nuclear norm regularization, which reduces the rank of the matrix of parameter sequence, into a pseudolikelihood-based estimation framework with the sparseness and local smoothness. We derive a simple estimation algorithm based on the alternating direction method of multipliers which can effectively utilize the separable structure of our minimization problem. We demonstrate the performance of proposed method with an ariticially-generated dataset, and also report a preliminary result for a real multi-neuronal spike dataset obtained by the functional Multineuron Calcium Imaging technique. |
|
|
P5-31 |
Contrastive Divergence Learningに対する新しい解釈とその理論解析 [資料] |
ディスカッション |
前田新一, 石井信(京大) |
|
Contrastive Divergence Learningは、Restricted Boltzmann Machineの学習則として経験的に良く動作することが示され、近年、注目されている。 しかし、その学習則の導出には大雑把な近似も含まれていることもあり、なぜこのような学習則が経験的にうまく働くかやアルゴリズムの収束性について疑問が残っていた。 本研究では、Contrastive Divergence Learningがマルコフ確率場の詳細釣り合い条件をもとにした学習アルゴリズムとしてみなせることを示し、その収束に必要な条件を示す。 |
|
|
P5-32 |
マスターマインドにおける最適解法とヒューリスティックを用いた解法に対する考察 [資料] |
ディスカッション |
藤居真登(京大) |
|
マスターマインドは、出題者の作成した数字列を、ヒントを元に推理する数当てゲームである。まず、出題者が正解となる数字列(正解コード)を作成する。次に回答者は正解コードを推理し、推理した数字列(回答コード)を出題者に伝える。最後に出題者は正解コードと回答コードを比較して、回答者にヒントを提示する。ここで提示されるヒントは、回答コードの中に正解コードと一致している桁がいくつあるか、正解コードに含まれている数字がいくつあるのかを示す。回答コードの生成とヒントの提示を繰り返して、できるだけ早く正解コードにたどり着くことがこのゲームの目的である。本発表では、答えにたどり着くまでの試行回数の期待値や回答することにより得られる情報量などの観点から比較することで、ヒトがどのようなヒューリスティックを用いてゲームを行っているのかについて考察する。はじめにマスターマインドの最適解法について述べる。ここでは正解コードに対する事前知識が全くないものと仮定して最適解法を考えた。正解コードとなる可能性のある全ての数字列から各ヒントの得られる確率を計算し、正解コードを推理するために必要な試行回数の期待値が最も少なくなるような回答コードを生成する探索方法を考えたとき、生成されるコードは(1)今までの回答コードとヒントに矛盾が生じない、正解を当てにいくことを目的としたコードと、(2) ヒントと矛盾を含むが、過去の回答コードと重複が少ない、今後の探索範囲を狭めることを目的としたコードの二つに分類できることがわかった。最適解法は(1)(2)を上手く組み合わせることで得られる。続いてヒトの回答コード生成の傾向を調べるため行った、インターネット上での心理実験について述べる。多くのヒトに気軽にプレーしてもらうため、一般的に用いられている4桁×8数字よりも小さめの3桁×4数字を用いた。実験参加者の回答コード系列を解析したところ、最適解法と同様、(1)(2)のコードがどちらも含まれることがわかったが、この二つに大きな偏りがあることがわかった。このことから、ヒトは毎回得られるヒントを全て利用するのではなく、正解コードを絞り込みやすいヒントに重点を置いてコード生成を行っていることが示唆される。本発表では、ヒトの行うコード生成戦略の偏りの傾向、今後の回答コード解析の方針について議論したい。 |
|
|
P5-33 |
過完備性を考慮したICAによる特徴抽出とその応用 [資料] |
ディスカッション |
松田源立(青学大) |
|
主成分分析(PCA)に代表される多次元観測データからの特徴抽出手法は、機械学習において最も重要なツールの一つである。PCAは、与えられた観測ベクトルを線形変換し、互いに非相関な特徴量の中で分散が大きいものを順番に抽出する。PCAは大域的な意味で影響力の強い少数の特徴を抽出するのに適しているが、それが機械学習において必ずしも最適とは限らない。むしろ、出現頻度の低い局所的な特徴こそが、識別問題や分類問題において決定的に重要である場合が多い。そのような局所的特徴を抽出する手法の一つとして、独立成分分析(ICA)が近年多くの注目を集めている。ICAは、重要な特徴は互いに統計的な意味で独立しているという仮定に基づく手法である。具体的には、なんらかの非線形高次統計量を最大化するような特徴の抽出を行う。これにより、画像処理の分野では、局所的特徴を抽出可能であることが知られている。従来のICAは計算コストが非常に高く応用可能範囲が狭いという問題点があったが、筆者らは、推定すべきパラメータを限定して大幅な効率化を可能とする手法を既に提案している。本発表では、この提案した効率的なICA手法を、自然言語処理及び画像処理に応用し、識別問題や分類問題等の機械学習においてICAによる特徴抽出がどの程度有効なのかを検証する。本発表で新たに利用する重要な概念としては、overcompleteness(過完備性)がある。過完備性とは、観測ベクトルの次元よりも抽出すべき特徴の数の方が多いことを意味し、言語処理や画像処理でのデータはこの性質を持つと予測される。しかし、ICAで多数の過完備な特徴全てを正確に抽出するのは極めて困難である。そこで、本発表では、通常のICAで抽出された特徴を、本来の多数の特徴群の中からランダムに選択されたものと考える。本発表では、この枠組みが、機械学習にたいするICAの応用を容易にすることを示す。 |
|
|
P5-34 |
オンラインランク統合問題 [資料] |
ディスカッション |
安武翔太, 畑埜晃平, 瀧本英二, 竹田正幸(九大) |
|
近年,インターネット上での情報検索の発達や,オンラインショッピング,推薦システムの発展により,ランキングの研究が注目されている.中でも,ランク統合問題が大きな注目を集めている.ランク統合問題とは,サイズnの順列がm個与えられた下で,与えられた順列との“距離”の和を最小化する順列を求める問題である.ランク統合問題はNP困難であり[Bartholdiら,1989],またmを定数に限定しても, m ? 4の場合にはNP困難である[Dworkら, 2001].一方11/7倍近似を得る多項式時間アルゴリズム [Ailonら, 2008]や,多項式時間ε近似アルゴリズム(PTAS)[Kenyon-MathieuとSchudy, 2007]が知られている.本研究ではランク統合問題の“オンライン版”を考える.問題のプロトコルを以下に示す.各時刻tにおいて,アルゴリズムは順列を予測して出力し,環境は真の順列を返す. そして,アルゴリズムが出力した順列と真の順列との距離を時刻tにおける損失とする. これをm回繰り返す.アルゴリズムの目的は,m個の順列が予め全て与えられたと仮定したときのオフライン最適解に匹敵する予測を行うことである.代表的なオンライン予測アルゴリズムであるHedgeアルゴリズム[Freund Schapire,1997]および,異なる問題設定におけるオンライン順列予測アルゴリズムであるPermELearn[HelmboldとWarmuth,2009]は,オンラインランク統合問題への適用が可能である.しかし,これらのアルゴリズムはそれぞれO(n!)およびO(n^6)の計算時間を各時刻に要する.本研究ではオンラインランク統合問題を解くふたつのアルゴリズム(PermRank, PermRank2)を提案する.PermRankは,累積損失の上界はHedge AlgorithmやPermELearnより定数倍大きいが,各時刻における計算量はO(n^2)である.一方,PermRank2は,計算時間は不明であるが,累積損失はHedge AlgorithmやPermELearnより小さく,下界にほぼ一致する.簡単なシミュレーション実験では,計算時間のみならず累積損失においても,PermRankがHadge AlgorithmやPermELearnよりも優れているという結果を得た. |
|
|
P5-35 |
SlideSort: 次世代シークセンサデータのための高速全ペア類似度検索法 [資料] |
ディスカッション |
清水佳奈, 津田宏治(産総研) |
|
次世代シークエンサーが生み出す大量の配列間の類似度を評価することは、ゲノムアセンブリなどの課題において、非常に重要である。本研究では、配列の集合から、編集距離の意味で類似したペアを全列挙するアルゴリズムを提案する。本手法では、効果的に探索範囲を狭めるため、パターン成長法を用いて、共通するkグラムの列を高速に発見する。BWAのように、索引構造上でのバックトラッキングによる方法と比較すると、本手法は距離の閾値が大きいときに、遥かに高速であり、簡単に一千万本を超える配列をあつかうことができる。また、オンライン最小木のアルゴリズムと組み合わせることによって、大規模Single Linkクラスタリングを行うことができる。 |
|
|
P5-36 |
PC12細胞における細胞内シグナル伝達の通信路容量 [資料] |
ディスカッション |
宇田新介(東大) |
|
細胞内には主にタンパク質を媒介とした生化学反応ネットワークが存在し,生命現象に関わるシグナルを伝達している.生命現象の多様さに比べてシグナル伝達系を構成する分子種は少ないと考えられており,分子濃度が時系列に変化するパターンに生命現象を制御する情報が含まれていると考えられる.一方,細胞の分子濃度は,遺伝的に全く同一の細胞集団であってもばらつきがあるため,生命現象を制御する情報は必ずしも正確には伝達されない.従って,生化学反応ネットワークが伝達可能な情報には限りがあり,情報の伝達能力は,制御され得る生命現象の多様さと関連があると考えられる.生化学反応は一種の入出力システムであるので,シグナル伝達経路は情報理論で言うところの通信路とみなせば,生化学反応ネットワークが伝達可能な情報を情報理論の枠組みで評価できる. ラット副腎髄質褐色細胞種由来のPC12細胞は,成長因子の刺激により活性化されるERK分子の濃度の時系列変化に応じて,増殖と分化の表現系を選択することが知られている.従って,活性化ERK分子の時系列変化には増殖と分化のいずれかの表現系を決める情報が含まれていると考えられる.成長因子による刺激と活性化ERK分子,及び,活性化ERK分子と活性化ERK分子により活性化する遺伝子の発現タンパク質を,それぞれ入出力関係として通信路とみなし,1細胞レベルの計測技術を用いて得られた細胞集団の実データから通信路容量を数値的に計算した結果について報告する.通信路容量は,通信路に対して入力分布を最適化して得られる相互情報量の上界であり,本研究では,細胞内シグナル伝達が担う生命現象を制御するシグナルの情報量の指標となることを期待している. |
|
|
P5-37 |
時間横断的同一性判定のための機械学習方式 [資料] |
ディスカッション |
小山聡(北大), 鹿島久嗣(東大) |
|
データが実世界の同じ実体に対応するか否かを判定する名寄せは多くのシステムで必要とされ、同一性判定を行う関数を機械学習によって求めることが行われてきた。データの収集期間が長期にわたる場合には、異なる時刻のデータを名寄せする際、判定に有効な属性やそれらの依存関係が変化するため、単一の関数では十分な精度を実現できないことがある。たとえば、1995年と1996年にWeb検索について書かれた2つの論文が同一の著者による可能性と、1995年と2010年にWeb検索について書かれた論文が同一の著者による可能性は異なると考えられる。そこで本発表では、データの時刻に対応して異なる同一性判定関数を名寄せに用いる方法を提案する。マルチタスク学習の枠組みを用いることで、多数の関数を同時に精度良く学習できる方式を検討する。 |
|
|
P5-38 |
無順序木のための部分パス木カーネル [資料] |
ディスカッション |
木村大翼(東大), 久保山哲二(学習院大), 渋谷哲朗, 鹿島久嗣(東大) |
|
Kernel method is one of the promising approaches to learning with tree-structured data, and variousefficient tree kernels have been proposed to capture informative structures in trees.In this paper, we propose a new tree kernel function based on ``subpath sets" to capture verticalstructures in rooted unordered trees, since such tree-structures are often used to code hierarchicalinformation in data. We also propose a simple and efficient algorithm for computing the kernel by extending the multikeyquicksort algorithm used for sorting strings.The time complexity of the algorithm isO((|T_1|+|T_2|)log(|T_1|+|T_2|)) time on average, and the spacecomplexity is O(|T_1|+|T_2|), where |T_1| and |T_2| are the numbers of nodes in two trees T_1 andT_2.We apply the proposed kernel to two supervised classification tasks, XML classification in web miningand glycan classification in bioinformatics. The experimental results show that the predictive performance of the proposed kernel is competitivewith that of the existing efficient tree kernel for unordered trees proposed by Vishwanathan et al.,and is also empirically faster than the existing kernel. |
|
|
P5-39 |
階層型自然方策勾配法 [資料] |
ディスカッション |
福永修一(都立高等) |
|
強化学習とは,試行錯誤により報酬を最大化する方策を求める手法であり,これまでさまざまな問題へ応用されてきた.しかしながら,状態・行動空間が高次元になると学習が困難になるという問題がある.この問題を解決する手法として,方策を直接近似する方策勾配法が注目され,学習を高速化するためのさまざまなアルゴリズムが提案された.その中の1つとして,Ghavamzadehらによって提案された階層型方策勾配法がある.このアルゴリズムは,目的のタスクをサブタスクに分割することにより,学習を高速化するものである.一方,方策勾配法自体の高速化を目的とした,自然勾配を用いた方策勾配法が提案された.この方法は,パラメータ空間にプラトーが存在する場合,自然勾配を利用することによりプラトーに陥ることなく学習することが可能となる.そこで本研究では,階層型方策勾配法に自然勾配法を導入した,階層型自然方策勾配法を提案する.提案手法は,目的のタスクをサブタスクに分割し,それぞれのサブタスクにおいて平均報酬を最大にする方策パラメータを自然方策勾配法により学習するものである.そして提案手法の有効性を数値例を用いて示す. |
|
|