テクニカル・トラック2日目


ポスタープレビュー

T2-1:幾何学的双対表現を用いた部分観測マルコフ決定過程の近似的価値反復アルゴリズム

発表者:塚原裕史・安倍 満・大林真人(デンソーITラボ)

概要: 部分観測マルコフ決定過程(POMDP)の価値関数は、

価値反復の再帰計算で現れる状態区間上の線形関数の集合の最大値を取った区分線形な凸関数によって表されるが、これらの線形関数をそれらの重みベクトルの空間における点群へ写像した時、これらの点群の凸包上辺に対応することが知られている。本研究では、非負行列因子分解を用いて凸包を近似計算する手法を利用し、双対空間においてPOMDPの価値関数を高速に近似計算する手法を提案する。

T2-2:交換Monte Carlo 法を用いた規格化定数近似による自然画像事前分布の性能比較

発表者:松尾篤樹・大田垣 徹・井上真郷(早大)

概要: Bayesを用いた画像処理では画像の事前分布を仮定する必要がある。しかし、用いるべき事前分布を決定する明確な基準は存在しない。本研究では一般に使われることの多い自然画像データセットに対して平均Shannon情報量を計算することで、複数の事前分布について性能比較を行う手法を提案する。事前分布の規格化定数は熱力学的積分法と交換Monte Carlo法を用いたサンプル抽出により近似した。

T2-3:ガウス過程と動的計画法を用いたプロトン伝導体の伝導度推定

発表者:金森研太(名工大)・豊浦和明(京大)・中島伸一(ベルリン工科大)・世古敦人(京大)・烏山昌幸(名工大)・桑原彰秀(JFCC)・本多淳也(東大)・設楽和希(JFCC)・志賀元紀(岐阜大)・竹内一郎(名工大)

概要: 燃料電池に利用される材料の重要な特性であるプロトン伝導度はプロトンが結晶構造内のポテンシャルエネルギー曲面(potential energy surface: PES)を移動する経路上の最大ポテンシャルによって定義される. 計算材料科学の分野では計算機シミュレーションによってプロトン伝導度を求めることが行われているが, 結晶構造全体のPESを正確に把握するためには膨大な計算コストを要するという問題がある.

本研究では経路上の最大ポテンシャルがプロトン伝導度を定めることに着目して, 少ない回数のポテンシャル計算を選択的に行なうことでプロトン伝導度を正確に推定する方法を提案する. 具体的には, ガウス過程による予測分布から生成した仮想的なPESに対して動的計画法による経路探索を行うことで, 経路上の最大ポテンシャルを与える可能性が高い点を探索する. 提案法ではこの手続きによってプロトン伝導度の推定に有益である点に対する選択的なサンプリングを実現する.

T2-4:適応的劣モジュラ最大化によるストリーム型能動学習

発表者:藤井海斗・鹿島久嗣(京大)

概要: プール型能動学習に対して、適応的劣モジュラ最大化によるアプローチが近年盛んに研究されており、多数のアルゴリズムが提案されてきた。本研究では、能動学習のもう一つの重要な設定であるストリーム型能動学習に対して、適応的劣モジュラ最大化に基づく汎用的なフレームワークを構築する。本研究の成果によって、既存の多くのプール型能動学習に対するアルゴリズムをもとにして、ストリーム型能動学習のアルゴリズムを設計することが可能になる。

T2-5:K-Means法による攻撃検知 〜 教師あり学習手法との比較 〜

発表者:高原尚志(UNP)

概要: 今日,ほとんどすべてのコンピュータがインターネットに接続することを強いられている.このような中,インターネット上には無数の攻撃が存在しており,これを防ぐことは至上命題である.攻撃を防ぐ第一歩は攻撃検知である.攻撃検知には,過去の攻撃パターンと一致する通信を攻撃として検知するシグネチャ型検知と機械学習型検知がある.シグネチャ型検知は過去にデータのない新たな攻撃を検知できないが,機械学習型検知では検知できる可能性がある.機械学習型検知には,過去の攻撃データを参考に通信を攻撃通信と正常通信とに分類する教師あり学習手法と過去の攻撃データを用いない教師なし学習手法がある.前者が過去の攻撃データの影響を受けやすく,新たな攻撃の検知が難しくなる可能性があるのに対して,後者は過去のデータを用いないため,その影響を受けず,新たな攻撃であっても検知することができると考えられる.そこで本稿では,前述の考えを検証するため,広く知られた教師なし学習であるK-Means法と教師あり学習の各手法によって攻撃検知の検証を行ったので,その結果について報告する.なお,K-Means法では,分類するクラスタ数が課題となるが,本稿では,クラスタ数を2〜7に設定し検証を行った.本稿では,その理由についても考察する.

T2-6:非負値行列分解の実対数閾値とBayes学習への応用

発表者:林 直輝・渡辺澄夫(東工大)

概要: 非負値行列分解においては、データ行列を非負値の要素を持つ二つの行列の積として推測する問題が扱われるが、この問題はパラメータから確率分布への写像が一対一でないために統計的な正則性を持たず、その推測精度については理論的に解明されていなかった。本論文では、非負値行列分解における実対数閾値のバウンドの評価を行い、Bayes学習を行った場合の予測精度の上界を与える。

T2-7:有限の直径を持つ無限グラフ

発表者:渡邊千紘・中野允裕・武 小萌・川西隆仁・平松 薫・柏野邦夫(NTT)

概要: 映画俳優の共演関係など,多くのネットワークはその頂点数Nに対し小さな直径を持つ(スモールワールド性)ことが知られている.既存モデル(Watts&Strogatz modelなど)では,この性質を直径がlog Nのオーダで増加することにより表現していた.我々は新たに,直径が定数の上限を持つ任意の無限グラフを生成可能な確率過程を提案する.

T2-8:変分ベイズ法を用いたクラスタ構造変化の抽出

発表者:梶 大介(デンソー)

概要: 近年、ビッグデータを扱うための方法の1つとして、オンラインアルゴリズムが注目されている。オンライン処理では時系列的に流れてくるデータを逐次的に処理することで、その予測精度を向上していく。本研究ではその予測精度の指標となる変分自由エネルギーを利用することでデータ発生源の変化抽出が可能となることを実験的に示す。

T2-9:Particle Mirror Descent for the Infinite Majority Vote Classifier

発表者:Atsushi Nitanda・Taiji Suzuki(Tokyo Tech.)

概要: We propose a learning method of an infinite majority vote classifier for binary classification problem, which imposes a penalty on an average of base classifiers by density on a space of parametric base classifiers.

We show this learning scheme leads to a good generalization ability from the perspective of margin maximization.

Particle mirror descent (PMD) is a recently proposed optimization method on a probability space for Bayesian inference.

We extend PMD method for the general convex minimization problem with respect to probability and apply PMD to our proposed learning scheme of the infinite majority vote classifier.

T2-10:Semi-Supervised Classification based on Classification from Positive and Unlabeled Data

発表者:Tomoya Sakai・Marthinus Christoffel du Plessis・Gang Niu(UTokyo)・Masashi Sugiyama(RIKEN/UTokyo)

概要: 従来の半教師付き分類では,データのクラスタ構造や多様体構造を活用することによってラベルなしデータを利用している.一方,近年盛んに研究されている正データとラベルなしデータからの分類(PU分類)では,データの特定の構造に依存せず,ラベルなしデータからラベル情報を直接利用する.本研究ではPU分類に基づく新しい半教師付き分類法を提案し,数値実験を通してその有用性を示す.

T2-11:Incremental Natural Actor Critic with Importance Weight Aware Update

発表者:岩城 諒(阪大)・横山裕樹(玉川大)・浅田 稔(阪大)

概要: 自然方策勾配法などの強化学習の成功には,適切な学習率の設定が不可欠である.確率的勾配法の適応的学習率として提案された Importance weight aware update (IWAU) は,パラメータに対して線形な関数近似器の学習において,学習率を動的に変更することでパラメータの更新が停留点を越えないこと(safety)を保証する.特に,二乗損失を利用する場合,IWAUは簡潔な形式で表現できる.本研究では,自然方策勾配の推定が,線形回帰と漸近的な二乗損失の最小化であることに着目し,safetyを満たす新たな強化学習則を提案する.

T2-12:離散分布の加法分解可能なスカラー汎関数におけるミニマックス最適推定量

発表者:福地一斗・佐久間 淳(筑波大)

概要: 離散分布$P=(p_1,…,p_k)$において,関数$phi$によって定義される汎関数$theta(P)=sum_{i=1}^kphi(p_i)$を推定する問題を取り扱う.この汎関数は$phi$の形によってShannonエントロピー,Renyiエントロピーなどの数多のエントロピーを含み,これらの推定は機械学習において,decision-treeの学習や,特徴量の算出などの重要なコンポーネントとなっている.本稿では,この問題においてミニマックス最適な推定量を提案する.結果として,$phi$の3階微分の大きさがパラメータ$alpha$で定義される上界をもつという仮定において,ミニマックスレートが$frac{k^2}{(nln n)^{2-2alpha}}+frac{k^{2alpha}}{n}$であることを示す.また,$phi$の2階微分の上界に関する仮定が本質的であり,これより上界が大きいと最適な推定量が存在しないことも示す.

T2-13:カイ二乗検定の幾何的解釈に基づく多重仮説検定の差分プライバシー保証

発表者:柿崎和也・福地一斗(筑波大)・佐久間 淳(筑波大/JST)

概要: カイ二乗検定において,個人データをもとに算出された検定統計量から個人に関する機微な情報が推測される可能性がある.また,複数の仮説に対して複数の検定統計量が算出される多重仮説検定においては,個人情報推測の可能性はさらに高まる.本研究では,カイ二乗検定を幾何的解釈することによる,新しい差分プライバシーを保証する多重仮説検定手法を提案する.

T2-14:周期的境界条件を持たないガウスマルコフ確率場モデル

発表者:片上 舜・坂本浩隆・村田 伸・岡田真人(東大)

概要: 本研究では, 周期的境界条件を持たないガウスマルコフ確率場モデルを議論する. はじめに, 周期的境界条件を持たない画像の生成モデルと推定モデルを定式化し、ベイズ推論を適用することにより, 画像修復やハイパーパラメータ推定ついて議論する.つぎに, 数値実験により本研究による手法と先行研究として行われている周期的境界条件を仮定とした推定モデルの比較を行い、本枠組みの有効性について議論する.

T2-15:Wavelet木構造を用いた複数コイルMR画像のMAP推定

発表者:笠原勇布・井上真郷(早大)・富樫かおり(京大)

概要: MRIでは撮像に時間がかかるという問題がある。スパースモデリングにより少ない観測データから画像を推定することで、観測時間を減らすことができる。本研究では、複数コイルMRIデータの画像再構成法であるSENSEに、Wavelet変換が木構造の疎性を持つことを仮定する事前分布を導入したモデルをMAP推定する。従来の研究ではこの推定が近似的に行われていたが、本研究では目的関数の近似を行わずに推定をする。

T2-16:リカレント型神経回路モデルに埋め込まれた低次元アトラククターの動的モード分解による抽出

発表者:村田 伸(東大)・岡田真人(東大/理研)

概要: Dynamic Mode Decomposition (DMD) は,高次元の動力学データを少数のモードに分解する手法であり,流体力学分野で開発された手法である.分解されたモードは,空間パターンを表すDMDモードと,時間発展を支配する固有値とで表されている.本研究では,DMDをリカレント型神経回路モデルの数値計算データに適応する.DMDを用いることにより、これまで不可能であった、モデルに埋め込めれている低次元アトラククターを抽出することに成功した.

T2-17:ランダムウォークによる擬似文書を用いたトピックモデルの学習

発表者:野沢健人・若林 啓(筑波大)

概要: トピックモデルの課題として,文書に含まれる単語数が少ない文書集合においてトピックの推定が困難であることが指摘されている.確率的変分推論は文書に含まれる単語が変化しても学習可能なため,本研究では文書集合において同じトピックを共有しやすい単語を含む文書を動的に生成することでトピックの推定性能を向上する手法を提案する.

T2-18:バンディットアルゴリズムを用いたメンテナンスタイミング適正化

発表者:桐淵大貴・西川武一郎(東芝)

概要: 本発表では、バンディットアルゴリズムを用いて、装置のメンテナンス等のタイミングを適正化する手法を提案する。この問題では一回の試行により、選択したタイミングの報酬だけでなく、それより短いタイミングの報酬も分かるという包含関係がある。この問題を特殊なバンディット問題だと捉え、この入手可能な報酬情報を全て活用できるようにバンディットアルゴリズムを修正することで、装置の保守コストを削減できることを示す。

T2-19:無限層デノイジング・オートエンコーダーの輸送理論解釈

発表者:園田 翔・村田 昇(早大)

概要: デノイジング・オートエンコーダー(DAE)を輸送写像とみなすことで,DAEには入力データのエントロピーを減らしてデータを整理する逆拡散作用があることが分かった。この作用は浅いニューラルネットよりも深層ニューラルネットを用いる方が顕著である。特に無限層の場合にはDAEは厳密に拡散過程を逆に辿る輸送写像になる。DAEはディープラーニングの基本形の一つなので,輸送解釈の適用範囲は広い。

T2-20:区間データに対する経験損失最小化とそのプライバシー保護への応用

発表者:花田博幸・高田敏行・柴垣篤志・佐久間 淳・竹内一郎(名工大)

概要: プライバシーに関わる情報を含むデータを公開する際にプライバシーを保護する手段として、一部の値を例えば「32歳」から「30歳〜39歳」のような範囲にすること(匿名化)が挙げられる。本研究ではこのような値が区間で表現されるデータ(区間データ)に対し、機械学習の一手法である経験損失最小化において、学習結果が取りうる範囲を求める方法を示す。また、学習結果から値を逆算するという攻撃に対して、事前に定めた区間以上には値を絞り込めないように学習結果をぼかして(範囲として)出力する方法も示す。

T2-21:全状態探索による線形回帰のスパース変数選択

発表者:五十嵐康彦・竹中 光・中西 (大野)義典(東大)・植村 誠(広島大)・池田思朗(統計数理研)・岡田真人(東大)

概要: 本研究では,データの説明変数がスパースであると仮定して,少数の説明変数の組み合わせを網羅的に探索し,線形回帰の変数選択を行う枠組みを提案する.我々は,ベイズ情報量基準(BIC)や交差検証を用いて説明変数の数を決めるとともに、説明変数の組合せ爆発に対しては交換モンテカルロ法を用いて効率的に探索した.本手法を,大規模な実データへの適用を想定したシミュレーションデータへの適用を行うことで,その有用性を示し,最後に天文データに適用した結果について報告する.

T2-22:クラスタリング基準転移;不完全なデータセットでの転移学習

発表者:石川昌義・鈴木英明・奥出真理子・新 吉高(日立)

概要: 通信技術や計算機の技術革新により,機械の稼動状態を分析し最適な運用,保守を行うサービスが増えている.ここでは,機械の異常予兆を検知し稼働率を保障し,機械の稼動状態を正常や複数の異常に分類し,適切な運用,保守計画を提示することが行われている.異常予兆検知や稼動状態分類といったデータ分析サービスを行うには,機械の正常,異常の稼動データを事前に入手することが必要である.しかしながら,機械の故障データを様々な稼動状況下で取得することが難しいため,機械の出荷直後にはデータ分析サービスを提供することが難しいことが課題となる.このような課題に対して旧い型式や固体の稼動データを活用することを考える.しかしながら,型式毎あるいは固体毎に機械のデータ分布が異なるため,旧い型式,固体の稼動データをそのまま活用することはできない.これは旧い型式,固体を元ドメイン,新しい型式,固体を目標ドメインとして見たときに,目標ドメインのクラスが不完全な場合に行う転移学習としてみることができる.

このような問題を解決するために,我々はクラスタ基準転移(CBT)を提案する.CBTはドメイン間でクラス間の幾何的な位置関係が変化しないという仮定の下で,目標ドメインのクラスが不完全な場合においても転移を可能とする. CBTでは元ドメインの稼動データと目標ドメインの稼動データにそれぞれクラスタリングを行い,両ドメインで共通するクラスタ特徴を抽出し,転移関数を求める.本紙では数値実験によって本研究の有効性を確認した.また加えて実際に機械事例に適用した際の知見を報告する.

T2-23:音楽音響信号に対する多重音高推定と和音構造学習のための階層ベイズ音響・言語統合モデル

発表者:尾島優太・中村栄太・糸山克寿・吉井和佳(京大)

概要: 本稿では,音楽音響信号から教師なしで,音高とコードを同時推定するための手法を提案する.音楽的に不自然な音高推定結果を回避するため,スペクトログラムの生成過程を表現する音響モデルに,ピアノロールの生成過程を表現する音楽文法としての言語モデルを統合した階層ベイズモデルを提案する.

T2-24:歌声F0軌跡に対する自動採譜のための準ビート同期セグメンタルHMM

発表者:錦見 亮・中村栄太・糸山克寿・吉井和佳(京大)

概要: 本稿では楽曲の歌声(メロディ)からメロディの音符系列を推定する統計的手法を示す.手法のキーアイデアは,オンセット変動(歌声のオンセットとビート時刻とのずれ)と周波数変動(歌声の音高と楽譜の音高のずれ)の2つの変動が歌声に含まれると仮定することである.これらの変動を考慮して音符系列を推定するために,音符がビート時刻に緩く同期して変化するセグメンタル隠れマルコフモデルを提案する.

T2-25:滑らかなテンソル分解

発表者:今泉允聡(東大)・林 浩平(産総研)

概要: テンソル分解は画像解析や時系列解析などの分野で用いられているが、データが高次元になるにつれ統計的な損失が増大しやすい。これを防ぐため、時間や空間方向に滑らかさを持つデータテンソルの新しい分解法を提案する。提案手法は、テンソルが持つ一種の連続性を少数の基底関数で表現することで高次元性を回避する。本研究は、提案手法の推定誤差および近似誤差を理論的に評価し、またテンソル補完問題などに応用した際の性能を実験的に示す。

T2-26:マルチチャネル音源分離のための低ランク音源モデルとスパース重畳過程に基づくネスト型ベイズ混合・因子モデル

発表者:板倉光佑・坂東宜昭・中村栄太・糸山克寿・吉井和佳・河原達也(京大)

概要: 本稿では音源スペクトログラムの低ランク性と音源の重畳過程におけるスパース性に基づいたネスト型混合・因子モデルを用いたマルチチャネル音源分離について述べる.音源の生成過程と重畳過程はどちらも混合モデルと因子モデルを用いてモデル化できる.本稿ではそれらのモデルの組み合わせにより実現される複数の分離手法の比較を行った.

T2-27:SVM全状態探索法(ES-SVM)によるスパース変数選択

発表者:川端大貴(東大)・市川寛子(東京理科大)・五十嵐康彦(東大)・永田賢二(産総研/JST/東大)・永福智志・田村了以(富山大)・岡田真人(東大)

概要: NagataらはN個の入力変数のすべての組み合わせに対して,SVMのクロスバリデーションエラーを計算し,その分布をもとめるES-SVMを提案した.本研究では,使用する入力変数の数Kを1つから徐々に増やしながら,K毎にnCk個のES-SVMを行い,スパース変数選択する手法を提案する.つぎに,レプリカ交換モンテカルロ法によるサンプリングとマルチヒストグラム法を用いた提案法の効率的な枠組みを提案する.

T2-28:Multimodal Deep Neural Networks分析の試み 〜 モダリティ統合機構の解明に向けて 〜

発表者:本武陽一(東大総文)

概要: 近年の情報技術の急速な発展に応じて,画像やテキスト,音声といった異なるモダリティの情報を統合して文章生成などを行う機械学習機が実用化されつつある.一方で,我々のモダリティ統合メカニズムそのものに対する知見はまだ十分にあるとは言い難い.本研究の目的は,近年急速にその学習アルゴリズムが発展してきたDeep Neural Networksの内部状態の分析を通して,これを探ることである.分析の結果,モダリティの統合時には、それぞれのモダリティの空間の和集合がとられるのではなく、空間も統合されていることが示唆された.この現象の精緻な分析結果を発表する.

T2-29:A Generalized Model for Multi-dimensional Intransitivity

発表者:Jiuding Duan・Jiyi Li・Yukino Baba・Hisashi Kashima(Kyoto Univ.)

概要: Recent data-driven approach for pairwise preference modelling reveals a rational way to model the Intransitivity. Intransitivity refers to the intransitive pairwise preference that potentially forms a preference loop, which has been widely evidenced at scale. However, such multi-faced intransitivity between individuals is not easy to be captured, due to the sparsity of pairwise interactions in large communities under stochastic environment. By identifying the inherent limitation of the state-of-the-art method (Chen 2016) in multi-dimensional embeddings of intransitive preferences, we propose a generalised probabilistic model that overcomes the identified limitation and learns the predictive model more effectively. We also empirically evaluate the predictive performance of the proposed method with both synthetic dataset and real world datasets including individual preferences and social choices. We demonstrate that the proposed method significantly outperforms several competing methods.

T2-30:ツァリスエントロピーと加法的エントロピー

発表者:田中 勝(福岡大)

概要: 非加法的エントロピーであるツァリスエントロピーは,規格化のための因子を新たな座標とみなすことで,加法的エントロピーにすることができる.これは,素粒子理論で言うところのAdS/CFT対応またはホログラフィー原理に触発されたものであり,この方法についてτ-情報幾何学を用いて具体的に示す.