テクニカル・トラック1日目

ポスタープレビュー

T1-1:質的産業連関表の中心性尺度の頑健性 〜 RAS法を使ったシミュレーションによる確認 〜

発表者:田村 肇(筑波大)

概要: 産業連関表の質的化を行う場合、中心性の尺度によっては、粗視化の度合いによる頑健性が保証されないことは、実際のデータですでに確認してきた。今回は、これらの結果を踏まえて、シミュレーションによって多数の産業連関表を生成し、これらのデータを用いて中心性の頑健性の確認を行う。
産業連関表の生成においては、RAS法を用いることにする。

T1-2:半導体露光装置における構造変化検知

発表者:大坪洋介(ニコン)・杉山 将(理研/東大)

概要: 半導体露光装置は,半導体デバイス回路のパターンをウェハと呼ばれるシリコン板に焼き付ける装置である.安定してナノメートルオーダーの露光精度を実現するためには,環境の変化に敏感に反応する各部の状態を正確に把握する必要がある.本研究では,露光装置から得られたデータを用いて,密度比推定に基づく直接的構造変化検知手法を適用し,機械的な構造と合致する変化検知結果が得られることを示す.

T1-3:混合ガウス分布を用いたサンプルクラスタリングに基づく方策探索

発表者:矢野泰樹・前田新一(京大)

概要: EM-based Policy Hyper Parameter Exploration (EPHE)(Wang et al., 2016)は、

ステップサイズの設定が不要なEMアルゴリズム型の方策改善と決定論的な方策のもとで確率的に探索を行うことのできるPolicy Gradient Parameter Exploration (PGPE)の両方を実現した手法である。PGPEやEPHEにおけるパラメータ探索に用いられる分布は、ガウス分布とされることが多かったが、我々はこの分布に混合ガウス分布を用いることを提案する。これによって、EPHEの実装において恣意的に決定されていたサンプル集団を自動的に決定することを可能とした。

T1-4:主成分分析を用いた教師なし学習による変数選択法のバイオインフォマティクスへの応用

発表者:田口善弘(中大)

概要: 我々は主成分分析を用いた教師なし学習による変数選択を提案し、広範なバイオインフォマティクスの問題に適応してきた。今回はそれらについて説明を行う。

T1-5:交差検証法による圧縮センシングの成否判定

発表者:中西(大野) 義典・福島孝治(東大)

概要: 圧縮センシングでは,データ量がある閾値より多ければ,原信号の推定に成功することが知られている.しかし,原信号やそのスパース度合いを知らずにデータ量の閾値を知ることはできない.したがって,実際取り扱うデータが閾値を超えているかを知ることは難しい.本研究では,交差検証誤差の統計力学的解析を通じて,交差検証を用いて圧縮センシングの成否を判定する手法を提案する.

T1-6:等価性構造探索を効率化するための局所生起分布の性質調査

発表者:潮 旭(慶大)・高橋良暢(電通大)・佐藤聖也(産総研)・山川 宏(ドワンゴAIラボ)

概要: 等価性構造抽出技術は、特定の次元数(D)の部分空間において局所時間内に生じる多様なパターンに着目し、パターンの出現が類似する部分空間の集合を抽出するが、膨大なD次元部分空間のペアに対応した類似度の計算が高コストとなる課題がある。本稿では、全ての等価なD次元部分空間のペアを得るには、同一の局所生起分布(局所的時間で取り出した多変量データの各要素の生起分布)を含むD次元の部分空間内で全ペアを比較すれば十分であることを示す。その上で計算コストを削減するため、頻出する局所正規分布のパターン数が少なくなる入力データの性質を調査して分析した。

T1-7:Robust supervised learning under dataset shift uncertainty

発表者:Weihua Hu・Issei Sato(UTokyo)・Masashi Sugiyama(RIKEN/UTokyo)

概要: When machine learning is deployed in the real world, its performance can be significantly undermined because test data may well follow a different distribution from training data. To build a reliable machine learning system in such a scenario, we propose a supervised learning framework that is explicitly robust to the uncertainty in dataset shift. More specifically, we introduce an adversary that shifts a test distribution from a training distribution within some f-divergence, and our learning objective is to minimize a loss function for the worst-case test distribution. We show efficient optimization algorithms as well as effectiveness of our approach on real world datasets.

T1-8:深層学習によるWavelet解析画像を用いた楽器音の識別

発表者:江口 脩・田中 勝・藤木 淳(福岡大)・栗田多喜夫(広島大)

概要: 音楽情報処理において,楽曲解析をするために楽器音の計算機による解析は重要な研究課題である.楽曲は正の値により重みづけをされた複数の楽音の足し合わせにより構成されると考えることが出来る.楽曲中の楽音の解析は,楽器音辞書を用いて楽曲の非負値分解により実現できる.その際,楽器音辞書を楽音のどのような特徴量に従って作成するかが重要となる.本研究では楽器音のWavelet解析による結果を可視化した画像データを特徴量とし,機械学習による画像認識を行う.まず,楽器音をWavelet解析し,縦軸をウェーブレット係数,横軸を時間として可視化した画像データを特徴量として用いる.これを入力として深層学習のツールであるChainerで実装されたImagenetを用いて学習を行う.このようなシステムで,フルート,オーボエ,ファゴットの3種類の楽器で作成した楽器の単音と2和音を対象とした実験を行い本手法の有効性を確認した.

T1-10:英日機械翻訳のための畳み込みニューラルネットワークによる文表現生成モデル

発表者:茶谷 慎・山根 智・櫻井孝平(金沢大)

概要: 機械翻訳というタスクにおいて、翻訳対象の言語の語順は重要な要素の一つであり、語順が異なる英語と日本語の間の機械翻訳を行うのは困難であるとされている。そこで本研究では、入力される文章からその文章の表現ベクトルを生成する、畳み込みニューラルネットワークを用いたモデルを検討し、生成された文表現ベクトルによる翻訳結果と既存の翻訳手法の結果の精度を比較し、精度が向上できるかを検証する。

T1-11:正規分布とハイゼンベルグ群 〜 情報幾何的視点から 〜

発表者:時松 照・田中 勝(福岡大)

概要: 実5次元空間の点(θ^1, θ^2 , η _1 , η_2 , ψ)で考える.そこにダルブー座標系を局所的に入れる時,接触1形式λを標準系で定義することができる.

この接触1形式に双対な接ベクトルとしてレーブベクトル場ξを考えると,λ(ξ) = 1である.この時λのカーネルを考える.λのカーネルの基底ベクトルとレーブベクトル場は互いに1次独立なので対象としている実5次元空間の基底ベクトルとして見ることができる.これらの接ベクトルの交換関係を調べると,2次のハイゼンベルグ代数になっていることがわかるので,2次のハイゼンベルグ群を5次元空間の座標を用いて考えることができる.2次のハイゼンベルグ群のある元の逆元を考えるとルジャンドル変換を連想させる項を0にする必要があることがわかる.この時,ψがθに依存すると考えると,λ=0と置くことでルジャンドル変換そのものが得られる.従って情報幾何をλ=0の超平面上で考えることができることになる.ここでは,正規分布を用いて具体的にこれらのことがどのように現れるのかを示し,静的な情報幾何に動的な時間変数を導入することを試みる.

T1-12:オンライン型異種混合機械学習による時系列データ解析

発表者:池原徹也(金沢大)

概要: データの利活用に注目が集まりデータ分析を効率よく行う手法が近年提案されており, なかでもリアルタイムなデータ分析への需要が高まっている。本研究ではデータに複数の異なる規則性が混在した状態である異種混合性をもつ時系列データを対象として, 異種混合機械学習における変分ベイズ法で用いられていたVB-EMアルゴリズムに対し, オンライン型EMアルゴリズムを適用することでオンライン学習手法でのデータ分析を行うことを提案する。

T1-14:複数正則化項を含む目的関数のための加速勾配法

発表者:中里佳央・福地一斗・佐久間 淳(筑波大)

概要: 我々は微分可能な凸関数と微分不可能な複数の凸関数からなる目的関数を最適化する手法を提案し,解析し,実験を行う.

既存の加速法を複数正則化項を含む目的関数に適用した際,最適解に収束しない.このような問題に対して,ある条件のもとで加速法で用いられるステップサイズを変更することで最適解に収束する改善案を提案する.

また,提案する改善案が既存の手法より収束速度や最適解に収束するという点で優れていることを示す.

T1-15:マルチタスクグレンジャー因果推定のための大域的疎構造を維持する加法的モデル分解

発表者:安部斉志・佐久間 淳(筑波大)

概要: 本稿の目的は,マルチタスク学習によって時系列データのグレンジャー因果を推定することである.我々は,マルチタスク学習において加法的モデル分解を用いることで,タスクに共通した構造と特有の構造を同時に推定する.この加法的モデル分解によって,スパース解においてより多くのグレンジャー因果を発見できる.従来の加法モデルでは,大域的疎構造を保持できないため,得られたグレンジャー因果を解釈できない.乗算モデルは,大域的疎構造を保持することができるが,スパース解でグレンジャー因果を発見しにくい.提案する目的関数は,従来の加法モデルの問題を解消し,乗算モデルよりも優れたグレンジャー因果推定を実現する.

T1-16:メッセージ伝播型アルゴリズムによる近似MAP推定の大規模化の検討

発表者:佐野 崇・一杉裕志(産総研)

概要: 確率模型における最大事後確率(MAP)推定問題は、一般にNP困難である。近似的なMAP推定手法として、max-product belief propagationに代表されるメッセージ伝播型アルゴリズムがある。これらのアルゴリズムは実装が簡単で分散処理に適しているという利点があり、多くの模型で効率的な近似推定が可能である。しかし、メッセージ伝播型アルゴリズムがどのような模型に対して有効かは、数学的にも経験的にも未だ研究の途上である。我々は、文字認識ができる程度の大規模な確率模型への適用を目指して、数種のメッセージ伝播アルゴリズムの模型の大きさに対する振る舞いを調べた。

T1-17:アンサンブル学習を用いたMR画像再構成

発表者:笠原勇布・井上真郷(早大)・富樫かおり(京大)

概要: MRIでは撮像時間を短縮するために、少数のサンプリングデータからの画像再構成手法が多数提案されている。しかしながら、画像再構成手法はサンプリングされたデータにより得意不得意が存在する。この問題に対し、数種の画像再構成法のアンサンブルにより画像の推定をする。

T1-18:高次元分類問題のためのSelective Inference

発表者:梅津佑太・中川和也(名工大)・津田宏治(東大)・竹内一郎(名工大)

概要: Lee et al (2016)によって提案されたSelective Inferenceは近年のデータ解析において多くの注目を集めている. 彼らの結果は非常にリーズナブルなものではあるが, ノイズの正規性に大きく依存しており線形回帰モデル以外のモデルへの拡張が困難であった. そこで我々は, 高次元大標本理論に基づき, Lee et al (2016)の結果を分類問題に拡張することを試みる. また, 数値実験を通して, 提案手法の有用性を確認する.

T1-19:Weight Normalizationによる高速なオンライン学習の統計力学的解析

発表者:吉田雄紀・唐木田 亮・岡田真人(東大)・甘利俊一(理研)

概要: ニューラルネットワークの結合加重を動径長と方向ベクトルに分解して勾配法で学習するweight normalizationと呼ばれる手法がSalimans & Kingma (2016) にて提唱され,画像認識タスクや強化学習タスクにおいて従来よりも高速な学習を実現している.しかしその理論的根拠は不明である.本研究では,weight normalizationを統計力学的視点で解析可能な形で定式化し,その学習速度に関して議論する.

T1-20:多次元マルチヒストグラム法による古典スピンモデル推定

発表者:竹中 光(東大)・永田賢二(東大/産総研/JST)・溝川貴司(早大)・岡田真人(東大/理研)

概要: 本研究では,磁性体における電子状態のエネルギーと近接スピン構造を同時に含んだ状態密度を多次元マルチヒストグラム法で再構成することにより,ベイズ推論に基づく古典スピンモデル推定を効率的に行う手法を提案した.本手法を三角格子系の電子状態計算データに適用し,サンプリングに交換モンテカルロ法を用いた結果,全状態数の10分の1以下のサンプリングだけを用いて,全状態を用いたモデル選択の結果を正確に再現できた.

T1-21:疎な事前分布での変分ベイズ法を用いた行列補完問題の近似的解法

発表者:川澄亮太・竹田晃人(茨城大)

概要: 部分的に観測行列された行列を補完する問題について変分ベイズ法による定式化を試みる。本研究では、観測行列が低ランクの行列積で表されかつ行列積の片側の行列が疎であると仮定した場合に、補完された行列の解析的表現の導出を変分ベイズ法により試み、得られた結果と数値実験の結果との比較を行う。

T1-22:Policy Search with High-dimensional Context Variables

発表者:Voot Tangkaratt(The Univ. of Tokyo)・Herke van Hoof・Simone Parisi・Gerhard Neumann・Jan Peters(Technical Univ. of Darmstadt)・Masashi Sugiyama(The Univ. of Tokyo)

概要: Direct contextual policy search methods learn to improve policy parameters and simultaneously generalize these parameters to different context or task variables. However, learning from high-dimensional context variables, such as camera images, is still a prominent problem in many real-world tasks. A naive application of unsupervised dimensionality reduction techniques to the context variables, such as principal component analysis, is insufficient as task-relevant input might be ignored. In this paper, we propose a contextual policy search method in the model-based relative entropy stochastic search (MORE) framework.The MORE framework requires to learn a reward model which is, in the contextual case, quadratic in the policy parameters and the context variables. We perform supervised linear dimensionality reduction on the context variables by learning a low-rank matrix for the quadratic model. Such a low-rank matrix of model parameters can be learned efficiently using nuclear norm regularization. The experimental results show that the proposed method outperforms naive dimensionality reduction via principal component analysis and a state of the art contextual policy search method.

T1-23:Efficient learning of ranking model using belief propagation

発表者:Arise Kuriya・Toshiyuki Tanaka(Kyoto Univ.)

概要: ランキングを出力とするような統計モデルは盛んに研究されており、二部グラフのマッチング問題とも関連がある。ランキングモデルをデータから学習するということもよく議論されている。Pettersonらによって提案された指数分布族型のランキングモデルでは、学習をMAP推定の枠組みで行う。提案されたモデルでは分配関数の計算が行列のパーマネントを求めることに相当し、その計算を各学習ステップごとに行う必要がある。しかしパーマネントを厳密に計算するアルゴリズムは指数時間であるため、問題のサイズが大きな場合には何らかの近似手法を用いる必要がある。パーマネントの計算に関して近年、高速な近似手法として確率伝搬法を用いたものが提案されている。本研究では、確率伝搬法を用いることでPettersonらのランキングモデルの学習の高速化を行う手法を提案する。さらに、学習の各ステップにおける確率伝搬法のメッセージの収束結果を、次の学習ステップにおける確率伝搬法のメッセージの初期値に用いることで学習のさらなる高速化を目指す。

T1-24:変分ベイズ法を用いた混合区分線形モデルによる車両の車間-速度特性の推定

発表者:中村文士・渡辺澄夫(東工大)

概要: 車の流れを解析することは、渋滞などの交通現象の解明や都市交通シミュレーションの開発において重要である。近年、交通流データからセルオートマトンの交通流モデルを推定する方法が提案されており、車間距離と速度の関係などを推定することが可能となった。しかしながら、セルオートマトンを用いた推定方法は、離散化した交通流データを扱う方法であり、離散化する前のデータを扱う推定は行われてこなかった。そこで、本論文では、連続的なデータの車間距離と速度の関係を混合区分線形モデルを用いて、変分ベイズ法により推定を行い、セルオートマトンのモデルを用いた場合の推定結果との違いを考察する。

T1-25:Machine learning approach to glottal closure instant estimation from speech signals

発表者:Akihiro Iohara・Toshiyuki Tanaka(Kyoto Univ.)

概要: Glottal closure instants (GCIs), defined as the instants of the vocal fold closure in voiced speech, provide important information about behaviors of the vocal fold. In this study, unlike existing methods for GCI estimation, which are based on audio signal processing, we formulate the GCI estimation problem as a binary classification problem and propose a machine learning approach to it. We adopt support vector machine (SVM) for GCI estimation, in which we utilize distances of data points to the separating hyperplane in selecting the best GCI candidate among positively classified data points typically appearing consecutively in time. In addition, we select GCIs from a set of GCI candidates, obtained from SVM classifier, so that there is only one GCI in each of the prediction interval obtained from the mean-based signal of speech signal. The proposed method is shown to outperform existing methods based on signal processing.

T1-26:ネットワークにおける重複を許すコミュニティ抽出アルゴリズムの提案

発表者:森 清貴・西野兼治・手塚宏史・稲葉真理(東大)

概要: 現在のグラフにおけるコミュニティ抽出手法の多くは,各頂点が唯一のコミュニティに属するという仮定を置いている.この仮定は現実のデータにおいて即さないことも多く,頂点が複数のコミュニティに属することを許す手法が研究されつつある.しかし,現状では大規模グラフにおいて実用的な時間での運用が困難である.そこで本研究では,重複を考慮したより高速なコミュニティ抽出法を提案する.提案手法は従来手法と比べ,やや精度は低下するが高速に実行できるということが示された.

T1-28:ガウス過程に基づく粒界カスプ構造の確率的探索

発表者:烏山昌幸・田村友幸・小林 亮・竹内一郎・中山将伸(名工大/物質・材料研究機構/JST)

概要: 材料科学において結晶粒界と呼ばれる結晶同士の作る境界面の解析は電池材料開発など様々な場面で必要とされる.しかし,可能な粒界のパターンは大量に考えられるためシミュレーション計算などで網羅的に調べることは難しい.本稿では,カスプと呼ばれる粒界の安定エネルギーが示す特徴的な傾向について,ガウス過程を用いて効率的に調べるための方法を提案する.

T1-29:音楽音響信号解析のためのディリクレ過程に基づくベイズ潜在成分分析

発表者:吉井和佳・中村栄太・糸山克寿(京大)・後藤真孝(産総研)

概要: 混合モデルである確率的潜在成分分析をディリクレ過程を用いて拡張することにより、周辺化ギブスサンプリングを用いて音源数を推定しながら高精度な音源分離が可能になることを示す。また、因子モデルであるガンマ過程あるいはベータ過程に基づく非負値行列因子分解との違いを明らかにする。

T1-30:組み合わせ論的拘束を持つ確率過程の構成

発表者:中野允裕・渡邊千紘・木村昭悟・平松 薫(NTT)

概要: ノンパラメトリックベイズと呼ばれる機械学習技術において確率過程はモデル構成のための重要な役割を果たす。従来、中華料理店過程、モンドリアン過程、長方形分割過程など少数の例において組み合わせ論的な拘束を持つ確率過程の構成に成功してきたが、これらは発見法的な巧妙な方法によって初めて実現できた。本稿ではより一般の拘束に対して広く適用可能な新しい無限拡張定理を提案する。

T1-31:階層化クラスタリングを用いた深層アンサンブル学習の最適化法

発表者:香田夏輝・渡邊澄夫(東工大)

概要: 同じデータを用いて得られた異なる学習機械の重ね合わせにより汎化誤差を小さくする予測を行う方法はアンサンブル学習と呼ばれている。深層学習においてはパラメータの初期値によって学習の結果が異なるが、このことを利用してアンサンブル学習を行う場合には、非常に多くの局所最適化パラメータを用いた推論を重ね合わせる必要があった。本研究では、局所最適パラメータの集合に階層化クラスタリングを適用することで実質的に異なるパラメータを選び出すことにより、少ない個数の推論の重ね合わせで高精度なアンサンブル学習を実現する方法を提案し、その有効性を人工データと実データを用いて明らかにする。