ポスターセッション2

テクニカル・トラック

T-17: Regularized Policy Gradients — Direct Variance Reduction in Policy Gradient Estimation —

発表者:Tingting Zhao(TUST)・Gang Niu(UTokyo)・Ning Xie(Tongji Univ)・Jucheng Yang(TUST)・Masashi Sugiyama(UTokyo)

概要:Policy gradient algorithms are widely used in reinforcement learning problems with continuous action spaces, which update the policy parameters along the steepest direction of the expected return. However, large variance of policy gradient estimation often causes instability of policy update. In this paper, we propose to suppress the variance of gradient estimation by directly employing the variance of policy gradients as a regularizer. Through experiments, we demonstrate that the proposed variance-regularization technique combined with parameter-based exploration and baseline subtraction provides more reliable policy updates than non-regularized counterparts.

T-22: Learning Structure of Partial Markov Random Field via Partitioned Ratio

発表者:Song Liu(ISM)・Taiji Suzuki(Tokyo Tech.)・Masashi Sugiyama(UTokyo)・Kenji Fukumizu(ISM)

概要:A new concept, partitioned ratio is proposed to find the partial connectivity of the Markov random field. First we argue this partitioned ratio has a profound link with the Markov properties of random variables via its factorization. Specifically, partitioned ratio may be further decomposed into Bridges, a novel subgraph structure, capturing the partial connectivity of the Markov random field, which can be roughly considered as the “link” structure between two partitions. Second, a simple one-shot optimization is illustrated to learn the sparse factorizations of partitioned ratio efficiently, regardless the Gaussianity of the joint distribution or the marginal distributions. Third, we show the sufficient conditions for the proposed algorithm recovering the correct pairwise bridge factorizations.

T-24: 比熱から見るベイズ推定における必要最小データ量

発表者:徳田 悟・永田賢二・岡田真人(東大)

概要:データのサンプル数や含まれるノイズの大きさにより,ベイズ推定の結果が質的に変わることがある.本発表では,ベイズ統計と統計物理の数理的対応と取ることで,ベイズ比熱という新たな統計量を定義し,前述の現象を説明する理論的枠組みを構築する.RBFネットワークを用いたシミュレーションを例に,ベイズ比熱の示すクロスオーバーポイントを元に,推定に必要な最小サンプル数,あるいは最小ノイズ分散が定められることを示す.

T-26: R木過程

発表者:中野允裕・武 小萌・森 稔・木村昭悟・柏野邦夫(NTT)

概要:集合の包含関係の木構造を表すR木と呼ばれるデータ構造に対し、その確率過程としての表現を与える。具体的には、行と列のサイズが無限となった行列に対する無限通りのR木を表現するような確率的生成モデルを与える。また、本発表では、このモデルを用いた関係データ解析の応用例を示す。

T-27: 少数の教師データと多クラス問題のための再帰的アンサンブル土地被覆分類

発表者:大屋 優・金盛克俊・大和田勇人(東京理科大)

概要:多くの環境問題に土地被覆情報が活用されているが,放置林などのように情報が殆ど無い,もしくは古すぎて参考にならない現状がある.しかしながら多クラスな土地被覆分類では大量の教師データを要するため,資源可能性のある放置林に対し機械的に詳細な情報を得る有効手段が欠けていた.そこで,本研究は僅かな教師データから詳細に分類可能な手法を提案した.まず時系列データを用いて正解と思われる分類結果のみを抽出する.次にそれら結果を教師データとしてアンサンブル学習を行い,教師データ集合の更新を再帰的に行っていく.本手法により1クラス1点の教師データから12クラスの分類を行ったところ,対象地の半数を教師データとした従来手法と比較して同程度な結果となった.

T-29: Weighted Semi-Binary NMFに基づく機器別消費電力推定

発表者:松本眞子・藤本 悠・林 泰弘(早大)

概要:家庭内総消費電力量から機器毎の消費電力量の内訳を把握することを目的としたWeighted Semi-Binary NMFの応用を考える.従来,このような枠組みにおいては機器の消費電力量に対して分散の均一性が仮定されることが多かったが,本稿では機器毎に消費電力量の平均,分散が異なるという特徴を考慮した行列分解に基づくアプローチを提案し,複数家庭の実測データを用いて従来手法との精度比較を行う.

T-30: 複数多様体の同時推定に基づく特徴クラスタリング

発表者:烏山昌幸(名工大)・馬見塚拓(京大)

概要:多様体学習は多次元の特徴空間に潜在的に存在する構造を捉える手法として広く利用されてきた.ただし,これまでに知られている手法は与えたデータの全ての特徴次元が共通の多様体上に存在しているという強い仮定を課している.本研究では多次元データが複数の異なる多様体から生成されているという仮定のもとで,多様体を推定するアルゴリズムの提案を行い,その挙動を解析的,実験的に検証する.

T-31: 能力テスト得点の非負行列分解

発表者:兼村厚範(産総研)・大成弘子・鹿内 学・橋本将崇(リクルートキャリア)・赤穂昭太郎(産総研)

概要:能力テストや問題設計を少ない出題数で遂行することができれば、テスト時間の短縮、出題準備の低負荷化など、受検者・出題者の双方にとって時間や金銭のコスト削減となることに加え、これまで不可能だった大量受検などへの展開可能性が広がる。本論文では、出題する問題数が少ないということを、応答パタン行列に欠測が生じていることとモデル化する。さらに、応答パタン行列を非負行列分解により基底と荷重とに分解し再構成することで、欠測値を推定する。これにより、未解答の問題があっても、テスト全体の得点や、問題設計の基準となるクロンバックのα係数が予測できることを示す。さらに、補完値のあいまいさに基づいて出題順を決定する能動学習を採用することで、効率的な出題を行う方法を提案する。

T-33: Sufficient Dimension Reduction via Direct Estimation of the Gradients of Logarithmic Conditional Densities

発表者:Hiroaki Sasaki・Voot Tangkaratt・Masashi Sugiyama(UTokyo)

概要:Sufficient dimension reduction (SDR) is a framework of supervised linear dimension reduction, and is aimed at finding a low-dimensional orthogonal projection matrix for input data such that the projected input data retains maximal information on output data. A computationally efficient approach employs gradient estimates of the conditional density of the output given input data to find an appropriate projection matrix. However, since the gradients of the conditional densities are typically estimated by a local linear smoother, it does not perform well when the input dimensionality is high. In this paper, we propose a novel estimator of the gradients of logarithmic conditional densities called the least-squares logarithmic conditional density gradients (LSLCG), which fits a gradient model directly to the true gradient without conditional density estimation under the squared loss. Thanks to the simple least-squares formulation, LSLCG gives a closed-form solution that can be computed efficiently. In addition, all the parameters can be automatically determined by cross-validation. Through experiments on a large variety of artificial and benchmark datasets, we demonstrate that the SDR method based on LSLCG outperforms existing SDR methods both in estimation accuracy and computational efficiency.

T-34: Non-Gaussian Component Analysis with Log-Density-Gradient Estimation

発表者:Hiroaki Sasaki・Gang Niu・Masashi Sugiyama(UTokyo)

概要:Non-Gaussian component analysis (NGCA) is a semi-parametric framework for unsupervised linear dimension reduction, and is aimed at identifying a subspace such that projected data follows a non-Gaussian distribution. In this paper, we propose a novel NGCA algorithm based on log-density gradient estimation. Unlike existing NGCA algorithms, the proposed algorithm efficiently identifies the subspace by using the eigenvalue decomposition without any iterative procedures. Through experiments, we demonstrate that the proposed algorithm more accurately identifies the subspace and is computationally more efficient.

T-36: 系列間隔状態ノードを有する隠れセミマルコフモデルの評価

発表者:成松宏美・笠井裕之(電通大)

概要:近年あらゆるセンシングデバイスの普及に伴い,時々刻々と変化する状況をログとして記録することができるようになってきた.しかしながら,そのデータ量が膨大であることから,必要なデータへの簡易なアクセスが困難になってきている.我々は,センシングデータの特徴である時系列の系列特徴に着目し,系列長と系列間隔を同時に考慮可能なモデリング手法を提案してきた.本稿では特に,従来から系列データモデリングとして使われていた隠れマルコフモデル(HMM)に系列長を扱えるよう拡張された隠れセミマルコフモデル(HSMM)に着目し,系列間隔状態を導入した場合のモデリング性能を評価する.

T-37: Performance degradation of AMP for Ising perceptron when the system size is small

発表者:Arise Kuriya・Toshiyuki Tanaka(Kyoto Univ.)

概要:Donohoらの提案した近似メッセージ伝搬法(AMP)は、確率伝搬法に大システム極限でのガウス近似とメッセージ数を削減するための一次近似とを適用することで導出される。 筆者らは、AMPを比較的小さなサイズの問題に適用した際の性質を、確率伝搬法との比較実験により検討し、近似による影響や性能低下の原因を調べる研究を行ってきた。本研究ではイジング・パーセプトロンの学習にAMPを適用した場合を取り上げ検討を行った。結果として、小さなサイズのイジング・パーセプトロンの学習にAMPを用いた際に見られる性能低下に対しては、一次近似が主要な因子となっており、ガウス近似の導入は問題サイズが小さな場合でもほとんど性能に影響しないことが分かった。

T-38: 準同型暗号を用いた経験損失最小化のための秘密精度保証

発表者:高田敏行・花田博幸(名工大)・佐久間 淳(筑波大)・竹内一郎(名工大)

概要:本研究では準同型暗号を利用したプライバシ保護機械学習について考える.準同型暗号は加算や乗算は容易に評価できるが,対数関数や指数関数などの非線形な関数については難しいことが知られている.そのため,ロジスティック回帰など非線形関数を含む最適化問題では近似関数を用いて評価することで最適化を可能にしている.しかし,得られる近似解と最適解には誤差が存在し,その差を実際に知ることはできない.本研究では,近似解を用いて最適解の存在範囲を保証するプロトコルを提案し,実験によりその有効性を検証する.

T-39: 分布の局所平滑化による正則化の提案

発表者:宮戸 岳・前田新一・小山雅典・中江 健・石井 信(京大)

概要:分類や回帰問題において過学習は避けられない問題である。我々は過学習を防ぐための新たな正則化法として、訓練データ点周辺の分布の滑らかさを担保する正則化項の導入を提案する。提案手法で導入される正則化項は、既存の対抗事例学習(adversarial training)において導入される正則化項と形式的に類似するが、提案法は対抗事例学習とは異なり、ラベルなしの訓練データに対しても定義され、半教師あり学習に適用可能である。提案手法をベンチマークデータセットに対して適用したところ、教師あり学習、半教師あり学習の両方で最新の手法に匹敵する性能を達成した。

T-40: ベイジアンマスキングを用いたスパース特徴選択

発表者:近藤洋平(京大)・林 浩平(NII)・前田新一(京大)

概要:線形モデルのパラメータ推定において、L2やL1といった正則化項を導入することでタスクに無関係な特徴量に対する重みを小さくできる。しかし、このような正則化項は、タスクと関係する特徴量の重みをも小さくするバイアスを生じさせる。そこで、このバイアスを抑えつつ、無関係な特徴量の重みをゼロにするために0か1の2値のマスク変数を各特徴量に導入し、その変数を情報量基準FICに基づいて推定する手法を提案する。

T-41: ガウシアンプロセスカーネル法による非線形テンソル学習およびマルチタスク学習への応用

発表者:金川平志郎・鈴木大慈(東工大)

概要:低ランクテンソル推定は複数のデータソース間の高次の関係性を学習する方法として,マルチタスク学習,推薦システム,時空間解析など様々な問題に応用されている.低ランクテンソルを推定する代表的な手法として,線形のモデルを仮定した凸最適化に基づく手法がよく用いられる.しかし,このような線形な凸最適化手法は,データに潜む非線形性の記述が難しいという実用的問題やデザインへの強凸性の仮定のような強い仮定が必要であるという理論的問題がある.本研究では,線形モデルを再生核ヒルベルト空間での問題に拡張し,特にガウシアンプロセス事前分布を用いたベイズ法に基づく手法を提案し,その収束レートを制限強凸性のような条件を仮定せずに示す.また提案手法を実データに対するマルチタスクラーニングへと適用し,既存の線形手法に比べ,高い推定精度を持つことを数値的に示す.

T-42: SENSE法とwavelet木構造の疎性を用いた複数コイルMR画像再構成法

発表者:笠原勇布・井上真郷(早大)・富樫かおり(京大)

概要:磁気共鳴画像(MRI)では撮像に時間が掛かるという問題がある。この問題を解決するために、複数コイルによる画像再構成手法や圧縮センシングを用いることで撮像時間を短縮することができる。圧縮センシングでは解の疎性を仮定するが、本研究では複数コイルの画像再構成手法であるSENSE法に画像のWavelet変換が木構造の疎性を持つことを仮定したモデルを組み合わせた手法を提案する。

T-43: Adaptive Objective Function of ICA by Gaussian Approximation in Second-Order Polynomial Feature Space

発表者:Yoshitatsu Matsuda・Kazunori Yamaguchi(Univ. of Tokyo)

概要:本論文では、元信号の分布の4次統計量(尖度)を適応的に評価可能な、独立成分分析(ICA)手法を提案した。既存のICA手法の多くは、元信号に対し、固定された尖度の事前分布を与えるため、多様な元信号が存在する場合の性能に問題があった。これに対し、事前分布の自由度を上げるというアプローチもありうるが、その場合パラメータ推定がより困難となるので、かえって性能が低下する場合があった。本研究では、信号の2次元特徴空間上でのガウス分布近似を利用し、自由度の増加を最小限に抑えつつ、多様な分布に柔軟に適応できるICA手法を構築した。

T-44: 順序回帰問題に対するL1正則化の導入

発表者:長島主尚・井上真郷(早大)

概要:近年,意味の解釈が容易になる,計算時間が短くなるといった観点から,パラメータに疎性を持たせるような学習法の研究が盛んに行われている.本発表では,順序回帰問題に対してL1正則化を導入し,最適化法としてFISTAを用いる手法を提案する.結果,速度面に改善の余地はあるものの,既存の順序回帰手法と同程度の汎化性能を保って疎な解を得ることができた.

T-46: 統一的2値判別モデルに対する効率的な加速近接勾配法

発表者:伊藤直紀・武田朗子(東大)・TOH Kim-Chuan(NUS)

概要:様々な2値判別モデルを統一的に扱うことのできるモデルに対し、高速な汎用解法を提案する。提案手法は、加速近接勾配法をもとに様々な高速化の工夫を取り入れている。数値実験ではサポートベクターマシン等を題材に、提案手法を既存解法と比較し、大規模データでの優位性を示した。

ディスカッション・トラック

D-02: 確率ブロックモデルの漸近近似にもとづくトラクタブルなベイズ推論およびモデル選択

発表者:林浩平(NII)・小西卓也(NII)・川本達郎(東工大)

概要:確率ブロックモデルの扱いやすいベイズ推論アルゴリズムを提案する.漸近近似によりパラメータ周辺化の効果が信念伝搬法においてモデル正則化項としてあらわれ,それによって計算が大変なモデル選択問題を推論問題と同時に最適化できる.実ネットワークを含むデータで実験し,提案法がモデル選択・推論の両方でよい性能を持つことを示す.

D-04: オンライン広告の実システムへのオンライン学習の適用

発表者:高木 潤(ヤフー株式会社)・田頭 幸浩(ヤフー株式会社)・野村 拓也(ヤフー株式会社)・岸本 忠士(ヤフー株式会社)・田島 玲(Yahoo! JAPAN研究所)

概要:本研究では、Yahoo! JAPANの広告配信システムへのオンライン学習の適用を通し、その際に生じる実問題ならではの課題を示すと共に、その現実的な対応策を提案する。また、実際のトラフィックを使ってのABテストにより、オンライン学習がこのような実問題に対しても有用であることを示す。

D-08: 特性関数を用いた変化要因解析・可視化

発表者:田川貴章(株式会社豊田中央研究所)・田所幸浩(株式会社豊田中央研究所)・矢入健久(東京大学)

概要:2データ間でどのような変化が生じているかを専門家でなくとも分かりやすく可視化する技術を提案する。特に従来手法と比較してパラメータ設定を要求せず、高速な計算が可能で、かつ従来手法と同等の性能を維持出来る事を示した。

D-12: Riemannian preconditioning for tensor completion

発表者:Hiroyuki Kasai(The University of Electro-Communications)・Bamdev Mishra(University of Cambridge)

概要:We propose a novel Riemannian preconditioning for the tensor completion problem with rank constraint.

D-14: 正則化経験誤差最小化問題に対する確率的分散縮小双対平均化法

発表者:村田 智也(東京工業大学大学院 情報理工学研究科 数理・計算科学専攻)・鈴木大慈(東京工業大学大学院 情報理工学研究科 数理・計算科学専攻)

概要:本発表では, 正則化経験誤差最小化問題に対する新しい確率的最適化手法として, 確率的双対平均化法に分散縮小の考えを応用した手法を提案する. そして, その理論的な収束レートを与え, 数値実験によって既存手法との比較を行い, その優位性を見る.

D-16: 半順序つき非負値行列分解を用いた交通リスクマイニング

発表者:李太斗(東京大学)・松島慎(東京大学)・山西健司(東京大学)

概要:本研究の目的は,各道路の危険度の順序付けの学習とリスクの評価指標の生成を同時に行うことである.その手法として,非負値行列分解に半順序制約を新たに加えた数理モデルを提案した.数値実験として,東京都の交通事故多発地点に関するヘテロなデータに加えて,部分的に得られた危険度の半順序を用いた結果を示す.

D-18: シミュレーションの計算過程からの結果KPI予測

発表者:原聡(IBM東京基礎研究所)・森村哲郎(IBM東京基礎研究所)・ルディー・レイモンド(JST/CREST)・牟田英正(IBM Research – Australia)

概要:渋滞を解消するための交通規制の探索など”良いシミュレーションパラメータ”を探す問題では、様々なパラメータ下でのシミュレーションを実行する必要がある。本研究ではこのような場合にシミュレーション計算時間を短縮する方法を提案する。提案法では、シミュレーションの計算途中で結果のKPI(例えば渋滞長)を予測する。予測により結果KPIが悪いとわかれば、これ以上の計算は不要と判断して計算を打ち切ることができる。

D-20: バスケット2パートモデルによる他部門医療支出データの分析

発表者:菅原慎矢(東京大学)・呉天逸(東京大学)・山西健司(東京大学)

概要:本研究は、多部門の医療サービスに対し、消費者の選択行動を分析する統計手法を提案する。提案手法は、伝統的な2パートモデルにバスケット分析による次元圧縮を加え、高次元データの分析を可能にした。さらに、バスケットごとに異なるモデルを許容することで、多部門での複雑な相互依存関係を扱いうる。応用として、アメリカ医療経済データMEPSを分析し、個人の経済状況が医療支出へ与える影響に対して精緻な示唆を得た。

D-22: CNNとMILを用いた弱教師あり領域分割

発表者:下田 和(電通大)・柳井 啓司(電通大)

概要:画像全体に対してラベルがついている学習画像のみを用いて物体領域の領域抽出を行う弱教師あり領域分割問題を扱う.CNNでの画像の認識結果をバックプロパゲーション(BP)することによって物体存在位置に関するheat mapが得られるが,本研究ではそれにsuperpixelとMultiple Instance learningを組み合わせることでより高い精度の領域分割を実現する.

D-26: 完全変数化NML符号長に基づくべイズ正準相関分析のランク推定

発表者:中村友彦(東京大学大学院情報理工学系研究科)・岩田具治(NTTコミュニケーション科学基礎研究所)・山西健司(東京大学大学院情報理工学系研究科)

概要:ベイズ正準相関分析は行列分解型のマルチタスク学習を実現する有効な方法である。本研究では、ベイズ正準相関分析において、共通部分と固有部分のランクを同時に推定する新しい手法を提案する。本手法は完全変数化を用いた正規化最尤符号長をモデル選択規準として用いるところに特長がある、人工データを用いて、本手法が従来手法を凌駕することを実験的に検証する。

D-28: Learning volatile targets via strategic truncation

発表者:Matthew J. Holland(Nara Institute of Science and Technology)・Kazushi Ikeda(Nara Institute of Science and Technology)

概要:観測データが比較的「暴れやすい」(例:sub-Gaussianでない)とき、アルゴリズム性能をめぐる保障(excess risk boundsなど)に必要な解析道具をそろえる作業と、ある種のロバスト性をもつ推定量を設計することが、多くの共通点をもつ。本研究では、この密接な関係に着目しつつ、実用性を見据えて、弱い条件の下でも一定の性能を保持するアルゴリズムの特徴づけをめざす。

D-30: 同次ダイバージェンスとその応用

発表者:竹之内高志(はこだて未来大学)・金森敬文(名古屋大学)

概要:隠れ変数を持つボルツマンマシンに代表される離散空間上の確率モデルのパラメータ推定においては, しばしば正規化項の計算のために指数オーダーの計算量が必要となる.本研究では, 同次ダイバージェンスを経験分布を用いて局所化することによって, 正規化項の計算をすることなく構成可能な推定量を提案し, その統計的性質について議論する.

D-33: セーフスクリーニングを用いた高次相互作用モデルによる分類アルゴリズム

発表者:中川和也(名古屋工業大学)・鈴村真矢(名古屋工業大学)・烏山昌幸(名古屋工業大学)・津田宏治(東京大学)・竹内一郎(名古屋工業大学)

概要:本研究では高次相互作用モデルによる分類問題を考える.ナイーブな学習法では,指数的に増加する相互作用項を取り扱うことが困難である.セーフスクリーニングを用いた以前の研究(Nakagawa et al., 2015)では,木構造を考えることで学習に不要な相互作用を高速に同定し,効率的に回帰モデルを学習する手法を提案したが,本ポスターでは分類問題においても同様のアプローチが適用できることを説明する.

D-34: 多変量自己回帰モデルを利用した脳波時系列の欠測値推定

発表者:金子拓光(東京都立産業技術高等専門学校)・兼村厚範(産業技術総合研究所)・福永修一(東京都立産業技術高等専門学校)

概要:近年広がりつつある脳波などの生体計測は,実用上は一部チャネルの値が欠測しても計測データを継続利用してサービス提供を続けられることが望ましい.そこで,同時刻を含む多変量自己回帰モデルにより実脳波データの欠測値補完を行い,単純な近傍平均法よりも補完精度が優ることを示す.

D-37: Convergence Rates of Quasi Monte Carlo Integration under Misspecified Assumptions

発表者:金川元信(総研大)・Bharath K. Sriperumbudur(Penn. State Univ)・福水健次(統数研)

概要:Quasi Monte Carlo法(QMC)は数値積分の手法であり,通常のモンテカルロ法よりも速い収束レートを達成できる.QMCでは被積分関数に一定の滑らかさを仮定して,サンプル点を決定論的に生成する.しかし,実際の被積分関数は仮定した滑らかさを持ってない可能性がある.本発表ではこの場合でもQMCは一致性を持つことを示し,その収束レートを議論する.

D-39: ランダムフォレストに基づく風力発電のランプアラート手法の検討

発表者:高橋由佳,藤本悠,林泰弘(早稲田大学,早稲田大学,早稲田大学)

概要:風力発電出力の急変(ランプ)は電力系統全体の需給バランスを崩しうる。このような変動を代替発電機の運用などによって緩和させるためには、発電出力と共にランプの適切な予測が必要となる。本稿では電力系統に接続された風力発電出力の総量を対象とし、ランダムフォレストに基づくランプイベントの予測器の近接度行列を用いた発電出力予測アプローチを提案し、その精度の比較検証結果などを報告する。

D-41: Infinite bi-clusteringのための無限Plaid Model

発表者:石黒勝彦(NTT)・佐藤一誠(東大)・中野允裕(NTT)・木村昭悟(NTT)・上田修功(NTT)

概要:Non-Exhaustive and Overlapping(NEO)バイクラスタリングはクラスタの 重複を許し、さらに関係データ行列を分割しつくす制約もない、バイクラスタリングの一般形である。本研究ではクラスタ数を無限拡張したNEOバイクラスタリング、infinite bi-clusteringを提案する。また、ノンパラメトリックベイズによる回答例を示す。

D-43: 完全変数化正規化最尤符号長に基づくCo-clustering

発表者:尾亦範泰(東京大学)・山西健司(東京大学)

概要:関係データを通じて異なる2つの集合をクラスタリングするCo-clusteringの問題を考える.多くの従来手法は、クラスタ数を事前に与える必要があった.本研究では,Co-clusteringの確率モデルに対し,一般化EMアルゴリズムを用いた最尤パラメータの推定法と,完全変数化を用いた正規化最尤符号長に基づくクラスタ数決定手法を新しく提案する.人工データと実データに対する実験でその有用性を検証する.

D-45: 正規化最大尤度(NML)を用いた変化点同定についての理論解析

発表者:宮口航平(東京大学)・山西健司(東京大学)

概要:本研究ではNMLを用いた変化点同定の枠組みについて理論的な評価を行い,対応するアルゴリズムを提案する.提案する枠組みでは,可算個の異なる統計モデル間の状態遷移を扱うことができる.単一の変化点を扱った誤り確率の評価はこれまでに複数知られているが,本研究は複数の変化点を扱いつつ誤り確率を評価した点で新しい.また提案アルゴリズムでは,オンラインの動的計画法に枝刈りを適用することで効率的な計算を実現する.

D-47: 大脳皮質モデルBESOMのクラスタ分散化とGPGPU並列化

発表者:中田秀基(産業技術総合研究所)・黎明曦(筑波大学)・井上辰彦(産業技術総合研究所)・一杉裕志(産業技術総合研究所)

概要:大脳皮質をベイジアンネットで模したモデルBESOMは、ニューラルネットワークと比較すると計算が複雑であり、並列化が一般に困難である。本発表では、モデル単位で複製し計算機クラスタに分散して実装する手法と、GPGPUによるモデル内部の並列化について述べる。

D-49: 教師生徒型強化学習のための複雑ネットワーク

発表者:石井 良(千葉大学融合科学研究科)・鬘谷 拓未(千葉大学融合科学研究科)・須鎗 弘樹(千葉大学融合科学研究科)

概要:2014年,2つのエージェントが順番に強化学習を行い,先に学習を終了したエージェントが後に学習するエージェントにアドバイスを行う「教師生徒強化学習」が提案された.この手法では,どういった状況でアドバイスを行うかが重要となる.本発表ではより良いアドバイスの方法を見つけるために,複雑ネットワークを利用したアドバイスを行う方法を提案し,その結果,既存のいずれのアドバイス方法の学習効率を超えたことを示す.

D-51: Gibbs事後分布の(ε,δ)-差分プライバシー

発表者:南賢太郎(東京大学)・荒井ひろみ(東京大学)・佐藤一誠(東京大学)・中川裕志(東京大学)

概要:差分プライバシーとは、「ランダムな統計量の分布がデータの入れ替えに対してどの程度ロバストであるか」を定義した指標であり、プライバシー保護学習の文脈で重要である。Gibbs事後分布とは、ベイズの事後分布を含むデータ依存の確率分布のクラスであり、種々の学習の問題で重要である。本発表では、Gibbs事後分布が差分プライバシーを満たすかどうかについて、測度集中の理論を用いた新しい解析方法を紹介する。

D-53: Expert advice による前立腺特異抗原の時系列予測

発表者:森野佳生(東京大学)・平田祥人(東京大学)・林典宏(高岡市民病院)・頴川晋(東京慈恵会医科大学)・合原一幸(東京大学)

概要:前立腺癌の進行度合いは前立腺特異抗原(PSA)を測定することにより調べることができるため,PSAの時系列を予測することは臨床上非常に重要な問題である.最近,我々は expert advice を拡張した手法を提案し,PSAの時系列を少数データから予測できることを示した.今回の発表では expert advice によるPSAの時系列予測研究の最近の発展について報告する.

D-55: Topic Models for Analyzing Short Text Documents with User and Time Information

発表者:今井 優作(奈良先端科学技術大学院大学)・岩田 具治(NTTコミュニケーション科学基礎研究所)・澤田 宏(NTTサービスエボリューション研究所)・山田 武士(NTTコミュニケーション科学基礎研究所)

概要:Twitterをはじめとする,投稿ユーザと投稿時間の情報をもつ短い文書データの解析のためのトピックモデルを提案する.提案法は,各ユーザのツイート集合に対して潜在トピック情報と時間情報を用いてクラスタリングを行い,同じクラスタに割り当てられたツイート集合を擬似的に1文書とする.これにより,従来のトピックモデルで短い文書データを適切に解析できない問題を改善し,より高い精度で解析可能であることを示す.

D-57: 医学・医療用疑似データセットの構築に向けて

発表者:城 真範(産総研人間情報)・赤穗 昭太郎(産総研人間情報)

概要:医療分野では個人情報を扱う都合上プライバシー保護の観点から元データの開示が困難であり研究結果の相互比較や追試が難しい。また学術目的外の教育用資料やプレゼンテーションにデータ利用はできない。こうした状況を改善するため安全に使える疑似データを作成したい。今回は数理的モデルが与えられている場合の疑似データ作成器の実装を示す。今後実データの統計情報から血液検査値等、生体諸データのモデル構築を目指す。

D-59: 差分プライバシー的最小二乗密度比推定

発表者:高林裕太(東京大学)・荒井ひろみ(東京大学)・中川裕志(東京大学)

概要:プライバシー保護において,非公開データベースに対する学習を別の公開済みデータベースで近似したいという要求がある.これに対し,確率的分類法と呼ばれる密度比推定手法に差分プライバシーを適用することで実現する手法が提案されている.一方,密度比推定自体の手法としては,より性質の良い最小二乗密度比適合法,uLSIFが既に知られている.本発表では,このuLSIFに対し差分プライバシーを適用した手法を提案する.

D-61: Tree-likeな距離空間の特徴づけ

発表者:早水桃子(総合研究大学院大学)・福水健次(統計数理研究所)

概要:N個の点からなる距離空間(X,d)がN個の頂点からなる木で表現されるための必要十分条件を発表し,最小全域木との関連性を述べる.さらに,距離空間の木らしさ(”tree-likeness”)を評価する尺度についても考察を与える.

D-63: エージェントモデルを用いた緑内障病変の時空間伝播に関する予測手法

発表者:友田恭輔(東京大学)・森野佳生(東京大学)・村田博史(東京大学)・朝岡亮(東京大学)・山西健司(東京大学)

概要:緑内障は視野が欠損する疾患であり、症状の進行を予測することは重要である。視野全体の視野欠損の時間発展を捉えるにあたって、視野上の各点間における病状伝播のし易さを推定しながら伝播を予測する必要があるが、異なる時間間隔で測定された視野データから伝播のし易さを捉えることは難しい。今回我々は、エージェントベースモデルを援用しながら、病変の時空間伝播のし易さを推定, 伝播を予測する新たなモデルを提案する。

D-65: 相互情報量の推定におけるMinimax最適推定量

発表者:福地 一斗(筑波大学)・佐久間 淳(筑波大学/JST CREST)

概要:確率変数間の独立性指標,特に相互情報量は,特徴選択,クラスタリング,公平配慮学習などにおいて広く用いられている.一方で,そのようなアルゴリズムでは,未知分布のサンプルに関する独立性指標を推定する必要がある.本研究では,相互情報量の推定問題においてminimax最適な推定法の導出を目指す.結果として,離散確率変数のminimax最適推定誤差が,$\Theta(1/n)$であることを示す.

D-67: 重み付きグラフに対するマイクロクラスタリングの拡張とオークションデータへの応用

発表者:山崎 朋哉(京都大学大学院情報学研究科)・清水 伸幸(ヤフー株式会社)・小林 隼人(ヤフー株式会社)・山内 智(ヤフー株式会社)

概要:本研究では重み付き無向グラフに対するマイクロクラスタリングを提案する.先行研究では,重みなし無向グラフに対しての高速なグラフクラスタリング手法の一つとしてマイクロクラスタリング[T.Uno+ 15]が提案されており,本研究ではその研究を重み付きグラフへ拡張する.また,オンラインオークションでのユーザー間の類似度グラフに提案手法を適用し,NMIによるクラスタの精度が先行研究よりも高いことを示した.

D-69: 非一様サブサンプルによるSGLD

発表者:横井 創磨(東京大学)・佐藤 一誠(東京大学)・中川 裕志(東京大学)

概要:大規模データの統計モデルに対して、効率的に事後分布からサンプルを得る方法としてSGLD [Welling+2011] がある。SGLDは事後確率の勾配をミニバッチで近似するが、それはデータ全体からの一様サブサンプルに限られる。本研究ではその制限をなくし一般の確率でのサブサンプルに拡張する。これにより計算機間で実データをやり取りしなくても正しい事後分布が得られ、通信・記録容量を削減できる。

D-71: 非線形テンソル学習手法の高速化とYahoo!ショッピング購買金額予測への適用

発表者:金川平志郎(東京工業大学情報理工学研究科数理・計算科学専攻)・清水伸幸(ヤフー株式会社)・小林隼人(ヤフー株式会社)・田頭幸浩(ヤフー株式会社)・鈴木大慈(東京工業大学情報理工学研究科数理・計算科学専攻)

概要:ガウス過程事前分布を用いた非線形テンソル学習法を、Yahoo!ショッピングにおけるユーザの購入金額の予測へと適用した。具体的にはある月の特定の商品カテゴリにおけるユーザの購入金額の予測をマルチタスク学習問題として設定した。学習に用いる特徴を選択し、線形手法との比較を通じてユーザの特徴のもつ非線形性を調べた。本発表ではその結果および手法の高速化について議論・検討する。

D-73: 大規模ベイジアンネットワークによるディープラーニング実用化に向けた課題の検討

発表者:佐野崇(産総研人工知能研究センター)・川田正晃(産総研人工知能研究センター)・一杉裕志(産総研人工知能研究センター)

概要:ベイジアンネットワークの大規模化は特徴抽出に必要なだけでなく、大脳皮質の模型としても有望であり、脳を模倣した機械学習へのステップになる。我々はベイジアンネットワークの推論と学習における課題を検討した。閉路を持つベイジアンネットワークは信念伝播法により時間的に効率の良い近似推論が可能である。また、近似推論結果による学習も可能である。信念伝播法による推論精度の定量的評価は今後の課題である。

D-75: 混合ガウス過程による時空間変数予測

発表者:大川 真耶(NTTサービスエボリューション研究所)・澤田 宏(NTTサービスエボリューション研究所)・上田 修功(NTTコミュニケーション科学基礎研究所)

概要:時空間変数の予測には、ガウス過程が広く用いられている。また、ガウス過程の拡張モデルとして変数の非定常性を考慮した混合ガウス過程が提案されている。しかし、従来の混合ガウス過程では線形分離可能なクラスタしか抽出できないという課題がある。本研究では、データを非線形変換した後、特徴空間上で各クラスタへの振り分けを行う新たな手法を提案した。また、提案手法を交通流予測に適用し、有効性を示した。

D-76: Stiefel多様体における連続値入力RBMの最尤推定

発表者:唐木田亮(東京大学)・岡田真人(東京大学)・甘利俊一(理研BSI)

概要:Restricted Boltzmann Machine (RBM)は深層ネットワークの構成要素として広く使われるモデルである. しかし, RBMの最尤推定は多数回のサンプリングが必要となり計算時間の観点から実用が難しい. 本発表では, 連続値入力を持つRBMにおいてパラメータ空間をStiefel多様体上に制限すれば, サンプリングせずに最尤勾配およびモデル尤度が解析的に計算できることを示す.

D-77: A classification method based on nested normal mixture models with cancer outlier profile analysis

発表者:Kota Matsui(Nagoya University)・Tomonori Oura(Asia Pacific Statistical Science, Medicines Development Unit Japan, Eli Lill y Japan K.K.)・Shigeyuki Matsui(Nagoya University)

概要:本研究では, 癌の異質性 (正常遺伝子に対して高 (低) 発現をしている癌関連遺伝子が, 癌の種類によって異なること) を考慮に入れた, 入れ子構造を持つ正規混合モデルに基づく癌の判別法を提案する. 提案法は, 各症例がある癌関連遺伝子のプロファイルを持つ事後確率を推定し, これに基づいて癌か健常かを判別する手法である. 数値実験において, 既存の判別方法に対する有効性を示す.

D-79: ロバストな多ドメインマッチング相関分析の提案と画像認識への応用

発表者:奥野彰文(大阪大学大学院基礎工学研究科)・下平英寿(大阪大学大学院基礎工学研究科)

概要:多ドメインマッチング相関分析(CDMCA)を用いれば,一対一対応ではなく多対多の対応がついたデータについても,CCA likeな分析を行うことができる.ところが現実のデータではしばしばデータ間に誤まった対応付けが混入し,分析の精度が下がる.本発表ではこれらの誤った対応付けにロバストなCDMCAを提案し,数値実験の結果と共に,Flickr画像とタグからなる実データに適用した結果を紹介する.

D-81: 逆強化学習の枠組みを用いた未知状況下の移動予測に関する検討

発表者:幸島匡宏(NTT)・松林達史(NTT)・澤田宏(NTT)

概要:今後起こり得る自然災害や大規模イベントに伴う交通規制などの未知の状況下における人の移動を予測するという問題を考察する.本発表では,(i)逆強化学習の枠組みに基づく人個人のもつ内部のパラメタ(報酬関数)と周囲の環境に関するパラメタ(遷移関数)によって人の移動が決定すると仮定したモデルの推定と,(ii)交通規制情報などの環境情報の統合により,未知状況下の予測を行う手法の検討案について紹介する.

D-82: ディープラーニングによるdetectionの一手法

発表者:疋田聡(株式会社リコー)

概要:ディープラーニング技術は近年さまざま分野に応用されて高い性能を出しており、画像からのオブジェクトのdetectionにも応用されている。本発表では、ディープラーニングによるdetectionの一手法として、ニューラルネットワークによって抽出された内部表現を利用してオブジェクトの候補領域を生成する手法を紹介する。

D-85: 光干渉断層計による網膜層厚からの緑内障患者の視野推定

発表者:上坂俊允(東京大学)・森野佳生(東京大学)・村田博史(東京大学)・朝岡亮(東京大学)・山西健司(東京大学)

概要:効果的な緑内障治療の為に重要である視野中心10度内の計測は,臨床現場への負担が大きい.そこで視野を直接計測するよりも簡便な光干渉断層計(OCT)による網膜層厚の計測から視野を推定する手法が有用と考えられる.本発表では潜在変数を用いて網膜層厚を視野感度に変換するモデルとその学習手法を提案する.提案手法では教師なしデータから潜在変数を決定できる為,少ないOCT-視野データ対からの学習が可能となる.

D-87: 分散表現に基づく劣モジュラ最適化を用いた文書要約

発表者:小林隼人(ヤフー株式会社)・野口正樹(ヤフー株式会社)・谷塚太一(ヤフー株式会社)

概要:本研究では,文書要約タスクを劣モジュラ最適化問題として定式化し,分散表現に基づく目的関数の提案を行う.提案する目的関数は,文書を分散表現の点分布として表し,元文書と要約の非類似度を各点間の最近傍距離の和により算出する.我々は,この目的関数の単調劣モジュラ性を証明し,KL情報量やEarth Mover’s Distanceとの関連を示した.また,実データを用いた実験により提案手法の優位性を確認した.

D-89: 再帰的紛失通信の提案と秘匿ゲノム検索への応用

発表者:清水佳奈(AIST, MSKCC)・縫田光司(AIST, JST)・Gunnar Raetsch(MSKCC)

概要:(Positional) Burrows-Wheeler Transferなどの離散データ構造と紛失通信と呼ばれる暗号技術を組み合わせた秘匿ゲノム検索の手法を提案する.従来手法では,クエリの長さに対して指数関数的な計算量が必要であったが,提案手法では線形の計算量で部分/最長文字列の一致を検索可能.SNPデータベースにおける実験結果を示す.様々な離散データ構造への応用についても議論したい.

D-91: システム同定に基づくクアッドコプタの飛行制御

発表者:江藤 力(日本電気)・鈴木 貴之(NEC航空宇宙システム)・亀田 義男(日本電気)

概要:ここではクアッドコプタの飛行制御にシステム同定を適用することを考える.クアッドコプタの運動方程式は非線形であり、平衡点まわりで線形近似できるできることはよく知られている.しかし、システム同定でデータから直接、線形モデルを構築する際には試行錯誤が必要である.本発表では、そのような試行錯誤の一例を紹介する.

D-93: 動的シナプスを導入したリカレントニューラルネットワークを用いた時系列処理

発表者:森 竜太(東京大学情報理工学系研究科)・香取 勇一(公立はこだて未来大学,東京大学生産技術研究所)・合原 一幸(東京大学生産技術研究所)

概要:本研究では動的シナプスを導入したリカレントニューラルネットワークを用いた時系列処理を提案する。動的シナプスを導入したモデルでは従来のモデルに比べて基礎的性能が向上した。これは、動的シナプスの性質が過去の神経活動のタイミングを検出するのに適しているためと考えられる。学習後の中間層ニューロンでは動的シナプスの性質を利用した神経活動伝搬も見られ、この様な現象は生体にも存在している可能性がある。

D-95: Deep Neural Networksの内部構造の解析とその応用

発表者:本武陽一(東京大学大学院総合文化研究科)・池上高志(東京大学大学院総合文化研究科)

概要:各種deep learningアルゴリズムで学習済みのdeep neural networksを解析することで,Bengio等が提唱している「機械学習における多様体仮説」が成立するかを検証した.さらに,解析手法を応用し,高次元力学系データを学習したdeep neural networksから,その縮約構造を抽出することを試みた.

D-97: 深層強化学習によるロボット制御

発表者:松元叡一(株式会社Preferred Networks)

概要:深層学習と強化学習を組み合わせることで、ゲームAIやロボットの運動制御において、入力情報を画像のような高次元のデータにすることができるようになった。本発表では深層強化学習をカリキュラム学習で効率化し、シミュレーションだけでなく、実機のロボット制御に応用した事例を発表する。