ディスカッション・トラック1日目

ポスタープレビュー(D1-1 〜D1-30)

ポスタープレビュー(D1-31 〜)

概要集

D1-1: 大量生産品の組立工程におけるカメラ画像を用いた作業異常動線クラスタリング

発表者:木村隆介(㈱日立製作所 生産システム研究部),松井貴元(㈱日立製作所 生産システム研究部),今沢慶(㈱日立製作所 生産システム研究部)

概要:工場内の人手組立作業を対象に,生産性低下の要因特定を目的とし,カメラ画像用いて作業異常をクラスタリングするシステムを開発している。本研究ではクラスタリングの特徴量に組立作業者の動線間の距離行列を用いているが,異なる動線長や動線に挿入・欠損があっても距離最小となり,異なる作業異常が同クラスとなる問題がある。そこで,作業時間と作業エリア毎の出現頻度を特徴量に加え,クラスタリングする手法を開発した。

D1-2: 非負値行列分解を用いたWeb 上の行動パタン解析

発表者:出町彰啓(東京大学大学院情報理工学系研究科),松島慎(東京大学大学院情報理工学系研究科),山西健司(東京大学大学院情報理工学系研究科)

概要:Web が人々の生活に欠かせないものとなった今日,Webのアクセス履歴データを解析することは人々の嗜好や流行を知る上で重要である.本研究では,クラスタリング手法として近年注目されている非負値行列分解にスパース制約を加えた新たなアルゴリズムを提案し,Web行動における有意な特徴パターンの抽出,ユーザーのソフトクラスタリング及びWeb行動と実際の購買行動の関連性の評価を行った.

D1-3: 三次元確率セルオートマトンによるドローン交通流モデル

発表者:山崎啓介(産業技術総合研究所人工知能センター),柳澤大地(東京大学先端科学技術研究センター)

概要:交通流のモデルの1つとして確率セルオートマトンが知られており、渋滞現象の解析や交通シミュレータに利用されている。これらのモデルは道路をセルで表現するため、多くの場合2次元以下のセルオートマトンになる。本研究では交通流セルオートマトンモデルを3次元に拡張し、ドローンなど空間を移動する物体の渋滞をモデル化する。そして、渋滞現象からパラメータ推定やクラスタリングを行った結果を紹介する。

D1-4: Saliency Mapを用いたCNNブレーキシーン判別器の解析

発表者:嶋田達之介(早稲田大学), 園田翔( 早稲田大学), 村田昇( 早稲田大学), 加藤真平( 東京大学)

概要:運転中の画像(運転シーン)を入力し, 出力としてブレーキを踏んでいるか否かを判別するCNNを学習し、その解析をSaliency Mapを用いて行う。解析結果からCNNがうまく学習できていることの確認やネットワークの構造等ハイパーパラメタのチューニングを行う。

D1-5: 勾配情報を用いたベイズ最適化手法に基づく構造最適化

発表者:本多淳也(東京大学),世古敦人(京都大学)

概要:与えた原子組成に対してポテンシャルを最小化する結晶構造を決定する問題は材料科学における主要な問題の一つであり構造最適化とよばれる.ポテンシャルは局所解を大量にもち,また1回の計算に大きな時間がかかるため,本研究ではこれをベイズ最適化の枠組みで行う.ここで構造最適化では力という形で目的関数の微分情報が安価に求まるため,これらの微分情報を用いることによりどの程度最適化が高速化されるかについて検討する.

D1-6: VAEとGANを活用したファッションアイテムの特徴抽出と検索システムへの応用

発表者:後藤亮介(株式会社VASILY),中村拓磨(株式会社VASILY)

概要:本研究では,画像と属性情報をクエリとする新しいファッションアイテム検索システムを提案する.ファッションアイテムは視覚的な情報を要素とする高次元データであるため,既存のキーワード検索で目的のアイテムを探すことが困難である.そこで,画像と属性情報を入力とする生成モデルを用いて潜在ベクトルを抽出し,検索に利用することで感覚的な表現を検索結果に反映するシステムを実現した.

D1-7: 混合確率的動的モード分解

発表者:武石直也(東京大学)

概要:動的モード分解(Dynamic mode decomposition, DMD)は、非線形動的システムの観測関数に作用する線形無限次元作用素のスペクトルを有限のデータによって近似する手法として注目されている。通常のDMDは作用素の固有関数を一次近似するが、一般にこの近似は状態空間中の限られた領域でしか有効でない。そこで本研究では、DMDを混合モデルに拡張することでその適用可能性を高める。

D1-8: Heterogeneous Transfer Learning Based on Sparse Coding

発表者:松井孝太(名古屋大学), 熊谷亘( 神奈川大学), 金森敬文( 名古屋大学)

概要:本研究では不均一なドメイン間の転移学習を考える.この問題は,ソースドメインで獲得した知見を,異なる特徴空間を持つターゲットドメインのタスクに転用することが目的である.提案手法では,ソースドメインのデータとターゲットドメインのデータを共通空間に射影し,共通空間における辞書学習によってスパース表現を獲得する.この際,提案アルゴリズムでは射影と辞書の同時に学習することができる.

D1-9: 集計データに基づく人流グラフ推定技術の検討

発表者:田中佑典(NTTサービスエボリューション研究所),岩田具治(NTTコミュニケーション科学基礎研究所),倉島健(NTTサービスエボリューション研究所),戸田浩之(NTTサービスエボリューション研究所),上田修功(NTTコミュニケーション科学基礎研究所)

概要:人間の位置情報履歴はプライバシー保護の観点から個人を追跡できないよう集計化されて提供されることがある.また現実問題として,十分な数の観測点を想定できない状況が考えられる.この様な状況において,集計データに基づく高精度な人流推定の実現を目指す.観測点間のつながりをグラフで表現し,グラフ上の人の流れを確率モデルによりモデル化する.観測点間の移動時間を組み込むことで,上記の状況においても適用可能とした.

D1-10: Support Transfer Machines

発表者:Song Liu(The Institute of Statistical Mathematics (ISM))

概要:We propose a regression method that “transfers” the error margin (i.e., the support) from one predicting task to another. It allows the efficient use of samples to reuse knowledge between tasks.

D1-11: 隠れセミマルコフモデルを用いた複数系列の重複状態考慮手法の提案

発表者:成松宏美(電気通信大学),笠井裕之(電気通信大学)

概要:隠れセミマルコフモデル(HSMM)を用いて複数系列の入力をモデル化可能な拡張手法を提案する.従来のHSMMでは,1つの系列から1つのモデルを生成するが,近年のセンシング技術の発展等により,複数の系列で1つの意味を持つグループを構成することも起こりうる.複数系列を扱う上で生じる,意味のある要素の同時刻での重なりを1つのモデルで表現することを目的として,重複状態を考慮可能なHSMM拡張手法を提案する.

D1-12: 2段階転移学習を用いたDCNNによるびまん性肺疾患の識別

発表者:鈴木 藍雅(電気通信大学 情報理工学部), 鈴木 聡志( 電気通信大学 情報理工学研究科), 木戸 尚治( 山口大学 創成科学研究科), 庄野 逸( 電気通信大学 情報理工学研究科)

概要:肺疾患の早期発見にはX線CTによる診断が有効であるが, パターン認識による診断支援を行う場合, 用意できる教師データの少なさが問題となる. 本研究では2段階転移学習に基づき,畳み込みニューラルネット(DCNN)を学習し,肺X線CT画像から病変ごとの識別を行う手法を提案する. 実験では自然画像・テクスチャ画像を用いた事前学習により,DCNNがより適切な特徴を抽出し, 識別精度が向上することを示した.

D1-13: 近似最近傍検索手法によるExtreme Multi-label分類手法の改善

発表者:田頭幸浩(ヤフー株式会社)

概要:Extreme multi-label分類問題は、ラベルの種類数が数十万以上と、極端に多い場合の分類問題である。本研究では近似最近傍検索手法を適用した手法を開発し、予測精度と速度を改善した。実データを用いた既存手法との比較実験で、提案手法の有用性を報告する。

D1-14: サンプル間類似度の推定によるニューラルネットの新しい解釈法の提案

発表者:小山田創哲(リクルートテクノロジーズ/産総研/京大),石井信(京大)

概要:ニューラルネットワークを用いたモデルは,様々なタスクにおいて高性能を示している一方で,実用上においてはその解釈性の乏しさが問題となる.本研究では,ニューラルネットワークの学習時の挙動から,サンプル間のモデルにおける類似度を推定することによる新しい解釈法を提案する.また提案手法について,系列予測タスクでの有効性を評価した.

D1-15: L0ノルム最適化に基づく判別分析法の開発と高次元データへの適用

発表者:伊藤紀基(電気通信大学大学院情報理工学研究科),佐藤匡(電気通信大学大学院情報理工学研究科・日本学術振興会特別研究員),樺島祥介(東京工業大学情報理工学院),宮脇陽一(電気通信大学先端領域教育研究センター)

概要:高次元データから真に重要な情報を抽出するにはスパースモデリングが有効である.本研究では,L0ノルム最適化に基づく判別分析アルゴリズムをiterative hard thresholding法をもとに開発した.人工データ解析の結果,本手法がSVMよりも高い判別成績を示し,低ノイズ下では特徴量選択の精度が高かった.また,機能的磁気共鳴画像の実データに対しても本手法が適用可能なことも分かった.

D1-16: 確率的ブロックモデルの尤度への補正とグラフクラスタリング

発表者:押野怜依(茨城大学), 竹田晃人( 茨城大学)

概要:グラフクラスタリングはネットワーク分析の際に用いられる手法の一つである.本研究ではネットワークの生成モデルである確率的ブロックモデルから導出される尤度に適切と思われる補正項を加えたある種の情報量基準を定義し,それを最大化することによりグラフクラスタリングを行い,その効果を検証する.

D1-17: Sequential Symmetric Correspondence Nonparametric Topic Models for Video Data Analysis

発表者:Jianfei Xue(Kobe University), Koji Eguchi( Kobe University)

概要:In this work, we propose a novel topic model, sequential symmetric correspondence hierarchical Dirichlet processes, to improve the multimodal data modeling issue in video analysis.

D1-18: 近似カーネル平均埋め込みに基づくBag-of-Wordsデータのためのニューラルネット

発表者:吉川友也(千葉工業大学 人工知能・ソフトウェア技術研究センター),岩田具治(NTTコミュニケーション科学基礎研究所)

概要:単語の分散表現の集合をRandom Fourier Featureによって近似したカーネル平均埋め込みで表現し、これをニューラルネットと連結することで、教師ラベルに合わせてニューラルネットのパラメータと単語の分散表現を学習できる、Bag-of-Wordsデータのためのニューラルネットを提案する。
実験では、既存のニューラルネット等と比較して、提案法が同等かそれ以上の予測性能を達成することを示す。

D1-19: 区間値公開による安全な予測値公開メカニズムと差分プライバシーメカニズムの有用性による比較

発表者:草野 光亮(筑波大学), 竹内 一郎( 名古屋工業大学), 佐久間 淳( 筑波大学 / JST CREST)

概要:個人情報を入力値とし予測値を提供するサービスが始まりつつある.このようなサービスにおいて,第三者が予測値を得た場合,予測値から個人情報である入力値を推定される可能性がある.本研究では,提供する情報を実数値から区間に抽象化することにより,入力値の推定リスクが許容範囲であることを保証し有用性を最大とする関数を設計する.提案手法におけるプライバシー定義と差分プライバシーの比較を有用性の観点から比較する.

D1-20: 自然勾配近似法としてのバッチ正規化

発表者:木脇太一(東京大学大学院)

概要:バッチ正規化(BN)と呼ばれる最適化手法はNeural Networkの学習効率を劇的に向上させるが,その数理的原理は不明である.本研究ではBNと自然勾配法(NG)との関係性を定量的に議論し,BNがNGを近似することを示す.

D1-21: 決定木学習後の Post-Selection Inference と精度検証

発表者:鈴村真矢(ヤフー株式会社),田頭幸浩(ヤフー株式会社)

概要:本研究ではブースティングされた決定木において、各決定木の葉ノードの有意性検定法を構築する。この問題では、選ばれた葉ノードに対する選択バイアスを補正しつつ、高い検出力を有する検定法を構築することが重要となる。統計的な観点から有用と期待されるノードをモデルに組み込むことにより、モデルの冗長性の削減や説明力の向上を目指す。

D1-22: 深層クロスドメインマッチング相関分析の提案とその応用

発表者:羽田哲也(大阪大学大学院基礎工学研究科),福井一輝(大阪大学大学院基礎工学研究科),下平英寿(大阪大学大学院基礎工学研究科)

概要:複数のビューにわたり多対多の対応関係をもつデータの多変量解析手法が提案されている(CDMCA).これはCCAを拡張したもので,各ビューのベクトルを共通空間へ線形変換する.本発表では,CDMCAを多層ニューラルネットワークを用いて非線形変換に拡張した深層クロスドメインマッチング相関分析 (DCDMCA) を提案し,Web画像とタグ情報のマッチングに適用した結果を紹介する.

D1-23: ノルム制約付き行列分解に基づいた行列補完問題に対する汎化誤差の導出

発表者:森富賢一郎(九州大学),畑埜晃平(九州大学),瀧本英二(九州大学)

概要:本研究では,ノルム制約付き行列分解によって定義されるクラスを仮説として協調フィルタリング問題に用いた場合の汎化誤差の上界について,ノルムを制限することにより従来よりもタイトな上界を導出した.また,本結果の応用として相対評価情報に基づく協調ランキング問題への応用を示した.

D1-24: スパース最適化問題に対する加速近接DCアルゴリズム

発表者:東野 克哉(東京大学),武田 朗子(統計数理研究所),後藤 順哉(中央大学)

概要:スパース正則化学習では,滑らかな非凸関数と滑らかでない非凸関数の和の最小化問題がよく現れる.問題が凸である場合には加速近接勾配法などの効率的な解法が知られているが,一般にはDCアルゴリズムのような効率的でない汎用解法に頼られることが多かった.本発表では,前記2つの手法を組み合わせることにより,非凸な問題の停留点を効率良く求めるアルゴリズムを提案し,既存手法に対する理論的・数値的な優位性を示す.

D1-25: word2vecを用いた商品レビューの評価値予測の改良

発表者:本間明紀(茨城大学), 竹田晃人( 茨城大学)

概要:単語を任意次元のベクトルで表現する技術としてword2vecがあり、この手法で得られるベクトル表現を機械学習することで、文章を分類できる。今回は先行研究を元に、機械学習モデルとして多層ニューラルネット、楽天市場の商品レビューを文章データとして用い、文章データに基づいて同商品の評価を分類したときの、分類精度の改善を試みる。

D1-26: Robust Quadratic Programming for Price Optimization

発表者:矢部顕大,伊藤伸志,藤巻遼平 ( NEC Corporation )

概要:価格最適化の目的は、利得を最大にする価格戦略を決定することである。売り上げ数は価格の関数として予測できるが、このとき機械学習により得られた予測が含む誤差の取り扱いが重要な課題となる。この研究では、予測における誤差が行列正規分布の形で表せることを示すと共に、そのような不確実性を取り扱う新たなロバスト2次最適化アルゴリズムを構築する。

D1-27: 変分推論のための確率勾配リスケーリング

発表者:大塚琢馬(NTT研究所),石黒勝彦((株)みらい翻訳)

概要:SVI,BBVI,VAEなど多くの変分推論法はモンテカルロ近似した確率勾配を用いて最適化を行っている.
分布のパラメータ更新には自然勾配法が効果的である一方,確率勾配法はAdaGrad,Adam,AdaDelta等の勾配のリスケーリング法が有用である.
本発表ではこれらの両立を目指し,AdaDelta法をベースに自然勾配法を用いた確率勾配による変分推論法を議論する.

D1-28: 非負値行列分解における変分自由エネルギーの観測行列数に関する漸近挙動について

発表者:幸島匡宏(東工大),渡辺澄夫(東工大)

概要:本研究では,非負値行列分解の変分ベイズ学習において学習の際の目的関数となる変分自由エネルギーの漸近挙動を解析した. 観測行列の個数が大きくなる場合の漸近解析によって, 変分自由エネルギーの漸近値を理論的に解明した. 本発表では, 導出した理論結果とその有効性を示す実験結果を報告する.

D1-29: Alternative targets for building better learners

発表者:Matthew J. Holland(NAIST), Kazushi Ikeda( NAIST)

概要:Risk, as a target to be minimized, is ubiquitous in learning models. The use of alternative quasi-risk parameters in learner design is fruitful, but introduces a number of analytical challenges.

D1-30: Selective Inferenceによる異常標本を考慮した2標本検定

発表者:井上茂乗 梅津佑太 中川和也 竹内一郎(名古屋工業大学 名古屋工業大学 名古屋工業大学 名古屋工業大学 )

概要:2標本検定において,一方の標本の平均が群内で異なる状況を考える.便宜上各群を正常群,異常群と呼ぶことにし,異常群内で特に大きな平均を持つ標本と正常群の比較をSelective Inference (SI)の枠組みで定式化する.SIでは,データに基づく標本の分割アルゴリズムを条件付けるので,選択バイアスを考慮しなければならない.本研究では,提案手法のパフォーマンスの良さを数値実験によって確認する.

D1-31: 心拍変動解析と機械学習に基づいた睡眠時無呼吸症候群スクリーニングアルゴリズム

発表者:仲山千佳夫(京都大学),藤原幸一(京都大学),松尾雅博(滋賀医科大学),加納学(京都大学),角谷寛(滋賀医科大学)

概要:睡眠時無呼吸症候群 (SAS) は,睡眠時に呼吸停止または呼吸量が減少する疾患である.SAS は自覚が難しく,多くの患者は適切な診断と治療を受けていない.無呼吸は心拍に影響を与えるため,本研究では,心拍変動解析に基づいた SAS スクリーニング手法を提案する.提案法により,感度 90%・特異度 80% で SAS 罹患のスクリーニングができることを確認した.

D1-32: Model Selection for Pairwise Hidden Markov Models using Factorized Information Criterion

発表者:Taikai Takeda(Waseda University), Michiaki Hamada( Waseda University)

概要:塩基/アミノ酸配列アラインメントの確率モデルであるPairwise Hidden Markov Models(PHMM)において、 Factorized Information Criterion (FIC)を用いたモデル選択手法を提案する。シミュレーション実験において良いモデル選択の性能を示し、またDNA配列の実データ実験でも進化的背景と整合性のある結果が得られた。

D1-33: Bayes factorを用いた大規模ベイジアンネットワークの構築

発表者:名取和樹(電気通信大学),宇都雅輝(電気通信大学),植野真臣(電気通信大学)

概要:ベイジアンネットワーク学習ではA*探索や整数計画法といった従来の探索アプローチが用いられてきた.本研究では,より大規模な構造学習を実現するため,全く新しいアプローチとして漸近一致性を有するBayes factorを用いた条件付き独立性テストを導出し,これを用いた構造学習法を提案する.これにより,計算量を画期的に削減し,1000変数以上の大規模構造学習を実現できることを示す.

D1-34: マージン最大化にもとづく確率的ブロックモデル

発表者:小山田 昌史(NEC),中台 慎二(NEC)

概要:確率的ブロックモデル (SBM) はネットワーク構造に対する確率的生成モデルであり、ネットワークの構造予測や共クラスタリングに用いられている。SBMはリンク生成過程をパラメトリックなモデルによってモデル化するため、表現力に乏しい。我々はノンパラメトリックなモデルであるSVMによってリンク生成過程をモデル化した、表現力の高いSBMを提案する。

D1-35: 比較バンディット問題におけるコープランド勝者の推薦

発表者:小宮山純平(東京大学),本多淳也(東京大学),中川裕志(東京大学)

概要:比較バンディット問題は、有限個のオプションのうち最良のものを一対比較を用いて学習を行う問題である。著者らは前年6月のIBISML研究会においてコンドルセ勝者と呼ばれる最良オプションを発見するアルゴリズムを提案したが、コンドルセ勝者は存在しない場合がある。その場合も、コープランド勝者と呼ばれるコンドルセ勝者の自然な拡張がある。本研究ではコープランド勝者の発見に関して効率的なアルゴリズムを提案する。

D1-36: カーネル法を用いた従属性の高い部分木ペアの教師なし推定

発表者:横井祥(東北大学),持橋大地(統計数理研究所),岡崎直観(東北大学),乾健太郎(東北大学)

概要:自然言語は多様な言い換え表現を持ち、また蛇足的な情報を多く含むため、コーパスから文のペアの形で知識を取り出したあと、これらの汎化とデノイジングをおこなう必要がある。本発表では、依存構造木のペアの集合が与えられたとき、HSIC(カーネル法に基づく依存性尺度)の意味で相互情報量を最大化する部分構造ペアを教師なしで推定する問題としてこれを捉え、学習法を提案する。また実験によりその有用性を確認する。

D1-37: 確率的決定則について

発表者:村松純(NTTコミュニケーション科学基礎研究所), 三宅茂樹( NTT未来ねっと研究所)

概要:確率的決定則の誤り確率に関する基本的な事実を紹介する. また, 理論限界(シャノン限界)を達成する情報圧縮や誤り訂正符号への応用についても紹介する.

D1-38: ドロネー空間分割のラベル伝搬への応用

発表者:松本一則(KDDI総合研究所),池田和史(KDDI総合研究所),帆足啓一郎(KDDI総合研究所)

概要:グラフ構造を用いてラベルなしデータを学習に利用するラベル伝搬法(Label propagation)では、データどうしの隣接関係を適切に設定することが重要である。本発表では、ドロネー三角形分割を多次元に拡張し,データの隣接性を抽出する手法を紹介し、2-moonデータでラベル伝搬の結果が向上したことを報告する。

D1-39: クリックフィードバックを用いた記事の地域性推定モデルの構築

発表者:大倉俊平(ヤフー株式会社)

概要:ニュースサイトのクリックデータとユーザのアクセスポイントから、ニューラルネットによって記事の地域性の推定を試みた。
本手法は地域性をユーザログから推定するため、地名やランドマーク名の辞書を作る必要がなく、新語や時事性の強い語への適応も自動的になされることが利点である。
また、アクセスポイントの緯度経度情報から近傍エリアへ正則化をかけることで、汎化性能が向上したことを報告する。

D1-40: 条件付き確率場を用いた自然言語文章からの上位下位関係抽出

発表者:平松淳(筑波大学),若林啓(筑波大学)

概要:ウェブ上に存在する文書の数は日々増加しており,それらは情報源として価値が高い.
本研究では,質問応答などの自然言語処理タスクにおいて重要な知識である上位下位関係の自動抽出を,系列ラベリング問題として解くことを試みる.
文章に対して上位概念・下位概念・および定型表現のラベルを予測する条件付き確率場を学習し,テストデータを用いて評価実験を行ったのでこれを報告する.

D1-41: 光干渉断層計による網膜層厚からの緑内障患者の視野推定について

発表者:上坂俊允(東京大学大学院情報理工学系研究科),森野佳生( 東京大学生産技術研究所),村田博史( 東京大学病院眼科視覚矯正科),朝岡亮( 東京大学病院眼科視覚矯正科),山西健司( 東京大学大学院情報理工学系研究科)

概要:緑内障治療において視野中心10度内の視野感度が重要であるが, この計測は臨床現場への負担が大きい. 近年光干渉断層計により簡便な計測が可能になった網膜層厚から視野中心感度を予測することは有用と思われる.本発表では網膜層厚から視野感度を推定するモデルとその学習手法を提案する. 緑内障症状の多様性を反映し, 学習に用いるデータを適切にクラスタリングしておくことで予測精度を上げられることを実験的に示す.

D1-42: アンサンブル木モデル解釈のためのモデル簡略化法

発表者:原聡(国立情報学研究所),林浩平(産業技術総合研究所)

概要:ランダムフォレストなどのアンサンブル木は高い予測能力を持ち、様々な予測問題で使われている。しかし、アンサンブル木は複数の決定木を組み合わせて膨大な予測ルールを生成するため、人間が予測ルールを解釈することは困難である。本発表ではアンサンブル木を簡略化して簡潔なルールとして表現する手法を提案する。提案法ではアンサンブル木を確率的モデルとしてモデル化し、ベイズ的モデル選択を使うことで簡略化表現を求める。

D1-43: 非負制約付きスパースコーディングを用いた チームスポーツフォーメーション特徴量の自動抽出手法

発表者:阿部俊樹(明治大学 総合数理学部), 山本莉沙( 明治大学 総合数理学部), 中田洋平( 明治大学 総合数理学部)

概要:本研究では,チームスポーツの選手位置情報からフォーメーション特徴量を自動抽出する方法を提案する.提案手法では,まず,選手位置情報から選手密度情報を算出する.得られた選手密度情報を用いて辞書学習を行い,フォーメーションの部品とも言える基底選手密度の辞書を得る.この辞書を用いて,非負制約付きスパースコーディングで得られた係数を特徴量とする.また,サッカー選手位置情報を用いて提案手法の有効性を検証する.

D1-44: 解釈可能な統計モデルをスケーラブルに学習させるためのデータ圧縮法

発表者:田部井靖生(科学技術振興機構(さきがけ)),西郷浩人(九州大学),山西芳裕(九州大学),Simon J. Puglisi(ヘルシンキ大学)

概要:解釈可能な統計モデルをスケーラブルに学習するための新しいデータ行列の圧縮表現を提案する。膨大な高次元実データを用いた実験により、 PLS回帰モデル学習における提案手法の有効性を示す。

D1-46: パラメータの漸近予測によるニューラルネットワーク学習の高速化

発表者:高瀬朝海(北海道大学),栗原正仁(北海道大学),小山聡(北海道大学)

概要:ニューラルネットワークの学習においてパラメータの予測を行う手法を提案する.その目的は,過去のパラメータの値の変化をもとに漸近予測を行うことで学習を部分的に省略し学習を高速化することである.これにより,入力データやモデル構造の複雑化のため収束が遅くなる問題点が大きく改善される.MNISTおよびCIFAR-10,SVHNの各データセットを用いた実験を行い,本手法が学習の高速化を実現することを示す.

D1-47: Riemannian stochastic variance reduced gradient (R-SVRG)

発表者:Hiroyuki Kasai(UEC), Hiroyuki Sato( TUS), Bamdev Mishra( Amazon India)

概要:本稿では,従来検討されてきたユークリッド空間における確率的分散縮小勾配法を拡張し,コンハクト多様体に適用可能な “リーマン確率的分散縮小勾配法 (R-SVRG)” を提案する.機械学習における様々な問題に適用し,シミュレーション実験からその有効性を示すとともに,減衰ステッフサイスの場合における大域的収束と固定ステッフサイスの場合における局所収束レート証明を与える.

D1-49: Scalable Clustered Multi-task Learning

発表者:谷本 啓(NEC), 本橋 洋介( NEC)

概要:多数の予測対象を持つ予測問題において、予測対象間の関係性を適切に学習し利用する方法としてマルチタスク関係学習が提案されている。しかし、既存手法ではタスク数が増えると膨大な計算量が必要となる問題があった。これを解決し、固有値分解を行うことなくクラスタリングと回帰係数の推定を同時に行う手法を提案する。

D1-50: ラベルなしデータを活用した最新の分類器学習法

発表者:熊谷充敏(NTT),岩田具治(NTT)

概要:様々なドメインにおいて,分類器の性能は経時劣化する.主な原因は,(1) 新たな特徴量の出現,(2) データ分布の変化である.対策として,ラベルありデータによる分類器更新が考えられるが,ラベルありデータの収集は高コストである.本研究では,ある時刻までに収集したラベルありデータと,それ以降に得られた,比較的収集が容易なラベルなしデータを用いることで,両問題を解決する新たな分類器学習法を提案する.

D1-51: 頻出パタンマイニングに基づく線形予測基底の選択

発表者:李太斗(東京大学),松島慎(東京大学),山西健司(東京大学)

概要:線形モデルの予測精度向上の視点からは,複雑な基底を構成すべきであるが,知識発見の視点からは各基底は単純である方が好ましい.そこで単純な基底を多数組み合わせることで,解釈性が高くなおかつ複雑な基底を構成するアルゴリズムを提案する.新しい基底は元の基底を論理的に結合した形に限定し,効率的に列挙する手法として頻出パタンマイニングに基づいた手法を与え,交通データに適用し交通リスクに関する知識発見を行った.

D1-52: 機械学習を用いた表情判定のためのActionUnit最適化

発表者:大澤 愛喜(電気通信大学),宇都 雅輝(電気通信大学),植野 真臣(電気通信大学)

概要:本研究では、顔画像から抽出されるActionUnit(AU)と呼ばれる特徴量をもとに、恐れ・驚き・幸福などの表情を高精度に推定することを目指す。
既存研究では、表情推定に用いるAUの数を恣意的な特徴選択により削減しているが、この特徴選択では推定精度が最適化される保証はない。
そこで、本研究では、さまざまな機械学習手法に対して、予測を最適化する特徴選択を行い、顔表情の推定精度を改善する。

D1-53: 検索キーワードの検索頻度を考慮した商品検索のランキングモデルの構築

発表者:齋藤祐樹(ヤフー株式会社)

概要:ECサイトのアクセスログから決定木を用いて検索キーワード(クエリ)と商品の関連度の推定を行う.一部のクエリは検索数が非常に多いが, 全体としては検索数の少ないクエリが大部分を占める.本研究ではクエリの検索頻度の違いによる商品の特徴量の分布の違いに注目したランキングモデルを構築する.

D1-54: 単語の分散表現の逐次的学習

発表者:鍜治伸裕(ヤフー株式会社), 小林隼人( ヤフー株式会社)

概要:Skip-gramなどの分散表現モデルの学習には、訓練データの大域的統計情報が必要であり、新しいデータが追加されたときに効率的にモデルを更新することができない。本発表では、この問題を解決するための逐次的な学習方法について提案する。

D1-55: TV-priorを用いた圧縮センシングによるSparse-view X線CT画像再構成の性能検討

発表者:菅 智徳,鄭 黎褞,井上真郷 ( 早稲田大学大学院先進理工学研究科電気・情報生命専攻 )

概要:X線CTは医学的に有用な検査の1つである。しかし、被ばくによって発がんリスクが高まるため、投影数をまびくこと等でX線の投射量を減らすことが重要である。本研究では本来必要とされる量よりも少ない観測データからCT画像を再構成するという不良設定問題を考える。TV-priorを導入したモデルを圧縮センシング技術により解き、それが十分な投影量から得られる画像に対してどのくらいの劣化で抑えられるか検討する。

D1-56: 畳み込み半非負値行列因子分解と,記述長最小原理に基づく基底数推定法

発表者:鈴木 惇(東京大学),山西 健司(東京大学)

概要:非負値データを時間幅のある非負基底と非負アクティベーションの畳み込みで近似する手法である畳み込み非負値行列因子分解は,時系列データから時間連続な特徴を抽出するのに用いられる。本研究は,これを正負双方の値をとるデータを対象とする場合に拡張し,正負双方の値をとる基底と非負アクティベーションの畳み込みで近似する手法を提案する。さらに,完全変数化NML符号長を用いデータから基底数を推定する方法を提案する。

D1-57: 3Dレーシングゲームにおける模倣学習と強化学習

発表者:工藤康統(慶應義塾大学),楠本充(Preferred Networks(株)),藤田康博(Preferred Networks(株))

概要:本発表では3Dレーシングゲームのエージェントを少ない試行回数で学習させることを目標にする。エージェントの方策は、ゲーム画面画像を入力とし制御を出力とするようなニューラルネットによって表される。強化学習のみにより学習する場合と比べ、事前にエキスパートの行動から模倣学習を行うことが試行回数を減らすことを示す。また、模倣学習後に強化学習を行った結果、エキスパートを超える方策が得られたことを示す。

D1-58: 劣モジュラ正則化雑音除去の自由度

発表者:南 賢太郎(東京大学 情報理工)

概要:信号の雑音除去または線形回帰の問題において,劣モジュラ関数のLovasz拡張型の正則化項を伴う推定量を考える.近年,このような推定量は主に計算的な側面から注目を集めているが,統計的な性質はあまり調べられていない.本発表では,Lovasz拡張型推定量について「パラメータの実効的な自由度」を計算することで予測リスクの不偏推定量を導出する.

D1-59: A Gaussian Process Model for Non-Convex Probabilistic Clustering

発表者: Daniel Andrade(Graduate University of Advanced Studies (SOKENDAI)), Kenji Fukumizu ( The Institute of Statistical Mathematics)

概要:We propose a probabilistic model for clustering that is inspired by the Gaussian Process Latent Variable Model (GP-LVM).

D1-60: ラベル伝播法はいつ失敗するか?ネットワーク生成モデルとしての解釈

発表者:山口祐人(産業技術総合研究所),林浩平(産業技術総合研究所)

概要:本研究では,ラベル伝搬法(LP)の確率モデル的解釈を行う.主結果として,我々はある特定の状況下において,MAP解が離散型のLPの解と等しいネットワーク生成モデルを導出した.この結果から,ネットワークがDisassortative,エッジの密度が異なるクラスタ構造を持つ,クラスラベル頻度の分布が一様でない,およびクラスラベルにノイズを多く含む場合,LPは望まれる結果を出力しないことを理論的に示した.

D1-61: 教師なし異常検知器に対する誤検知情報のフィードバック手法

発表者:山中友貴,山田真徳 ( NTTセキュアプラットフォーム研究所 )

概要:教師なし機械学習技術を用いてデータからパターンを抽出しパターンの外れから異常を検知する技術は、機器故障監視やセキュリティ監視の分野に広く応用されている。教師なし学習による異常検知はあらゆる異常を検知可能な一方で、正常状態と類似の異常は誤検知してしまう課題がある。さらに通常の教師なし検知器は誤検知結果をフィードバックする手段を持たない。そこで本発表では、新たに前述のフィードバックする手法を提案する。

D1-62: 進化情報と物理情報を用いたタンパク質の立体構造予測と立体構造情報からのタンパク質生成

発表者:椿真史(奈良先端科学技術大学院大学)

概要:我々は、タンパク質の進化情報や物理情報を特徴量とし、Long Short-Term Memoryを用いた構造分類と、Convolutional Neural Networkを用いた立体構造予測を行う。特に我々は、タンパク質における螺旋構造とシート構造が形成する空間的な制約やアミノ酸の間接的な相互作用を適切にモデル化する。最後に、機械学習を用いた立体構造情報からのタンパク質生成について議論する。

D1-63: 時系列データの周期成分分解と位相推定

発表者:松田 孟留(東京大・情報理工),駒木 文保(東京大・情報理工&理研・脳センター)

概要:本研究では,時系列データを周期成分に分解して各成分の位相を推定する手法を開発した.提案手法は,周期成分を線形ガウス状態空間モデルでモデル化し,時系列データを複数の周期成分に分解する.その結果,各成分の位相が推定できる.経験ベイズ法と情報量規準の利用により,時系列データの背後に潜む振動子を自然に取り出せる点が特徴である.太陽黒点時系列や神経電位時系列に適用したところ,興味深い結果が得られた.

D1-64: ニュース・動画サービス間のクロスドメイン推薦における課題

発表者:金川 平志郎(東京工業大学),小林 隼人(ヤフー株式会社),清水 伸幸(ヤフー株式会社),田頭 幸浩(ヤフー株式会社),鈴木 大慈(東京工業大学)

概要:特定のサービスのみを使用しているユーザに対し、他のサービスの利用を促すことができれば、新たなユーザの獲得につながる。そのためには、そのユーザが使用しているドメインでの行動履歴から誘導するサービスにおける興味を適切に表現する必要がある。本発表では、ヤフー・ジャパンの二つのサービス(Yahoo!ニュース、GYAO!)でのクロスドメイン推薦における課題について議論する。

D1-65: Stochastic Primal Dual Coordinate Methodにおける適応的サンプリング

発表者:柴垣篤志(名古屋工業大学),竹内一郎(名古屋工業大学)

概要:Stochastic Primal Dual Coordinate (SPDC), Doubly SPDCは大規模な経験損失最小化問題を解くための最新の最適化手法の一つである. 本研究の目的は, それらの手法においてサンプリングの分布を適応的に変化させることによって最適化を高速化することである. また, ワーキングセット法と組み合わせることによってより実践的な高速化についても考察する.

D1-66: 心拍変動解析と統計的プロセス管理に基づいたてんかん発作予知アルゴリズム

発表者:藤原幸一(京都大学),宮島美穂(東京医科歯科大学),山川俊貴(熊本大学),加納学(京都大学)

概要:てんかん患者は発作による事故リスクがあるが,発作起始前にアラームを発報できれば事故を回避できる.てんかん発作は心拍間隔のゆらぎである心拍変動(HRV)に影響するため,HRVを解析することで発作を予知できる可能性がある.本研究はでHRV解析と多変量統計的プロセス管理(MSPC)に基づいたてんかん発作予知アルゴリズムを開発し,感度91%,誤検知率0.7回/hで発作を予知できることを確認した.

D1-67: 局所PLSを用いた欠損RRI補間

発表者:鎌田啓輔(京都大学),藤原孝一(京都大学),山川俊貴(熊本大学),加納学(京都大学)

概要:心電図のRR間隔(RRI)の変動である心拍変動は,自律神経活動と関係があることが知られており,心拍変動解析に基づくヘルスモニタリングサービスの開発が進められている.欠損RRI データへの対応が実用化に向けた課題となっているため,本研究ではプロセス制御分野で用いられている局所PLSに基づいた欠損RRI補間手法を提案した.その結果,従来の補間手法と比較し,RRIデータ補間性能は20%向上した.