ディスカッショントラック・セッション1日目

ポスタープレビュー

概要集

D1-1: 動的モード分解のためのKoopman不変空間学習

発表者:武石直也(東京大学),河原吉伸(大阪大学,理化学研究所),矢入健久(東京大学)

概要:Koopman作用素に基づく力学系のモード分解は時系列データの分析、次元削減、特徴抽出等に幅広く利用されている。その計算手法として動的モード分解(dynamic mode decomposition, DMD)がよく用いられるが、非線形性の強い力学系ではデータの非線形変換が必要となる。本研究では、Koopman作用素に対して不変な関数空間を学習することでデータだけに基づく非線形DMDを実現する。

D1-2: 分布に対する位相的データ解析

発表者:草野元紀(東北大学大学院理学研究科)

概要:位相的データ解析ではデータの幾何構造をパーシステントホモロジーとして特徴付けている。従来の研究では、実験等で得られたデータに対してパーシステントホモロジーを計算し解析しているが、そのデータは常に再現可能とは限らず、ノイズが乗っていたり確率的に得られたりと考える方が自然である。そのため、本研究ではデータを生成する分布に対してそのパーシステントホモロジーの計算法を提案する。

D1-4: Gamma Process Edge Partition Modelのモデル縮退効果の改良

発表者:大濱 郁(パナソニック株式会社),佐藤 一誠(東京大学),喜田 拓也(北海道大学),有村 博紀(北海道大学)

概要:Gamma Process Edge Partion Model (EPM)は関係データからオーバラップを許容した低次元構造を取り出す有用なモデルである。しかしながら、EPMはそのモデル縮退の効果に欠点があり容易に過学習を起こしてしまう。本発表では、EPMのモデル縮退効果の欠点を解析し、より効果的に学習が可能なIDEPMモデルを提案し有効性を示す。

D1-5: 機械学習を用いた量子力学計算の高速かつ高精度な近似法

発表者:椿真史(産業技術総合研究所)

概要:本研究で我々は、機械学習を用いた量子力学計算の高速かつ高精度な近似法の開発に取り組む。特に、密度汎関数理論で近似された化合物の電子物性を、グラフニューラルネットワークを用いて予測する手法を提案する。提案法は、化学や物理学で用いられる特徴量を一切使わずに、すべてをデータから学習することができる。実験では、4つの電子物性予測において、既存法を上回る性能を達成した。

D1-6: Bayesian Lasso のための実験計画に関する一考察

発表者:堀井俊佑(早稲田大学)

概要:少ないサンプルサイズで学習を効率的に行うために,実験計画は重要である.一方で,パラメータが高次元スパースであるモデルを扱うスパースモデリングに関する研究が盛んに行われているが,スパースモデリングに対する実験計画の研究は十分に行われていない.本研究では,スパースモデリングとしてBayesian Lassoを考え,Bayesian Lassoのための実験計画に対する考察を行う.

D1-7: 高次元特徴量に対するスケーリング法と教師付きスペクトラルクラスタリング

発表者:松田萌望(筑波大学),保國惠一(筑波大学),櫻井鉄也(筑波大学・JST/CREST)

概要:高次元データに対するスペクトラルクラスタリングを考える。データの一部のラベル情報を使って特徴量のスケールを調整するための因子(スケーリング因子)を固有ベクトルとして持つような矩形固有値問題を定式化する。これを解いて得られるスケーリング因子をデータ全体に施すことで精度の良い分類を実現するような教師付きスペクトラルクラスタリングを提案する。遺伝子発現データを用いた数値例を示す。

D1-8: 因子化情報量基準を用いたLDAのモデル選択

発表者:松谷太郎(早稲田大学 先進理工学部 電気・情報生命工学科),浜田道昭(早稲田大学 先進理工学部 電気・情報生命工学科,産総研・早大 生体システムビッグデータ解析 オープンイノベーションラボラトリ)

概要:潜在ディリクレ再配置(LDA)はよく使われるトピックモデルの一つである.LDAにおける重要な問題として,ハイパーパラメータであるトピック数の選択があり,先行研究ではテンソル分解を用いたものや変分ベイズ法を用いたものなどが存在する.今回,我々は近年発展しつつある因子化情報量基準と因子化漸近ベイズ推論をLDAへ適用することで,Shrinkage Mechanismを用いたトピック数の選択を可能とした.

D1-9: 動的行列式点過程

発表者:恐神貴行(IBM東京基礎研究所),ルディーレイモンド(IBM東京基礎研究所),Akshay Goel(Graduate School of Mathematics, Kyushu University),白井朋之(九州大学IMI),前原貴憲(理研AIP)

概要:行列式点過程(DPP)のカーネルが時間変動する動的行列式点過程(DyDPP)を提案し、その学習アルゴリズムを構築する。DyDPPのカーネルは、過去に選択されたアイ テム集合に依存するが、効率的な学習を可能とする構造を持つ。また、カーネルが低ランクであることを仮定したDPPの学習アルゴリズムを利用するが、そのボトルネックの計算量を削減する。

D1-10: 2ステージ回帰による公正配慮型学習

発表者:小宮山純平(東京大学生産技術研究所),島尾尭(Purdue University)

概要:人材採用・昇進、信用リスクなどの人間に関わるタスクへの機械学習の適用を考える。分類・回帰アルゴリズムはデータから学習を行うため、データの潜在的バイアスの影響を受ける。結果として学習器は特定のセンシティブ属性(性別、年齢、信条など)に関して差別的扱いをしてしまう可能性がある。本研究では、計量経済学でよく用いられる2ステージ回帰の手法によるバイアス除去を試みる。

D1-11: 母固有値の推定を必要としない標本マハラノビス距離補正法の改良

発表者:小林靖之(帝京大学 理工学部)

概要:標本マハラノビス距離T^2は学習サンプル数nの不足により識別性能が劣化するため、n→∞に当たる母マハラノビス距離D^2の推定が望ましい。そこで、真の共分散行列Σの固有値(母固有値λ)の推定値を用いたT^2をD^2へ補正する方法を考案した。しかし、前提である母固有値の推定が難しい。そこで、母固有値の推定なしで補正性能が優れる改良方法を考案した。その概要と検討経過を報告するので、議論したい。

D1-12: Robust and Sparse Online GLM

発表者:川島孝行(総研大),藤澤洋徳(統計数理研究所)

概要:ロバストなダイバージェンスであるガンマ・ダイバージェンスに基づくロバストかつスパースなGLMを提案する.GLMの代表例である,線形回帰およびロジスティック回帰については,効率的な推定アルゴリズムを導出し,数値実験また実データにおいて有効性を確認した.しかし,ポアソン回帰を対象とした場合,超幾何級数の計算が必要となり,推定が困難となる.これを,確率的最適化の枠組みを導入することで克服する.

D1-13: 構造化データにおけるベイズクラスタリング精度について

発表者:山崎啓介(産総研AI研究センター),川本達郎(産総研AI研究センター)

概要:独立同分布からのデータ数が十分に大きい場合についてベイズクラスタリングのラベル分布推定精度が解明されている.
しかしながら1つの構造化データのサイズが大きくなった場合のクラスタリングについてはその精度は不明である.
本発表では系列データとグラフデータに対し,隠れマルコフモデルと確率的ブロックモデルをそれぞれ用いて
ベイズクラスタリングを行った場合の精度の上界を紹介する.

D1-14: 能動的変化点検知

発表者:林勝悟(京都大学大学院情報学研究科),河原吉伸(大阪大学産業科学研究所),鹿島久嗣(京都大学大学院情報学研究科)

概要:既存の変化点検知問題では,データ取得コストが考慮されていなかった.本発表では,取得するデータを能動的に選択し,より少ないクエリ数で変化点を検知する問題,能動的変化点検知を提案する.また我々は,既存の変化点検知手法とベイズ最適化手法を変化度計算とデータ選択に用いることにより,幅広い種類のデータに対して適用可能な枠組みを提案する.材料科学の相転移同定実験データにおいて,本枠組みの有効性を示す.

D1-15: ソフトラベルの非確率的解釈と分類学習への応用

発表者:高瀬朝海(北海道大学),小山聡(北海道大学/理研AIP),栗原正仁(北海道大学)

概要:データとクラスの関係を小数値で表したソフトラベルは、統計的機械学習においてはクラスの事後確率として解釈される。しかし、事後確率の推定は、非専門家にとって直感的でなく難しい。そこで、帰属度という非確率的解釈に基づき、各クラスの模範的なサンプルとの類似度としてソフトラベルを与える方法を考える。クラウドソーシングで二種類のソフトラベルを作成し、拡張したフィッシャーの線形判別で利用した結果を比較する。

D1-16: 一般の雑音分布によるデノイジング・オートエンコーダーの解析

発表者:園田翔(早稲田大学),村田昇(早稲田大学)

概要:正規雑音を用いるデノイジング・オートエンコーダー(DAE)は,データ分布のエントロピーを減らすようにデータ点を輸送する輸送写像とみなせる。一般の雑音分布の場合には解析的な計算が難しいが,統計学的な考察と,Wasserstein幾何学に基づく計算により,部分的な結果が得られたので,これらを報告する。

D1-17: 深層学習のための線形制約付きウェイト

発表者:沓名拓郎(豊田中央研究所)

概要:複数の隠れ層を持つディープニューラルネットワーク(DNN)では、勾配消失問題が発生し、その学習が困難となる。本研究では、DNN内部で生じる角度バイアスと呼ぶ偏りに注目し、それがDNNにおける勾配消失の主要因の一つであることを示す。また、角度バイアスを抑制するための仕組みとして、線形制約付きウェイトを提案する。提案手法により、100層の多層パーセプトロンを効率的に学習可能となることを実験的に示す。

D1-18: テンソルt分布とその応用

発表者:宇野光平(大阪大学)

概要:データ分析において正規分布はその簡便さから広く用いられているが、外れ値の影響を受けやすいことが知られている。そこで正規分布に比べて裾が重いt分布を用いることで、よりロバストな推定をする手法が数多く提案されている。本研究ではt分布を一般化したテンソルt分布を提案する。さらにテンソルt分布を用いたデータ分析手法を同時に提案することで、テンソルt分布が機械学習に広く応用可能であることを示す。

D1-19: ベータダイバージェンスと逐次最小二乗法を用いたロバストな二値分類

発表者:土田雄輝(東京都立産業技術高等専門学校),福永修一(東京都立産業技術高等専門学校)

概要:逐次型の学習器を用いた二値分類において,データに外れ値が含まれる場合,精度良く分類を行うことは難しい.そこで本研究では,ベータダイバージェンス最小化から得られる反復再重み付き最小二乗法を逐次化し,ロバストな二値分類を行う手法を提案する.提案手法により,データに外れ値およびラベルノイズが含まれる場合において,既存のオンライン学習器を上回るロバスト性を確認した.

D1-20: ベータダイバージェンスを用いたロバスト部分最小二乗法

発表者:藤野眞人(東京都立産業技術高等専門学校),福永修一(東京都立産業技術高等専門学校)

概要:部分最小二乗法は,説明変数と目的変数を直接関連付けず,説明変数を低次元空間に射影して潜在変数とし,その潜在変数の線形結合で目的変数を表現している.本研究では,ベータダイバージェンスを用いた部分最小二乗法のロバストなアルゴリズムを提案する.提案手法では,指数関数型の重みを用いることで,低次元空間への射影ベクトルとローディングベクトルのロバスト推定を行う.従来手法との比較から提案手法の有効性を示す.

D1-21: 気象シミュレーションにおける衛星画像データ同化への機械学習の応用

発表者:粟津妙華(理化学研究所 計算科学研究機構),大塚成(理化学研究所 計算科学研究機構),三好建正(理化学研究所 計算科学研究機構)

概要:データ同化は、主に気象分野で発展し、数値モデルと誤差を含む不連続な観測を使い、より精度の高い推定値を求める技術である。気象予測においてデータ同化を行う場合、通常は気温や水蒸気や気圧などの衛星から得られる観測を同化する。本研究では、降水領域を示す画像から特徴量を抽出し、それを観測として同化する。特徴量は傾きなどの単純なものと、Deep learningによって抽出した特徴量を使用し、比較する。

D1-22: 機械学習モデルの列挙

発表者:原聡(大阪大学産業科学研究所),石畠正和(北海道大学大学院情報科学研究科),前原貴憲(理研AIP)

概要:機械学習モデルは最適化問題の解として定義されるが、これはモデルが実用において最適であることを意味しない。
例えば、モデルがユーザの直感に反する場合、それはユーザにとって”安心して使えない”という点で最適ではない。
この問題を解決するために、本研究では線形モデル・ルールモデルを列挙する方法を提案する。
モデル候補を列挙してユーザに提示することで、より直感に即した”安心して使える”モデルを提供できる。

D1-23: k-最近傍グラフの分割によるExtreme Multi-label分類器の学習

発表者:田頭幸浩(ヤフー株式会社)

概要:Extreme multi-label分類問題は、ラベルの種類数が数十万以上と、極端に多い場合のマルチラベル分類問題である。本研究ではラベルベクトルのk-最近傍グラフの構造を可能な限り保ったまま、特徴量空間で再帰的に分割することで、分類木を構築する手法を提案する。実データを用いた既存手法との比較実験で、提案手法の予測精度と速度に関する有用性を報告する。

D1-24: Deep Reinforcement Learning with Relative Entropy Stochastic Search

発表者:Voot Tangkaratt(RIKEN AIP center, Japan),Abbas Abdolmaleki(The University of Aveiro, Portugal),Masashi Sugiyama(RIKEN AIP center, Japan/ The University of Tokyo, Japan)

概要:We propose a deep reinforcement learning method that learns a function maximizing an expected return and fits the learned function to a neural network. Experiments show our method performs well.

D1-25: HTTP通信を用いた半教師あり学習によるマルウェア感染端末の分類器について

発表者:西山泰史(日本電信電話株式会社セキュアプラットフォーム研究所),熊谷充敏(日本電信電話株式会社セキュアプラットフォーム研究所),神谷和憲(日本電信電話株式会社セキュアプラットフォーム研究所),谷川真樹(日本電信電話株式会社セキュアプラットフォーム研究所)

概要:近年、マルウェア感染の有無を判定する機械学習を用いた分類器の需要が高まっている。高精度な分類器を作成するには、様々な環境で収集されたラベルありデータが必要となるが、ラベル付けの負担や様々な環境でログを収集することの難しさから、現実的とは言えない。そこで本研究では、グラフベースの半教師あり学習を用いて、HTTP通信ログからマルウェア感染端末を高精度に検知する手法を提案し、実験で本手法の有効性を示す。

D1-26: 生成要約のための隣接畳み込みニューラルネットワーク

発表者:近藤 雅芳(奈良先端科学技術大学院大学),松本裕治(奈良先端科学技術大学院大学)

概要:入出力が複数の文章で構成されるニューラル生成要約タスクでは、RNNを生成モデルとして研究を行う場合、勾配消失・発散の問題や再帰的処理によるエンコード時間増加の問題が避けられない.本研究は、生成要約のための新しいCNNを提案する.実験では、長文要約データセットを用いてROUGEスコアによる精度検証を行い、BiLSTMエンコーダと同程度以上の精度を示すことを報告する.

D1-27: 教育ログデータからの解釈性を重視した潜在スキル推定

発表者:玉野浩嗣(NECソリューションイノベータ),丸山晃一(NECソリューションイノベータ)

概要:学習者が問題に取り組んだ正誤ログから,学習者が保持する潜在スキルの変化と,問題を解くのに必要な潜在スキルを推定する方法を提案する.提案方法では,正誤ログの生成を,階乗隠れマルコフモデルを基に問題の潜在スキルと学習者のスキル習得を反映した確率モデルで表現する.潜在スキルを二値で表現することで,推定したスキルの解釈を容易にする.実験により,提案方法がスキルの推定とその解釈に有効であることを確認する.

D1-28: Bayesian NetworkとDeep Learningによる品質予測方式の開発

発表者:堀脇一樹((株)日立製作所 生産システム研究部),今沢慶((株)日立製作所 生産システム研究部)

概要:製造業では,品質向上のため,前工程の制御結果から品質を予測し,予測結果から次工程の製造条件を変更する.多工程の製造工程では,予測誤差の累積により予測精度が低下し,製造条件と品質との関係の把握が困難となり,適切な製造条件を特定できない.
そこで,本研究ではBayesian NetworkとDeep Learningを組み合わせたモデルにより予測精度を向上する手法を開発し、適切な製造条件を特定した.

D1-29: 教師あり学習に基づく時系列の因果推論

発表者:近原 鷹一(NTTコミュニケーション科学基礎研究所),藤野昭典(NTTコミュニケーション科学基礎研究所)

概要:時系列の因果推論は,時間変化する変数間の原因と結果の関係(因果関係)を推定する問題である.従来手法の多くは,回帰した結果によって因果関係を推定するが,適切な回帰モデルでなければ誤った推定結果を導く.
本研究では,時系列の因果推論を,訓練データを用いて分類器を学習する,教師あり学習の問題として解くことを考える.実験では,カーネル埋め込みを用いた特徴量表現により,高精度な推定結果が得られることを示す.

D1-30: ロバスト制御方策と探索木を用いた近似ベイジアン強化学習アプローチ

発表者:菱沼徹(京都大学),泉田啓(京都大学)

概要:モデルベース・ベイジアン強化学習は,運動方程式モデル等の先見情報を試行錯誤プロセスへと自然に組み込むことができるという点で,実ロボットの試行錯誤負担を減らすために有効な枠組みである. 本研究では,ロボットにとって望ましい制御方策を現実的な計算量で見つけるために,ロバスト制御・モンテカルロ木探索・近似ベイズ推定を組み合わせた近似アプローチを提案する.数値実験を通じて,提案手法の有効性を検証する.

D1-31: Sparse Regression for Network Graphs and Its Application to Gene Networks of The Brain

発表者:Hideko Kawakubo(Division of Systems Biology, Nagoya University Graduate School of Medicine),Yusuke Matsui(Division of Systems Biology, Nagoya University Graduate School of Medicine),Teppei Shimamura(Division of Systems Biology, Nagoya University Graduate School of Medicine)

概要:It has been unclear whether and how disease-causing genes are associated with the brain network. To identify the brain regions related to a genetic disorder, we propose a sparse regression method.

D1-32: Maximum mean discrepancyに基づく分布マッチングを用いた教師なしドメイン適応

発表者:熊谷充敏(NTT),岩田具治(NTT)

概要:新たな教師なしドメイン適応法を提案する.提案法は,Maximum mean discrepancyに基づき,元ドメインと目標ドメインの特徴分布が同じになるよう,元ドメインから目標ドメインへの変換則を学習する.元データからの変化の大きさがある一定値以下になる変換の中から,最も目標ドメインの分布に近づける線形変換を学習することで,サンプルとラベルの関係を大きく崩すことなく,安定した適応が実現できる.

D1-33: LogDet正則化を用いた二値行列補完

発表者:森富賢一郎(九州大学),畑埜晃平(九州大学),瀧本英二(九州大学)

概要:二値行列のオンライン行列補完問題を考える.オンライン予測では,正則化項と累積損失を同時に最小化するように予測を行う手法が知られている.Herbster et al. (2016)は負のエントロピーを正則化項として用い,誤り回数の上界と下界を示した.本研究では,行列式の対数を正則化項として用い,より小さなリグレットと誤り回数の上界を示した.本結果は誤り回数の下界と一致し,最適なアルゴリズムである.

D1-34: VAEを用いた画像スタイル変換に向けて

発表者:中田 秀基(産業技術総合研究所),麻生 英樹(産業技術総合研究所)

概要:画像スタイル変換は、対象画像をそのコンテントを維持しながら、他の画像のスタイルに従うように変換する操作である。従来のスタイル変換ネットワークを学習する手法では、スタイルごとにネットワークを学習したり、スタイルを独立したネットワークで学習する必要があった。本稿ではVAEを用いて、スタイル情報を隠れ変数の一部として抽出し、隠れ変数の一部を変更することでスタイル変換を行うネットワークを提案する。

D1-35: 人ロボット協調作業ラインにおけるロボット異常検知技術の開発

発表者:今沢 慶((株)日立製作所 生産システム研究部)

概要:製造業では,品質と生産性の両立のため,高難度作業を得意とする人と繰り返し作業を得意とするロボットによる協調作業が求められている.
その際,ロボットは,人の作業状況に応じて,動作を変更するため,ロボットの異常を,過去の動作パターンとの比較により検出することが困難である.
そこで,人とロボットの動作パターンに関する発生確率を用いることで,人と協調作業を行うロボットに対する異常検知方式を開発した.

D1-36: 単体複体の増大列を利用したマルチスケールk近傍法と多クラス点群データの幾何学的構造分析への応用

発表者:南直人(筑波大学大学院 システム情報工学研究科 知能機能システム専攻),延原肇(筑波大学大学院 システム情報工学研究科 知能機能システム専攻)

概要:多クラス点群データの幾何学的構造推定のためのマルチスケールk近傍法を提案する。提案手法では、複数のクラスごとにデータ点を頂点とする単体複体を構築し、それらの間の距離を用いたk近傍法の識別率から点群データのトポロジーを推定する。幾何学的構造を持つ分布からサンプルされた点群データを用いて、識別率評価実験、およびホモロジー群比較実験を行い有効性を示す。

D1-37: Robust and Efficient Off-Policy Policy Evaluation via Enhanced Action-Gap

発表者:Tadashi Kozuno(Okinawa Inst. Sci. and Tech),Eiji Uchibe(ATR),Kenji Doya(Okinawa Inst. Sci. and Tech)

概要:Policy Evaluationは強化学習の基本的問題であり、それを効率よく行う手法が必要である。また実応用では、環境のノイズに対し頑健である事も必要となる。本研究では、最近提案されたRetrace作用素とAdvantage Learning作用素を組み合わせ、頑健なOff-Policy (つまり任意のデータを用いることが出来る効率的な) Policy Evaluation手法を提案する。

D1-38: 自己回帰テンソル分解による時空間予測

発表者:竹内 孝(NTT, 京都大学),鹿島 久嗣(京都大学, 理研AIP),上田 修功(NTT, 理研AIP)

概要:自己回帰モデルと空間自己回帰モデルを正則化として利用するテンソル分解法および因子行列と回帰係数を交互推定するアルゴリズムを提案する。時空間データの時間・空間的な外挿問題によって提案手法の優位性を示す。

D1-39: 分位点回帰を用いた高次元の条件付き密度・最頻値の推定

発表者:大田浩史(東京大学大学院 経済学研究科),原聡(大阪大学 産業科学研究所)

概要:最頻値は確率分布の特徴を表す要約統計量であり, 分布の非対称性や外れ値の影響を受けにくい頑健なものとして知られている. 裾が厚い分布・歪度が大きい分布については,最頻値は期待値が捉えられない分布の構造を捉えうる.本発表では入力Xで条件付けたときの出力Yの条件付き密度関数・条件付き最頻値を,分位点回帰を経由する推定法を与え,Xが高次元の際に既存手法より推定精度が高い傾向があることを示す.

D1-40: Probability Tenser Networks

発表者:石畠 正和(北海道大学),林 浩平(産総研/理研AIP)

概要:複数の離散確率変数を観測した時,それらの間の関係性を知ることは機械学習において重要なタスクであり,ベイジアンネットワークによる解法が主流である.本発表では,テンソルネットワークを用いた確率表現による解法を紹介し,そのポテンシャルについて議論する.

D1-41: IILasso:相関情報を罰則項に導入したスパースモデリング

発表者:髙田正彬(総合研究大学院大学),鈴木大慈(東京大学),藤澤洋徳(統計数理研究所)

概要:変数間の相関が強い場合、Lassoはたびたび互いに高相関の変数を選択し、モデル解釈性の低下や汎化誤差の悪化を引き起こす。そこで、相関情報を罰則項に導入した新しいスパースモデリング”Independently Interpretable Lasso”を提案する。IILassoは低相関の変数を選択するため、回帰係数が直感的に解釈しやすく、汎化誤差も改善する。サポートする理論解析と数値実験も示す。

D1-42: 深層モデルを用いたDisentangleな表現学習

発表者:山田真徳(NTT),岩田具治(NTT)

概要:分散学習ではなく深層モデルを用いたDisentangle学習を実現する方法としてVariational auto-encoderベースのβ-VAEとgenerative adversarial networkベースのInfoGANがある。まず2つの理論的関係について議論する。その後にβ-VAEで学習を行った際の相互情報量について調べた結果を議論する。

D1-43: 部分観測マルコフ決定過程の環境推定

発表者:奥戸道子(東京大学大学院情報理工学系研究科),森村哲郎(IBM東京基礎研究所)

概要:部分観測マルコフ決定過程(POMDP)は表現力の高い時系列モデルであり,強化学習など多くの意思決定過程のモデリングに用いられている.一方で,POMDPの推定はモデルの複雑性ゆえに困難である.本研究では,無限隠れマルコフモデルに対するMCMC法をPOMDP推定に適用し,ベンチマーク問題で性能を検証した.問題によっては目的分布の多峰性からMCMCの収束が非常に遅いため,レプリカ交換法の適用も検討した.

D1-44: Latent Dirichlet Allocationを用いた腸内細菌叢のコミュニティ解析

発表者:細田至温(早稲田大学大学院 先進理工学研究科 電気・情報生命専攻 産総研・早大 生体システムビッグデータ解析オープンイノベーションラボラトリ(CBBD-OIL)),西嶋傑(産総研・早大 生体システムビッグデータ解析オープンイノベーションラボラトリ(CBBD-OIL) 東京大学大学院 新領域創成科学研究科 早稲田大学 理工学術院 先進理工学研究科),福永津嵩(早稲田大学大学院 先進理工学研究科 電気・情報生命専攻 東京大学大学院情報理工学系研究科コンピュータ科学専攻),服部正平(早稲田大学 理工学術院 先進理工学研究科 東京大学大学院 新領域創成科学研究科),浜田道昭(早稲田大学大学院 先進理工学研究科 電気・情報生命専攻 産総研・早大 生体システムビッグデータ解析オープンイノベーションラボラトリ(CBBD-OIL) 日本医科大学 医学研究科)

概要:近年ゲノム解析技術の発展によりヒトの健康と腸内細菌との関係が明らかとなりつつある。一方で、腸内細菌叢には細菌の集まりであるコミュニティの存在が示唆されているが、コミュニティを考慮した解析はあまり行われていない。本研究では腸内細菌の組成比のデータに対して、文書を被験者、トピックを細菌のコミュニティ、単語を細菌属としてLDAを適用し、腸内細菌叢のタイプであるエンテロタイプとの関係を調べた。

D1-45: Supervised Nonparametric Multimodal Topic Modeling Methods for Multi-class Video Classication

発表者:Jianfei Xue(Kobe University),Koji Eguchi(Kobe University)

概要:Topic models are getting popular for video data analysis. We present a Sup-SSC-HDP model for video classification, where topic frequencies learnt from video are modeled as a predictor of video class.

D1-46: カーネル密度関数の局所変形に基づく線状構造物に対する非剛体イメージアライメント

発表者:綿島正剛(九州工業大学),久下小百合(九州大学),石原健(九州大学),飯野雄一(東京大学),吉田亮(統計数理研究所),徳永旭将(九州工業大学)

概要:イメージアライメントとは、異なる環境で計測された複数の画像を共通の座標系に変換するプロセスである。本研究では、カーネル密度関数の局所的な空間変形とマルコフ確率場に基づく変形モデルにより、血管のような細長い構造物も正確に位置合わせ可能な非剛体イメージアライメント手法の開発している。特に、比較する画像間で対応する特徴点を見つけることが困難な場合においても有効に機能するアライメント手法を提案する。

D1-47: 交換Monte Carlo法を用いたMR画像事前分布の正則化パラメータ推定の検証

発表者:松尾篤樹(早稲田大学),原田賢(早稲田大学),井上真郷(早稲田大学)

概要:MR画像再構成では超パラメータとして事前分布の正則化パラメータを決定する必要がある.通常は事後分布に対して交差検証法とグリッドサーチによって決定することが多いが重い計算負荷がかかってしまう.提案手法ではMR画像データセットに対して事前分布の最尤推定によってパラメータを推定する.本研究では提案手法によって推定したパラメータで実際にMR画像再構成を行い,その有効性を議論する.

D1-48: 関係データに向けた混合エキスパートモデル

発表者:小山田昌史(NEC),中台慎二(NEC)

概要:関係データにおけるエンティティ属性値の予測には関係行列に対する表現学習がよく用いられるが、表現学習により得られた特徴ベクトルは解釈が困難である。本研究は、混合エキスパートモデルを関係データ向けに拡張することにより、関係行列から特徴量を算出することなく、高い解釈性と予測精度の達成が可能であることを見せる。

D1-49: 分解型NML符号長を用いた連続値潜在変数モデルの選択

発表者:岡田誠(東京大学 大学院情報理工学系研究科),山西健司(東京大学 大学院情報理工学系研究科,CREST)

概要:潜在変数モデルのモデル選択を考える。従来、完全変数化の方法による正規化最尤符号長(以下、NML)が提案されていたが、計算が困難であった。最近、分解型NML符号長(以下、DNML)が提案され、離散潜在変数モデルの広いクラスに対し、計算効率と精度の両面で有効性が示された。本発表ではDNMLのガウス混合モデルや確率的主成分分析など、連続値をとる潜在変数モデルへの適用する計算方法と性能解析結果を示す。

D1-50: 学習可能なマスクを用いた柔軟な類似度計算手法

発表者:上月正貴(株式会社VASILY/東京大学),中村拓磨(株式会社VASILY),後藤亮介(株式会社VASILY)

概要:従来、一つの畳み込みニューラルネットでは単一の基準に基づいた類似度しか学習できず,複数の基準を扱うには,基準の数だけモデルを学習する必要があった.この解決策として単一のモデルで複数の基準を扱うためにマスクを適用する提案されている.本研究では複数の基準を単一のモデルで学習し,さらに複数の基準を考慮した類似度計算を行うことを目指した.発表では特徴量計算・マスクの構成について論じる.

D1-51: Training Generative Models with MMD

発表者:崔正行(東京大学),前田新一(Preferred Networks)

概要:In this work, we train generative models by minimizing the Maximum Mean Discrepancy (MMD) between joint distributions of data and latent variables.

D1-52: Direct Log-Density Gradient Estimation with Gaussian Mixture Models

発表者:Qi Zhang(Nara Institute of Science and Technology),Hiroaki Sasaki(Nara Institute of Science and Technology),Kazushi Ikeda(Nara Institute of Science and Technology)

概要:We propose a method to directly estimate the gradients of log-density functions with Gaussian mixture models. Through application to mode-seeking clustering, we show that our method is promising.

D1-53: クロスドメインマッチング相関分析を用いた画像とキャプションの同時埋め込み

発表者:福井一輝(京都大学/理研AIP),下平英寿(京都大学/理研AIP)

概要:正準相関分析 (CCA) を用いた単語埋め込みの手法であるEigenwordsをCCAの一般化であるクロスドメインマッチング相関分析を用いて拡張することで,パラレルコーパスの文章IDのviewを介して複数言語の単語を同時に埋め込む手法が提案されている.本発表ではこの手法を画像とキャプションの同時埋め込みに応用し,画像情報を反映した文章ベクトルを得る手法を提案する.

D1-54: Web小説を学習に用いた二段階LSTMによる台本形式小説生成

発表者:鈴木 惇(東京大学)

概要:自動小説生成では、文法、登場人物の人格、発話関係に矛盾のない文章を生成する必要があり、話者が特定された大量の学習データが必要である。Web上の投稿小説には、台本形式と呼ばれ、話者が明示されるものが大量に存在する。
本研究は、これらを二段階LSTMを用いて学習し、台本形式の小説を自動生成する枠組を提案した。本研究は、一度統計処理されたデータから文章を生成する点に著作権の関係から注意されたい。

D1-55: 密度比推定を用いた条件付き相互情報量の近似

発表者:高品佑也(早稲田大学),中谷秀洋(サイボウズ・ラボ(株)),井上真郷(早稲田大学)

概要:確率変数の間のグラフ構造推定は様々な用途で有用である.特に,連続な場合の基本的な手法としてグラフィカルラッソがあるが,非線形な従属性を捉えられないという欠点がある.一方,相互情報量は非線形な従属性も捉えられるが,他の変数を介した従属性も含んでしまっている.我々は,他の変数に条件付けられたときの条件付き相互情報量を密度比推定により近似することで,確率変数間のグラフ構造を推定する手法を提案する.

D1-56: 記述長最小原理に基づくブースティング木学習の早期停止基準

発表者:花田悠介(東京大学大学院情報理工学研究科),山西健司(東京大学大学院情報理工学系研究科)

概要:ブースティング木の学習では、新たな決定木の追加を繰り返すが、過学習を避けるために適切な停止条件を設けることが問題であった。
本研究では、MDL原理に基づいて、モデルとデータの記述長を最小化するような停止条件を提案する。
この停止条件に従って学習を止めることにより、優れた汎化性能が得られる一方で、従来手法のクロスバリデーションと比べて計算負荷が少ないことを実験的に示す。

D1-57: オンラインジャッジサイトのデータセットのプログラム自動生成への応用

発表者:Panyam Chandrasekarasastry Nagesh(The University of Melbourne),江原 遥(産業技術総合研究所),徳永 拓之(スマートニュース株式会社),鶴岡 慶雅(東京大学),小田 悠介(奈良先端科学技術大学院大学・情報通信研究機構),渡部 有隆(会津大学)

概要:プログラミングコンテストの練習のためのシステムとして、ユーザが投稿した、プログラミング問題を解くコードを自動検証するオンラインジャッジシステムがある。これらのシステムでは、自然言語で記述されたプログラミング問題に対して、多数のユーザからの投稿によってコードが蓄積される。本稿では、こうしたデータセットを、自然言語からのプログラム自動生成タスクに応用する手法について報告する。

D1-58: 条件付き変分オートエンコーダを用いた俳句生成

発表者:川島寛乃(慶應義塾大学環境情報学部),河野慎(慶應義塾大学政策・メディア研究科),米澤拓郎(慶應義塾大学政策・メディア研究科),中澤仁(慶應義塾大学環境情報学部)

概要:俳句は, 想いや情景などを定型で詠み込む非常に奥深い日本文学である.本研究では変分オートエンコーダによる言語モデルを用い,俳句の生成を試みる.その際に俳句の特徴の一つである17音という音数に対応するため,俳句をかな表記で扱いLSTM構造を採用する.また季語による季節表現を生成する俳句に反映させるため,言語モデルの条件として季語を入力する.本発表では,提案手法を用いた俳句の生成結果について議論する.

D1-59: 交差検証による正常データ選別の自動化

発表者:鈴木英明((株)日立製作所 研究開発グループ),藤原淳輔((株)日立製作所 研究開発グループ),石田響子((株)日立製作所 研究開発グループ),河野敏明((株)日立製作所 研究開発グループ)

概要:設備機器などの時系列データに基づいて異常検知を行う場合,正常動作時のデータを機械学習させることで獲得した正常モデルと診断対象データとの再構成誤差を指標として用いるが,実際には機器の正確な内部状態は外観検査だけでは判断できないため,正常・異常のラベルを正確につけることが難しい。本発表では,交差検証法を援用することで正常データの選別を自動化する手法について実データによる検証の観点を交えて議論する。

D1-60: フルプロクルステス距離の拡張とその距離計量学習

発表者:岡本 司(広島市立大学),岩田 一貴(広島市立大学),末松 伸朗(広島市立大学)

概要:フルプロクルステス距離はランドマークに基づく形状間の距離のうちで最も代表的なものである.フルプロクルステス距離は,等方的スケーリングしか考慮しないため,同じクラスの形状であっても,非相似に歪んだ形状間の距離は大きくなってしまい,形状検索において問題になることがある.そこで,本研究ではこの問題を解決するために,フルプロクルステス距離を拡張し,その距離計量学習を示す.

D1-61: 近傍標本点の対応を考慮した形状間の対応づけとその計算コストの削減

発表者:山本 大貴(広島市立大学),岩田 一貴(広島市立大学),末松 伸朗(広島市立大学)

概要:線描画などの実データを使って,形状間の対応づけに関する最小化問題を解くと,形状の歪みや標本点の配置などが原因で,適当な対応づけが得られないことがある.そこで,本研究では,近傍標本点の保存も考慮した対応づけを考えることにより,この問題を軽減する方法を提案する.また,そのような対応についての最小化問題を解くには,大きな計算コストがかかるので,分岐限定法を用いた計算コストの削減についても検討する.

D1-62: ソフトラベル判別

発表者:谷本啓(NEC / 京都大学),山田聡(NEC)

概要:実数値の目的変数がある閾値を超えるかどうか判別する問題を考える。このような設定は、商品の売上が一定値を超えるなら陳列する、劣化度が危険水準に達するなら補修する、映画の評価値が一定値を超えるなら推薦する、など予測に基づいて二値の行動を決定する問題の中に現れる。これに対し判別モデルを用いることにより近似誤差を抑えつつ、実数目的変数値の情報を活用することで学習におけるサンプル効率を高める手法を提案する。