ディスカッショントラック・セッション２日目

ポスタープレビュー

概要集

D2-1: 非凸スパース正則化に対する確率伝搬法とその収束条件

発表者：坂田綾香（統計数理研究所），許インイン（Aalto university）

概要：スパース制約を用いた変数選択は近年様々な分野で用いられている。特にL1制約が広く用いられるが、推定値にバイアスが生じるという問題点が知られている。そこでバイアスを抑えるようデザインされた非凸スパース制約が提案されている。本研究では、非凸スパース制約の性能を理論的に明らかにし、達成限界を理論的に保証したアルゴリズムを構成する。また非凸スパース制約に対するモデル選択規準を導出する。

D2-2: Learning Efficient Tensor Representations with Ring Structure Networks

発表者：Qibin Zhao (RIKEN AIP)，Longhao Yuan (Saitama Institute of Technology/RIKEN AIP)，Masashi Sugiyama (RIKEN AIP/UTokyo)，Andrzej Cichocki (RIKEN BSI)

概要：We propose a tensor ring decomposition by employing circular multilinear products over a sequence of low-order core tensors.

D2-3: 位置による割引効果が未知な複数選択バンディット問題

発表者：小宮山純平（東京大学生産技術研究所），本多淳也（東京大学大学院新領域創成科学研究科），武田朗子（統計数理研究所）

概要：複数のクリック率の不明なオンライン広告をウェブサイトに配置する問題を考える。このとき、クリック率の高い広告から順に配置したいが、ユーザのフィードバックを見ながらオンライン的に配置を最適化する必要がある。下の位置にある広告は通常より見る確率が低いが、この割引効果を考慮したオンライン最適化を多腕バンディット問題として定式化し、有効なアルゴリズムを提案する。

D2-4: Delayed Feedback を考慮した予測モデルの提案

発表者：今井優作（株式会社サイバーエージェント），吉川友也（千葉工業大学）

概要：予測モデルの構築にあたり目的変数が確定するまでに時間遅れが生じる問題がある．例えばインターネット広告におけるクリック予測を考えると，ユーザが広告をクリックしてからコンバージョンするまでに最大で30日間かかるような場合がある．本発表では，上記のように目的変数が未ラベルとなる「Delayed Feedback」に対して頑健な予測モデルを提案し，より高い精度で予測可能であることを報告する．

D2-5: 重み付き射影法を使ったKernel Regressionによる予算付き追記学習

発表者：山内康一郎（中部大学工学研究科情報工学専攻）

概要：組み込み機器にインストール可能な予算付きオンライン学習法を提案する。ただしここではregressionを前提とする。ここではまず、kernel perceptronを使った予算付き学習法の発展版：重み付き射影学習法を提案する。この学習法は従来法よりも少ないregret boundを持つことを示す。次にこれをkernel regressionに適用し、アンバランスデータに強いことを示す。

D2-6: 適応的独立成分分析によるノイズ除去と特徴抽出

発表者：松田源立（東京大学）

概要：筆者らは、以前に、源信号の2次元特徴空間上でのガウス分布近似を利用し、源信号分布を適応的に評価可能かつシンプルな独立成分分析手法(適応的ICA)を提案した。本研究では、適応的ICAの源信号分布に依存しない特性を利用し、一般的な情報量基準を導入することで、非ガウス源信号の個数同定によるノイズ除去や、少数サンプルからの特徴抽出等が可能となることを示す。

D2-7: ベイズ推論による生成物時間分析を用いた触媒反応機構の解明

発表者：安倍雅史（東大総合文化），水野雄太（東大総合文化），板子健太郎（東大新領域），中西(大野)義典（東大総合文化），佐々木岳彦（東大新領域），福島孝治（東大総合文化）

概要：生成物時間分析(TAP)装置とは，固体触媒を用いた化学反応の速度論的性質を調べる装置である．TAP実験では，ガスフローの時系列データから反応ガスの拡散係数などのパラメータが求められる．一方従来の解析方法では，実験データを特定の点で代表させているため得られた情報を十分生かし切れていない．本発表では， TAPデータにベイズ推論の枠組みを適用することで，系のパラメータを推定する手法を提案する

D2-8: 一般化加法モデルの全変動ノルムによる正則化

発表者：松島慎（東京大学）

概要：一般化加法モデルは複雑かつ解釈性の高い予測関数のモデルであるが、大規模なデータからの学習は計算量的な困難があった。
本研究では一般化加法モデルの経験リスク最小化に対し全変動ノルムを用いた正則化を課すことで、効率的に複雑かつ解釈性の高い予測関数を学習できることを示す。
さらに統計的機械学習の見地から、この枠組みは最適な予測関数を漸近的にPAC学習の意味で学習可能であることを示す。

D2-9: 関数微分法による深層ニューラルネットワークの構築

発表者：二反田篤史（東京大学），鈴木大慈（東京大学）

概要：深層ニューラルネットワークと目的関数の勾配流が定める連続方程式の解の離散化及びL2空間での関数微分よる最適化法の関係を明らかにし，この観点に基いた理論解析を与える．教師無し学習での応用例としてWGANsを取り上げ，収束解析と実験結果を紹介する．教師有り学習では勾配流がラベル情報を取り込む事に起因する問題が発生するが，この問題を回避するためのカーネル法に基づく手法を提案し，その汎化性解析を与える．

D2-10: グラフ上の区分単調信号の推定

発表者：南賢太郎（東京大学），駒木文保（東京大学）

概要：DAGの連結成分上で，枝の向きから定まる半順序と整合的な信号（区分単調信号）の推定について考える．この問題に対し，DAGの枝による正則化について議論する．まず，適切なパラメータを選べば区分単調信号を推定できるという理論保証が得られる．さらに，これは劣モジュラ正則化に属し，推定量とそのリスクの推定量が高速に計算できる．特に，データからパラメータを自動決定できるが，この有用性を数値実験により確認する．

D2-11: 深層混合モデルによるクラスタリング

発表者：林楓（立命館大学情報理工学研究科），岩田具治（NTT コミュニケーション科学基礎研究所），谷口忠大（立命館大学情報理工学研究科）

概要：確率的混合モデルと深層学習を組み合わせることで，原空間上の非ガウス型クラスタ形状をもつデータに対するクラスタリング手法を検討した．本手法では，原空間上のデータをVariational autoencoderを用いて潜在空間に写像し，潜在空間上で混合ガウスモデルによってクラスタリングする．また，その混合ガウス分布とニューラルネットのパラメータを同時学習する際の近似推論法を提案する．

D2-12: クラウドソーシングを用いた半教師あり学習のための深層生成モデル

発表者：新恭兵（北海道大学），小山聡（北海道大学/理化学研究所革新知能統合研究センター），栗原正仁（北海道大学）

概要：教師あり学習のためのラベルの収集方法としてクラウドソーシングが注目されているが，その作業品質にはばらつきがある．また，近年得られる大規模データにおいては，全てにラベルを付けることはコスト面で現実的ではない．そこで本研究では，クラウドソーシングを用いた半教師あり学習のための深層生成モデルを提案する．我々のモデルでは，潜在特徴とデータの生成分布を導入することでラベルなしデータを効果的に利用できる．

D2-13: 深層強化学習による車両と交通システムの最適化

発表者：大橋耕也（東工大），幸島匡宏（NTT），堤田恭太（NTT），松林達史（NTT），戸田浩之（NTT）

概要：都市の交通渋滞や大規模イベントにおける混雑の解消のためには, 人や車両の誘導だけではなく, 信号や公的交通機関等の交通システムを含めた最適化が有効であると考えられる. 本研究では, 近年広くその有効性が示されている深層強化学習を用いて, 車両と交通システムを制御する最適方策の発見を試みた. 交通シミュレーションによる実験を通して得られた方策の定量的・定性的結果について報告する.

D2-14: ガウス過程を用いたイオニクス結晶中における伝導キャリアの準安定構造探索

発表者：椙田大輔（名工大），豊浦和明（京大），金森研太（名工大），竹内一郎（名工大, 理研, NIMS）

概要：イオニクス結晶におけるイオン伝導経路は, 短距離のイオンのホッピング現象の組み合わせによって記述される. しかし, ホッピングの起点となる準安定構造すべてを材料科学的な知見なしに同定することは困難であり, 複雑な構造をもつ結晶の解析への障害となっている. 本発表では, ガウス過程による確率モデルを用いることで, 専門的知識を用いることなく, 効率的に準安定構造を探索する手法について検討する.

D2-15: 単語辞書を併用した単語分割しない単語埋め込み

発表者：Geewook Kim（京都大学工学部/理研AIP），福井一輝（京都大学大学院情報学研究科/理研AIP），羽田哲也（大阪大学大学院基礎工学研究科/理研AIP），下平英寿（京都大学大学院情報学研究科/理研AIP）

概要：単語分割を経由しない単語埋め込み手法が提案されている．これは単語の代わりにn-gramを対象として埋め込みを行うことで，単語分割の誤りを回避するという手法である．しかし，この手法では意味を持たない文字列までを含んで学習を行うこととなり，全体的な埋め込みの性能が劣化する問題がある．本発表では単語辞書の初期値を与えてその辞書を拡張することで上記の問題を改善する方法を提案する．

D2-16: ネットワーク解析に基づく多層ニューラルネットの大局構造抽出と理解

発表者：渡邊千紘（NTTコミュニケーション科学基礎研究所），平松薫（NTTコミュニケーション科学基礎研究所），柏野邦夫（NTTコミュニケーション科学基礎研究所）

概要：深層学習は様々な分野でのデータ予測性能を大幅に向上したが，多層ニューラルネットによる推論は多くの非線形パラメータからなり，人間が理解するのは難しい．我々は以前，ネットワーク解析を用いて多層ニューラルネットの大局構造を抽出し，単純化して提示する手法を提案した．本発表ではこの手法を，文字画像データセットMNISTを用いて学習したニューラルネットに適用し，得られた結果からその推論の構造について考察する．

D2-17: Fully adaptive algorithm for pure exploration in linear bandits

発表者：徐立元（東京大学／理化学研究所），本多淳也（東京大学／理化学研究所），杉山将（理化学研究所／東京大学）

概要：各腕の報酬がその腕の特徴量に対する線形モデルで表現される線形バンディットの設定において、報酬の期待値が最大の腕を早く見つける最適腕識別問題を考える。これまでは事前に固定した戦略に基づいて引く腕を決める手法が提案されていたが、過去の報酬から戦略を適応的に変化させることで、更に性能が改善できる。本発表ではこの考えに基づく新しい手法を提案し、従来法よりも早く最適腕を識別できることを理論的・実験的に示す。

D2-18: 共鳴現象を用いた自己組織化リザーバコンピューティング

発表者：金澤直輝（日本アイ・ビー・エム株式会社東京基礎研究所），山根敏志（日本アイ・ビー・エム株式会社東京基礎研究所）

概要：物理系の非線形なダイナミクスを用いた時系列信号の処理手法として，リザーバコンピューティングという枠組みが注目されている．これは，リザーバ層および線形のアダプティブフィルタによって構成され，フィルタ部の係数のみを学習する．この実装例として，磁性体等に見られる共鳴現象をリザーバ層の活性化関数として用いる自己組織化リザーバの構築方法に関する提案を行ったので，これを報告する．

D2-19: 機械学習におけるエンタングルメントエントロピー

発表者：新谷祐矢（神戸大学），笹川佳則（神戸大学）

概要： エンタングルメントエントロピー(EE)は量子力学系の情報量を定量化するものである。近年、量子系との対応を通じて、ニューラルネットワークにおいて、EEが果たす役割が解析されつつある。我々は、制限ボルツマンマシンについて、可視層と隠れ層の間のEEが学習とともにどのように変化していくかを調べた。EEが学習を反映した指標となっているか議論したい。有効な隠れ層の構造についても考察する予定である。

D2-20: 経験ベイズ法による行列・テンソル補完

発表者：松田孟留（東京大学），駒木文保（東京大学）

概要：行列補完とは、行列型データの観測成分をもとに未観測成分を推定する問題であり、商品推薦など多くの応用をもつ。本研究では、経験ベイズ法による行列補完のアルゴリズムを開発した。これはEfron and Morris(1972)による行列平均の特異値縮小型推定量を土台にしている。また、テンソル補完への拡張も行った。

D2-21: Bi-Module PathNet: ネットワーク構造の汎用性と学習の計算量の改善に向けた転移学習アルゴリズム

発表者：今井俊輔（筑波大学大学院システム情報工学研究科知能機能システム専攻），延原肇（筑波大学大学院システム情報工学研究科知能機能システム専攻）

概要：モジュール型ニューラルネットにより破滅的忘却を防ぐPathNetの汎用性の向上および学習パラメータ削減のため，Bi-module PathNetによる転移学習を提案する．
提案法の転移前学習ではモジュール型の構造を用いず一般的な確率的勾配降下法等で学習，転移後の学習では，転移前学習のパラメータで固定したモジュールと新規モジュールのいずれかの選択により学習，汎用性の向上と計算量の削減が期待できる．

D2-22: グレイゾーン幅を利用した悪腕存在チェックアルゴリズム

発表者：田畑公次（北海道大学電子科学研究所），中村篤祥（北海道大学大学院情報科学研究科），本多淳也（東京大学大学院新領域創成科学研究科），小松崎民樹（北海道大学電子科学研究所）

概要：与えられた1未満の３正数θ_U, θ_L, δ(θ_U>θ_L)に対し，確率的多腕バンディット問題設定において，与えられたKアームの中に損失平均がθ_U以上のものが存在する，または全てθ_L以下である場合に，できるだけ少ない回数試行することで確率1−δ以上で正しく答える問題を考える。この問題に対し，グレイゾーン幅θ_U−θ_Lを利用したアルゴリズムを提案し，その理論的及び実験的解析を行う。

D2-23: ブランドコンセプトを反映したファッションアイテム類似検索

発表者：中村拓磨（株式会社VASILY），上月正貴（株式会社VASILY/東京大学），後藤亮介（株式会社VASILY）

概要：ファッションブランドは独自のコンセプトに基づいた商品開発により各々固有のファンを獲得している．本研究では各ブランドの支持の偏りから抽出された意味表現をブランドコンセプトと位置づけ，商品画像をブランド意味表現空間に埋め込むことで，画像からブランドコンセプトを抽出することを目指す．また，提案手法の応用例として検索やレコメンドシステムへの展開を論じる．

D2-24: Monotonic Policy Improvement from On- and Off-Policy Mixture Data

発表者：岩城諒，浅田稔（大阪大学，大阪大学）

概要：本研究では，on-policy と off-policy が混在した学習データを利用する場合であっても，方策を単調改善できることを示す．理論解析結果に基づき，experience replay を利用した trust region policy optimization 法を提案する．提案法は，off-policy 型の自然方策勾配法の一種であると解釈できる．

D2-25: ベイズ最適化を用いた交通流信号制御の最適化

発表者：伊藤秀剛（NTT），堤田恭太（NTT），松林達史（NTT），戸田浩之（NTT）

概要：信号による交通制御を最適化する問題を考える。信号による交通制御においては、複数の信号を系統的に制御することの有効性が知られている。そこで本研究では、ベイズ最適化を用いて、信号を系統的に制御するパラメータの最適化を実現する手法を提案する。

D2-26: ベイズ機械学習によるテキストの論理構造抽出

発表者：木下涼（電気通信大学大学院情報理工学研究科），宇都雅輝（電気通信大学大学院情報理工学研究科），植野真臣（電気通信大学大学院情報理工学研究科）

概要：近年，テキストの論理構造を自動推定する論証マイニング技術が注目されているが，既存手法の推定精度は十分に高いとはいえない．推定精度の低下要因の一つとして，論理構造の構成要素間について因果関係の強さを考慮していない点が挙げられる．そこで本研究では，各要素間に因果関係がある確率を用いて論理構造を推定できる手法を提案する．さらに評価実験により，提案手法が推定精度の向上に寄与することを示す．

D2-27: サービス運用中のRNNモデルにおけるパラメータ更新時の問題点とその緩和法

発表者：岩瀬智亮（ヤフー株式会社），大倉俊平（ヤフー株式会社）

概要：実サービスにおいて、推定モデルの定期的なパラメータ更新は精度維持のために必須である。一方で、通常のRNNモデルは更新前のモデルの隠れ状態を更新後のモデルが引き継ぐことができない。各系列の初めから状態を再計算することは計算コストが高く、かつそのために過去の系列データをすべて記憶しておく必要が生じる。本研究では、これらの問題を緩和する学習方法を提案し、記事閲覧実績データに適用してその有効性を検証した。

D2-28: ソフトウェア依存関係ネットワークにおけるベイズ的コミュニティ抽出

発表者：渡邊裕貴（電気通信大学情報理工学研究科），寺田実（電気通信大学情報理工学部）

概要：オープンソースソフトウェアの分野ではソフトウェアはパッケージ単位に分割されて提供されるが、パッケージの数が増えるにつれ、パッケージ間の依存関係のつながりはより複雑になり、全てのパッケージを通じた巨大な関係の全体像を把握することは難しくなる。本研究では、依存関係ネットワークにおいてベイズ的なコミュニティ抽出手法を適用し、複雑なパッケージの繋がりを分かりやすく理解できるようにする方法を提案する。

D2-29: 半教師あり学習による分子の物性予測

発表者：グエンハイ（京都大学），大野健太（Preferred Networks），前田新一（Preferred Networks）

概要：大量のデータベースを用いた分子の物性(毒性, 親水性, HOMO値など)予測を深層学習を用いて行うことで物性予測が可能になってきている。しかし、物性の計測は実験の手間がかかる。そこで、本研究では分子の構造情報のみが与えられたデータと構造情報と物性の両方が与えられたデータの両方を用いた半教師あり学習による性能向上をはかった。その手法と実験結果について述べる。

D2-30: 可変窓上の記述長最小化に基づく時系列データの変化検知

発表者：金子亮也（東京大学），宮口航平（東京大学），山西健司（東京大学）

概要：高頻度で観測された大容量の時系列データの挙動変化を検知する問題は，ビッグデータ解析における主要なテーマの一つとなっている．本研究では，データ圧縮の観点に由来する検定統計量を導入し，可変窓の枠組みで統計的仮説検定を行うことで変化検知を行うアルゴリズム（SCAW）を提案する．SCAWはその計算量の準最適性，仮説検定の誤り確率に関する理論的保証，さらに最適な超パラメータが決定可能であることに特長がある．

D2-31: カーネル正準相関分析を用いたデータ融合法の提案

発表者：光廣正基（慶應義塾大学大学院経済学研究科），星野崇宏（慶應義塾大学経済学部）

概要：異なる情報源から取得した2つの多変量データを融合する方法として，統計的マッチング法が挙げられる．本研究では，各データにカーネル正準相関分析法を適用し，共変量を同じ低次元空間に射影した後，得られた正準変量にマッチング法を適用するデータ融合法を提案する．提案手法の有用性を示すため，通常のマッチング法で欠測補完した結果と予測精度の比較を行う．

D2-32: 属性ベクトルとニューラルネットワークを用いた異種データ間のリンク構造の最尤推定

発表者：奥野彰文（京都大学大学院情報学研究科・理化学研究所革新知能統合研究センター），羽田哲也（大阪大学大学院基礎工学研究科・理化学研究所革新知能統合研究センター），下平英寿（京都大学大学院情報学研究科・理化学研究所革新知能統合研究センター）

概要：画像やテキストといった，種類の異なるデータを異種データと呼ぶ．
本発表では，異種データの属性ベクトルを用いてデータ間のリンクを生成する確率モデルを提案し，その最尤法の理論的性質を示す．
さらに提案モデルにニューラルネットワークを組み合わせることで，既存のフレームワークを用いて最尤推定量を効率的に求めることができ，リンクの予測精度も向上することを理論・応用の両面から説明する．

D2-33: A study on the performance of DDPG (Deep Deterministic Policy Grandient)

発表者：洪青（筑波大学），中田秀基（筑波大学/産総研），谷村勇輔（筑波大学/産総研）

概要：強化学習とニューラルネットワークを結合した学習モジュールは、比較的単純な環境であるビデオゲームなどにおいては人間よりも高い性能を示すことが知られているが、より複雑な環境における性能は明らかではない。本稿ではActorとCritic双方にDDPを用いるアルゴリズムDDPGを高度に複雑なシミュレーション環境における学習に適用し、その有用性を確認する。

D2-34: 収益分布推定の不確実性に基づく効率的な探索法

発表者：野口裕貴（慶応大学），楠本充（Preferred Networks），前田新一（Preferred Networks）

概要：強化学習のタスクにおいては効率的な探索が求められる。本発表では、収益分布の事後分布を求め、Bayes-UCBに基づいて探索を行う手法を提案する。Bayes-UCBを利用することで、高い収益が得られるかどうかが不確実と思われる状態・行動対をより重点的に探索することができる。簡単な計算機実験で提案法の有効性を確かめる。

D2-35: 密度推定器を用いた確率的ホワイトリスト生成による異常検知

発表者：山中友貴（NTT），高橋大志（NTT），山田真徳（NTT）

概要：教師なし学習を用いた異常検知は、機器故障監視やセキュリティ監視をはじめ数多くの分野に応用されている。本発表ではこの中でも、確率密度推定を用いた異常検知システムに着目する。このような異常検知システムは、学習対象となる正常データ間に数の偏りがある状況では、数が少ない正常データを誤検知してしまう傾向にある。そこで本発表では変分オートエンコーダを用い、前述の課題に対応した新たな異常検知システムを提案する。

D2-36: 観測が制限されたオンラインスパース線形回帰問題に対する効率的アルゴリズム

発表者：伊藤伸志（NEC），波多野大督（国立情報学研究所），澄田範奈（国立情報学研究所），矢部顕大（NEC），福永拓郎（JSTさきがけ），垣村尚徳（慶応義塾大学），河原林健一（国立情報学研究所）

概要：逐次的に得られる多次元データに対し、限られた次元数の観測に基づいて線形回帰モデルを構築し、逐次的に予測値を出力する問題を考える。この問題に対して、多項式時間アルゴリズムで劣線形なリグレットを達成することは困難であることが示されている。本研究では、入力データが適当な条件をもつ生成モデルに従うという仮定のもとで劣線形リグレットを達成する多項式時間アルゴリズムを提案する。

D2-37: 確率的な希少事象条件探索と、その迷光解析への応用

発表者：木佐森慶一（産業技術総合研究所），鷲尾隆（産業技術総合研究所），亀田義男（産業技術総合研究所）

概要：シミュレーションを用いた工学設計において、非常に稀(例えば1億分の1の確率)だが致命的な欠陥となる設計条件を効率よく発見することを目的として、確率的探索手法であるmulticanonical MCMC法を用いた。さらにこれを拡張し、希少事象の発見に特化した手法の提案を行った。本提案手法を、人工衛星に搭載する光学系での迷光の発生条件の探索に適用し、提案アルゴリズムの有効性を実証した。

D2-38: 頭部姿勢情報からのストレス予測

発表者：草野仁志（京都大学大学院情報学研究科），堀口裕士（京都大学大学院情報学研究科），馬場雪乃（京都大学大学院情報学研究科），鹿島久嗣（京都大学大学院情報学研究科）

概要：ユーザーのストレスを予測することは、ワークロード最適化などに対して大きな可能性を秘めている。これまでに、様々な手法でストレス予測が試みられてきたが、センサの利用しやすやプライバシーの問題から、日常的な状況で利用することは困難である。本研究では、VRやARの普及に伴い一般的なデータとなり、プライバシーの問題も生じにくい頭部姿勢の動きから抽出した特徴量によってストレスの度合いを予測できることを示す。

D2-39: ノンパラメトリック被覆木

発表者：今泉允聡（統計数理研究所），Manohar Kaul（Indian Institute of Technology Hyderabad）

概要：被覆木（Cover Tree）とは、標本点の集合を表現するデータ構造で、標本点による木構造とその深さに応じた半径の閉球で構成される。このデータ構造は最近傍点探索に用いられ、検索システムなどに応用がある。本研究は、標本点の分布の情報を用いて被覆木の効率化手法を提案した。提案手法は、ノンパラメトリック統計手法を用い、小球確率に基づく最適な閉球半径を導出する。発表では手法及び理論的・実験的な性能を示す。

D2-40: アウトプットの重み付き和に基づくRNN言語モデル

発表者：川田航希（電気通信大学大学院情報理工学研究科），西山悠（電気通信大学大学院情報理工学研究科），川野秀一（電気通信大学大学院情報理工学研究科）

概要：本研究では、自然言語処理分野において様々な形で利用される技術である言語モデル、とくにリカレントニューラルネットワークを用いた言語モデルに焦点をあてる。このモデルでは文脈を表すベクトルとの内積が最も大きくなる単語ベクトルを求め、それをモデルの予測として用いる。単語に対応するベクトルが複数あれば言語モデルの精度向上や応用の可能性などが見込める。様々な実験によってこの考えが有効であることを示す。

D2-41: 大規模データに適した局所的なベイズ学習法

発表者：小山雅典（立命館大学理工学部数理科学科），前田新一（PFN）

概要：本研究は、データ空間を局所的には線形に近似できるという多様体仮説をもとに，Big Data に対してスケールする新しい学習アルゴリズムを提案する。本発表ではこのコンセプトを超解像へ適用したものを紹介する.

D2-42: Constrained Deep Q-learning gradually approaching ordinary Q-learning

発表者：大西翔太（京都大学），石井信（京都大学），安井裕司（本田技術研究所），中西康輔（本田技術研究所），喜住祐紀（本田技術研究所），内部英治（国際電気通信基礎技術研究所）

概要：DQNは目標値を計算するためのターゲットネットワークを導入し、サンプル間の依存関係を軽減することで学習を安定化させている。しかし、ターゲットネットワークを更新しない限り価値は伝播されないため、DQNは学習に膨大な時間を要する。そこで我々はターゲットネットワークを目標値の制約として用いる手法を提案する。提案手法は従来法よりもサンプル効率が良く、ターゲットネットワークの更新頻度に対してロバストである。

D2-43: 複数ドメイン間の転移学習におけるドメイン重要度の最適化

発表者：松井孝太（名古屋大学大学院医学系研究科），金森研太（名古屋工業大学大学院情報工学専攻），熊谷亘（理化学研究所革新知能統合研究センター）

概要：目標ドメインでの判別タスクの精度を向上させるために，複数の元ドメインのデータを重要度で重み付けして統合する問題を考える．これは元ドメインが単一の場合には通常の共変量シフト問題となり，パラメトリックな相対密度比による重み付けが良い性能を示している．本研究では相対密度比を複数ドメインに対応できる形に修正し，各ドメインの重要度を制御するパラメータを最適化する方法を提案する．医学データへの応用も紹介する．

D2-45: 確率的劣モジュラ関数の適応的最大化とそのニュース推薦への応用

発表者：小西卓哉（国立情報学研究所），福永拓郎（科学技術振興機構さきがけ），藤田澄男（ヤフー株式会社），河原林健一（国立情報学研究所）

概要：本研究では、各アイテムの状態が確率的に決まるアイテム集合上において、単調劣モジュラ関数のナップサック制約付き最大化問題を考える。特に、状態によって目的関数とナップサック制約への貢献が異なる場合を考え、理論保証のある適応的近似アルゴリズムを提案する。具体的な応用先として、ユーザの反応を考慮したニュースリストの推薦問題についても合わせて議論する。

D2-46: カーネル法に基づく共起尺度

発表者：横井祥（東北大学,理化学研究所），福水健次（統計数理研究所），小林颯介（Preferred Networks），乾健太郎（東北大学,理化学研究所）

概要：言語表現の間の共起の強さのモデル化は自然言語処理における基本的タスクである。自己相互情報量は計算コストが小さく経験的に有用だが疎性に弱い。深層学習ベースのモデルは疎性に強いがデータ数と学習時間を要する。本研究ではカーネルによる相互共分散への標本対の寄与を計算し、これを共起の尺度とする。実験では、提案手法が相対的に計算コストが小さく、またデータが疎で小標本の場合に有効であることを示す。

D2-47: Kernel recursive ABC: point estimation with intractable likelihood

発表者：梶原隆文（NEC/産業総合技術研究所），山崎啓介（産業総合技術研究所），金川元信（Max Planck Institute for Intelligent Systems），福水健次（統計数理研究所）

概要：We propose a novel method for point estimation with intractable likelihood. Its consistency with maximum likelihood estimate (MLE) is discussed.

D2-48: 動画フレームごとのコメント密度の推定による画像サムネイル生成

発表者：山口想（電気通信大学情報理工学研究科），大垣慶介（株式会社ドワンゴ），小田桐優理（株式会社ドワンゴ），松井勇佑（国立情報学研究所）

概要：動画から要約的なサムネイル画像を生成する研究として, 既存のサムネイルを教師データに用いて各フレームが画像サムネイルかどうかを分類する手法がある. 一方で，動画共有サービスには, 動画毎のサムネイルの他にも, コメントなど各フレームへの注目を表す指標が存在する. 我々は各フレームごとに推定したコメント密度を介して, より高い精度で注目フレームを要約したサムネイル画像を生成することを試みる.

D2-49: U-netを用いた細胞画像からのNC比推定

発表者：石部大夢（東京大学），奥田敬二郎（東京大学），佐藤匠（東京大学），佐藤瞭（東京大学），長岡風吹（東京大学），山地穂岳（東京大学），佐藤一誠（東京大学）

概要：NC比とは，核と細胞質の容積比のことで，細胞診における悪性細胞の判定基準の一つとして重要である．本研究では，U-netを用いて細胞画像からNC比を推定することを試み，その性能に関して分析を行う．

D2-50: 人流シミュレーションにおけるエージェントパラメータの推定

発表者：清水仁（NTTコミュニケーション科学基礎研究所），大塚琢馬（NTTコミュニケーション科学基礎研究所），岩田具治（NTTコミュニケーション科学基礎研究所），澤田宏（NTTコミュニケーション科学基礎研究所），上田修功（NTTコミュニケーション科学基礎研究所）

概要：大規模イベントなどでの群衆の混雑を予測したり誘導策を策定したりする際には，マルチエージェントシミュレータ（MAS）の活用が期待される．MASをより正確に実行するためには，実際の観測に近い出力が得られるようなパラメータを設定する必要がある．本研究では，道路網において一部のリンクの通過人数を観測したときに，エージェントのパラメータ（発生時刻と移動経路）を推定する手法を提案する．

D2-51: Correction of Covariate Shift Bias Produced by Action of Optimization

発表者：比嘉亮太（NEC）

概要：In many cases, evaluation for optimization effect before the actual operation changes the data distribution between validation and test set. We show that covariate shift adaption can correct the bias.

D2-52: PU-データに対するスパースSVMの同時セーフスクリーニング

発表者：杉山太信（東京工業大学,理化学研究所革新知能統合研究センター），前原貴憲（理化学研究所革新知能統合研究センター）

概要：スパースSVMは分類問題に用いられる手法であり、同時スクリーニングは不要なサンプル・特徴量を除くことでSVMを高速化する手法である。多くの実データは正例とラベル無しデータからなるが、このようなデータに対する同時スクリーニング手法は存在しない。本研究ではこの手法を開発する。

D2-53: 正規化最尤符号を用いた潜在的漸進変化の兆候検知

発表者：平井聡（東京大学），山西健司（東京大学）

概要：本研究では，漸進的に変化の伴う時系列データに対してそれの潜在構造変化を検出する問題を考える．本問題に対する新しい手法として，正規化最尤（NML）符号を用いて潜在構造特定と変化度推定を行う手法を提案する．これは記述長最小原理に基づき各時刻の潜在構造を推定，また変化の兆候を検出するものである．データの性質に応じて様々なモデルを仮定することで，時系列データの漸進的な変化をモデル化し特定することを目指す．

D2-54: 系列モデル学習におけるαダイバージェンスを用いた目的関数の統合

発表者：小山田創哲（リクルートホールディングス・産総研・京大），菊池悠太（Preferred Networks），兼村厚範（産総研），前田新一（Preferred Networks），石井信（京大・ATR）

概要：系列予測を行うニューラルネットワークモデルの学習において，αダイバージェンスを目的関数に用いる新しい学習法を提案する．提案手法の目的関数が系列予測において，尤度最適化ベースの目的関数と，強化学習ベースの目的関数を一般化し，パラメータαの選択において両者を特殊な場合として再現できることを示す．また機械翻訳タスクにおける数値実験の結果，提案手法は既存の尤度最適化ベースの手法を上回る性能を示した．

D2-55: The optimal-baseline estimator is not the optimal baseline-estimator

発表者：Paavo Parmas（OIST），Jan Peters（TU Darmstadt），Kenji Doya（OIST）

概要：We provide methods for debiasing the use of a baseline for likelihood ratio gradient estimators, commonly used in reinforcement learning and stochastic optimisation.

D2-57: 確率的勾配MCMCを用いた有界確率変数の生成

発表者：横井創磨（東京大学），大塚琢馬（NTTコミュニケーション科学基礎研究所），佐藤一誠（東京大学）

概要：Stochastic gradient Langevin dynamics (SGLD)は大規模データにおける事後分布からのサンプリングで広く使われる。その背景にある確率的勾配とウィーナー過程により、SGLDが生成したサンプルの値は実数全体をとる。本発表では、実数全体に定義されたSGLDを、有限区間に定義された変数に対してどのように用いるかについて述べる。

D2-58: 系列データのための構造推定を伴う予測モデル

発表者：勝木孝行（IBM東京基礎研究所）

概要：本発表では、系列データにおける予測問題を扱う。系列内の各データの役割やそれらの間の関係性を適切に記述することで精度の高い予測を目指すことに加えて、推定された構造そのものが意味を持つようなモデルを提案する。

D2-59: ニューラルネットワークによる様々な相転移の検出

発表者：荒井俊太（東北大学大学院情報科学研究科応用情報科学専攻），大関真之（東北大学大学院情報科学研究科応用情報科学専攻），片岡駿（東北大学大学院情報科学研究科応用情報科学専攻），田中和之（東北大学大学院情報科学研究科応用情報科学専攻）

概要：本発表ではニューラルネットワーク(NN)が様々な相転移を検出できることを示す.扱うモデルはXYモデルと一次元横磁場イジングモデルである.XYモデルはKT転移と呼ばれる渦の有無によって生じる相転移を起こし,CNNによるKT転移の検出可能性を示す.また,一次元横磁場イジングモデルは横磁場の大きさによって量子相転移を引き起こす.NNの重みに基づく秩序変数を評価することにより量子相転移を検出する.

D2-60: データ融合におけるホットデック法の妥当性

発表者：松下亮祐（株式会社NTTデータ数理システム）

概要：データ融合は、観測される変数が部分的に重複する複数のデータセットを融合し、一つのデータセットを得る技術である。本研究では、ホットデック法とよばれるノンパラメトリックな手法に対し、データ融合で作成したデータセットから得られる経験分布の、真の確率分布に対する近似精度の理論的評価を行う。近似精度の評価は、機械学習における汎化誤差の評価同様、手法の妥当性等を議論するうえで中心をなすと考えられる。

D2-61: 連続値隠れ変数を用いた混合ガウスモデル

発表者：江藤力（NEC データサイエンス研究所）

概要：制御工学の分野では線形パラメータ変動モデルという複数の線形モデルの凸結合で表現されたモデルが広く使われている．本発表では、この凸結合係数を連続値隠れ変数と見なして各線形モデルと共に学習するアルゴリズムを提案し、混合回帰モデルの学習に対して、通常のバイナリ値隠れ変数による混合ガウス回帰として学習したものとの比較を行った例を示す．

D2-62: 組み合わせ行動空間上のQ学習による１次元上のメンテナンス区間最適化

発表者：谷本啓（NEC / 京都大学）

概要：複数の対象の状態を維持するために各時刻においてメンテナンス行動をとるべき部分集合を決定する問題を考える。このとき状態は後に影響することから逐次意思決定となり、かつ隣接する対象を同時刻にメンテナンスすることで行動コストが抑えられることから組み合わせ最適化となる。これを組み合わせ行動空間上のQ学習として定式化し、特に高速道路などの１次元に連続した対象について効率的に学習・最適化する方法を提案する。