ポスターセッション

Pocket

1日目(11月20日 16:00-19:00)
発表一覧
プレビュースライド

2日目(11月21日 12:45-15:15)
発表一覧
プレビュースライド


11月20日 16:00 – 19:00

1-001: Stochastic depthが勾配降下法の学習速度に与える影響の理論解析

発表者: 古庄泰隆; 池田和司 (NAIST; NAIST)
概要: Stochastic depth(SD)は訓練時にResNetのブロックをランダムに落とし学習を加速させるが,その理論的背景は明らでない.勾配降下法の学習速度は収束する限り学習率が大きいほど早い.本研究ではResNet,SD,類似手法dropoutの収束する最大学習率をフィッシャー情報行列の固有値を通して計算した.その結果SDはその他の手法と比べ大きな学習率が使え,学習が加速することを確認した.

1-002: Emulation for tsunami inundation forecasting

発表者: Takafumi Kajihara; Motonobu Kanagawa; Wataru Suzuki (NEC/RIKEN AIP; EURECOM/RIKEN AIP; National Research Institute for Earth Science and Disaster Resilience)
概要: We introduce a novel kernel-based algorithm for emulation of a computationally extensive tsunami simulator, with an application to early tsunami inundation forecasting.

1-003: カーネル平均埋め込みによる共変量シフト下でのシミュレーションパラメタ推定

発表者: 木佐森慶一; 山崎啓介; 金川元信 (NEC/産総研; 産総研; EURECOM)
概要: 尤度が書けないシミュレーションモデルを回帰関数とした、共変量シフト下での回帰手法をカーネルABCを拡張して開発した。解釈可能なシミュレーションモデルのパラメタ事後分布が得られ、かつ、法則やルールを制約として実装しているシミュレーションを回帰関数として用いることにより外挿的な領域における予測が可能なことが期待される。製造メーカでの生産シミュレータを用いた実験結果を紹介する。

1-004: 局所的変分法による非補償型ナレッジトレーシング

発表者: 玉野浩嗣; 持橋大地 (NEC/総合研究大学院大学; 統計数理研究所)
概要: 項目応答理論の時間発展拡張であるナレッジトレーシングにおいて、補償/非補償型のモデルが提案されている。前者は問題に必要なスキルのどれか一つが高ければ正解でき、後者はすべて高いことで正解できるとする。非補償型でスキル分布の時間変化を推定する場合、尤度関数が複雑な形になり事後分布の厳密解は求まらない。本研究では、局所ガウス近似により近似事後分布を解析的に求める方法を提案する。

1-005: 誘導相対エントロピー逆強化学習

発表者: 中口悠輝; 江藤力 (NEC中央研究所; NEC中央研究所)
概要: 人手による報酬関数設計を回避するため熟練者の軌跡から報酬関数を推測する逆強化学習の研究が近年盛んだが、その計算複雑性とサンプル複雑性の高さが問題である。既存手法の誘導コスト学習は方策も同時に学習することでこれら複雑性を下げたが、ダイナミクス推定が必要で一般のダイナミクスに適用できない等の欠点がある。本研究では、それら複雑性を同様に下げつつダイナミクス推定が不要な、新しい逆強化学習手法を提案する。

1-006: 非同期分散計算機上のデータを使った深層学習技術

発表者: 丹羽健太; 原田登; Guoqiang Zhang; W. Bastiaan Kleijn (NTT; NTT; University of Technology Sydney; Victoria University of Wellington)
概要: P2Pネットワークのような非同期分散計算資源上にあるデータを一か所に集めることなく深層学習モデルを最適化する技術について提案する。データを各ノードから移動する必要がないので、医療画像、製造工場のIOTデバイスのようなプライバシー性/機密性の高いデータを使ったアプリケーション開発に寄与できると考える。

1-007: 非単調劣モジュラ関数最大化に対する確率的貪欲法の近似保証

発表者: 坂上晋作 (NTTコミュニケーション科学基礎研究所)
概要: 非単調劣モジュラ関数はカット関数や相互情報量などを含む重要な関数クラスであるが,この関数の要素数制約下での最大化に対する既存の近似アルゴリズムは,単調な場合のものに比べて長い計算時間を実用上要していた.本研究では,単調劣モジュラ関数最大化に対して考案された高速な手法である確率的貪欲法の,非単調な場合に対する近似保証を示す.これにより非単調劣モジュラ最大化に対する高速な近似アルゴリズムが得られる.

1-008: A unified view of likelihood ratio and reparameterization gradients and an optimal importance sampling scheme

発表者: Paavo Parmas; Masashi Sugiyama (OIST; RIKEN, The University of Tokyo)
概要: We show a theoretical link between likelihood ratio (LR) and reparamaterization (RP) gradients via the divergence theorem. The theory motivated us to derive optimal importance sampling methods to reduce LR gradient variance. Our newly derived distributions have analytic probability densities and can be directly sampled from. We evaluate in reinforcement learning evolution strategies experiments.

1-009: Mitigating overfitting in supervised classification from two unlabeled datasets: A consistent risk correction approach

発表者: Nan Lu; Tianyi Zhang; Gang Niu; Masashi Sugiyama (The University of Tokyo/ RIKEN-AIP; The University of Tokyo; RIKEN-AIP; RIKEN-AIP/ The University of Tokyo)
概要: We consider the weakly-supervised learning problem of training arbitrary (from linear to deep) binary classifiers from only unlabeled (U) data by empirical risk minimization (ERM). In this paper, we propose a generalized consistent risk correction method to mitigate the overfitting problem.

1-010: An improvement on CycleGAN based symbolic music genre transfer

発表者: Yingfeng Fu; Yusuke Tanimura; Hidemoto Nakada (The University of Tsukuba; National Institute of Advanced Industrial Science and Technology; National Institute of Advanced Industrial Science and Technology; National Institute of Advanced Science and Technology )
概要: In this work, we optimize a CycleGAN based symbolic music generation system, which could do a symmetric genre transfer of music between two domains. We applied various kinds of encoders and decoders, and some of them could drastically reduces training time and keep the quality. We also provide a novel data representation and compression which how good performance in this scenario.

1-011: Few-Shot Style Transfer for Handwriting Chinese Synthesis Using Conditional GAN

発表者: Liu Liangyu; Yusuke Tanimura; Hidemoto Nakada (University of Tsukuba; National Institute of Advanced Science and Technology; National Institute of Advanced Science and Technology)
概要: Creating a handwritten Chinese font shows a great challenge due to the large amount of characters. We create handwritten fonts using few samples and synthesize other characters. We train a model with large amounts of characters in various handwritten style at the same time, and evaluate performance on synthesized characters. We find that cGAN perform better with a few examples.

1-012: Image synthesis for One-shot Classification with Triplet Network

発表者: Mu Zhou; Yusuke Tanimura; Hidemoto Nakada (University of Tsukuba; National Institute of Advanced Science and Technology; National Institute of Advanced Science and Technology)
概要: Humans can learn visual concepts quickly at a glance, whereas it is a challenge for machine to solve one-shot classification. We try to synthesize more instances from new concept to augment the scarce dataset with different augmenting methods. Then we fed our support set into Triplet Networks and the kNN classifier. We found that the synthesized images perform well on one-shot classification.

1-013: アニーリングマシンを用いた配車マッチング

発表者: 佐藤由佳; 工藤和恵 (お茶の水女子大学大学院)
概要: 電車遅延・運休時のタクシー配車を効率化するための一手段として、利用者の乗り合いが挙げられる。本研究では距離情報だけでなく、年齢や性別を考慮した乗り合いを再現するモデルを設計し、アニーリングマシンを利用してシミュレーションを行った。適切な乗り合いの実現には、制約条件や特徴量の重み付けを調整する必要がある。本発表ではシミュレーション結果を示し、モデルに用いたパラメータのチューニングについて議論する。

1-014: QBoostを用いた画像分類

発表者: 坂倉佑季; 工藤和恵 (お茶の水女子大学大学院; お茶の水女子大学大学院)
概要: 画像認識を組合せ最適化問題に置き換え、最適化問題を高速かつ高精度に解くと言われるアニーリングマシンで解き処理の高速化を実現したいと考えた。本発表では、アニーリングマシン用のBoostingアルゴリズムであるQBoostを用いて画像分類を行った際の、正答率のデータ数や正則化パラメータへの依存性、正則化パラメータによる過学習への対応,、従来手法であるAdaboostと比較した時の利点について議論する。

1-015: 二値制約非負値行列分解を利用した画像解析

発表者: 朝岡日向子; 工藤和恵 (お茶の水女子大学大学院; お茶の水女子大学大学院)
概要: 二値制約非負値行列分解という計算手法を用いて、画像が持つ特徴を取り出し、それを利用した画像解析を行う。本発表では、顔画像を解析の対象とする。特徴を組み合わせることによる画像の再現や、類似する特徴を持つ画像の探索を試みる。また、計算の一部において、アニーリングマシンという量子力学の考え方を取り入れた次世代型の計算機を使用する。新しい技術を取り入れることによって、従来よりも優れた解析に期待する。

1-016: DeepClusterによる半教師あり学習のクラスタリング性能による精度評価

発表者: 藤岡義治; 竹田晃人 (茨城大; 茨城大)
概要: 教師なし学習で良い結果を示すDeepClusterという手法を畳み込みニューラルネットワークと組み合わせて構築した半教師あり学習器を考える.この学習器の画像分類データセットの分類性能について,クラスタ数の違いやクラスタリング手法の違いによる分類精度への影響を調べた.結果として,クラスタ数はラベル数よりも若干多い方が分類精度が上昇することが分かった.加えて,クラスタリング手法の性能と分類精度との相関が見られた.

1-017: 生成モデルを用いた神経集団のベイズ推定法の改良

発表者: 木村俊; 竹田晃人; (茨城大; 茨城大)
概要: 本発表では,Caイメージングデータ等から得られるニューロンの活動状態と対象生物の行動との関連性を調べるための統計的手法の改良を提案する.ベースとなる手法は,神経活動に関する事前知識から生成モデルを作成し,マルコフ連鎖モンテカルロ法を用いたベイズ推定により,ニューロンの集団への分類と集団ごとの発火状態を推定する手法である.結果として,焼きなまし法のアイデアを適用し,より高速な推定法を得ることができた.

1-018: 行列分解問題への信号雑音分離法の適用評価

発表者: 玉井 智貴; 竹田 晃人 (茨城大学; 茨城大学)
概要: 行列分解問題に対する変分ベイズ法に基づく数値アルゴリズムが知られているが、アルゴリズムの収束性が理論的に明らかになっていない問題がある。その解析のため、我々は神経回路網理論で用いられる信号雑音分離法を援用した簡約ダイナミクスを提案した。本発表では提案した簡約式が実際のアルゴリズムの動的挙動とどれだけ一致するかを数値実験で詳細に検証し、両者の挙動の差異が生じる原因を干渉ノイズ仮定に着目して調べた。

1-019: ブロックチェーンを使ったAI出自検定基盤の提案

発表者: 川本康貴; 小林啓洋 (沖電気工業株式会社; 沖電気工業株式会社)
概要: AI作成者がAI倫理に関する説明責任を果たすためのAI出自検定基盤の提案である.AI作成者は,AIモデルの学習に使ったデータや方法といったAIの学習に関する情報を本基盤へ登録しておくことによって,自身が作った学習済みAIモデルの判定結果についての説明責任を担保できる.また,本システムのこういったシステムにとって重要なシステムの信頼性を,ブロックチェーンを使うことで担保している.

1-020: ニュース推薦システムにおける各種埋め込み手法の比較検討

発表者: 飯塚洸二郎; 関喜史 (株式会社Gunosy; 株式会社Gunosy)
概要: 近年の推薦システムにおいて、ユーザーやアイテムの埋め込み表現は推薦精度に大きな影響を与えている。本研究では、各埋め込み手法が推薦精度に与える影響を包括的に検証する。また、当社の複数のニュースサービスにおいて各種埋め込み手法を比較することで、同一ドメイン内での精度の差異を明らかにする。

1-021: 広告種類を考慮した不均衡データからのCTR予測モデルの学習

発表者: 欧陽江卉; 西林孝 (株式会社VOYAGE GROUP)
概要: 二値クラス分類問題として捉えるクリック率の予測はインターネット広告配信事業において重要である。広告配信データは負例(非クリック)に極端に偏っており、学習には負例を減らす手法(ダウンサンプリング)が使われる。一方で、広告の種類によって正負の割合が大きく異なることがわかっていた。我々は、広告種類によって配信ログを分けそれぞれのダウンサンプリング率を調整し、配信効果に与える影響について検討した。

1-022: 制約付きオンライン凸最適化によるアドネットワークのクリック単価決定

発表者: 西林孝 (株式会社VOYAGE GROUP)
概要: アドネットワークはインターネット広告配信事業の形態の一つで、広告主とパブリッシャー双方と契約して広告枠に対して広告を配信する。アドネットワークではクリック毎に報酬を支払うPay Per Click方式がよく使われるため、クリック毎の支払い金額を決めるタスクが重要となる。本発表ではPID制御による方式と制約付きオンライン凸最適化による結果の比較を行なった。

1-023: 深層学習の全結合層における準同期式更新の提案

発表者: 堀哲也; 竹中要一 (関西大学総合情報学部; 関西大学総合情報学部)
概要: 深層学習の学習は,順伝播,逆伝播とニューロンの重み更新で構成される.現状の学習法では,Dropout対象となるニューロン以外の全ニューロンの重みが同時に更新される.この更新方式を同期式更新と呼ぶ.本研究では,同時に重み更新されるニューロン数を限定する更新方式を提案する.これを準同期式更新と呼ぶ.本発表では準同期式更新を用いることにより,正答率と誤差が改善されたことを報告する.

1-024: 深層ニューラルネットを用いたマルチタスク距離学習の理論解析

発表者: 前田 篤刀; 奥野 彰文; 伊森 晋平; 下平 英寿 (京都大学; 理研AIP; 広島大学・理研AIP; 京都大学・理研AIP)
概要: マルチタスク距離学習は、部分的にパラメータを共有した複数の距離関数を複数のタスクで同時に学習する。しかし、一般的に距離関数として用いられるマハラノビス距離は線形変換のユークリッド距離とみなせるため表現力に制限がある。本発表では、線形変換の代わりに部分的にパラメータ共有した複数の深層ニューラルネットを用いて、マルチタスク距離学習を行った場合の汎化バウンドについて収束レート等の解析を行った。

1-025: 条件付き確率に従うクエリを用いたベイズ最適化

発表者: 林勝悟; 鹿島久嗣 (京都大学; 京都大学)
概要: クエリとして入力変数の一部を条件付け,残りは確率的に決まるベイズ最適化を提案する.このような問題には、例えばクラウドソーシングにおいて成果物の品質を最大化するためにワーカ属性の一部を指定する場合や、科学実験において実験条件の一部のみが指定可能な場合などが考えられる。我々は確率的に決まるクエリの不確実性を考慮した手法を提案し、数値実験を通してその有効性について検証する.

1-026: 半教師あり介入効果推定

発表者: 原田 将之介; 山田 誠; 鹿島 久嗣 (京都大学; 京都大学, 理研AIP; 京都大学, 理研AIP)
概要: 個々の対象に対する介入効果の推定は, 広告や医療など様々な領域で重要な問題である. しかし, 介入データ収集はしばしばコストが高く, できるだけ少数のデータで介入効果を推定する必要がある. 本研究では, 介入の有無とその結果が既知の教師ありデータに加えて, 教師なしデータを活用する半教師あり介入効果推定問題を提案し, 半教師あり問題のアプローチのひとつであるラベル伝播法を拡張した手法を提案し, その効果を検証する.

1-027: 相互情報量に基づいた正則化を加えた混合ガウス変分オートエンコーダ

発表者: 暮石航大; 山田誠; 岩田具治; 鹿島久嗣 (京都大学; 京都大学,理研AIP; NTT CS研,理研AIP; 京都大学, 理研AIP)
概要: 変分オートエンコーダのフレームワークに事前分布として混合ガウス分布を用いたモデルを混合ガウス変分オートエンコーダという.このモデルではデコーダとして表現能力の高いニューラルネットワークを用いるため,事前分布として混合ガウス分布を用いたとしてもクラスタリングがなされるとは限らない.そこで,意味のあるクラスタを得るためデータとクラスタ割当の依存性を高める正則化を提案する.

1-028: 欠損値問題や不均衡データを埋め込みとして用いた時空間機械学習モデル

発表者: 大北 剛 (九州工業大学)
概要: 経験リスク最小化を用いる場合に機械学習アルゴリズムが陥る典型的問題として欠損値問題, 不均衡データ問題, バイアス問題などがある. この問題は, 不変リスク最小化[Arjovsky et al., 2019]という枠組みで克服する方法が提案されている. 一方, 近年これらを埋め込みとして実現する方法が[Grangier and Melvin, 2010], [Huang et al., 2016], [Sutton et al., 2018]などで提案されている. 本発表においては後者の観点から, これらを時空間モデルへ適応する方法について論じる.

1-029: マルチインスタンス学習への再定式化に基づく理論的汎化誤差導出

発表者: 末廣 大貴 (九州大学 / 理研)
概要: 学習器に対する理論的汎化リスクは,仮説クラス,損失関数などに基づき,個別に推定するのが主流である.本発表では,ある学習問題と学習器に対し,マルチインスタンス学習として(ある種強引に)再定式化し,統一的に汎化リスクを推定するアプローチを提案する.本アプローチにより,マルチクラス学習アルゴリズムやランキング学習アルゴリズムについて汎化リスクの推定を行い,既存のバウンドからの改善にも成功した.

1-030: 線形計画法に基づくブースティング手法の収束性解析

発表者: 三星諒太朗; 畑埜晃平; 瀧本英二 (九州大学; 九州大学/理研AIP; 九州大学)
概要: 1ノルム正則化ソフトマージン最大化問題は疎な分類器を学習する定式化の1つで,反復型型の手法LPBoostとERLPBoostなどで解けることが知られている.前者は1反復でLPを解くためであるため高速だが,反復回数の上界は知られていない.一方,後者は反復回数の上界が既知だが,1回あたりの反復に凸最適化問題を解くため計算時間を要する.本研究では両者の利点を合わせ持つ手法を提案する.

1-031: Neural processによる意味的整合性を考慮した文書生成

発表者: 川島寛乃; 河野慎; 松井孝太; 熊谷亘; 中澤仁 (慶應義塾大学; 東京大学; 理研AIP; 理研AIP; 慶應義塾大学)
概要: 自然言語生成において,前の単語や文をもとに後に続くものが定まるというマルコフ過程を仮定した言語モデルが用いられることが多い.しかし,構造が定められている文や文書の場合,全体における意味的整合性の維持が難しいことが知られている.本研究では,与えられたデータから背後の確率過程の推論が可能であるneural processに着目し,与えられた複数の単語,文とその位置から整合性を保った文書の生成を目指す.

1-032: Robust modal regression with direct log-density derivative estimation

発表者: 佐々木 博昭; 坂井 智哉; 金森 敬文 (公立はこだて未来大学; NEC; 東京工業大学; 理化学研究所)
概要: Estimating the mode of the conditional density function has led to regression methods robust against heavy-tailed or skewed noises. Based on the conditional mode estimation, we propose two robust regression methods with reproducing kernels and neural networks. The superior performance of the proposed methods is demonstrated on a wide-range of artificial and benchmark datasets.

1-033: 深層学習による果実セグメンテーション

発表者: 福田素久; 奥野貴士; 結城伸哉 (山形大学理学部; 山形大学理学部; 株式会社 Elix)
概要: 果実の生育過程において、その大きさを精密に測定することは収穫時期の判断材料となりうる。特に成熟過程で果皮色の変化があまりない場合はより重要となる。本研究では、深層学習モデルの一つであるU-Netを用いて果実のRGB画像のセグメンテーションを行った。訓練画像数は200枚にも満たないが、U-Netは(部分的に影や枝などが被ったり光が反射している場合でも)様々な種類の果実のセグメンテーションを学習した。

1-034: 深層学習を用いた架空名義入札に頑健なオークションメカニズムの自動設計

発表者: 櫻井 祐子; 小山 聡; Mingyu Guo; 横尾 真 (産業技術総合研究所; 北海道大学/理研; アデレード大学; 九州大学/理研)
概要: 我々は,深層学習を用いた,架空名義入札に頑健なオークションメカニズムの自動設計手法を提案する.架空名義入札とは一人の入札者が複数の名義を用いて入札を行うことであり,インターネットなどの匿名環境における不正行為として認識されている.既存の深層学習を用いたオークションメカニズムの自動設計手法を架空名義操作不可能性制約を満たすように拡張し,学習されたメカニズムが実際に制約を満たすことを確認する.

1-035: モデルブリッジによるシミュレーションパラメータの推定

発表者: 山崎啓介; 木佐森慶一; 小森雄斗; 時枝紘史 (産総研; NEC/産総研; 産総研; 産総研)
概要: 近年、データ同化技術の発展により実データからシミュレータのパラメータ推定が行われている。しかしながら推定にはシミュレーションを多く実行するため、複雑な現象を模擬するシミュレータでは膨大な計算量を要する。そこで本研究ではシミュレーションパラメータと統計モデルの関係を事前に学習することで、推定対象のデータに対しシミュレーションを実行せずに高速なパラメータ推定を可能にする手法を提案する。

1-036: 物理シミュレーションパラメータのモデルブリッジによる推定

発表者: 時枝紘史; 小森雄斗; 木佐森慶一; 山崎啓介 (産総研; 産総研; 産総研/NEC; 産総研)
概要: シミュレーションパラメータと統計モデルの関係を学習することで、シミュレーションを実行せず現象を支配するパラメータを高速に推定する方法がモデルブリッジである。本研究では、流体解析に代表される計算コストが高いCAEシミュレータを例に挙げながら、モデルブリッジの運用例を紹介する。

1-037: なぜ血液検査値は対数正規分布になるのか

発表者: 城 真範; 興梠 貴英; 香川 璃奈; 赤穂 昭太郎 (産総研; 自治医大; 筑波大; 産総研)
概要: 大学病院で取得されるいくつかの一般的な血液検査値が、正常値範囲において対数正規分布になることを見つけた。対数正規分布は乗算過程において発生するものだが、これが何を意味しているのかについて議論したい。生体内で関係する物質の濃度積がバランスしていて、それぞれの物質同士が複雑なネットワーク構造をしているという仮説を立てると、近似された対数正規分布のパラメータからネットワークの形状推定ができないだろうか。

1-038: 確率的環境下における期待値のベイズ最適化

発表者: 岩山幸治 (滋賀大学)
概要: 環境の影響を受ける対象についてのベイズ最適化を考える。ここで、環境についての情報は次の入力を決めた後に与えられるものとする。例えば、対象が天候の影響を受ける場合、われわれは天候を事前に正確に知ることも操作することもできない。このような状況において、確率的な環境の下での期待値を最大化する入力を探索するため、ベイズ最適化の一般的なアルゴリズムであるGP-UCBを拡張したアルゴリズムを提案する。

1-039: データセット削減による大規模ネットワーク構造探索の高速化

発表者: 山田芙夕楓 (神戸大学システム情報学研究科アーキテクチャ研究室)
概要: ネットワーク構造を自動的に探索するNeuralArchitectureSearch(NAS)が注目されている。NASは探索と探索結果に対する学習を行う必要があるため、大規模なネットワークでは処理時間が極めて長くなる。従って、NASの高速化のためには探索時間と学習時間を削減する必要がある。本研究ではPDARTSにおける探索の際に、削減したデータセットを用いることで探索時間を短縮した。

1-040: テーブル参照を用いたTernary圧縮・伸長アルゴリズムの検討

発表者: 大原 遼太郎 (神戸大学大学院 科学技術イノベーション研究科 アーキテクチャ研究室)
概要: ネットワークの重みを{1,0,-1}の3値へ量子化するternaryは、圧縮率・表現力ともに優れた表現方式である。しかし、ハードウェア上では3値の重みを2bitで記録するため、4値を表現可能な2bit変数の表現力を25%無駄にしている。そこで本研究では、連続する5桁のternaryを8bitに圧縮し、演算時はテーブル参照により高速に伸長する手法を提案する。

1-041: 演算精度可変深層学習用プロセッサ向けニューラルネットワークの混合精度量子化

発表者: 辻 聡樹 (神戸大学大学院システム情報学研究科情報科学専攻アーキテクチャ研究室)
概要: 本研究では深層学習を用いた画像分類の推論時間短縮を目的とし、ネットワークのレイヤ毎に重みのダイナミックレンジを適切に設定する手法について検討を行った。レイヤ毎に変数のダイナミックレンジを動的に切り替え可能とする専用ハードウェアを想定し、ネットワークアーキテクチャを自動探索するアルゴリズム(NAS)を組み合わせることで、推論精度を維持したまま演算コストを削減することに成功した。

1-042: Web閲覧履歴に基づくユーザクラスタリングにおける各潜在クラスモデルの挙動分析

発表者: 青木章悟; 三川健太; 後藤正幸 (早稲田大学; 湘南工科大学; 早稲田大学)
概要: Web閲覧履歴に基づくユーザクラスタリングは,様々な応用を持つ興味深い問題である.このクラスタリング問題に対しては,トピックモデルの一種であるPLSAやLDAが適用可能である.しかし,Web閲覧ユーザのクラスタリングという問題に対する,これらの手法の特性については検討の余地がある.本研究では,EMアルゴリズムによるPLSAと変分ベイズ法によるLDAのクラスタリング特性を分析し,その差異を考察する.

1-043: Slackの会話履歴データに基づく社員間ネットワーク分析モデル

発表者: 野中賢也; 山下遥; 後藤正幸 (早稲田大学; 上智大学; 早稲田大学)
概要: 近年,Slackなどのビジネスチャットアプリを活用する企業が増えている.本研究では,Slackに蓄積された会話履歴データにおいて,発言の共起度合いに基づき,社員間の結びつきを決定すると同時に,社員間のネットワークを可視化するモデルを提案する.また,提案手法を企業の実データに適用してネットワークの可視化を行い,コミュニティやこれらを繋ぐハブ人材の発見が可能であることを示す.その結果,提案手法の有効性を確認する.

1-044: ランク学習モデルを用いた料理画像の魅力度定量化に関する一考察

発表者: 莫鈞貽; 藤波英輝; 三川健太; 雲居玄道; 後藤正幸 (早稲田大学; 早稲田大学; 湘南工科大学; 早稲田大学; 早稲田大学)
概要: ユーザが提供した飲食店情報を掲載するグルメサービスでは,提供された膨大な料理画像のうち,他のユーザの参考となる魅力的画像を特定することが重要になる。本研究では,料理画像に対して1対1比較を行うアノテーションシステムを構築すると共に,ランク学習モデルの一つであるRankNetを適用することで,料理画像の魅力度を定量的に評価するシステムを提案する。収集した実データを用いてその有効性を検証する。

1-045: 購買履歴データに基づくポイントカードユーザのクレジット切り替え行動分析モデル

発表者: 平野洋介; 世古裕都; 楊添翔; 後藤正幸; 立花徹也 (早稲田大学; 早稲田大学; 早稲田大学; 早稲田大学; 小田急エージェンシ―)
概要: 近年,通常のポイント付与に加えクレジット決済額に応じて加盟店で利用可能なポイントを付与することで,加盟店の利用増加を目的としたクレジット機能付きポイントカードが普及している.そこで本研究では,ポイント専用カードからクレジット機能付きポイントカードへの切り替えを促すため,過去に切り替えを行ったユーザの特徴を分析するモデルを構築する.また,構築したモデルを実データ分析に適用し,結果に対する考察を行う.

1-046: 学習可能性の再考(Re-thinking learnability)

発表者: Matthew J. Holland (大阪大学)
概要: 従来の統計的学習理論では「ERMで学習可能でないならば、どの学習則であっても不可能」という結果が有名であるが、そもそも学習可能性(=learnability)の定義は収束レートを考慮していない一方、あらゆる確率分布の下で成り立つことを要求している。前者の条件を強めて、後者をほどよく弱めることで、真に役に立つ学習則の特徴づけを追究する。いくつかのimpossibility resultsを題材に、新たな理論体系の整備に向かいたい。

1-047: 密度比を用いたクラス事前確率推定

発表者: 吉田 剛; 新家 英太郎; 鷲尾 隆 (大阪大学 産業科学研究所)
概要: 正負例が混ざったラベルなし事例集合と正例集合のみから,ラベルなし事例集合の混合割合を推定する新しい手法を提案する.本手法は密度比推定を用いることにより,従来手法とは異なり,混合割合の推定を直接に行う点に特色がある.本手法は既存手法に比べ,混合割合や事例生成分布に対してロバストかつ高精度に混合割合の推定ができる.さらに,誤って正ラベルを付けられた負例が正例集合中に混在する場合についても報告する.

1-048: 計測を指向するインバースカーネル回帰の提案

発表者: 新家英太郎; 木戸俊輔; 鷲尾隆 (大阪大学; 大阪大学; 大阪大学)
概要: 過去のデータから学習した従来の推定回帰式を用いる計測は,環境が変化すると大きな推定誤差を生じる可能性がある.この問題を回避するため,本研究ではxとyの関係が非線形な場合も含めてカーネル回帰を用いて正則化項付きの回帰式を求め,その逆関数であるインバース回帰式を得る原理を提案する.また,インバースカーネル回帰学習と従来のリバースカーネル回帰学習の理論的誤差解析と人工画像および数値による検証実験を行う.

1-049: 弱劣モジュラ関数最大化問題に対する効率的な分枝カット法

発表者: 植松直哉; 梅谷俊治; 河原吉伸 (大阪大学/理研AIP; 大阪大学/理研AIP; 九州大学/理研AIP)
概要: サイズ制約下の弱劣モジュラ関数最大化問題では,貪欲法により短時間で近似解が得られる.しかし,特徴選択問題などでは厳密な最適解が必要となる応用事例も少なくない.本研究ではその最大化問題を多数の制約式を持つ整数計画問題に定式化した。その定式化に基づいた制約生成法を提案し,それを分枝限定法に組み込んだ分枝カット法を提案した.数値実験により,提案手法が従来手法より良い性能を示すことを確認した.

1-050: ナノギャップ技術と機械学習の融合による塩基分子の識別

発表者: 鷹合孝之; 大城敬人; 吉田剛; 小本祐貴; 鷲尾隆; 谷口正輝 (大阪大学産業科学研究所; 大阪大学産業科学研究所; 大阪大学産業科学研究所; 大阪大学産業科学研究所; 大阪大学産業科学研究所; 大阪大学産業科学研究所)
概要: ナノギャップデバイスを用いた次世代DNAシーケンンサの開発においては、1分子を測定して得られる電流波形の識別精度向上が不可欠である。本研究では、ACGTのうち単塩基(A,C,G,T)、2塩基(AC,TCなど)、3塩基(ACT,GACなど)からなる分子それぞれの電流波形について機械学習を用いた分類を行う。特にPU learningを用いたノイズ除去の効果についても報告する。

1-051: 選択的不感化ニューラルネットを用いた特徴選択手法の相互情報量解析との比較

発表者: 安藝友宏; 森田昌彦 (筑波大学; 筑波大学)
概要: 特徴選択において,2つの入力特徴が組み合わさることで有効な特徴量(組み合わせ有効特徴)を,無効な特徴量と判別することは難しい.本研究では組み合わせ有効特徴と無効特徴を含む関数近似課題について,選択的不感化ニューラルネット(SDNN)と,相互情報量の多変量拡張化である多変量相互情報量の,それぞれを用いた特徴選択手法の判別能力を比較した.その結果,SDNNを用いた手法がより少ない入力サンプル数で判別可能であった.

1-052: 線虫の胚発生画像を対象としたSeq-VAEに基づく時間的超解像

発表者: 田村壮; 河合新; 延原肇; 東裕介; 大浪修一 (筑波大学; 筑波大学; 筑波大学; 理化学研究所; 理化学研究所)
概要: 蛍光顕微鏡撮影の細胞傷害性により、対象の線虫画像の撮影枚数が少数化・画質の低品質化する問題を解決するために、隣接フレーム間の補間画像を無制限に生成できるSeqVAEを提案する。線虫実画像約5万枚による、評価指標PSNR・SSIMを用いた画像の再構築実験による定量的評価と補間画像の定性的評価を通して、提案手法の有効性を示す。

1-053: Slice Samplingに基づく教師なし分節化における推論の高速化

発表者: 長野匡隼; 中村友昭; 長井隆行; 持橋大地; 小林一郎; 高野渉 (電気通信大学; 電気通信大学; 大阪大学; 統計数理研究所; お茶の水女子大学; 大阪大学)
概要: 統計的時系列モデリングでは,Forward filtering-Backward sampling (FFBS)によってパラメータを推論することができる.しかし,FFBSではあらゆる隠れ変数の組み合わせに対して確率を計算する必要があり,計算コストが非常に大きい.そこで,Slice Sampling (SS)をFFBSに導入し,計算する隠れ変数の組み合わせを確率的に制限することで,精度を保持したまま計算コストを小さくする.本発表では,教師なし分節化手法に対してSSを導入し,高速化した結果に関して報告する.

1-054: 効率的なロボット学習に向けた深層状態空間モデルを用いた映像予測

発表者: 近藤生也; 岩澤有祐; 松尾豊 (東京大学; 東京大学; 東京大学)
概要: ロボット学習において、長期の物理現象の予測は行動計画の生成や安全性の向上のために重要な技術である。ロボットの行動系列で条件付けを行う映像予測手法はいくつか提案されているが、長期の予測については未だ発展途上である。本研究では深層状態空間モデルを用いて環境の潜在表現とその遷移を明示的に捉えることで長期の映像予測の改善を図る。また、映像予測モデルを用いた効率的なロボット学習方法についても考察する。

1-055: データ間の関係性を考慮したNeural Processとその学習

発表者: 河野慎; 幡谷龍一郎; 熊谷亘; 松井孝太; 岩澤有祐; 松尾豊 (東京大学; 東京大学; 理研AIP; 理研AIP; 東京大学; 東京大学)
概要: Neural Process(NP)は,Gaussian Process(GP)とDNNの特徴を組合せた,大量データの学習と不確実性の出力が可能なモデルである.NPは計算量の多いGPの代替として期待される一方,GPのように観測されたデータ間の相関を考慮できない課題が残る.本研究ではNP/GP双方の利点を持つNPを構成するため,データ間の関係性を考慮した確率的汎関数鏡像降下法に基づくアルゴリズムの提案と実験に関する報告をする.

1-056: Latent Block Modelのクラスタ数に関する適合度検定

発表者: 渡邊千紘; 鈴木大慈 (東京大学; 東京大学/理研AIP)
概要: Latent Block Modelは様々な関係データの解析において有用であることが知られているが,そのクラスタ数を統計的に検定するための手法はこれまで提案されていなかった.本研究では,ガウス型ウィシャート行列と呼ばれるランダム行列の理論における結果に基づき,観測データ行列における行・列クラスタ数の組について適合度検定を行う手法を提案し,検定統計量の漸近的な性質を明らかにする.

1-057: Random Featureを用いた確率的勾配法の期待識別誤差の収束解析

発表者: 八嶋晋吾; 二反田篤史; 鈴木大慈 (東京大学; 東京大学/理研AIP; 東京大学/理研AIP)
概要: カーネル法で二値識別問題を解く設定を考える.近年,ラベルの分布が特定の条件を満たす場合に,期待識別誤差が確率的勾配法により線形収束させられることが示された.本研究ではそれらの解析を,カーネル法の代表的な近似手法であるRandom Featureを適用した場合に拡張し,汎化誤差の意味でRandom Featureが計算量を削減できることがあることを示す.

1-058: 全バンディット組合せ最適腕識別に対する多項式時間アルゴリズム

発表者: 黒木 祐子; 徐 立元; 宮内 敦史; 本多 淳也; 杉山 将 (東京大学/理研AIP; 東京大学/理研AIP; 理研AIP; 東京大学/理研AIP; 理研AIP/東京大学)
概要: 多腕バンディット問題とは,複数の“アーム”と呼ばれる選択肢から最も良いアームを逐次的に探す問題である.本研究では複数の選択肢を同時に探索し複数のアームからのノイズありの報酬の和しか観測できない設定を扱う.楕円型信頼区間最大化問題を0-1二次整数計画として捉え,その問題に対する多項式時間近似アルゴリズムを与える.最適なアーム集合を求めるのに必要なサンプル数の上界を示し,実験的評価を行う.

1-059: 画像領域分割における疑似アノテーション生成ネットワークの活性化関数の影響

発表者: 品川大樹; 田中剛平 (東京大学工学系研究科電気系工学専攻; 東京大学工学系研究科電気系工学専攻)
概要: 畳み込みニューラルネットワークの学習は大量の教師データを要するため、簡易な情報で学習できることが望ましい。弱教師付き学習は画像内に存在するクラス名のみを教師データとして使用する枠組みである。画像領域分割タスクにおいては、画像内の特定の領域とクラス名を結びつけるためにアノテーションと呼ばれるヒートマップを作成する。本発表では、その際に用いる活性化関数の選択が分割結果に与える影響について検討する。

1-060: 量子コンピュータによる高速ランダム特徴量サンプリング

発表者: 山崎隼汰; Sathyawageeswar Subramanian; 園田翔 (東京大学工学系研究科附属光量子科学研究センター; DAMTP, Centre for Mathematical Sciences, University of Cambridge; 理研AIP)
概要: In random-feature-based learning algorithms, it is computationally hard to sample features from an optimized feature distribution that minimizes the required number of features for learning data. We develop an algorithm using a quantum computer to sample a feature from the optimized distribution, which can be exponentially faster than the existing classical algorithm.

1-061: パーシステントホモロジーの観点からの画像解析

発表者: 浅尾泰彦; 長瀬准平 (東京大学大学院数理科学研究科; 芝浦工業大学大学院理工学研究科)
概要: 本研究では画像解析への統一的な数学的枠組みの構築と、それを用いた経験則によらない普遍的な画像の取り扱いを目指す。今回は0次パーシステントホモロジーの考え方に基づいて、画像の複雑度の指標である「深さ」を定義し、その定性的な性質を調べた。その結果を用いて、データセットの性質を調べ、学習データの選別やノイズ識別、データの分類を試みた。また画像の主要なオブジェクトの識別への応用を検討する。

1-062: 確率的バンディットにおけるKL-UCB戦略とKL-UCB+戦略の漸近最適性について

発表者: 高木航平; 本多淳也 (東京大学大学院数理科学研究科; 東京大学大学院新領域創成科学研究科)
概要: バンディット問題においてKL-UCB戦略とKL-UCB+戦略はその高い性能が理論と実験の両面でよく調べられてきた戦略である。一方で、実験的に予測されている性質の一部は、理論面では未解明だった。本研究では、UCBスコアの待ち時間と呼ばれる量に着目し、KL-UCBとKL-UCB+の漸近最適性との関係を示す。特に、漸近最適性の観点からは、両戦略が同程度の性能を持つことを示す。

1-063: プライバシ保護機能を持つベータダイバージェンスを用いたロバスト線形回帰

発表者: 竹下虎太朗; 福永修一; 田中覚; 黄緒平 (東京都立産業技術高等専門学校; 東京都立産業技術高等専門学校; 東京都立産業技術高等専門学校; 産業技術大学院大学)
概要: 本研究では暗号プロトコルを用いたプライバシ保護データマイニングにおける手法のひとつである線形回帰に着目する.線形回帰はデータに外れ値が含まれた場合に推定性能が劣化する.この問題に対して,プライバシ保護機能を持つベータダイバージェンスを用いたロバストな線形回帰を提案する.外れ値の除去に用いる重み関数は非線形となり暗号プロトコル上での計算が困難なため,提案手法では重み関数を線形モデルにより近似を行う.

1-064: 人流誘導のための深層強化学習の報酬設計

発表者: 原 崇徳; 清水 仁; 岩田 具治 (奈良先端科学技術大学院大学; NTTコミュニケーション科学基礎研究所; NTTコミュニケーション科学基礎研究所)
概要: 大勢の歩行者に対する誘導計画では,特定の人流パターンに対して最適な誘導策を準備しても,想定外の人流パターンに対しては適切な効果が期待できない.そこで我々は深層強化学習を用いて,シミュレーション上で様々な人流に対して適切な誘導策を学習し,未知の人流に対しても誘導策を出力できる手法を提案する.シミュレーション上の評価により,提案手法が比較手法よりも有効な誘導策を高速に出力できることが示された.

1-065: PruningによるELMのスパース化

発表者: 高岡昇吾; 北村拓也 (富山高等専門学校; 富山高等専門学校)
概要: PruningによるELMのスパース化を提案する. 初めに,教師データからランダムに半分のデータを抽出し学習を行う. 学習後,識別境界面付近のデータ,または,誤認識しうる教師データのみを抽出し,それらを用いサイド学習を行う.この選択には,アクティブ集合を用いた繰り返し学習を用いる.この作業を繰り返すことで,解にスパース性を付与できる.これによりこれにより保持するメモリが入力データより削減され,処理速度の向上にも繋る.

1-066: カーネルELMの深層化

発表者: 吉田岳; 北村拓也 (富山高等専門学校; 富山高等専門学校)
概要: カーネルELMの隠れ層を多層とした深層カーネルELMを提案する.深層化を可能にするために,高次元特徴空間と分布が類似する有限次元の標本特徴空間に写像する.深層化を行うことで,各隠れ層で識別性能の観点から良い特徴を抽出することができ,従来のカーネルELMと比較して識別性能の向上が期待できる.また,標本特徴空間を用いることで解へのスパース性を付与することができる.

1-067: 負の標本数と$\tau$-変換 — $\tau$-情報幾何学の視点から —

発表者: 田中 勝 (福岡大学)
概要: 負の標本数へ外挿するマルチスケールブートストラップ法について,tau-情報幾何学の視点から逆tau-変換を用いてt-分布の場合に負の標本数を実現することで,その意味と曲率反転がもたらす確率分布への影響を具体的に示す。例えば,逆tau-変換により自由度(標本数 – 1)を2ずつ減少させると曲率も負から正へと反転するが,曲率が反転する瞬間に不連続なギャップがありサポートがコンパクトになることがわかる。

1-068: 一般化Euler不等式による二重自己平行な統計部分多様体の特徴付け

発表者: 佐藤直飛 (北海道大学)
概要: 統計多様体とは統計モデルの幾何学的一般化である。統計多様体の枠組みでは、統計的機械学習は、ある点から統計部分多様体への最短点を求める問題と解釈できる。したがって、統計的機械学習の諸特性は、統計部分多様体の形状の問題と深く関わっている。本研究では、3次元Euclid空間内の平面や球面を特徴付けるEuler不等式を統計断面曲率を用いて一般化し、平面や球面に相当する統計部分多様体の特徴付けを行った。

1-069: Distribution-Aware Counterfactual Explanation by Mixed-Integer Linear Optimization

発表者: 金森憲太朗; 高木拓也; 小林健 (北海道大学; 富士通研究所; 富士通研究所)
概要: For a given instance, counterfactual explanations provide perturbed features (actions) whose predicted class is different from the original one. However, an action extracted by existing methods is not necessarily practical because they do not consider the empirical distribution. We propose a new mixed-integer programming approach to extracting an action by taking feature-correlations into account.

1-070: ブラックボックス関数のノイズ入り関数値からの閾値以上の値の存在判定アルゴリズム

発表者: 伊藤直輝; 中村篤祥; 工藤峰一 (北海道大学大学院情報科学院; 北海道大学大学院情報科学研究院; 北海道大学大学院情報科学研究院)
概要: 連続的な定義域を持つブラックボックス実数値関数に,ある閾値以上の値をとる点が存在するか否かを判定する問題を考える.入力に対する関数値そのものが得られる設定のDOO-BAEC アルゴリズムを改造し,平均0のノイズ入りの関数値しか得られない設定のStoOO-BAECアルゴリズムを提案し,性能を理論的,実験的に分析する.

1-071: ReLU深層ニューラルネットワークの一般化されたBesov空間での関数近似能力について

発表者: 谷口晃一; 池田正弘; 園田翔; 大野健太; 鈴木大慈 (名古屋大学; 理研AIP/慶應義塾大学; 理研AIP; 東京大学/PFN; 東京大学/理研AIP)
概要: 近年, 深層ニューラルネットワークがBesov空間に対して高い適応力を持つことが示されている. Besov空間は三つのパラメータをもつ空間であり, パラメータを調節することで関数の性質を精密に記述することを可能とする. 本発表では, 一般化されたBesov空間 (滑らかさが場所によって変化するようなBesov空間など) に対するこのような深層学習の関数近似理論の最近の研究を紹介する.

1-072: 顕微鏡画像の自動取得と深層学習による画像修復

発表者: 東裕介; 大浪修一 (理化学研究所; 理化学研究所)
概要: 生命科学の研究において細胞の動態を詳細に解析することは重要であり、そのためには高画質・高時空間分解能・長時間の顕微鏡撮影が必要である。しかし、蛍光顕微鏡による撮影では、レーザー照射によるサンプルへのダメージのため、これらの条件を同時に最適化することはできない。本研究では、深層学習を利用した画像修復技術と自動的な学習データ取得によりこの問題を解決した。その結果、細胞形状の定量解析が可能となった。

1-073: ノンパラメトリックなリンク回帰とその理論的性質について

発表者: 奥野彰文; 矢野恵佑; 下平英寿 (理研AIP; 東大情報理工; 京大情報学・理研AIP)
概要: データベクトル間にグラフ状のリンクとその重みが得られるとき,ベクトルを通じてリンクの重みを予測する問題をLink regression (LR)と呼ぶ.通常のLRではパラメトリックなニューラルネットやベイズ推定が用いられる。本発表では,ノンパラメトリック回帰を考え,結果としてノンパラのグラフ埋め込みが自然に導出されることを示す.また、提案手法の理論的な性質についても併せて報告する.

1-074: info-cycleGANを用いたドメイン適応のためのCG実写変換

発表者: 永吉耕太郎; 八谷大岳 (和歌山大学システム工学部; 和歌山大学システム工学部)
概要: 近年、監視カメラ画像からの顧客行動分析など、深層モデルの実応用が期待されるなか、多様な環境に対応するために各環境特有のデータをCGにより生成し、モデルを再学習する方法が必要とされている。本研究では、最先端の画像変換法cycleGANにおいて既存のモデルの性能を考慮するために、相互情報量を導入しCGを実写に変換するinfo-cycleGANを提案する。そして、監視画像からの顔向き推定にCG画像を用いる実験を通して、本提案法の有効性を示す。

1-075: 実データ解析における曖昧なラベルを活用した学習

発表者: 勝木 孝行 (IBM東京基礎研究所)
概要: 実データを機械学習の方法で解析する場合、正確なラベル付き学習データを常に用意できるとは限らない。本発表では特に回帰問題における曖昧なラベルの活用法を扱う。交通データ解析やセンサーデータ解析におけるアプローチを提案し、その有効性を確認する。

1-076: 変分オートエンコーダーと相転移現象

発表者: 林祐輔 (Japan Digital Design 株式会社)
概要: β-VAEの目的関数にあらわれる係数 β は、統計力学における温度と密接な関係がある。実際、β の値がある一定値以上になると、潜在空間の様相が一変する相転移現象との類似を確認できる。この考察から、β-VAEは、エンコーダーとデコーダーの温度が等しい「平衡状態」にあると解釈できる。そこで本発表では、エンコーダーとデコーダーに独立した温度自由度を与える新しいVAEを考え、潜在空間にあらわれる非平衡現象を考察する。

1-077: 企業間ネットワークのリンク予測

発表者: 澤木太郎 (Japan Digital Design株式会社)
概要: 近年、グラフ構造を用いたノード分類やリンク予測の研究が盛んに行われているが、企業間ネットワークはあまり扱われていない。企業間ネットワークはtransitivityが低くコミュニティ構造を持たないためリンク予測が難しい。このような特性のグラフで有効なリンク予測の手法について議論する。

1-078: 知識グラフ間の知識アラインメントにおける損失関数の検討

発表者: 黒川茂莉; 米川慧; 牛コウ; 小野智弘; 萩原将文 (KDDI総合研究所,慶應義塾大学; KDDI総合研究所; KDDI総合研究所; KDDI総合研究所; 慶應義塾大学)
概要: 実体をノード、実体間関係をエッジとする知識グラフを用いて知識を表現し、実体間関係に関する知識を推論する技術があり、質問応答等に利用されている。本研究では、複数の知識グラフの存在を前提とし、知識グラフ間で知識のアラインメントを行い知識の埋め込みを学習し、埋め込みを用いた推論を行う。知識のアラインメントの数が希少である場合に対応するため、知識のアラインメントの損失関数を検討し、実験的に評価する。

1-079: ボロノイセルサイズを考慮したラベル伝搬手法の検討と評価

発表者: 松本 一則; 帆足 啓一郎 (KDDI総合研究所; KDDI総合研究所)
概要: 高精度で知られるZhouらのラベル伝搬手法を拡張し、データ点が属するボロノイセルの大きさを反映した伝搬式を提案する。2-moon等の3種類の人工データ及び MNISTで提案手法とZouの手法を比較した結果、提案手法が統計的に優位であった。本提案手法を MNISTの1,200件(内、ラベルあり12件のみ)に適用し、3と8を識別する深層学習を行った結果、acc=0.987と高い精度が得られた。

1-080: 双曲空間への埋め込みを用いたグラフ間モジュールネットワーク変化検出

発表者: 川久保秀子; 島村徹平 (名古屋大学; 名古屋大学)
概要: 本研究では、特定の生命現象を特徴づける遺伝子リストからなる頂点集合(モジュール)で構成されるネットワーク(モジュールネットワーク)が複数観測されたときに、モジュールネットワーク間での変化を検知する問題を考える。この問題に取り組むために、ネットワークの頂点を双曲空間に埋め込み、頂点の分布間距離を再生核ヒルベルト空間で測ることにより、モジュールネットワークの変化を検出する手法を提案する。

1-081: 時相論理タスクに対する逆強化学習

発表者: 窪田大; 江藤力 (NEC)
概要: 従来の逆強化学習は、エキスパートデータから単一の報酬関数を推定することを目的としてきたが、現実には時相論理を用いて表されるタスクを扱わなければならない場合が多く存在する。このような問題において正しい報酬関数を推定するためには、従来の逆強化学習に加えて時相論理タスクの構造推定までが必要となる。本発表では、エキスパートデータから時相論理タスクを推定する逆強化学習について話す。

1-082: Fully Automated TV Advertisement Scheduling via Maximum Entropy Inverse Optimization

発表者: Yasuhisa Suzuki; Wemer M. Wee (NEC; NEC)
概要: In KDD2019, we presented an automated TV ad scheduling system based on Maximum Entropy Inverse Optimization, which learns experts’ intentions from their historical demonstrations and reproduces them. However, the system can still be improved in terms of ads clustering and schedule consistency. In this work, our goal is to solve these problems to get a fully automatic ad scheduling system.

1-083: コピュラを用いたニューラルネットワークの可視化

発表者: 久保裕介; 小森悠斗 (NEC; 産業技術総合研究所)
概要: 近年、機械学習モデルの解釈可能性が重要視されてきている。中でも、ニューラルネットワークがどのような過程を経て推定結果を出力しているか等、モデルの挙動を正しく理解することは、アカデミック及び実務の現場で強く望まれている。そこで本研究では、コピュラを用いたニューラルネットワークの挙動を可視化する方法を提案する。

1-084: Learning from expert datasets

発表者: 吉田 周平; 寺尾 真 (NEC; NEC)
概要: データセットのアノテーションコストを軽減するため,識別対象カテゴリーのうち一部のカテゴリーに対してのみ正解が与えられている「エキスパート・データセット」の活用について検討する.この場合,データが曖昧なラベルを含んでいるにも関わらず,曖昧さのないラベルから計算されるリスク関数を期待値の意味で推定できることを示し,それを活用した学習の評価を行った.

1-085: 落とし穴状態の存在するMDPに対するオンライン強化学習

発表者: 竹村 慧; 中口 悠輝 (NECデータサイエンス研究所; NECデータサイエンス研究所)
概要: マルコフ決定過程(MDP)上でのオンライン強化学習では、どんなアルゴリズムに対しても、学習が失敗するようなMDPを構成できる。それは、一度陥るとその後良い報酬を得られないような状態が存在するMDPで、その状態を本研究では落とし穴状態と呼ぶ。落とし穴状態があるMDPを扱うために、本研究では、複数の学習者が同時に学習するオンライン強化学習の問題設定を提案する。また、提案した問題設定に対する効率的なアルゴリズムを提案する。

1-086: Rotation+: 複数画像変換を組み合わせた自己教師学習

発表者: 山口真弥; 金井関利; 塩田哲哉 (NTT)
概要: 自己教師学習の一種である回転角度予測 (Rotation)は,シンプルでありながら精度良く学習できることから注目を集めている.しかし,Rotation はテクスチャや色が重要なデータでは十分に効果を発揮しない.そこで,テクスチャや色に着目するための画像の強調変換(e.g., 尖鋭度変換)予測タスクを追加し Rotation を改善することを目指す.本発表ではこれらを組み合わせるマルチタスク自己教師学習手法を提案し,その効果を確かめる実験結果を報告する.

1-087: Sybil検知手法のグラフ信号処理的解釈

発表者: 古谷諭史; 芝原俊樹 (NTT; NTT)
概要: 社会ネットワーク上のSybil検知はセキュリティ分野において重要な課題であり,近年までに多くの検知手法が提案されている.既存の検知手法の多くは,ランダムウォークや信念伝播法に基づいた更新則に従って既知のラベル情報を更新・伝播することで未知のラベルについて推論を行う.本発表では,Sybil検知の更新則をグラフフィルタリングとして表現することで既存の検知手法を統一的に解釈する方法について考察する.

1-088: Reinforcement Learning in Latent Action Sequence Space

発表者: 山田真徳; Kim Heecheol; 三好康祐; 岩田具治; 山川宏 (NTT; 東京大学; narrative nights株式会社; NTT; ドワンゴ/全脳アーキテクチャーイニシアチブ)
概要: One problem in the application of reinforcement learning to real-world problems is the curse of dimensionality on the action space. We present Factorized Macro Action Reinforcement Learning (FaMARL) which autonomously learns disentangled factor representation of a sequence of actions to generate macro actions that can be directly applied to general reinforcement learning algorithms.

1-089: Fast Sparse Group Lasso

発表者: 井田安俊; 藤原靖宏; 鹿島久嗣 (NTT/京都大学; NTT; 京都大学/理研AIP)
概要: Sparse Group Lasso(SGL)は特徴量にグループ構造を持ったデータに対する特徴選択の手法であり,その学習にはBlock Coordinate Descent(BCD)が広く用いられる.本研究ではBCDをビッグデータに適用するため,(1)パラメータの優先度付き更新,(2)不要な計算のスキップ,の2つのアイディアを取り入れた高速なアルゴリズムを提案する.

1-090: ノイズ付き非線形力学系のためのKrylov部分空間法

発表者: 橋本悠香; 石川勲; 池田正弘; 松尾洋一; 河原吉伸 (NTT/慶大; 理研AIP/慶大; 理研AIP/慶大; NTT; 理研AIP/九大)
概要: 非線形な力学系を転移作用素と呼ばれる線形作用素を用いて解析する方法が多くの科学技術分野において注目を集めている.本研究では,転移作用素を用いてノイズ付き力学系を表現し,その転移作用素をKrylov部分空間法を用いて推定する枠組みを与える.この際,転移作用素が非有界になることを考慮し,非有界でも収束性が保証されるよう工夫する.さらに,この枠組みを時系列データの異常検知に応用する方法を示す.

1-091: 極値統計を用いたネットワークトラヒックの異常検知

発表者: 大屋優; 浅野秀平; 久保田大樹 (NTTコミュニケーションズ株式会社)
概要: ネットワーク事業者は安定したサービスを提供するためにトラヒックを監視しており,その一つにトラヒック変化の検知があげられる.この検知に用いられる閾値の設定はオペレータの経験や試行錯誤に基づくことが多く,設定に多大な時間を要する.そこで,本研究ではネットワークトラヒックの統計的性質を明らかにするとともに,地域的・時間的分布特性を示すことのできる極値統計を用いることで閾値を自動設定することを目指す

1-092: Variance Regularization of Causal Effects for Fair Classification

発表者: 近原 鷹一; 藤野 昭典 (NTTコミュニケーション科学基礎研究所)
概要: 個人に関する意思決定を機械学習によって行う際、予測結果が性別/人種といったセンシティブな特徴に関して差別的にならないような、公平なモデルを学習することは重要である。本研究ではセンシティブな特徴と決定結果の間の因果効果の平均・分散に制約を課すことで公平なモデルを学習する制約付き最適化問題を考え、これに対し、因果効果の上側信頼限界に基づく目的関数を提案することで、収束保証のある解法を提案する。

1-093: マルウェア検知のためのpAUC最大化学習法

発表者: 西山泰史; 熊谷充敏; 藤野昭典; 神谷和憲; 谷川真樹 (NTTセキュアプラットフォーム研究所; NTTセキュアプラットフォーム研究所; NTTコミュニケーション科学基礎研究所; NTTセキュアプラットフォーム研究所; NTTセキュアプラットフォーム研究所)
概要: マルウェアの感染被害を抑制するため,機械学習を用いて通信ログを自動で分析し,マルウェア由来の通信を検知する手法が注目されている.性能評価指標としてAUCがよく用いられるが、実運用ではネットワーク管理者の負担軽減の観点から,AUC全体ではなく,低誤検知領域のAUCが重要となる.そこで本稿では,任意の誤検知領域のAUCを最大化する学習法を提案し、通信ログ分析の問題に適用する。

1-094: 未知のバイクシェアポート需要予測のためのノンパラメトリックベイズ生成モデル

発表者: 三村知洋; 石黒慎; 川崎仁嗣; 深澤佑介 (NTTドコモ; NTTドコモ/東京大学; NTTドコモ/東京大学; NTTドコモ)
概要: バイクシェアサービスにおいて機会損失を減らすために,各バイクシェアポート(ポート)の溢れ,不足がない状態を保つことが重要である.このために各ポートの需要予測が行われるが,新規に開拓されたポートの需要を予測することは難しい.そこで、本稿では無限関係モデルと混合ガウスモデルを組み合わせたノンパラメトリックベイズ生成モデルによって未知のポートの需要予測を行う手法を提案する.

1-095: 制約付きマルコフ決定過程問題を解くRPアルゴリズムの提案

発表者: 前田新一; 綿引隼人; Wesley Chung; 藤田康博; 岡田真太郎; 小山雅典 (PFN; 東大; McGill大; PFN; PFN; PFN)
概要: 実問題においては安全性を確保するためにしばしば制約を満たすことが保証された方策が求められる。本研究では、この問題を制約付きマルコフ決定過程の問題として定式化し、その解法としてRPアルゴリズムを提案する。提案法は、リスクポテンシャル法と似た手続きをとるが、リスクポテンシャル法とは異なり理論的な保証を与えることができる。提案法によってチャレンジングな制約付きマルコフ決定過程の問題が解けることを示す。

1-096: Einconv: Exploring Unexplored Tensor Decompositions for Convolutional Neural Networks

発表者: 林浩平; 山口大器; 菅原洋平; 前田新一 (PFN; 東大; PFN; PFN)
概要: 様々なCNNモジュールを統一的に表現できるEinconvという枠組みを提案する.ResNetのボトルネック構造などがテンソルネットワークを用いることでグラフ表現でき,またモデル圧縮として有用なことを示す.アーキテクチャー探索への応用例も紹介する.

1-097: Direction Matters: On Influence-Preserving Graph Summarization and Max-cut Principle for Directed Graphs

発表者: Wenkai Xu; Gang Niu; Aapo Hyvärinen; Masashi Sugiyama (Gatsby Unit of Computational Neuroscience, UCL; RIKEN AIP; INRIA-Saclay/University of Helsinki; RIKEN AIP/The University of Tokyo)
概要: Summarizing large-scaled directed graphs into small-scale representations is a useful but less studied problem setting. In this paper, we present a model which relates to a “Max-Cut” criterion that simultaneously identifies the compressed nodes and the directed compressed relations between these nodes, and propose a multiplicative update algorithm with theoretical guarantees.

1-098: 大規模ネットワークにおけるノードの属性情報を利用した未知ノードのグラフ埋め込みの近似

発表者: 奥田 裕樹; 吉村 皐亮 (Sansan株式会社; Sansan株式会社)
概要: グラフ構造からノードの分散表現を獲得するグラフ埋め込みは、リンク予測や類似検索などに用いられる特徴量抽出の方法である。頻繁にノードが追加される大規模ネットワーク対するグラフ埋め込みは、更新されるたびに新たにグラフ全体の学習を行う必要があり、計算量や計算時間のコストから現実的ではない。そこで本研究では、新しいノードに対する分散表現を、周辺ノードの属性情報を用いて近似する手法を比較検討する。

1-099: Calibrated Surrogate Maximization of Linear-fractional Utility in Binary Classification

発表者: Han Bao; Masashi Sugiyama (The University of Tokyo / RIKEN AIP; RIKEN AIP / The University of Tokyo)
概要: Complex classification performance metrics such as the F-measure are often used to handle class imbalance. They are not endowed with M-estimation, which makes optimization hard. We consider a family named linear-fractional metrics and propose methods to directly maximize performance objectives via a calibrated surrogate, which is a tractable yet consistent lower-bound of the original objectives.

1-100: Faster AutoAugment: Learning Augmentation Strategies using Backpropagation

発表者: Ryuichiro Hataya; Jan Zdenek; Kazuki Yoshizoe; Hideki Nakayama (The University of Tokyo, RIKEN AIP; The University of Tokyo; RIKEN AIP; The University of Tokyo)
概要: データ拡張は画像認識において過学習を防止し、性能を向上させるために重要である。近年、画像変換の組合せを探索することで性能の良いデータ拡張を構成可能なことが分かってきたが、既存手法には計算コストが大きいという問題があった。本研究では画像変換を微分可能な表現にすることで性能を落とさずに高速な探索を可能にした。変換後の画像は元画像と同じ分布に属する必要があるため、敵対的学習によって分布を近づけている。

1-101: Classification from Triplet Comparison Data

発表者: Zhenghang Cui; Nontawat Charoenphakdee; Issei Sato; Masashi Sugiyama (The University of Tokyo, RIKEN; The University of Tokyo, RIKEN; The University of Tokyo, RIKEN; RIKEN, The University of Tokyo)
概要: Learning from triplet comparison data has been extensively studied in metric learning and ordinal embedding. An important fundamental question of whether we can learn a classifier only from triplet comparison data has remained unanswered. In this paper, we give a positive answer to this important question. We provide both theoretical and experimental results to show that our method is favorable.

1-102: A Stein Method for Statistical Inference with Unnormalized Models

発表者: Song Liu; Takafumi Kanamori; Wittawat Jitkrittum; Yu Chen (University of Bristol; Tokyo Institute of Technology/RIKEN AIP; Max Planck Institute for Intelligent Systems; University of Bristol)
概要: The maximum likelihood estimator (MLE) has many useful properties. However, the computation of the MLE is often intractable due to the normalization term. To overcome the difficulty, we propose the discriminative likelihood estimator based on the Kullback-Leibler divergence minimization criterion implemented via density ratio modeling using Stein operator.

1-103: 局所変分近似による双曲線正割分布の推定とクラスタリングへの応用

発表者: 中村文士; 小西亮介; 清木康 (ゼネリックソリューション株式会社; ゼネリックソリューション株式会社; 慶應義塾大学)
概要: 双曲線正割分布は裾の広い分布であり、正規分布とは違った性質が期待できる。しかしながら、この分布の推定をベイズ的なアプローチで行う方法はまだ確立されていない。そこで、本発表では、局所変分近似を用いて、ベイズ事後分布の近似事後分布を得るためのアルゴリズムの導出を行う。また、クラスタリングの分布にこの分布を用いた場合の精度を正規分布のものと比較し、裾の広い分布に対して有用であることを実験的に示す。

1-104: 被写体の関係性を考慮した視線推定

発表者: 笹井健行; 福島真太朗 (トヨタ自動車株式会社; トヨタ自動車株式会社)
概要: 視線推定は、画像・動画のどの部分が注目されているかを推定する課題である。視線推定においては被写体の関係性が重要と考えられる.今回提案する手法は,関係性を表す特徴を明示的に利用することで,より効果的な推定ができるものと考えられる。また、入力と合わせて関係性を表す特徴と出力の関係を比較することが可能となり,解釈性の向上にも寄与するものと考えられる.

1-105: Application of mult-armed bandit problems in drug discovery

発表者: 鷹羽 健一郎 (旭化成ファーマ株式会社)
概要: Here, we present that designing novel drug candidates can be considered as a multi-armed bandit (MAB) problem. MAB is used to allocate the limited computational resources to more promising compounds, i.e., low energy scored compounds, and avoid unpromising ones. This allows chemists to make faster decisions to which compounds to synthesize, thus leading to more success in drug discovery projects.

1-106: 深層ニューラルネットワークを用いたブレグマン距離最小化に基づく密度比推定による画像データ異常検知

発表者: 阿部将大; 杉山将 (株式会社D2C; 理化学研究所/東京大学)
概要: 本研究では、正常データとラベルなしデータを用いた弱教師付きの異常検知問題を考え、ブレグマン距離最小化に基づく密度比推定法を深層ニューラルネットワークに適用することによって異常スコアを推定する。この手法を複数の画像データセットに対して適用し、異常検知性能と計算効率性の両面で既存手法を上回ることを実験的に示す。

1-107: ノード共有のないヘテログラフにおけるグラフネットワークの効率的学習

発表者: 小西達也; 黒川茂莉; 米山暁夫 (株式会社KDDI総合研究所; 株式会社KDDI総合研究所; 株式会社KDDI総合研究所)
概要: ノード共有のない完全へテロなグラフを扱うドメインにおいて,学習の効率化のためにはノード特徴量の埋め込みを共有化することが必要である。本研究では多層からなる潜在ノード層を導入することで,ヘテロでありノード数の異なるグラフを同時に効率的に学習できる手法を提案する。

1-108: 時間遷移学習に拡張したマルチモーダルVAEによる未来行動予測

発表者: 小島亮一; 和田真弥; 吉原貴仁 (株式会社KDDI総合研究所; 株式会社KDDI総合研究所; 株式会社KDDI総合研究所)
概要: スマホセンサや宅内センサなどの時系列マルチモーダルデータを入力とした人の未来行動予測モデルを提案する。提案モデルはマルチモーダルに共通する潜在表現を学習する層に加え、その時間遷移を学習できる層からなるVAEである。層別に定義した2つの損失関数の結合前にドロップアウトを入れることで学習データに過学習をしない汎用な潜在表現と10秒20秒と先にいくつれ顕著となる予測精度の劣化を抑えた時間遷移学習を達成している。

1-109: 花札におけるナッシュ均衡戦略の計算

発表者: 阿部拳之 (株式会社サイバーエージェント)
概要: 本研究では花札の競技の一種である「こいこい」におけるナッシュ均衡戦略を計算することを目指す.花札は二人零和不完全情報ゲームの一種であるが,膨大な状態数を有するゲームであるため,均衡戦略の計算が困難である.そこで,本研究では膨大な状態数を扱えるようにするために,花札のゲームの状態を抽象化する方法を提案する.

1-110: HSICに基づく特徴クラスタリングによるマルチモーダル特徴融合探索の効率化

発表者: 上田隼也; 吉川友也; 紫藤佑介 (株式会社メルカリ; 千葉工業大学; 株式会社メルカリ)
概要: マルチモーダル特徴融合探索では、各モダリティから得られる特徴を融合するための適切なネットワーク構造を求める。このタスクにおいて、探索候補となる特徴が多い場合は探索時間が長大になる問題がある。この問題に対して、本発表では、HSICに基づく特徴クラスタリングを用いて探索の前に有用な特徴を選択することを提案し、選択された特徴を用いたマルチモーダル特徴融合探索の効率性を検証する。

1-111: Variational Auto Encoder を用いた Click Through Rate を改善するためのバナー画像変換

発表者: 熊谷雄介; 久原卓; 三木一弘; 町田尚基; 田原將志; 藤原晴雄; 道本龍 (株式会社博報堂; 株式会社博報堂; 株式会社テクノプロ; 株式会社アイズファクトリー; 株式会社博報堂; 株式会社博報堂; 株式会社博報堂)
概要: 入力されたバナー画像に対して,Variational Auto Encoder と CTR 予測ネットワークのふたつから構成されるニューラルネットワークを用い,本来期待される Click Through Rate よりも改善が見込まれるように入力画像を変換する手法について発表する.

1-112: 学習用入力の複数サンプルに対する予測出力の調和による学習法

発表者: 井手 敦也; 岡留 剛; (関西学院大学; 関西学院大学; )
概要: 深層学習において高い汎化性能を持つモデルの訓練を行うことは重要であり、データの拡張方法やバッチサイズ・学習率の最適化などが広く研究されている。その一つの方法としてバッチ内部で同一の元データから拡張を行う手法がある。本研究ではバッチ内の拡張されたデータの出力を調和し学習することで汎化性能の向上を目指す。

1-113: 混合エキスパートモデルによる略語や表記揺れに頑健なテキスト名寄せ

発表者: 酒井一徳; 小山田昌史; 董于洋; 竹岡邦紘 (関西学院大学大学院理工学研究科; 日本電気株式会社データサイエンス研究所; 日本電気株式会社データサイエンス研究所; 日本電気株式会社データサイエンス研究所)
概要: 企業名や住所など略称や誤字脱字の多く含まれるテキストの名寄せは重要かつ困難な課題である。アルファベット化や頭文字の取得など種々の文字列変換は精度向上に有用だが、文字列によってはかえって精度を低下させることもある。本研究は、混合エキスパートモデルを活用し、文字列に応じて最適な文字列変換ルールを選別することで、高い精度で略語や表記揺れを多く含むテキストの名寄せができることを示す。

1-114: ドメイン適応型変化検知

発表者: 田中大貴; 鹿島久嗣 (京都大学; 京都大学)
概要: 変化値検出問題とは、2つのデータセットを比較し、その差となるデータを検出する問題であり、現実世界においてしばしば重要な問題となる。データ収集のコスト等の問題から、比較元のデータセット(ソースドメインデータ)と比較対象のデータセット(ターゲットドメイン)を同じドメインで比較することが難しい場合がある。その際、環境の変化などにより、ソースドメインデータとターゲットドメインデータの分布が必ずしも一致しないことがある。そのような状況でソースドメインデータとターゲットドメインをそのまま比較すると、ターゲットドメインの大部分が変化値として検出されてしまう問題がある。このような状況において正しく変化値を検出するため、ドメイン適応の考え方を用いて、ソースドメインデータとターゲットドメインデータを共通の空間に射影し、変化値検知を行うことが考えられ、本研究ではこのアプローチについて検証する。

1-115: マルチスケールk-近傍法を用いた画像のタグ推定

発表者: 田中卓磨; 奥野彰文; 福井一輝; Kim Geewook; 下平英寿 (京都大学・理研AIP; 理研AIP; 京都大学・理研AIP; 京都大学・理研AIP; 京都大学・理研AIP)
概要: 画像に関連したタグを推定するとき,k-近傍法では近傍k枚の画像に関連したタグ出現頻度を集計し,各タグの事後確率を推定する.kが大きいと推定のバリアンスは小さいが,近傍にない画像のタグも集計してしまいバイアスが大きくなる.kが小さいと逆の効果がある.本研究では複数のkで事後確率を計算し,kを外挿してトレードオフを制御するマルチスケールk-近傍法を提案する.Flickr画像でタグを推定した結果も示す.

1-116: Domain Generation Algorithm Detection Using Adversarial Hardening

発表者: Nathaniel Gould; Taishi Nishiyama; Kazunori Kamiya (Georgia Institute of Technology, Computer Science; NTT Secure Platform Laboratories; NTT Secure Platform Laboratories)
概要: We created a model that can detect domain generating algorithms, which are often used by malware, using a CNN and LSTM classifier. Using a GAN, additional training samples are generated to harden the discriminator model. To show the effectiveness of the training, the model is tested on its ability to detect in-sample and out-of-sample DGAs and compared to an identical, non-GAN trained model.

1-117: モデルベース強化学習のためのベイズモデル選択的に基づくメタアプローチ

発表者: 菱沼徹; 泉田啓 (京都大学; 京都大学)
概要: モデルベース強化学習において適切なモデルを選択することはサンプル効率化の面で重要であるため,本研究では,エージェントが観測したサンプルを用いてベイズ的モデル選択を行いモデルベース強化学習のためのモデルを決定するというメタアプローチを考える.モデル化誤差が小さい場合には,現在観測されたサンプルに対する適合度による選択が効率的ではないので,これを改善する方法を提案する.

1-118: モード統計手法に対して漸近統計的に最適なカーネル関数

発表者: 山崎遼也; 田中利幸 (京都大学; 京都大学)
概要: カーネルベースのモード統計手法(カーネルモード推定,シンプルモード推定,条件付きカーネルモード推定,ノンパラメトリックモード回帰,モード線形回帰)の推定精度を研究した.これらの手法の推定精度は,用いるカーネル関数と帯域幅に依存している.本発表では,推定量の漸近平均二乗誤差が最小化される帯域幅とカーネル関数の組み合わせを示す.

1-119: グラフニューラルネットワークの組合せ問題に対する近似度

発表者: 佐藤竜馬; 山田誠; 鹿島久嗣 (京都大学; 京都大学・理研AIP; 京都大学・理研AIP)
概要: グラフニューラルネットワーク(GNN)は組合せ問題を解くタスクに対して有用であることが実験的に知られており、同型問題についての解析を通してその理論的性能も一部明らかにされた。しかし、最小頂点被覆問題や最大マッチング問題など、同型問題以外の重要な組合せ問題に対しての理論的性能は知られていない。本研究ではGNNと分散アルゴリズムの繋がりを示すことで、GNNの組合せ問題に対する理論的性能を明らかにする。

1-120: グラフと近傍グラフの確率的同時埋め込みによるマルチモーダルデータの可視化

発表者: 水谷守裕; 奥野彰文; 福井一輝; Kim Geewook; 金沢朋実; 白石 友一; 岡田眞里子; 下平英寿 (京都大学; 理研AIP; 京都大学・理研AIP; 京都大学・理研AIP; 大阪大学; 国立がん研究センター・理研AIP; 大阪大学; 京都大学・理研AIP)
概要: ベクトル間の類似度により計算される重み付き隣接行列を近傍グラフと呼び,t-SNEは近傍グラフが保存されるような低次元埋め込みを計算する.一方でグラフ埋め込みでは与えられたグラフが保存されるような低次元埋め込みを計算する.ここでは前者の近傍グラフと後者の与えられたグラフが混在するマルチモーダルデータの確率的同時埋め込みによる可視化を提案し,細胞画像ー阻害剤ー遺伝子など実データ可視化の結果も報告する.

1-121: ランダムフォレスト・二分決定図とニューラルネットの表現能力について

発表者: 熊野颯; 阿久津達也 (京都大学大学院情報学研究科; 京都大学化学研究所)
概要: 従来から、機械学習モデルの表現能力が研究されてきた。例えば、ニューラルネット(NN)においては、深さから効率性が生じる。しかし、ランダムフォレスト(RF)におけるノード数に関する効率性の有無は不明である。本研究ではNNとRF 、二分決定図の表現能力を比較し、RFはNNと全く同種の効率性は持たないことを示す。また、RFを構成する決定木の本数からノード数に関する効率性が生じる場合があることを示す。

1-122: 敵対的逆強化学習による報酬関数を用いたBehavioral Cloningの正則化

発表者: 西尾 大智; 山根 智 (金沢大学; 金沢大学)
概要: 模倣学習の古典的な手法のBehavioral Cloning(BC)はエキスパートのデモデータにない状態で上手く行動を決定できないという欠点がある. しかし最近BCを正則化する論文が提案され, 現在の主流である敵対的生成模倣学習を超える性能が出ることが報告された. 本発表では, その手法の欠点を敵対的逆強化学習による報酬関数を用いたり, 吸収状態も考慮したりすることで改善する方法の提案をする.

1-123: Universal Adversarial Perturbationを用いた医療画像診断用ディープニューラルネットワークの信頼性評価

発表者: 平野北斗; 三奈木啓成; 竹本和広 (九州工業大学; 九州工業大学; 九州工業大学)
概要: 近年、医療画像診断用ディープニューラルネットワーク(DNN)が多く提案される。DNNの騙されやすさは実際の医療診断において問題になると考えられるが、その問題はほとんど評価されていない。この研究では、Universal adversarial perturbationを用いることで、医療画像診断用DNNもまた簡単に騙せることを示し、医療診断におけるDNNの安直な応用に対して警鐘を鳴らす。

1-124: 転移学習された画像分類モデルのUniversal Adversarial Perturbationに対する脆弱性:病理画像診断を例にして

発表者: 三奈木啓成; 平野北斗; 竹本和広 (九州工業大学; 九州工業大学; 九州工業大学)
概要: 転移学習による画像分類は様々な分野で応用されるが,その敵対的摂動に対する脆弱性はよく議論されていない。本研究では,病理画像診断を題材に,転移学習されたディープニューラルネットワークを誤認識させるUniversal adversarial perturbationが,訓練画像ではなく,事前学習済みモデルに関連する画像からも作成可能であることを示し,実応用における転移学習の安直な利用に警鐘を鳴らす。

1-125: データベースシステムにおける深層強化学習を用いたクエリ最適化

発表者: 林 瑛晟; 宮崎 崇史; 清水 伸幸; 川島 英之 (慶應義塾大学; ヤフー株式会社; ヤフー株式会社; 慶應義塾大学)
概要: クエリ最適化はデータベースシステムの性能に大きな影響を及ぼす重要な要素である。クエリ最適化器は与えられたクエリについて、リレーション結合順序の選択などによって最適と思われる実行計画を決定するが、通常はフィードバックを受け取らない。本研究では、深層強化学習の適用により、学習による改善が可能なクエリ最適化器の構築を目指す。

1-126: NMARな欠測でのガウス過程潜在変数モデルを用いたデータ融合法の提案

発表者: 光廣正基; 星野崇宏 (慶應義塾大学大学院経済学研究科; 慶應義塾大学経済学部,理化学研究所革新知能統合研究センター)
概要: 異なる情報源から取得した2つの多変量データを融合する方法として,潜在変数モデリングによるアプローチがあるが,この方法では観測値と潜在変数の非線形関係までは捉えられない.本研究では,ガウス過程潜在変数モデルを応用したデータ融合法を提案し,欠測有無に離散選択モデルを仮定することで,NMARな欠測でも適用可能とする.

1-127: 確率分布に基づく形状データのクラスタリング

発表者: 岩田一貴 (広島市立大学)
概要: 形状データのフルプロクルステス解析とは,形状のユークリッド相似変換に結果が影響を受けない統計解析手法のことである.本研究では,フルプロクルステス解析としての形状データのクラスタリング手法を提案する.この方法では,形状データの行列表現についての混合分布モデルを定義し,そのモデルパラメータの最適化問題を解くことによって,クラスタリング結果を得る.

1-128: 勾配ブースティングによる数理最適化のためのend-to-endな学習

発表者: 小西卓哉; 福永拓郎 (国立情報学研究所; 中央大学/理研AIP/JSTさきがけ)
概要: 数理最適化問題のパラメータをデータから学習する問題を考える。単純な方法として、解きたい最適化問題と独立にパラメータを学習することが考えられるが、近年、最適化問題を考慮してend-to-endに学習する方法が検討されている。本研究では、陰関数微分による勾配ブースティングのend-to-endな学習を提案し、その有効性を確認する。


11月21日 12:45 – 15:15

2-001: Pokémon2Vec ~Word2Vecを用いたポケモン連想システムのwebアプリ実装~

発表者: 比嘉舞輝 †; 杉浦伊織 †(† equally contributed); 興津心平; 宮田龍太 (琉球大学大学院理工学研究科; 琉球大学工学部; 琉球大学工学部; 琉球大学工学部)
概要: 本研究ではWord2Vecを用いて、あるポケモンに「タイプ」や「とくせい」といった要素を与えると、それらから連想される別のポケモンを提案するシステム(e.g., イーブイ + みず = シャワーズ; ミュウ + ほのお = ビクティニ)を開発した。また2019年11月15日に発売される新作ゲームを盛り上げるために、開発システム“Pokémon2Vec”をwebアプリとして公開し、システムの出力がポケモンファンの感性に合うものであるか確かめた。

2-002: Causal Outcome Prediction on Combinatorial Action Spaces

発表者: 谷本 啓; 坂井 智哉; 竹之内 高志; 鹿島 久嗣 (NEC; NEC; 公立はこだて未来大学; 京都大学)
概要: 意思決定支援システムにおいて個々の介入結果を予測するためには、因果を考慮したモデリングが必要である。このような予測モデリングには理想的にはランダム化試験を行ったデータが必要であるが、実際にはコストの問題などから、観察データしか得られない場合が多い。近年、個人措置効果推定と呼ばれる領域において、介入を行った場合と行わなかった場合のそれぞれの結果を予測する手法が盛んに提案されている。しかし、既存研究では主に介入をするかしないかの二値など、限定的な数の介入行動が仮定されており、医者が処方する薬の組合せを選ぶ場合など、組合せ的な介入を支援したい場合、行動空間をモデル化しない既存法の適用は難しい。そこで本研究では、組合せ的な行動空間に適用可能な介入結果予測のための学習法を提案する。

2-003: Deep Learned Path Planning Via Randomized Reward Linked Goals and Potential Space Applications

発表者: Tamir Blum; William Jones; Kazuya Yoshida (Tohoku University; Tohoku University; Tohoku University)
概要: Using deep reinforcement end-to-end learning with randomized reward function parameters during training, we teach a simulated 8 degree- of-freedom quadruped ant-like robot to travel anywhere within a perimeter, conducting path plan and motion control on a single neural network, without any system model or prior knowledge of the terrain or environment.

2-004: 識別と再構成を行う マルチタスク ベクトル量子化 VAE

発表者: 小林 源太; 庄野 逸 ( 電気通信大学・大学院 情報理工学研究科; 電気通信大学・大学院 情報理工学研究科)
概要: 画像処理分野では識別問題と再構成問題がある。多くの場合、両問題は異なるモデルを定義して別々に解かれる。両問題を一つのモデルで同時に解決する手法として教師あり自己符号化器があるが、その両者の関係は十分に明らかになっていない。本研究では、識別問題と再構成問題をベクトル量子化した中間特徴量によって同時に解くモデルについて検討する。具体的に、ベクトル量子化の度合いと両問題の関係を調査する。

2-005: Voice Activity Detection Based Audio Information Hiding for Speech Sharing

発表者: Xuping HUANG (Advanced Institute of Industrial Technology)
概要: This method proposes an anti-forensics acoustic steganography technology to embed speech data into another acoustic carrier to conceal the existence, to achieve a confidentiality guaranteed communication channel against censor. Voice activity detection is used to explore barely audible waveform of background noise with low-amplitude and high spectrum coefficients to reserve embedding space.

2-006: Efficient convex clustering with submodularity

発表者: Jie Chen; Joe Suzuki (Graduate school of Engineering Science, Osaka University; Graduate school of Engineering Science, Osaka University)
概要: Convex clustering has drawn recent attention with convexity property. The ADMM algorithm solves the convex clustering problem, but it takes much time when faced with large data. There are many useful properties and algorithms in submodular function aspect. We propose a new way to solve the optimization problem of convex clustering by applying the submodular function.

2-007: PAC-Bayesian Transportation Bound

発表者: 宮口航平 (IBM東京基礎研)
概要: We present a new generalization error bound, the PAC-Bayesian transportation bound, unifying the PAC-Bayesian analysis and the chaining method in view of the optimal transportation. The proposed bound is the first PAC-Bayesian framework that characterizes the cost of de-randomization of any stochastic predictors. We also give an example with spectrally normalized NNs.

2-008: 深層強化学習による化学プラント全体収益最適化

発表者: 森達哉; 窪澤駿平; 大西貴士 (NEC, AIST, 理研AIP; NEC, AIST; NEC, AIST)
概要: 本研究では化学プラントのシステム全体を深層強化学習で制御し、全体収益を改善することを目指している。当発表では、Soft Actor Criticベースの深層強化学習を、化学プラント制御においてベンチマークとなっている酢酸ビニル製造プラントのシミュレータに適用した実験結果について報告する。

2-009: Link Prediction on a Large Business Social Network in Japan ーGraphSAGE based supervised inductive learning framework

発表者: Xing Li; Juan Nelson Martínez Dahbura; Kosuke Yoshimura; Takanori Nishida (Sansan, Inc.; Sansan, Inc.; Sansan, Inc.; Sansan, Inc.)
概要: The link prediction problem is being paid increasing attention. The NN based GraphSAGE provides an inductive learning framework to leverage node features and graph structure to generate node embeddings for even unseen nodes. Inspired by GraphSAGE, we build a supervised inductive learning framework to predict future connections on business network at company level, and achieve a promising result.

2-010: A study on the latent space of VAE

発表者: Paulino Cristovao; Hidemoto Nakada; Yusuke Tanimura; Hideki Asoh (University of Tsukuba; National Institute of Advanced Science and Technology,University of Tsukuba; National Institute of Advanced Science and Technology,University of Tsukuba)
概要: We study the role of latent space dimensionality and latent structure using sparse autoencoder. The assumption is that, inducing sparsity in the encoder will lead to better latent space representation. We extend our analysis to find the correlation between latent dimensionality and latent interpolation result. We tested our assumption on dSprites dataset.

2-011: バイアスのある正信頼度を用いた二値分類

発表者: 篠田和彦; 梶洋隆; 杉山将 (トヨタ自動車; トヨタ自動車; 理研/東京大学)
概要: 正例データとその信頼度のみから二値分類器を学習する分類手法において,正信頼度にバイアスがある場合には分類性能が低下する可能性がある.本研究では,正信頼度のバイアスの影響を抑制する補正パラメータを導入し,正例データのみを使って補正パラメータのチューニングを行う方法を提案する.さらにニューラルネットワークを用いた実験によって,現実のデータに対する提案手法の有用性を示す.

2-012: 車両走行運転シーンの検索

発表者: 小林 保正; 福島 真太朗 (トヨタ自動車株式会社; トヨタ自動車株式会社)
概要: 近年,自動車で取得可能な画像データ,センサーデータ等が爆発的に増大している.こうした状況において,蓄積したデータからユーザが求める運転シーンを効率的に検索する技術が重要となる.本発表では,画像データを入力,センサーデータを出力としたLTSMやGRUから時空間注視情報を特徴量として抽出する新たな検索手法を提案する.

2-013: 勾配ブースティング木における木成長時の勾配情報更新による学習加速

発表者: 阪田隆司 (パナソニック株式会社)
概要: 近年、勾配ブースティング木(GBDT)は機械学習コンペティションをはじめ広く用いられ、様々な領域で成功を収めている。一般的なGBDTのアルゴリズムでは、新たな木を追加する度に勾配情報を更新するが、本研究では決定木そのものを木の深さ方向の加法的モデルとみなし、木成長の度に勾配情報を更新することで、GBDTの学習を加速できることを示す。

2-014: Fast dropout prediction with uncertainty

発表者: 前佑樹; 熊谷亘; 金森敬文 (株式会社デンソー; 理研AIP; 東京工業大学/理研AIP)
概要: 自動運転車のような高信頼な自律システムの実現に向けて,予測の信頼性を定量化できるベイジアンニューラルネットワーク(BNN)への関心が高まっている.しかし,自律システムはセーフティクリティカルであると同時に計算資源が制約されているリアルタイムシステムでもあるため,BNNの搭載は困難である.本発表では,NNの一部のみのベイズ化と近似推論により,少ない計算資源で予測分布を計算できることを示す.

2-015: 帯行列を用いた線形観測に基づくスパース推定

発表者: 上村京也; 田中利幸 (京都大学大学院; 京都大学大学院)
概要: ノイズあり線形観測におけるパラメータ推定について、パラメータベクトルがスパースである場合、L1正則化によるスパース推定が有効であることが知られている。本研究では帯行列を計画行列とする観測問題に注目し、代表的ないくつかのスパース推定手法に基づいてパラメータ推定を行った。特に帯行列のバンド幅によって、推定結果に対する信号雑音比の影響がどのように変化するかについて実験的に検証した。

2-016: 能動学習の停止基準

発表者: 石橋英朗; 日野英逸 (九州工業大学; 統計数理研究所/RIKEN AIP)
概要: 本研究では能動学習の停止基準を提案する.能動学習は教師あり学習において効果的なサンプルを選択する枠組みであり,ラベリングのコストがかかる場合に特に有効である.能動学習において効果的なサンプリング法の研究は多い一方で学習を停止するタイミングについての方法は少ない.提案法は汎化誤差の期待値の差の上界を検定によって評価することで汎用的に利用することが可能である.

2-017: Tensor-train分解アルゴリズムによる薬物応答遺伝子発現データ解析と創薬応用

発表者: 岩田通夫; Yuan, Longhao; Zhao, Qibin; 田部井靖生; 山西芳裕 (九州工業大学; 理化学研究所AIP; 理化学研究所AIP; 理化学研究所AIP; 九州工業大学)
概要: ヒト細胞の薬物応答を遺伝子レベルで明らかにすることは、創薬の重要課題である。しかしながら、実際の薬物応答遺伝子発現データは多くの欠損値や未観測値を含んでいる。本研究では、薬物応答遺伝子発現データを高階テンソル構造とみなし、新規のtensor-train分解アルゴリズムを用いて補完する手法を提案した。更に、薬物応答遺伝子発現データから様々な疾患に対して薬物の新たな効能を予測する手法を開発し、その有効性を示した。

2-018: グラフィカルモデルを用いた犯罪発生リスクエリアのスパース性を考慮した相関関係の可視化

発表者: 一期﨑 翔; 川島 貴大; 庄野 逸 (警察庁、電気通信大学; 電気通信大学; 電気通信大学)
概要: 今日の地理的犯罪予測は、時間的に直近の犯罪発生地点周辺の犯罪リスクを予測することが主流となっている。本研究の目的は過去の犯罪発生状況からエリア毎の相関を求めることで、犯罪発生地点周辺以外での高犯罪リスクのあるエリアを予測することである。今回は一般に公開されているアメリカの都市の犯罪データを用いて、犯罪発生リスクエリアの相関関係をスパース性を考慮して得られた結果をグラフィカルに表現した。

2-019: Robust contrastive learning and nonlinear ICA in the presence of outliers

発表者: 佐々木 博昭; 竹之内 高志; Ricardo Monti; Aapo Hyvarinen (公立はこだて未来大学; UCL; INRIA; Univ. of Helsinki)
概要: Nonlinear independent component analysis (ICA) is a general framework for unsupervised representation learning. Here, we first theoretically analyze nonlinear ICA models in the presence of outliers, and then develop two robust nonlinear ICA methods based on the \gamma-divergence. We also experimentally demonstrate that the proposed methods are much more robust to outliers than existing methods.

2-020: 少数のサンプル画像からの任意人物姿勢画像の生成

発表者: 中田 秀基; 麻生英樹 (産業技術総合研究所)
概要: 少数の異なる姿勢をとった人物画像から、任意の姿勢の人物画像を生成する試みについて紹介する。人物画像をエンコードした表現を、指定姿勢を入力として変換し、変換後の表現から人物画像にデコードすることで指定姿勢の人物画像を得る。3D モデルから生成した学習データに対して、提案手法を評価した結果、比較的良好な画像が得られることが確認できた。

2-021: 通信パケットの変化予兆検知・異常推定手法

発表者: 比賀江 文子; 嶋 久登 (神戸情報大学院大学; 神戸情報大学院大学)
概要: より早い段階での変化の開始点を検知する手法として部分空間法による変化検知が紹介されている。不可積分時系列データにたいして部分空間法の特徴量をカルバック・ライブラー・ダイバージェンスを用いよりも正確に早い段階で変化開始点を検知する手法を提案する。

2-022: 格子暗号の安全性の推定における高次統計量とGram-Charlier展開の活用

発表者: 松田源立; 照屋 唯紀; 柏原賢二 (成蹊大学; 産業技術総合研究所; 東京大学)
概要: 格子暗号は、次世代の耐量子計算機暗号の候補として有力視されている暗号系である。格子暗号の安全性は、所与の格子基底から最短の非ゼロ格子ベクトルを探索する問題の困難性を根拠とする。従って、安全かつ実用的な格子暗号を構成するためには、この問題の計算量を見積ることが重要である。本発表では、探索における最短格子ベクトルの発見確率が、高次統計量とGram-Charlier展開により非常に正確に推定できることを示す。

2-023: ヒートマップを考慮した視線推定による操作

発表者: 堺一眞; 井上真郷 (早稲田大学 電気・情報生命 井上真郷 研究室; 早稲田大学 電気・情報生命 井上真郷 研究室)
概要: 人の視線は意図の推定などに役立つ重要な情報である。赤外線カメラを用いた視線推定を利用し、視線でパソコンなどを操作する装置は既に実用化されている。しかし、一般的なRGBカメラのみを用いた視線推定は精度が低く、視線操作には不十分である。本研究では操作対象のディスプレイの情報から注目されやすさの確率分布を作成し、それを導入した視線推定の手法を検証した。

2-024: 雑談チャットボットのための記憶注意機構の検討

発表者: 伊藤駿汰; 井上真郷 (早稲田大学; 早稲田大学)
概要: 対話応答タスクにEncoder-Decoderモデルを適用することにより比較的自然な応答の生成が可能になったが、応答の一貫性やペルソナの保持に課題がある。この課題の解決のため、応答の根拠となる情報やペルソナの情報を入力する経路をモデルに追加するアプローチがある。本研究ではEncoder-Decoderモデルに外部情報を入力するためのAttentionベースの構造を導入し、その効果を検証した。

2-025: 構造的正則化手法を用いた階層的時系列の予測

発表者: 白鳥友風; 小林健; 高野祐一 (筑波大学; 株式会社富士通研究所; 筑波大学)
概要: ある会社の営業部門,広告部門,経理部門等の売上の和によって会社全体の売上が表されるといった階層的な構造を持つ時系列データは数多く存在する.本研究ではこのような階層構造を事前情報として活用し,階層構造への違反度を表す罰則項を導入して各系列の将来の値を予測する方法を提案する.また,既存手法との予測精度の比較,及び罰則項の強さと予測誤差の関係の分析を通し,提案モデルの有効性を検証する.

2-026: Automated trimap generation using a matting neural network

発表者: 谷口 正樹; 手塚 太郎 (筑波大学; 筑波大学)
概要: 近年,特殊な撮影環境を必要としない自然状態ての写真から前景を抽出するAlpha Matting分野の研究が盛んに行われている.タスクでは元となる写真とTrimapと呼ばれる中間データを用いる手法が一般的である.しかしながら,このTrimapは人手で作られることが多く実用上高コストである.そこで,本稿ではTrimap作成をSemantic Segmentationタスクと捉え,写真からAlpha Matteへの変換の中間表現としてTrimapの自動作成に成功した.

2-027: 確率的動的モード分解における情報量基準による潜在的モード数推定

発表者: 川島貴大; 日野英逸 (電気通信大学; 統計数理研究所, 理研AIP)
概要: 動的モード分解は多次元時系列データにおいて振動モードを抽出する手法であるが,データを支配する実効的なモード数を直接推定することは困難である.この動的モード分解を生成モデルとみなした確率的動的モード分解において,情報量基準によるモデル選択の枠組みでモード数の推定が有効であることを示す.

2-028: Portilla-Simoncelli staisticsを用いたDCNNのテクスチャ表現解析

発表者: 浜野佑介; 庄野逸 (電気通信大学; 電気通信大学)
概要: 大規模自然画像で学習されたDCNN中間層の特徴量は,テクスチャ合成において非常に有用であることが知られている.画像合成の視覚的な結果から、DCNNは多様なテクスチャ表現を捉えていることが示唆されるが、具体的にどのような特徴を抽出しているかは不明瞭である.本研究では、認知心理学的なテクスチャ表現の統計量として知られているPSSを用いて、DCNN特徴量の定量的な評価及び解析を行う.

2-029: レイヤー毎の適応的学習率を用いた学習における初期学習率決定方法の提案

発表者: 長沼大樹; 横田理央 (東京工業大学 情報理工学院; 東京工業大学 学術国際情報センター)
概要: 高速化を目的とした大きなバッチサイズでの深層学習における汎化性能の劣化問題に対し、レイヤー毎の重み・勾配を考慮して適応的に学習率を定めるLARSが一般的に用いられる。LARSを小さなバッチサイズの学習に用いた場合の学習破綻に着目し、レイヤー毎の重み・勾配を解析を行った。特にバッチサイズに依存して、レイヤー毎の学習率平均が変化するため、全体の学習率の総和に基づいて初期学習率を決定する手法を提案する。

2-030: Graph Mining Meets Crowdsourcing: Extracting Experts for Answer Aggregation

発表者: 河瀬 康志; 黒木 祐子; 宮内 敦史 (東京工業大学/理研AIP; 東京大学/理研AIP; 理研AIP)
概要: We address an answer aggregation task in crowdsourcing. In particular, we are interested in the case where there are only a few experts overwhelmed by a large number of non-experts. For this hard scenario, we design effective answer aggregation algorithms with the aid of graph mining techniques. Computational experiments demonstrate that our algorithms outperform the state-of-the-art algorithms.

2-031: 半順序構造上の対数線形モデルのための座標降下法

発表者: 林翔太; 杉山麿人; 松島慎 (東京大学; 国立情報学研究所; 東京大学)
概要: 半順序構造を持つデータのための対数線形モデルは情報幾何学的に好ましい性質を持ち、パラメータの学習は勾配降下法で行うことができることが知られていた。本研究では、この対数線形モデル更新する際に必要な計算量が勾配降下法より小さく、パラメータの更新幅が解析的に求められる座標降下法を提案する。さらに、実データを用いた実験により本手法が勾配降下法よりも高速にモデルの学習が可能であることを確認する。

2-032: ニューラルネットワークを用いた点過程の強度関数のモデリング

発表者: 近江崇宏; 上田修功; 合原一幸 (東京大学/理研AIP; NTT コミュニケーション科学基礎研究所/理研AIP; 東京大学)
概要: 本発表では筆者らが最近提案したニューラルネットワークを用いた点過程時系列のモデルについて議論する(Omi et al., NurIPS 2019)。我々のモデルは強度関数を柔軟に推定することができるとともに、数値計算を用いずにモデルの尤度関数を厳密に評価できるという特徴がある。既存手法との推定精度や効率性に関する比較等について論じる。

2-033: 経験リスク最小化による半教師付き順序回帰

発表者: 土屋 平; Nontawat Charoenphakdee; 佐藤 一誠; 杉山 将 (東京大学/理研AIP; 東京大学/理研AIP; 東京大学/理研AIP; 理研AIP/東京大学)
概要: 全順序構造の入ったラベル付きデータと、ラベルなしデータが与えられた半教師付き順序回帰の問題を考える。既存の半教師付き順序回帰の手法は、特定のリスクや幾何学的仮定への依存などの問題点が挙げられる。本研究では、あらゆるリスクに利用可能であり、幾何学的仮定に依存しない半教師付き順序回帰の手法を提案する。

2-034: Tarone法を用いた頻出部分文字列マイニングの多重検定補正

発表者: 毛利 公一; 福永 津嵩 (東京大学情報理工学系研究科コンピュータ科学専攻; 東京大学情報理工学系研究科コンピュータ科学専攻)
概要: 生物情報学には二つの配列データセットのうち一方のみに頻出する部分文字列を検出する問題がある。本研究では、統計的に有意な任意長の部分文字列を全て発見するアルゴリズムを提案する。本問題の解決のために、全ての部分文字列に対し仮説検定を行った。多重検定補正法としてTarone法を用いて適切な有意水準を設定し、系列パターンマイニングと組み合わせる事で統計的に有意なパターンを列挙した。

2-035: ベイズ最適化を用いたイベント計測の停止判定

発表者: 武藤健介; 永田賢二; 有馬孝尚; 岡田真人 (東大新領域; NIMS; 東大新領域; 東大新領域)
概要: ポアソン過程に基づくイベント計測において,停止判定は難しく計測が冗長化しやすい.大量のデータを得ることでデータの微細な特徴を抽出できるが,装置の分解能を超えた情報は不要である.従って,計測の停止判定手法の構築が重要である.我々は,計測を行いながら,得られたデータに対してヒストグラムの最適なビン幅を計算し,それが装置の分解能を下回る時に計測を停止する手法を提案する.ここで,最適ビン幅の効率的な探索にベイズ最適化を用いる.

2-036: 身体動作を用いた講義に対する評価の推定手法の検討

発表者: 羽鳥康裕; 中島平; 佐藤克美; 塩入諭; 渡部信一 (東北大学電気通信研究所; 東北大学大学院教育学研究科; 東北大学大学院教育学研究科; 東北大学電気通信研究所; 東北大学大学院教育学研究科)
概要: 授業改善には講義に対する詳細なフィードバックが効果的である。本研究では、より効果的・効率的な授業改善を行うために、受講者の講義への関与の度合いを身体動作から推定する手法を検討している。本発表では、動画像から教師なし抽出により得られた受講中の身体動作の文節構造を報告し、身体動作情報を授業改善へ活用する方法について議論する。

2-037: 人間GAN:人間による知覚的識別に基づく敵対的生成ネットワーク

発表者: 藤井 一貴; 齋藤 佑樹; 高道 慎之介; 馬場 雪乃; 猿渡 洋 (徳山工業高等専門学校; 東京大学; 東京大学; 筑波大学; 東京大学)
概要: 人間による知覚評価を用いて生成モデルを学習する敵対的生成ネットワーク(GAN)を提案する.通常のGANの識別モデルを人間による知覚評価に置換することで,人間の知覚分布を表現可能な生成モデルを学習する.生成モデルのパラメータは,人間による知覚評価を用いた誤差逆伝搬法により推定される.音声の自然性に関する主観的評価により,提案法は人間の知覚分布を表現する生成モデルを学習できることを示す.

2-038: GANを用いた検出しやすい画像への変換に於ける教師なし学習手法の提案

発表者: 大西琢也; 岡田将吾 (北陸先端科学技術大学院大学; 北陸先端科学技術大学院大学)
概要: 本研究では、1枚の写真に同種の物体が複数散在している画像に対し、黒の背景に物体と同位置にある白球で構成される検出しやすい画像へ変換を行った後、白球に対する画一的な画像処理によって物体の検出を行う。提案手法では元画像からランダムに散在された白球画像へドメイン変換されるよう、DiscoGANを用いた変換器の教師なし学習が行われる。

2-039: 観測量間の動的構造を抽出するグラフ動的モード分解と集団スポーツデータへの応用

発表者: 藤井慶輔; 武石直也; 河原吉伸 (名古屋大学・理研AIP; 理研AIP; 九州大学・理研AIP)
概要: 構成要素が相互作用し複雑な動きを見せる集団運動を理解することは、物理学や生物学などにおいて重要な問題である。本発表では、集団運動などにおける観測量間の動的構造を抽出する、グラフ動的モード分解を紹介する。隣接行列系列を時間ダイナミクスとその係数である空間モードに分解することにより、データ駆動的にグラフ力学系の理解を可能にする。その応用例として、集団スポーツの選手集団の動きを分類する方法を紹介する。

2-040: Universal approximations of Permutation Invariant/Equivariant Functions by Deep Neural Networks

発表者: 高井 勇輝; 三内 顕義; Matthiue Cordonnier (理研 AIP 数理科学チーム/慶應義塾大学; 理研 AIP 数理科学チーム 慶應義塾大学/ エコール・ノルマル)
概要: 本発表では, 有限群 G の作用で不変な関数や同変な関数を近似することができる, 各層に群 G の作用をもつ各層の間のアフィン変換がその作用と可換であるディープニューラルネットワークの具体的な構成について説明する. 群の作用との可換性により, 表現論的議論を用いることが出来, 構成されたモデルのパラメータ数は, 通常のディープニューラルネットワークを用いる場合より, 格段に少ない. これについても説明する.

2-041: メタ学習に有用な事後分布の設計方法の提案

発表者: 前田新一; 中西敏樹; 小山雅典 (PFN; PFN; PFN)
概要: メタ学習の問題は、ベイズリスク最小化の観点からはベイズ推定の問題として定式化できる。このベイズ推定では、複数のタスクを解くことでタスク間で共通に用いられる尤度や事前分布のほか、タスクごとに異なるデータ数をもつ訓練データのもとでの事後分布を訓練データが与えられた下で素早く計算可能にすることが必要とされる。この計算にガウス分布を利用することで効率的な計算を提案する。

2-042: Deep Learning-Based Average Consensus

発表者: 岸田昌子; 小蔵正輝; 吉田悠一; 和田山正 (国立情報学研究所; 奈良先端科学技術大学院大学; 国立情報学研究所; 名古屋工業大学)
概要: This poster presents a deep learning-based approach for the fast linear average consensus over complex networks. We first unfold the consensus protocol to obtain a feedforward signal flow graph, which we regard as a neural network. We then train the neural network to minimize the consensus error. Our approach provides a set of time-varying weights and outperforms the existing approach.

2-043: 圏論と多様体仮説に基づく統計的機械学習の再定式化

発表者: 鈴木 藍雅; 坂無 英徳 (産業技術総合研究所/筑波大学; 産業技術総合研究所/筑波大学)
概要: 本研究では「実世界の高次元データは低次元の多様体構造の上に分布する」という多様体仮説と圏論に基づき、統計的機械学習を再定式化を行う。可能なデータ全体を多様体の圏の部分圏として定義することで、データ間の内部関係構造をデータの圏の射、モデルをデータの圏の間の関手、モデルの学習をモデル間の自然変換として表現できる。本理論は、データと統計モデル、モデルの学習を統一的な枠組みで説明する基盤となりうる。

2-044: HSICに基づく非線形モデルの変数選択

発表者: 紅林亘; 松井秀俊 (滋賀大学; 滋賀大学)
概要: 非線形モデルにおける変数選択手法として用いられるHSIC Lassoを拡張し、より幅広い枠組みで有効な変数選択手法を提案する。HSIC Lassoはカーネル法に基づき、非線形な関係性を持つデータへの有効性と、高いスケーラビリティという2点を両立する手法である。提案手法では、変数とカーネルを同時に選択する。これにより、データの非線形性が強い場合や、サンプルサイズが小さい場合において、手法の有効性が向上することを示す。

2-045: 除外制約を満たさない操作変数のスパース性を考慮した因果推論に対するベイズ的アプローチ

発表者: 堀井俊佑 (早稲田大学)
概要: 本研究では,除外制約を満たさない可能性がある操作変数の候補が複数存在する状況において,因果効果を推定するベイズ的手法を提案する.ベイズ的な視点で見ると,回帰分析において完全な除外制約を仮定するということは,操作変数の処置変数に対する回帰係数が0であるという事前分布を与えていることに相当する.本研究では,この事前分布の仮定を弱め,回帰係数が0かその近くの値を持つ可能性が高いという事前分布を仮定する.

2-046: ガウス過程を用いた強化学習手法の計算量削減について

発表者: 亀田希夕; 田中冬彦 (大阪大学; 大阪大学)
概要: ガウス過程は過学習を起こしづらい、不確かさを表現できる等の利点があり、その性質は強化学習においても有用である。しかしながら、ガウス過程は強化学習に用いるには計算量が大きいという問題点がある。そのために本研究では、変分推論とinducing pointsに基づいた近似手法によって、ガウス過程を用いた強化学習における計算量削減手法を提案する。さらに、その有用性を計算量の評価と実験の両面から示す。

2-047: SGDの挙動解析に基づくデータクレンジング

発表者: 原聡; 二反田篤史; 前原貴憲 (大阪大学; 東京大学/理研AIP; 理研AIP)
概要: 精度の高い予測モデルの学習には質の高い学習データが欠かせない。本研究ではモデルの精度を劣化させる有害な学習データを推定する方法を提案する。提案法ではSGDの挙動解析をもとに、各学習データがモデルに与える影響の有害度を推定する。MNIST/CIFAR10において、提案法で推定された有害なデータを取り除くことで実際にモデルの精度が向上することを確認した。

2-048: Variational inference for nonparametric Bayesian bi-clustering model with Pitman-Yor process

発表者: Li JiYao; 狩野 裕 (大阪大学基礎工学研究科数理科学領域; 大阪大学基礎工学研究科数理科学領域)
概要: Two-mode clustering is a widely-used technique for block modeling, which simultaneously classifies both rows and columns of a given data set. We incorporate the stick-breaking construction of Pitman-Yor process as a prior, in order to automatically determine the cluster number in a manner of power-law behavior.

2-049: Significant pattern mining with usefulness ordering between patterns

発表者: Thien Q. Tran; 福地 一斗; 秋本 洋平; 佐久 間淳 (筑波大学; 筑波大学; 筑波大学, RIKEN AIP; 筑波大学, RIKEN AIP)
概要: We focused on the significant pattern mining problem where some patterns are more useful than the others. We proposed a sequential method that repeatedly rejects a hypothesis and eliminates less useful ones, combining with the idea of ‘untestable hypotheses.’ Our method can reject more useful hypotheses while controlling the FWER under a certain assumption, showed theoretically and experimentally.

2-050: ランダム神経場の学習 ーNTKによる定式化と実験的検証ー

発表者: 渡部海斗; 坂本航太郎; 唐木田亮; 園田翔; 甘利俊一 (筑波大学; 筑波大学; 産総研; 理研AIP; 理研)
概要: 幅が十分に大きいDNNにおける最適化の大域収束性および汎化能力はNeural Tangent Kernel (NTK) と呼ばれるカーネルの解析によって解明されつつある.本研究では生物学的に妥当な深層学習を見据えて,相関のあるランダム神経場でNTKが成立することを数値実験的に示す.また本モデルは,チャンネル数を有限に設定できる点で,チャンネル数→∞を要請するCNTKよりも現実的な設定といえる.

2-051: Neural architecture search by information-theoretic evolutionary algorithm

発表者: 滑川静海; 手塚太郎 (筑波大学大学院; 筑波大学 図書館情報メディア系)
概要: データに合わせて最適な深層学習モデルを生成する研究(Neural Architecture Search)が近年注目を集めている。本研究では、進化的アルゴリズムをベースにモデル構造の探索を行う手法を改良し、新たに情報理論や変形の工夫等を取り入れた探索手法を提案する。探索過程で相互情報量を用いることにより、効率的に探索することを目標としている。

2-052: Hessian spectral analysis of adaptive optimizers

発表者: 本川哲哉; 手塚太郎 (筑波大学大学院 図書館情報メディア研究科; 筑波大学 図書館情報メディア系)
概要: SGDと適応的最適化器であるRMSprop・Adamの違いについて、収束点での損失関数のヘッセ行列を使用して調査した。ニューラルネットワークを使用した分類タスクでは、上位c個(c=クラス数)の固有値はノイズを除けば最小値が0でないことを示した。この結果に基づき、上位c個までの固有値を用いてスペクトルを視覚化した。実験によりSGDが到達した収束点の上位固有値は、RMSpropおよびAdamが到達した収束点の固有値よりも小さいことを示した。

2-053: テンソルデータに対する共通成分分析

発表者: 吉川剛平; 川野秀一 (電気通信大学 大学院情報理工学研究科; 電気通信大学 大学院情報理工学研究科)
概要: テンソルデータに対する解析手法が、機械学習において近年盛んに研究されてきている。本発表では、複数の2階のテンソルデータセットに共通する基本構造を抽出する共通成分分析モデルを提案する。提案モデルは従来モデルよりも高い近似精度を持つ次元削減を実行でき、テンソルデータを扱う際に問題となる計算効率を改善することができる。これら提案モデルの有用性については、数値実験を通して検証する。

2-054: 関連ベクトルマシンによる Multiple Kernel 回帰モデリング

発表者: 村山一明; 川野秀一 (電気通信大学 大学院情報理工学研究科; 電気通信大学 大学院情報理工学研究科)
概要: スパースなカーネル回帰モデルをベイズ的に構築する手法として関連ベクトルマシン(RVM)がある。この手法は各データに同一形状のカーネル関数を配置するため、局所的変化を捉えることが困難である。そこで各データに異形状のカーネル関数を複数配置し、さらに超パラメータの事前分布を調整したRVM回帰モデルを提案する。数値実験を通して、提案手法は緩やかな変化と局所的変化を含む不均一なデータへの回帰に有効であることを検証する。

2-055: 脳磁場解析における構造化スパースモデリングの適用および評価

発表者: 石橋直樹; 赤松和昌; 宮脇陽一 (電気通信大学大学院; 電気通信大学大学院; 電気通信大学大学院/JSTさきがけ)
概要: 脳磁場計測における信号源を高い精度で推定する手法が数多く提案されている.一方,こうした手法から推定した信号源を用いた統計解析では,本来情報が表現される領域外でも偽陽性の結果が得られてしまう問題が指摘されている.そこで本研究では,脳の機能的な領域ごとに共通の傾向を持たせることができる構造化モデルに着目した.人工データ解析を通して,構造化が位置推定精度の向上と偽陽性の抑制につながる可能性が示唆された.

2-056: 早期終了タイミングを予測する:深層学習における確率勾配の分布の変化点検出

発表者: 八島慶汰; 石川康太; 佐藤育郎; 野村哲弘; 横田理央; 松岡聡 (東京工業大学 情報理工学院; デンソーアイティーラボラトリ; デンソーアイティーラボラトリ; 東京工業大学 学術国際情報センター; 東京工業大学 学術国際情報センター; 理化学研究所 計算科学研究センター・東京工業大学 学術国際情報センター)
概要: 近年、SGDによる学習過程を連続時間の確率微分方程式により記述する試みがなされ、解が従う運動と局所解の性質に対する理論的進展が見られる。一方、有限データの学習においては、一般に局所解を得ることはせず、検証データでの性能が最大化されるタイミングで学習を早期終了する。本研究では、学習中に確率勾配の分布が切り替わることと、その変化点近傍に早期終了タイミングが含まれることを画像分類問題において確認した。

2-057: 情報熱力学第2法則に従う階層的メタ変分オートエンコーダ

発表者: 高田珠武己; 林祐輔 (東京工業大学理学院物理学系; Japan Digital Design 株式会社)
概要: 近年,複数のタスクに対する予測を行う方法としてメタ学習が注目されている.本発表ではグローバル潜在変数とタスク毎潜在変数を持つ階層的なメタ変分オートエンコーダを考える.まず,デコーダの潜在変数の分布がエンコーダの周辺化分布に等しいとき,損失関数の満たす不等式がデータとタスク毎潜在変数から成る部分系における情報熱力学第2法則と一致することを示す.次に,このモデルの複数タスク画像分類への応用を提案する.

2-058: ゲノム進化史推定のための混合系統樹モデル

発表者: 福永津嵩 (東京大学)
概要: ゲノム進化における遺伝子の獲得・欠失は生物進化の上で重要なイベントである。遺伝子組成の進化史を推定する手法として、進化史を連続時間マルコフ連鎖モデルで表現する手法が提案されているが、先行研究では全ての遺伝子が同一の進化速度に従うと仮定している問題点が存在していた。本研究では、より高精度な進化史推定を行うために、遺伝子の進化速度が混合状態であると考える混合系統樹モデルを提案する。

2-059: 全状態探索とベイズモデル平均化による特徴量選択

発表者: 大日方 孝輝; 五十嵐 康彦; 永田 賢二; 岡田 真人 (東京大学 大学院理学系研究科; 東京大学 大学院新領域創成科学研究科; 国立研究開発法人 物質・材料研究機構 統合型材料開発・情報基盤部門; 東京大学 大学院新領域創成科学研究科)
概要: 特徴量の全ての組み合わせを考える全状態探索では,従来,得られた最良のモデルやWeight Diagram等の結果から特徴量の重要性の議論が行われていた.本研究ではベイズモデル平均化を用いることで,特徴量の重要性を確率的な形で定量的に評価する.また,特徴量の数が大きく,全状態探索が計算量的に困難な状況においては交換モンテカルロ法を用いて統計的に不偏な形で推論を行う手法を提案する.

2-060: マルチレベルモンテカルロ変分推論

発表者: 藤澤将広; 佐藤一誠 (東京大学・理研AIP; 東京大学・理研AIP)
概要: モンテカルロ変分推論は、確率モデルにおいて、大規模データ上での高速な推論や、複雑なモデル構造上での推論を可能にする強力な方法であるが、その性能が、確率的に推定した勾配の分散に依存することが大きな問題となっている。近年、多くの分散抑制法が報告されているが、抑制において重要となる箇所が試行錯誤的である等、根本的な解決には至っていない。本研究では、マルチレベルモンテカルロ法を基にして、最適化の行程で自然に得られる「勾配とパラメータの履歴情報」を用いて分散を抑制する方法を提案する。また発表では、提案法における推論の収束性と既存法との比較、及びSN比に基づく確率的勾配の質の評価についての理論解析を報告し、様々な実データ上での実験を通して提案法の有用性を示す。

2-061: Model Specification Test with Unlabeled Data: Approach from the Framework of the Covariate Shift

発表者: 加藤真大; 河原崎燿 (東京大学; 東京大学)
概要: We propose a novel framework of model specification test in regression using unlabeled test data. In many cases, we have conducted statistical inference on the assumption that the model specification is correct. By applying our method, we can obtain a model that predicts the label for the unlabeled test data without losing the interpretability of the model.

2-062: 二変数間の相互作用を考慮した一般化加法モデルの効率的な学習

発表者: 上月正貴; 松島慎 (東京大学; 東京大学)
概要: 一般化加法モデル(GAM)は表現力と解釈性の高い予測関数のモデルである.しかし,特徴量間の相互作用が学習されないという課題があった.本研究では,二変数間の相互作用を考慮した一般化加法モデルの拡張を効率的に学習するアルゴリズムを提案する.提案手法は全変動ノルム正則化を課した経験リスク最小化問題から導かれた最適化問題を列生成法により最適化する.既存手法との比較実験により本手法の有効性を示す.

2-063: 大域的な潜在変数を持つ系列変分自己符号化器による状態遷移モデルのメタ学習

発表者: 阿久澤圭; 岩澤有祐; 松尾豊 (東京大学; 東京大学; 東京大学)
概要: POMDP環境において状態遷移モデルを少数の観測・行動データから推論する技術は,モデルベース強化学習に重要である.本研究ではある一つのエピソードが与えられた時に,その環境における隠れた状態遷移モデルのパラメータを系列の大域的な潜在変数として推論する系列変分自己符号化器を提案する.実験ではナビゲーション環境等においてRNNや深層状態空間モデルと提案手法の比較を行い,その予測性能を評価する.

2-064: Stiefel空間上のReparameterization可能な分布を用いた変分オートエンコーダ

発表者: 三條 嵩明; 岩田 具治; 石畠 正和; 小宮山 純平; 豊田 正史; 喜連川 優 (東京大学; 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所; 日本電信電話株式会社 NTT コミュニケーション科学基礎研究所; New York University; 東京大学 生産技術研究所; 東京大学 生産技術研究所)
概要: Stiefel空間を用いることで正規直交な制約を持つ統計量を扱うことができ、画像処理等の分野で応用されている。本研究では、勾配ベースで確率モデルを安定して学習するために重要となるreparameterizeという操作を適用可能なStiefel空間上の分布を提案した。また、この分布を用いた確率モデルとして、Stiefel空間上のVAEを開発し、実験によって学習の精度や安定性について評価を行った。

2-065: 高次元二層ニューラルネットに対する勾配降下法による識別誤差の大域収束性と汎化性能解析

発表者: 二反田篤史; 鈴木大慈 (東京大学/RIKEN AIP/JSTさきがけ; 東京大学/RIKEN AIP)
概要: 深層学習モデルを含む高次元ニューラルネットは多大な成功を収めているが,その成功を理論的に裏付ける為には次の問題を解決する必要がある:(I)非凸最適化問題に対する最適化手法の大域収束性,(II)データが完全フィット可能な状況下での汎化誤差保証.これらは機械学習コミュニティにおける重要な問題であるが,Neural Tangent Kernel (NTK)と呼ばれるニューラルネット由来のカーネルの解析を通して部分的に解決され始めている.回帰問題を対象とする既存研究ではNTKの正定値性が大域収束性の為の重要な役割を担うが,識別問題ではNTKによるデータの識別可能性がより本質的な仮定である事を本研究で示す.更にこの仮定の下で,既存研究の結果に比べ極めて現実的なサイズの二層ニューラルネットに対して勾配降下法の大域収束性と汎化誤差評価を与える.

2-066: 経験リスク最小化による類似対/非類似対及びラベルなしデータからの学習

発表者: 島田拓弥; 包含; 佐藤一誠; 杉山将 (東京大学/理化学研究所; 東京大学/理化学研究所; 東京大学/理化学研究所; 理化学研究所/東京大学)
概要: 実社会の識別問題において、ラベル付きデータよりもサンプル間の類似対/非類似対(同じクラスに属する/異なるクラスに属する)情報が集めやすい状況が存在する。本研究では、類似対/非類似対及びラベルなしデータを用いた識別リスクの不偏推定量を導出し、経験リスク最小化による学習アルゴリズムを提案する。

2-067: 伊藤過程としての確率的勾配降下法

発表者: 横井創磨; 佐藤一誠 (東京大学/理研; 東京大学/理研)
概要: 確率的勾配降下法を確率過程の数値解法として解釈することで、最適化の性質を確率微分方程式を使って考察することができる。本研究では新たな離散化法によって確率的勾配降下法を伊藤過程とみなすことで、既存研究の仮定を取り除き、より一般的に解釈できることを示す。また、Langevin dynamicsによるベイジアンサンプリングとの関連についても述べる。

2-068: 因果効果推定量を用いた公平性制約について

発表者: 小倉輝 ; 武田朗子 (東京大学情報理工学研究科数理情報学第五研究室)
概要: 公平性考慮型機械学習において, Mean Difference (MD)という公平性の指標があるが, MDは差別だけでなくexplanatory biasという, 説明可能な特徴を経由して生じる許容したい結果の差異を含めて定量化してしまう. 本研究では傾向スコアを用いた因果効果推定量に基づき, FairCEEsというexplanatory biasを残しつつ公平な出力を行うモデルを提案する.

2-069: パーセプトロンにおける誤り訂正能力の統計力学的解析

発表者: 長野泰志; 中西(大野)義典; 福島孝治 (東京大学総合文化研究科; 東京大学総合文化研究科, JSTさきがけ; 東京大学総合文化研究科)
概要: 学習モデルの典型的な性能の定量的評価は限られた例でのみ知られている. 本発表では分類問題の最も単純な模型の一つである一層のパーセプトロンを対象に, 訓練データに誤りが含まれる場合の誤り訂正能力を, いくつかの統計的な学習則について解析した. 解析には物理学のスピングラスの理論におけるレプリカ計算の手法を用いた. 我々はレプリカ対称解による自由エネルギーを導出し, 訓練データの精度と数から誤り訂正能力を計算する表式を得た.

2-070: Model-agnostic meta-learning の収束と学習率の関係

発表者: 高木志郎; 長野祥大; 吉田雄紀; 岡田真人 (東京大学大学院新領域創成科学研究科; 東京大学大学院新領域創成科学研究科; 東京大学大学院新領域創成科学研究科; 東京大学大学院新領域創成科学研究科)
概要: メタ学習の有力な手法の一つであるModel-agnostic meta-learning(MAML)は,学習が難しいことで知られている.その原因の一つに,MAMLが内部学習率α,メタ学習率βという2つの学習率を有する点が挙げられる.私たちは,単純化されたMAMLが極小解に収束するためにαとβが満たすべき条件を導出した.その結果,βの上限は,αが自らの上限値に近いときに,大きくなることを発見した.

2-071: メタ学習を利用した深層ニューラルネットワークによる局所的生成

発表者: 長野祥大; 高木志郎; 吉田雄紀; 岡田真人 (東京大学大学院新領域創成科学研究科; 東京大学大学院新領域創成科学研究科; 東京大学大学院新領域創成科学研究科; 東京大学大学院新領域創成科学研究科)
概要: 環境の背後に潜む構造の抽出は知的システムにとって重要である.多くの現実世界のデータセットはデータ間の関係が観測空間内の位置に依存する“局所性”によって特徴づけられる.この性質を取り入れた既存の局所学習は近傍ごとに写像を訓練するため,多くのデータと訓練時間を要する深層学習への適用は自明でない.本研究では,近傍ごとの“構造的類似性”の仮定のもと,メタ学習を用いた局所変分オートエンコーダーを提案する.

2-072: 区分的連続非凸正則化付き線形回帰の近似的交差検証法とスピングラス転移

発表者: 小渕智之; 坂田綾香 (東工大; 統数研)
概要: SCAD, MCPと呼ばれる非凸正則化に対して、近似的に交差検証誤差を求める方法を提案する。この近似法を用いると、与えられたデータに対する「不安定領域」を特定することができる。この領域を避けながらモデル選択する方法を提案する。

2-073: 相関のある特徴に対する半解析的stability selection法の開発

発表者: 髙橋昂; 樺島祥介 (東工大情報理工; 東工大情報理工)
概要: ブートストラップ法とスパース推定法を組み合わせた、stability selection法と呼ばれる変数選択アルゴリズムの、レプリカ法と近似推論法の組み合わせによる効率的近似計算法の開発を目指す。特に、特徴量同士が相関を持つ実データセットへの適用を見越し、近所ベクトルメッセージパッシング法を近似推論法として採用する。発表ではアルゴリズム、収束ダイナミクスの解析、実験による性能検証結果を報告する。

2-074: 量子アニーリングを用いた特徴選択

発表者: 浅井智佳子; 北井 孝紀; 田村 亮; 津田 宏治 (東大新領域; 東大新領域; 東大新領域; 東大新領域)
概要: 機械学習においてデータの次元を絞る特徴選択は, 推論時間の削減やモデルの精度, 解釈性の向上, 過学習の抑止のために重要な手法である.ナイーブな方法では特徴数に対し, 指数時間の計算時間がかかってしまう為, 効率の良い方法を考える必要がある. 本研究ではFactorization Machine という学習モデルと量子アニーリング(QA: Quantum Annealing) を組み合わせた手法であるFMQAを用いて, 量子アニーラの実機による特徴選択を行い, その効率を明らかにする.

2-075: 交換モンテカルロ法による分散関係観測データに対するモデルパラメータ推定

発表者: 片上 舜; 坂本浩隆; 有馬孝尚; 永田賢二; 岡田真人 (東大理, 学振; 学振, 東大新領域; 東大新領域; NIMS; 東大理, 新領域)
概要: 本研究では格子振動の分散関係スペクトルデータからベイズ推定に基づき格子モデルパラメータの分布推定を行う.格子振動の分散関係については中性子やX線の非弾性散乱を用いた観測が行われ,音速や原子間力を解析する研究が多く行われている.ここでは,非弾性散乱データからベイズ推論および交換モンテカルロ法を用いて,格子モデルのパラメータを推定する手法を提案し,人工データで手法の有効性を確認する.

2-076: 局所領域におけるモデルの模倣による機械学習の説明法

発表者: 浅野孝平; 全眞嬉 (東北大学; 東北大学)
概要: 機械学習のモデルや予測の根拠を明らかにする,説明性の研究が盛んに行われている.従来手法の多くは,複雑なモデルの決定境界を局所的に解釈可能なモデルで近似することで説明を導出する.これらの手法では,近似によって元のモデルと説明用のモデルの挙動にギャップが生じ,誤説明などの問題が生じる.本研究では,局所領域において極大なルールを用いてモデルを厳密に模倣する,より信頼性の高い説明手法を提案する.

2-077: Space-efficient Feature Maps for String Alignment kernels

発表者: Yasuo Tabei; Yoshihiro Yamanishi; Rasmus Pagh (RIKEN-AIP; Kyutech; IT University of Copenhagen)
概要: Alignment kernels are a useful tool for analyzing string data and are known for their high prediction accuracies in string classifications. However, alignment kernels have a crucial drawback in that they scale poorly due to their quadratic computation complexity in the number of input strings. We present the first approximation for string alignment kernels for large-scale string analyses.

2-078: 時系列データ多様体の対称性抽出とネーターの第2定理を介した保存量推定

発表者: 本武陽一 (統計数理研究所)
概要: 近年発達を続けるDeep Neural Networks(以下,DNN)が, 与えられたタスクを達成するために必要なデータセットの情報を, その分布を多様体としてモデル化することで 抽出する機能を持つことが示唆されている. 物理学においてネーターの第2定理として知られる, 系の局所対称性と系の保存量を結びつける定理がある.本研究では,この定理とDNNが捉えた多様体の座標変換に対する対称性の関係を数理的に明らかにするとともに,その関係を用いた保存量推定法を提案する.

2-079: 多次元上のWasserstein距離による統計的検定と信頼区間

発表者: 今泉允聡; 大田浩史; 濱口拓男 (統計数理研究所; Rutgers大学; 統計数理研究所)
概要: 本研究では、Wasserstein距離を用いた統計的推論の一般的な手法を構築した。Wasserstein距離は確率測度間の距離関数で、近年の生成モデルなどに盛んに用いられている。しかしながら、極限分布が導出できない性質を持つため、一般的な状況ではWasserstein距離による統計的検定はできなかった。本研究は、非漸近ガウス近似による分布近似法によって問題を回避し、統計的検定法を提案した。

2-080: 複数の制約下における劣モジュラバンディット問題について

発表者: 竹森翔 (富士ゼロックス株式会社)
概要: 劣モジュラバンディット問題とは、各時刻において腕のリストを選ぶと、アルゴリズムにとって未知な劣モジュラ関数から報酬が生成されるというプロセスを繰り返すとき報酬の累積和の最大化を目指す問題である。ここではこの問題を個数制約やナップサック制約を同時にみたすという制約の下で考え、手法を提案する。

2-081: 混合整数半正定値最適化問題に対する分枝切除法と機械学習への応用

発表者: 小林健,高野祐一 (富士通研究所, 東京工業大学; 筑波大学)
概要: 混合整数半正定値最適化問題(MISDO) とは非線形性を表現する半正定値制約と整数変数を含む最適化問題である.本発表では MISDO に対する効率的解法として切除平面法と分枝切除法を提案し,数値実験により既存の汎用ソルバーとの性能を比較する.また MISDO の機械学習分野への応用についても述べる.

2-082: CNN with Aperture Synthesis

発表者: 中村凌; 植田祥明; 田中勝 (福岡大学; 福岡大学; 福岡大学)
概要: 画像識別をCNN等で行う際に必要となる前処理で重要なアノーテーション作業の労力を減らすための試みとして、訓練画像をそのまま入力とせず訓練画像から小さなパッチを複数枚切り出し、それを入力として画像識別を行わせる手法を提案する。その際、効率的に識別を行うためには切り出すパッチの位置が重要となるが、それを遺伝的アルゴリズムに基づいた注視点制御機構を導入することで行う。

2-083: 黒色雑音の数値計算例

発表者: 荒木翔太; 天羽隆史 (福岡大学; 福岡大学)
概要: 白色雑音は次元に応じて分布が一意に定まるが、黒色雑音はその限りではない。ここでは、Tsirelson-Vershik (1998)において無限個の層がなすダイアグラムの射影極限として構成された黒色雑音の一例を、priorを乗せる位置を変えたBayesian CNNのようなものを用いて数値計算を試みる。

2-084: 機械は乱数の夢を見るか

発表者: 宮川幸人; 田中勝; 藤木淳 (福岡大学; 福岡大学; 福岡大学)
概要: 2次元の一様乱数と正規乱数を生成し,それぞれを散布図として表し画像として保存する。これらの画像をCNNに与え教師あり学習を行う。これにより何点あれば一様乱数または正規乱数により生成された画像であるかを明らかにする。実験の設定にも依存するが,乱数により生成された点の個数が数点では当然ながらコイントスによる判定と同レベルであるが,点の個数がある値以上あればかなりの精度で識別が可能となることがわかった。

2-085: Entanglement Entropyに基づく画像の低ランク近似を用いた画像識別

発表者: 植田祥明; 江口脩; 田中勝 (福岡大学; 福岡大学; 福岡大学)
概要: 自然画像は,輪郭や詳細部である高周波信号と,大域的な構造である低周波信号によって構成される.本研究では,Entanglement Entropyに基づき,画像を高周波信号と低周波信号に分解し,効率的な画像識別を行う手法を提案する.この手法はOctave Convolutionと類似のものであるが,ハイパーパラメータの決定過程が大きく異なっている.

2-086: 代数幾何学的アプローチによるメトロポリス法の採択率の漸近展開

発表者: 永田賢二; 本武陽一 (物質・材料研究機構; 統計数理研究所)
概要: ディープラーニングを代表とする階層的な確率モデルは特異モデルと呼ばれ,ベイズ推定を利用することで安定した推定が実現できる.しかしながら,ベイズ推定の実現に用いられるマルコフ連鎖モンテカルロ法は乱数を利用したアルゴリズムであるため,実装が難しい.本研究ではこうした問題の解決の一つとして,メトロポリス法の採択率に着目し,代数幾何学の活用により採択率の漸近型を導出するとともに,その有効性を明らかにする.

2-087: 高・低・ゼロ頻度N-gramに対する統一的な尤度比の推定法

発表者: 菊地真人; 川上賢十; 吉田光男; 梅村恭司 (豊橋技科大; 豊橋技科大; 豊橋技科大; 豊橋技科大)
概要: 本発表では、テキストの分割単位である単語N-gramの頻度情報から尤度比を推定する問題を扱う。N-gramの頻度のみを使用する単純な推定法は、低頻度のN-gramに対して推定値の変動が大きく、テキスト中で観測されないゼロ頻度のN-gramに対して推定値を算出できない。そこでN-gram自体の頻度に加えて、N-gramの構成要素である単語に基づく頻度も使用する推定法を提案し、実験によってその有効性を示す。

2-088: 決定木アンサンブル予測器の効率的ハードウェア実装のための簡約化に関する研究

発表者: 櫻田 健斗, 中村 篤祥, 工藤 峰一 (北海道大学)
概要: 決定木アンサンブルの訓練データに対する予測精度を保ちながら異なる分岐条件の数を減らす簡約化を行うことにより,ハードウェア実装における比較器を削減する方法を提案する.UCI Machine Learning Repositoryのデータを用いた実験によれば,データ数の多いデータにおいて,テストデータに対する精度を落とさずにランダムフォレスト予測器の異なる分岐条件数を90%以上削減できた.

2-089: 説明可能な機械学習に向けて:整数計画法と列挙に基づく最適決定木の厳密学習アルゴリズムの実験的比較

発表者: 王 叶; 有村 博紀 (北海道大学 大学院情報科学院; 北海道大学 大学院情報科学研究院)
概要: 説明可能性や信頼性の要求から,決定木等の解釈性が高い機械学習手法の研究が盛んであるが,貪欲法にもとづく学習手法は,解の最適性・安定性・近似性の保証を欠く.この問題を解決するため,最近,整数計画法に基づくOCT・BINOCTや,離散構造列挙に基づくCOREL,ODTなどの最適性を保障した厳密学習アルゴリズムが次々と提案されている.本ポスターではBINOCTとODTの実験比較を行い,二つの手法の性能と特徴を分析し,今後の拡張の方向性を探る.

2-090: ランダム分割木に基づく勾配ブースティングの検証

発表者: 松田 祐汰; 瀧川 一学; 有村 博紀 (北海道大学 大学院情報科学院; 理化学研究所 革新知能統合研究センター(AIP); 北海道大学 大学院情報科学研究院)
概要: ブースティングとバギングは,主要なアンサンブル学習の手法であるが組合せた場合の効果を検証する。Friedmanの確率的勾配ブースティングにより,ブースティングの各勾配近似ステップにランダム性を入れると,予測精度や実行速度が向上することが知られている.変数集合や事例集合のランダムサブセッティング(Random SubspaceやBagging/Subsampling)の活用が標準的であるが,本研究ではExtraTreesで提案されたランダム分割を導入する効果を検証し,その有効性を報告する.

2-091: バンディットフィードバック下での良腕悪腕の個数による分類問題

発表者: 田畑公次; 中村篤祥; 小松崎民樹 (北海道大学; 北海道大学; 北海道大学)
概要: 損失版の確率的バンディットフィードバック下で、与えられた閾値よりも平均損失が低い腕を良腕、高い腕を悪腕と定義する。このとき、全体で$K$個ある腕のうち与えられた個数の閾値$N_1$、$N_2$ ($0 \le N_1 < N_2 \le K$)に対して、悪腕の数が$N_1$個以下であるか、$N_2$個以上であるかに関して固定された信頼度以上で正しく答えるアルゴリズムを提案する。

2-092: モンテカルロ木特徴探索に基づく非線形グラフ分類回帰

発表者: 白川稜; 中村篤祥; 工藤峰一 (北海道大学; 北海道大学; 北海道大学)
概要: グラフ表現を入力とする分類回帰問題は多くの分野で応用されている。部分グラフ指示子は最も基本的な特徴量であるが、グラフサイズの増加に伴い可能な部分グラフ総数は組合せ的に膨大な数となるため、全ての部分グラフを考慮することは困難である。本研究では、学習に用いる部分グラフを適応的に探索・選択する回帰木学習アルゴリズムとそのアンサンブル学習、加えてモンテカルロ木探索を用いた効率的な探索手法を提案する。

2-093: 分類アンサンブル投票重みの小さな非負整数表現への変換

発表者: 前川広樹; 中村篤祥; 工藤峰一 (北海道大学大学院情報科学院; 北海道大学大学院情報科学研究院; 北海道大学大学院情報科学研究院)
概要: 複数の仮説を統合することで高性能な仮説を構成するアンサンブル学習は広く用いられている。分類問題において、ブースティングなどでは実数重みを用いた重み付き多数決により仮説を統合するが、訓練データに対して同じ分類結果を得るのに仮説の重みに実数の表現力は必要でない。本研究では、実数仮説重みを、訓練データに対する識別不変の条件の下、和が最小の非負整数重みに変換する手法を提案する。

2-094: 深層展開に基づく交互方向乗数法の学習

発表者: 仁枝亮太; 高邉賢史; 和田山正 (名古屋工業大学)
概要: 交互方向乗数法は大規模な凸連続最適化問題に対する有力な反復的解法であり,圧縮センシング等に広く用いられる.近年,反復アルゴリズム内のステップサイズパラメタ等を深層学習の方法により調節する深層展開と呼ばれる手法が注目を集めている.本発表では交互方向乗数法に深層展開を適用し,圧縮センシングにおける収束速度と信号推定性能の向上を数値的に検証した結果について報告する.

2-095: 超高次元加法モデルにおける変数選択

発表者: 梅津佑太 (名古屋工業大学)
概要: 線形回帰モデルにおいて基本的な変数選択手法であるsure independence screening (Fan & Lv, 2008)を加法モデルへと拡張する. 提案手法は, 変数の次元がサンプルサイズより指数的に多きな場合でも良い統計的性質を持つ. さらに, 変数選択の性能を改善するため, forward regressionと同様のアイデアを用いた逐次アルゴリズムを提案する.

2-096: k-近傍法に基づく外れ値除去後のSelective Inference

発表者: 作道 俊昭; 竹内 一郎 (名古屋工業大学; 名古屋工業大学, 理化学研究所, 物質・材料研究機構)
概要: 外れ値を含むデータを用いて解析を行うと, 平均などの統計量に影響を与えるため, データの解釈を誤る可能性がある. 様々な外れ値除去の手法が研究されているが, 外れ値除去後の統計的有意性を定量化するには選択バイアスの補正が必要となるため, 適切な方法が整備されていない. 本研究では, Selective Inference の枠組みを導入することで, k-近傍法に基づく外れ値除去後の統計的有意性を適切に評価する方法を提案する.

2-097: Pareto-frontier Entropyに基づく多目的ベイズ最適化

発表者: 鈴木進也; 竹野思温; 田村友幸; 設楽一希; 烏山昌幸 (名古屋工業大学; 名古屋工業大学; 名古屋工業大学,物質・材料研究機構; 大阪大学,物質・材料研究機構,ファインセラミックスセンター; 名古屋工業大学,物質・材料研究機構)
概要: 複数の目的関数の同時最適化を効率的に行う多目的ベイズ最適化 (MBO) という分野が存在している. MBOはパレート最適性を満たす全てのデータを, より少ない観測回数で手に入れることを目的としている. 本研究では, パレート最適値に関する情報量に基づくMBO手法を提案し, さらに各目的関数が個別に観測できるような設定への拡張も行う. また計算機実験によりその有用性を確認する.

2-098: ベイズ最適化による凸包を用いた新規材料の探索

発表者: 佐藤嵩晟; 渥美太瑠斗; 原田真帆; 中山将伸; 竹内一郎 (名古屋工業大学; 名古屋工業大学; 名古屋工業大学; 名古屋工業大学,物質・材料研究機構,京都大学 触媒・電池元素戦略拠点; 名古屋工業大学,理化学研究所,物質・材料研究機構)
概要: エネルギー的に安定な材料を発見することは材料の高性能・高機能化に繋がる重要なテーマである。材料の安定の度合いはエネルギー計算を行うことによってわかるが、これは高コストな計算であり、全ての材料候補に対して行うことは現実的ではない。本研究では、安定な材料がエネルギーと組成比の空間において凸包の頂点となることを利用し、ベイズ最適化を用いて安定な材料を効率的に発見する手法を提案し、その有効性を示す。

2-099: Selective Inferenceを用いたクラスタ中心間距離の統計的仮説検定

発表者: 鈴木健太; 井上茂乗; 梅津佑太; 竹内一郎 (名古屋工業大学; 名古屋工業大学; 名古屋工業大学; 名古屋工業大学/物質・材料研究機構/理研)
概要: クラスタリングは広く一般的に使用されている探索的なデータ解析手法の1つである. しかし, クラスタリング結果が信頼できるかどうか客観的に評価することは難しい. そこで, 本研究ではSelective Inferenceの枠組みを用いて, 階層型クラスタリングによって得られたクラスタが統計的に有意かどうかを検証する手法を提案する.

2-100: 高次元ベイズ最適化のためのBlock coordinate descent

発表者: 椙田大輔; 佐藤嵩晟; 渥美太瑠斗; 稲津祐; 松井孝太; 中山将伸; 竹内一郎 (名古屋工業大学; 名古屋工業大学; 名古屋工業大学; 理化学研究所; 理化学研究所; 名古屋工業大学,物質・材料研究機構,京都大学 触媒・電池元素戦略拠点; 名古屋工業大学,理化学研究所,物質・材料研究機構)
概要: 高次元な探索空間へのベイズ最適化が上手く機能しないことはよく知られている。この課題を解決するために、低次元空間での最適化を繰り返すことで高次元空間での最適化を達成するアプローチがある。このとき、低次元空間の選び方が重要である。私たちは低次元空間の選び方に修正ニュートン方向を近似する直線探索法を利用することで、提案法が従来手法よりも早く最適解を見つけることを確認した。

2-101: Max-value Entropy Searchに基づくMulti-fidelityベイズ最適化

発表者: 竹野思温; 福岡準史; 塚田祐貴; 小山敏幸; 志賀元紀; 竹内一郎; 烏山昌幸 (名古屋工業大学; 名古屋大学; 名古屋大学, JST; 名古屋大学; 岐阜大学, JST, 理研; 名古屋工業大学, 理研, 物質・材料研究機構; 名古屋工業大学, JST, 物質・材料研究機構)
概要: 近年, 高コストな未知関数の最適化に低コストな近似関数を活用するMulti-fidelityベイズ最適化(MFBO)がその有用性から注目されている. また, 情報量に基づくベイズ最適化手法は広く用いられるが, 既存のMFBO手法では情報利得の推定に困難が伴う. そこで, 本研究では, 計算の容易な情報量に基づく新しいMFBO手法を提案し, 計算機実験により有用性を確認する.

2-102: 入力が不確実な状況下でのReliable Level Setの同定

発表者: 岩﨑省吾; 稲津佑; 竹内一郎 (名古屋工業大学; 理化学研究所; 名古屋工業大学,理化学研究所,物質・材料研究機構)
概要: 評価コストが高いblack-box関数に対する能動学習においてLevel Set Estimation(LSE)は安全管理、品質保証、環境モニタリングなどの分野で重要である。しかし、実応用においては、入力の制御に不確実性がある状況が存在する。本研究では、入力の不確実性を加味した上で、αより大きい確率で、観測値が閾値を下回る入力点集合を同定するLSEを取り扱う。

2-103: Spectral Embedded Deep Clustering

発表者: Yuichiro Wada; Shugo Miyamoto; Takumi Nakagama; Léo Andéol; Wataru Kumagai; Takafumi Kanamori (Nagoya University; The University of Tokyo; Tokyo Institute of Technology; Sorbonne Université; RIKEN AIP; RIKEN AIP and Tokyo Institute of Technology)
概要: We propose a clustering method based on a deep neural network. The advantage of our method is, unlike previous methods, that it does not require strict conditions where a method performs well. For the evaluation, we conducted numerical experiments on five commonly used datasets to confirm the effectiveness of the proposed method.

2-104: ダイナミクス潜在構造抽出のためのクープマン不変部分空間のベイズ的学習

発表者: 平岡 将史; 河原 吉伸 (理化学研究所 革新知能統合研究センター,大阪大学 産業科学研究所; 理化学研究所 革新知能統合研究センター,九州大学 マス・フォア・インダストリ研究所)
概要: 非線形ダイナミクスの解析における関心の1つに,ダイナミクスの潜在構造の抽出がある.特に,応用物理分野においてクープマン作用素を用いた非線形ダイナミクスの解析が注目されている.クープマン作用素は観測量と呼ばれる物理量の張る関数空間における線型作用素であるため、関数空間の設定は根本的な問題である.本研究では,乱択化フーリエ特徴を用いてクープマン作用素の不変部分空間を学習する手法を提案する.

2-105: 入力がコストに依存した不確実性を持つ場合のレベルセット推定のための能動学習

発表者: 稲津 佑; 烏山 昌幸; 井上 圭一; 竹内 一郎 (理化学研究所; 名古屋工業大学,JSTさきがけ,物質材料研究機構; 東京大学; 名古屋工業大学,理化学研究所,物質材料研究機構)
概要: 本研究では, 入力に不確実性が伴い, かつ, 費やすコストに依存してその不確実性の度合いが変わるという設定の下で, 未知関数fが閾値hを上回る領域と下回る領域を同定するLSE問題を考える. この設定の下, 未知関数fの事前分布にガウス過程(GP) を仮定し, これによって定まる信用区間を用いて, 効率的にLSEを行うための能動学習法を提案する.

2-106: ランダム力学系の距離について

発表者: 石川 勲; 田中 章詞; 池田 正弘; 河原 吉伸 (理化学研究所/慶應義塾大学; 理化学研究所/慶應義塾大学; 理化学研究所/慶應義塾大学; 九州大学)
概要: 本研究では作用素論的な考察を用いて2つのランダム力学系の間の差異を測る計量を定義した。ランダム力学系は力学系的な構造と確率的な効果を併せ持った対象であり、その2つの構造を適切に扱うための枠組みとしてベクトル値(ヒルベルト空間値)再生核ヒルベルト空間の理論を用い、さらに、その空間の上に定まる線形作用素をPerron-Frobenius作用素を定義した。今回定義した計量は実装可能であり、また、確率変数の独立性検定など不変量との繋がりも見ることができる。

2-107: 再構成誤差のシャープレイ値による異常検知の説明

発表者: 武石 直也 (理研AIP)
概要: 異常検知のプラクティスとして,正常データに対して生成モデルを学習し,その再構成誤差を監視することがある.このとき,どの変数が異常なのかを知るために各変数の再構成誤差を比較することがよくある.しかし,異常な変数の再構成誤差だけが常に大きくなるとは限らない.そこで本稿では,シャープレイ値を用いて異常変数の説明を行うことを提案する.特に,各変数が独立とみなせない場合にシャープレイ値を計算する方法を示す.

2-108: ベジエ単体フィッティングの漸近リスク

発表者: 田中 章詞; 三内 顕義; 小林 健; 濱田 直希 (理研AIP, 慶應義塾大学; 理研AIP, 慶應義塾大学; 富士通研究所, 理研AIP; 富士通研究所, 理研AIP)
概要: 多目的最適化問題のパレートフロントは多くの場合曲がった単体をなし,その頂点,辺,面,…はもとの問題の部分問題のパレートフロントに対応する.近年,この構造を持つパレートフロントを小標本で近似する手法としてベジエ単体フィッティングが提案された.本研究ではベジエ単体フィッティングの漸近リスクを解析し,人工データ・実データを用いた数値実験により解析結果の妥当性について検証する.

2-109: 構造出力デザインのための能動学習

発表者: 松井孝太; 草川隼也; 安藤圭理; 沓掛健太朗; 宇治原徹; 竹内一郎 (理研AIP; 名古屋工業大学; 名古屋大学; 理研AIP; 名古屋大学, 産業技術総合研究所; 名古屋工業大学, 理研AIP, 物質・材料研究機構)
概要: 所望の構造出力を達成する入力を見つける逆問題のための能動学習法を提案する.提案法は,ブラックボックスなベクトル値の目的関数に対して出力の要素間の相関を効果的に取り込むことにより,所望の構造出力とガウス過程モデルによる予測との間の誤差を最小化するための獲得関数を提供している.人工の形状探索問題および炭化ケイ素結晶成長モデリングの実データを用いた成長速度分布の探索問題に適用し提案法の有効性を検証する.

2-110: 訓練事例が機械学習モデルの予測に与える影響の測り方

発表者: 塙一晃; 横井祥; 原聡; 鈴木潤; 乾健太郎 (理研AIP/東北大学; 東北大学/理研AIP; 大阪大学; 東北大学/理研AIP; 東北大学/理研AIP)
概要: テスト事例の予測に影響を与えた訓練事例を提示することで、ブラックボックスな機械学習モデルにある種の解釈性と信頼性を与えることができる。「訓練事例が予測に与える影響」の測り方の標準的な方法の一つとして「当該訓練事例を学習から除外した場合の予測の変化度合い」が提案されている。本研究では、実際のケースではこの測り方が効果的に機能しない場合があることを実験により実証した。さらに、より適切な影響の測り方について議論する。