11月5日 15:10 – 18:10
D1-01: ハイパーパラメータチューニングにおける不確実性の影響削減のための再評価戦略
発表者: 今村秀明; 渡部正樹; 秋葉拓哉 (東京大学; Preferred Networks)
概要: ニューラルネットワークの性能はそのハイパーパラメータによって大きく影響を受けるが、その性能は同じハイパーパラメータでも初期化や学習の不確実性に依存し大きく変化する。本研究では、確率的に同じハイパーパラメータを再評価し評価を修正することで、平均的には性能の悪いハイパーパラメータがハイパーパラメータ最適化アルゴリズムによって提案されてしまう問題を解決する手法を提案し、その理論的な性能の解析を行った。
D1-02: ロバストなグラフ埋め込み
発表者: 奥野彰文; 下平英寿 (京都大学・理研AIP; 京都大学・理研AIP)
概要: 新たな損失関数を提案し、隣接行列のノイズにロバストなグラフ埋め込みを提案する。提案した損失関数は、リンクの重みの期待値に関してロバスト統計で用いられるUnnormalized beta-score functionを適用した関数に収束することから、既存の枠組みと同様にロバスト性を示すことができる。本発表ではこれらの理論と、実データでの実験結果を併せて報告する。
D1-03: 形状検索のための距離計量学習
発表者: 岡本司; 岩田一貴; 末松伸朗; 三村和史 (広島市立大学; 広島市立大学; 広島市立大学; 広島市立大学)
概要: フルプロクルステス距離は等方的スケーリングしか考慮しないため、同じクラスの形状であっても、非相似に歪んだ形状の間の距離は大きくなってしまい、形状検索において問題になることがある. そこで、本発表では距離計量学習の枠組みを用いてこの問題を解決することにより、非等方的スケーリングに基づくフルプロクルステス距離を導出する.
D1-04: 形状局所記述子を用いた形状整合の新しい枠組み
発表者: 山本大貴; 岩田一貴; 末松伸朗; 三村和史 (広島市立大学; 広島市立大学; 広島市立大学; 広島市立大学)
概要: 形状検索における形状間の対応付けの研究の本質的な違いは、形状を表現する局所記述子とそれらの距離を表す整合コスト関数に帰着する。本発表では、これまでの研究のように、従来の局所記述子を上回る局所記述子を提案するのではなく、別の観点から形状間の対応付けに取り組む。具体的には、従来の局所記述子の識別性能を効率的に向上させるような新しい対応付けの方法を提案する。
D1-05: 巨大ランダム行列を用いた構造の変化点検知
発表者: 伊藤 克哉; 木下 僚; 小松 智希; 吉川 真史 (東京大学大学院経済学研究科; PFN; PFN; PFN)
概要: 本研究の目的は、ある構造に従って生成される時系列の構造の変化点を検出することである。本研究は手法として、時系列データを巨大なランダム行列とスパースな行列に分解するという新しい行列分解の手法を用いる。本研究は結果として、従来では検出できなかった構造の変化の検出を可能とし、かつノンパラメトリックでオンラインな変化点の新しい手法を提案する。例として潜在的時系列が重み付けされて観測されるときの、重みが平均分散は変わらず変化するときの変化を検出可能とした。
D1-06: Graph Convolutionの拡張に関する一検討
発表者: 石黒勝彦; 前田新一 (Preferred Networks; Preferred Networks)
概要: 化学化合物の原子グラフやネットワーク解析など、グラフデータを取り扱うDNNの研究は、Graph Convolution Network (GCN)の発展に伴ってこの数年で急速に研究が進展している。本発表では、gating, attentionなどを用いた最近のGCNモデルを統合・包含する新しいCGNモデル拡張を検討し、モデルアーキテクチャの設計指針や実験結果を報告したい。
D1-07: ResNetのショートカットが学習速度と汎化ギャップに及ぼす影響の理論解析
発表者: 古庄泰隆; Tongliang Liu; 池田和司 (奈良先端科学技術大学院大学; シドニー大学; 奈良先端科学技術大学院大学)
概要: 隠れ層を直列に積み上げたニューラルネットは隠れ層が増えると遂には訓練誤差が悪化する。この問題を解決したのがResNetで隠れ層が多くとも小さな訓練、テスト誤差を達成する。本研究ではその高い性能を解明するためResNetの持つショートカットが勾配降下法の学習速度と汎化ギャップにどう影響するのか解析した。ResNetはゆっくりと平坦な解へと収束し、その平坦性が小さな汎化ギャップを達成することを示した。
D1-08: 乗算ノイズによる勾配降下の高速ロバスト化
発表者: Matthew J. Holland (大阪大学)
概要: 近年、期待損失の勾配をよりロバストに推定した上で、それを近似的な最急降下に使う研究が見られるようになったが、特にgeometric median等はコストが高く、相当バイアスも食らうため、実用性を欠く。本研究では、乗算ノイズを損失の勾配ベクトルに付与し、慎重にその影響を分散させることで、勾配の2次モーメントさえ有限であれば強い汎化性能が保証できることを示す。実装は簡単で、反復演算も不要!
D1-09: Skew-t分布を適用した状態空間モデルによる将来の健康状態予測
発表者: 長谷川 嵩矩; 新井田 厚司; 山口 類; 井元 清哉 (東京大学医科学研究所; 東京大学医科学研究所; 東京大学医科学研究所; 東京大学医科学研究所)
概要: 健康診断で計測される検査値の中には裾が重く偏りのあるノイズを持つものが多いため、一般的なガウス分布を用いると結果に悪影響を与える。本発表では、観測ノイズの分布としてskew t-分布を導入した線形状態空間モデルを用い、その状態変数とパラメータ値を推定する方法として正則化を用いた学習法を提案する。
D1-10: 画像分類における適応的なSGDの挙動の解析
発表者: 今川和樹; 竹田晃人 (茨城大理工; 茨城大理工)
概要: 近年SGDでの学習に関し、過去の勾配の履歴を考慮した上で、適応的に勾配を更新するReinforced SGD (R-SGD)という手法が考案されている。本研究では、まずR-SGDを画像分類に適用すると、Adam等の学習則よりも良い性能を示す実験結果を提示する。加えて画像分類での訓練・汎化誤差関数の性質をNudged Elastic Band法で調べ、関数の性質のR-SGDの挙動への影響を考察する。
D1-11: 重み付き最大被覆問題への確率伝搬法の適用
発表者: 喜多野広貴; 竹田晃人 (茨城大; 茨城大)
概要: 2部グラフ上の頂点を出来る限り被覆する最大被覆問題を考える。この問題では、良い被覆解を得る方法として貪欲法が広く知られるが、近年、この問題に確率伝搬法を適用することで、貪欲法よりも最適解により近い解が得られるという結果が報告されている。本研究では、頂点に重みの付いた最大被覆問題へ確率伝搬法を適用し、重み付きの場合とそうでない場合の結果の差異を検証する。加えて文書要約問題への応用についても述べる。
D1-12: Model Selection with a Renewable Prior Distribution for Intractable Likelihood
発表者: Takafumi Kajihara; Motonobu Kanagwa; Kanishk Khandelwal; Kenji Fukumizu; Yuuki Nakaguchi (NEC; Max Planck Institute for Intelligent Systems; NEC; the Institute of Statistical Mathematics; NEC)
概要: We propose a novel method for model selection with intractable likelihood. It updates a prior distribution too-wide so that the models are compared on reasonable terms.
D1-13: そのクラスタ信用できますか? -クラスタ分割に対する妥当性の統計的検証-
発表者: 井上茂乗; 梅津佑太; 竹内一郎 (名工大; 名工大; 名工大,理研,NIMS)
概要: データの背後に存在する構造を理解できるという点で、クラスタリングは非常に重要なツールである。しかし、クラスタリングで得られた異なるクラスタが,異なる確率的構造に基づいているかを検証するのは難しい。本研究では, selective inferenceのアイデアを活用することで、K平均法により得られたクラスタ同士を比較し、その分割に対する有意性を評価する。
D1-14: データ均一化による回帰性能の向上を目指して
発表者: 井手 敦也; 角所 考; 岡留 剛 (関学大; 関学大; 関学大)
概要: ガウス過程回帰は一般に過学習を起こしにくい強力な回帰手法として多くの場面で利用されている。しかし、ガウス過程はカーネルの制限により、目標値に偏りの出るような不連続点を含む関数に対して精度の高い予測をすることは難しい。そこで我々は、目標値に非線形な変換を適用しデータの均一化を行い、回帰性能の向上を目指す。
D1-15: ベイズ的測度最適化
発表者: 林勝悟; 金川元信; 鹿島久嗣 (京都大学; マックスプランク研究所; 京都大学)
概要: ベイズ的測度最適化 (Bayesian Measure Optimization: BMO)を提案する。BMOでは、未知関数の積分値に関してある測度を最適化するために、次に評価を行う関数の入力点を求める、ベイズ的最適化を一般化した問題である。BMOに対しメタアルゴリズムを提案する。入力ノイズを含むベイズ的最適化と最大部分配列問題をBMOの応用問題として提案手法が有効に働くことを示す。
D1-16: Training Discriminative Model for Anomaly Detection through Generative Adversarial Network
発表者: Hirotaka Hachiya (Wakayama University)
概要: We discuss how to apply the generative adversarial network, to generate pseudo abnormal samples and train a classifier capable of detecting abnormal observations in a discriminative manner.
D1-17: Bayesian Inference on Transcription Elongation Rates from Total RNA Sequencing
発表者: 河村優美; 吉田亮 (総合研究大学院大学 複合科学研究科 統計科学専攻; 情報・システム研究機構 統計数理研究所)
概要: Total RNA-seqという手法を用いることで、細胞中のRNA分子の量を網羅的に計測できる。これから、RNA ポリメラーゼ II (Pol II)の転写伸長プロセスを再構成できることを示す。Pol IIの存在確率 (転写伸長の相対速度)とリードの分布の関係を状態空間モデルで表現し、ベイズ推論に則りPol IIの存在確率とスプライシングのパターンを同時に推定する。
D1-18: ガウス埋め込みによるSentence Representation
発表者: 川田航希; 西山悠; 川野秀一 (電気通信大学大学院情報理工学研究科; 電気通信大学大学院情報理工学研究科; 電気通信大学大学院情報理工学研究科)
概要: 文章をベクトル化する手法は文章間の類似度を計算することができるため、様々なアプリケーションにおいて有益である。そのようなベクトルを得るための手法としてはParagraph VectorやCNN, LSTMなどのニューラルネットワークが用いられることが多い。本研究では、単語埋め込みとして提案されたガウス埋め込みを拡張し、文章をベクトル化する方法を提案する。
D1-19: Nonparanormal分布のグラフ構造に対するロバスト推定
発表者: 奥田諭史; 笹井健行; 福島真太朗 (DATUM STUDIO株式会社; DATUM STUDIO株式会社; 株式会社トヨタIT開発センター)
概要: 正規分布の拡張の一つにNonparanormal分布があり、正規分布と同様に分散共分散行列の逆行列の成分のゼロ要素が条件付独立性を表すため、グラフィカルモデリングへの応用が期待される。しかし、Nonparanormal分布への拡張のみでは外れ値への対応が不十分であることから、さらにロバストなグラフ構造の推定に向けたアルゴリズムを提案する。
D1-20: 階層的モジュール表現に基づく多層ニューラルネットの推論構造の理解
発表者: 渡邊千紘 (NTTコミュニケーション科学基礎研究所)
概要: 多層ニューラルネットは多くの実データに対して高い予測性能を実現してきたが、その内部の推論メカニズムを人間が理解することは難しい。本研究では、学習済みニューラルネットに対し、階層的クラスタリングの手法を適用することにより、任意の解像度で元のネットワークを分解した階層的モジュール表現を獲得し、また同時に各モジュールの推論における役割を入出力データの各次元との相関に基づいて定量化する手法を提案する。
D1-21: Covariate Selection in Propensity Scores for Binary Outcomes via Sparse Regularization
発表者: 張安杰; 川野秀一 (電気通信大学大学院情報理工学研究科; 電気通信大学大学院情報理工学研究科)
概要: This research considers covariate selection in propensity scores for causal inference. We focus on binary outcome data. We develop sparse logistic models for selecting the covariates.
D1-22: VAEの事前分布の改善
発表者: 高橋大志; 岩田具治; 山中友貴; 山田真徳; 八木哲志 (NTT; NTT; NTT; NTT; NTT)
概要: Variational Autoencoder (VAE)では、潜在変数の事前分布として標準ガウス分布が用いられるが、この単純な事前分布は未学習を引き起こすことが知られている。VAEにとって最適な事前分布は周辺事後分布であることが知られているが、この分布を用いた場合、従来の手法でVAEを学習することはできない。本発表では、周辺事後分布を事前分布として用いたVAEの効率的な学習方法を提案する。
D1-23: Matrix Co-completion for Multi-Label Classification with Missing Features and Labels
発表者: Miao Xu; Gang Niu; Bo Han; Ivor W. Tsang; Zhi-Hua Zhou; Masashi Sugiyama (RIKEN; RIKEN; UTS/RIKEN; UTS; NJU; RIKEN/U. of Tokyo)
概要: We consider a multi-label problem where both feature X and label Y have missing entries. An existing method concatenated X and σ (Y) together and then use matrix completion (MC) method. However there is no theoretical guarantee. In this work, we present an upper bound on the recovery error and a new algorithm based on the theory. The practical usefulness of the proposed method is also demonstrated.
D1-24: VAEとガウス過程による高次元データの圧縮と同時分節化
発表者: 長野匡隼; 中村友昭; 長井隆行; 持橋大地; 小林一郎; 高野渉; 金子正秀 (電気通信大学; 電気通信大学; 電気通信大学; 統計数理研究所; お茶の水女子大学; 大阪大学; 電気通信大学)
概要: 本発表では、高次元の複雑な時系列データを教師なしで分節化する手法を提案する。我々はこれまで、ガウス過程を出力確率分布とした隠れセミマルコフモデルにより、統計的に身体動作を単位動作に分節化する手法 (HDP-GP-HSMM)を提案した。本発表では、さらにVariational Autoencoderを導入することで、高次元時系列データを圧縮し、特徴を抽出しながら、教師なしで分節化する手法を提案する。
D1-25: Tree-LSTMの拡張による抽象構文木のより良い分散表現獲得に向けて
発表者: 紫藤 佑介; 小林 靖明; 山本 章博; 宮本 篤志; 松村 忠幸; 嶺 竜治 (京都大学大学院情報学研究科; 京都大学大学院情報学研究科; 京都大学大学院情報学研究科; (株)日立製作所基礎研究センタ; (株)日立製作所基礎研究センタ; (株)日立製作所基礎研究センタ)
概要: LSTMネットワークの拡張としてTaiら (ACL 2015)はLSTMに木構造を組み合わせるTree-LSTMを提案した。この手法は自然言語処理のタスクにおいて良い性能を示す反面、ソースコードなどを扱う際に必要である任意長の子ノードの順序を扱うことが困難である。本研究ではこの問題点を解消するTree-LSTMの拡張を提案し、ソースコードの要約タスクにおいて従来法との比較実験を行った。
D1-26: HMLasso: 高次元・高欠測データに対するスパースモデリング
発表者: 高田正彬; 藤澤洋徳; 西川武一郎 (株式会社東芝; 統計数理研究所; 株式会社東芝)
概要: 高次元データには欠測が含まれることが多いが、通常のスパースモデリングは欠測を直接扱えない。近年、欠測を扱う手法 (CoCoLasso)も提案されているが、欠測が非常に多い高欠測データでは性能が大幅に悪化してしまう。本発表では、高欠測データに対応できる新手法HMLasso (Lasso for Highly Missing data)を提案する。非漸近理論と数値実験により、提案手法の有効性を示す。
D1-27: Designing Loss Function which Generates Latent Space for Image In-betweening
発表者: Paulino Cristovao; Hidemoto Nakada; Yusuke Tanimura; Hideki Asoh (University of Tsukuba; Advanced Institute of Science and Technology (AIST); Advanced Institute of Science and Technology (AIST); Advanced Institute of Science and Technology (AIST))
概要: Learning interpretable latent representation of independent data is an important task of intelligence machines. We design a loss function which generate a latent space that represent the spatial configuration of the object in the images. The resulting latent space could be used for image in-betweening or image prediction. Our network architecture is based on the variational autoencoders.
D1-28: One-Shot Learning Using Triplet Networks with KNN
発表者: Mu Zhou; Hidemoto Nakada; Yusuke Tanimura (University of Tsukuba; National Institute of Advanced Industrial Science and Technology (AIST); National Institute of Advanced Industrial Science and Technology (AIST))
概要: We propose triplet networks with KNN for the problem of one-shot learning, in which we predict the query images correctly by given only single example of each class where we do the data augmentation. Our triplet network learns a mapping from sample images to the Euclidean space. Then we apply KNN classifier on the embeddings generated by the triplet network to classify the query sample.
D1-29: Kernel Gragh Lapracian Features ~重みつきデータを用いた局所性保存射影のカーネル化~
発表者: 橋春輝; 竹川高志 (工学院大・情報; 工学院大・情報)
概要: 高次元データに対するクラスタリングの前処理として次元圧縮を行う手法は多岐に渡る。本研究では、類似度を維持しつつ線形変換を行う点で、MDSとPCA双方の特徴を持つような Graph Laplacian Features (GLF)_という手法のカーネル化を行うことで、多様体構造を表現した空間への変換手法の提案を試みた。SN 比の低いデータでも、重なり合ったクラスタが分離しやすい結果が得られた。
D1-30: 観測量間の動的構造を抽出するベクトル値再生核ヒルベルト空間における動的モード分解
発表者: 藤井慶輔; 河原吉伸 (理化学研究所; 大阪大学/理化学研究所)
概要: Koopman作用素のスペクトル解析のためのアルゴリズムの1つである動的モード分解 (DMD)が注目されている。本発表では観測量間で構造を持つ非線形動的システムを対象に、ベクトル値RKHSで定義されたKoopman作用素のスペクトル解析を定式化し、その推定アルゴリズムを提案する。この特殊ケースとして、隣接行列系列を用いたグラフDMDを提案し、動物の群れや自転車シェアリングへの適用例を紹介する。
D1-31: (取り下げ)
D1-32: 隠れ状態を持つ多腕バンディット問題における方策の検討
発表者: 工藤亘平; 竹川高志 (工学院大学・情報; 工学院大学・情報)
概要: 人は気分や状況など状態の変化によって異なる行動を起こす。このような対人行動は非定常多腕バンディット問題のモデルとして扱うことができる。状態変化が起こる行動を隠れ状態を持ち時間や行動に依存して状態遷移を行うモデルとして考え、一般的な多腕バンディット問題の方策がどのような選択をするか、また隠れ状態の推定を行うことでどの程度方策が改善されるかを検討する。
D1-33: 潜在的ディリクレ配分法を用いた問合せ文書と回答文書の関係分析
発表者: 大川順也; 雲居玄道; 後藤正幸 (早稲田大学; 早稲田大学; 早稲田大学)
概要: 近年、企業ではシステムやサービスに関する問合せが電子文書形式で送信可能となっている。この時、送られてくる問合せ文書に対して回答文書が人手で作成されている。このため、過去の問合せから類似する回答文書を抽出することは、作業効率向上に寄与する。そこで本研究では、潜在的ディリクレ配分法に基づき、問合せ文書と回答文書の関係を分析する。また、実際の問合せデータを用いた実験を行い、有用性を考察する。
D1-34: 共変量シフトの重み関数選択による因果効果推定
発表者: 横山悠; 下平英寿 (京都大学; 京都大学/理研AIP)
概要: 因果効果の推定は因果推論における中心的な問題である。因果効果推定法の一つに重み付き回帰を用いる方法がある。本研究は、共変量シフトの観点から、重み付き回帰による因果効果推定においてどのような重み関数を用いるべきかという問題を議論し、因果効果推定量の漸近分散を最小化するよう「テストデータ最適化」を行うことを提案する。提案法により重み関数を決定すれば、従来法より分散の小さい因果効果推定量が得られる。
D1-35: コヒーレンスが大きい線形観測によるLassoの近似的性能評価
発表者: 井原みのり; 岩田一貴; 末松伸朗; 三村和史 (広島市立大学; 広島市立大学; 広島市立大学; 広島市立大学)
概要: スパース推定においては、計算量を抑えた反復法が議論されているが、観測行列の性質によっては発散することが問題となっている。その代表的な例として、観測行列の各要素が平均が非零の分布に従う場合が挙げられる。本研究では、この場合の推定の理論限界を明らかにすることを目的に、Lasso推定値の平均2乗誤差を統計力学の手法を用いて解析的に評価した。
D1-36: 形状特徴項を用いたVAEの復元性能の向上
発表者: 佐藤玄; 前田宗彦; 鈴木一将; 大島誉寿; 内田雄太; 米倉一男 (株式会社IHI)
概要: 従来のVAEでは、復元誤差に明度の交差エントロピーを用いており、隣接した画素間の関係などの形状特徴を無視して復元誤差を計算していた。その結果、データセットによっては復元前後の形状が一致しない方向に学習が進んでしまった。そこで、復元誤差に形状特徴を記述する項を追加し、VAEの復元性能を上げる手法を考案した。本発表では微分による形状特徴項を追加し、復元性能を向上させた事例を紹介する。
D1-37: 強推移性を利用した漸近一致性を持つ大規模ベイジアンネットワーク構造学習
発表者: 本田和雅; 名取和樹; 磯崎隆司; 植野真臣 (電気通信大学大学院情報理工学研究科)
概要: 制約ベースアプローチによるベイジアンネットワーク構造学習手法は独立性検定を行う範囲を制約することにより、近年、大規模なベイジアンネットワーク学習への適用が注目されている。本研究はベイジ アンネットワークが表す独立性が強推移性を持つことを明らかにし、それを用いることでより探索を効率化する学習アルゴリズムを提案する。実験では、Bayes factor を条件付き独立性検定に用いるとき、提案手法が漸近一致性を持ち、従来手法より高速に学習できることを示す。
D1-38: On Training a Joint Magnitude and Phase Deep Generative Model
発表者: Aditya Arie Nugraha; Kouhei Sekiguchi; Kazuyoshi Yoshii (RIKEN AIP/Kyoto University; Kyoto University/RIKEN AIP; Kyoto University/RIKEN AIP)
概要: We would like to discuss our ongoing work on jointly representing the magnitude and the phase of a complex speech spectrogram with a single deep generative model. Evaluated for time-domain speech reconstruction, our models provide promising performance in terms of an objective perceptual metric.
D1-39: Learning Algorithms in Molecular Adaptation: Adaptive Response of Side-Chain Dynamics in Binding Site of Ribonuclease Inhibitor
発表者: Nobuyuki Takahashi (Hokkaido University of Education, Hakodate)
概要: We examined adaptive responses of molecular dynamics of the ribonuclease inhibitor for binding history with ribonuclease A. The conformational relaxation of side chains in binding sites is essential to the complex stability and the adaptive response. The molecular adaptation was compared with the ferroelectric polymer [Takahashi 2017, vol. 117, no. 293, IBISML2017-89, pp. 389-392, 2017].
D1-40: Frank-Wolfe型ブースティングの高速化
発表者: 三星諒太朗; 畑埜晃平; 瀧本英二 (九州大学システム情報科学府; 九州大学/理研AIP/九州大学)
概要: ブースティングの1つである LPBoostは、線形計画問題を繰り返し解くことで高速に最適解を求められる手法だが、反復回数の理論的上界が知られていない。一方、オンライン凸最適化の分野では線形計画問題を繰り返し解くことで、凸関数の最適解を求めるFrank-Wolfe法という手法が知られている。本研究では、 Frank-Wolfe法を用いた新たなブースティング法を提案し、理論的な反復回数の上界を示した。
D1-41: 深層生成モデルを用いた半教師あり多チャネル音声強調
発表者: 関口 航平; 坂東 宜昭; Aditya Arie Nugraha; 吉井 和佳; 河原 達也 (京都大学/理研 AIP; AIST; 理研 AIP; 京都大学/理研 AIP; 京都大学)
概要: 本研究では、音声の深層生成モデルとNMFに基づく雑音モデルを統合し、雑音の学習データが不要な多チャネル音声強調法を提案する。クリーンな音声のみから学習した深層生成モデルを音声の事前分布とし、音声と雑音が空間的に重畳することで多チャネル観測音が生成される確率モデルを定式化することで、尤度を最大化する音声を求めることができる。
D1-42: 単語分散表現に対する球面クラスタリングの適用
発表者: 三橋 響; 井上 真郷 (早稲田大学; 早稲田大学)
概要: 線形分離しやすい文書特徴量を得るために、単語分散表現に対してソフトクラスタリングを用いる手法が存在する。一方で、単語の類似度を測る際にはユークリッド距離ではなくコサイン類似度がしばしば用いられる。本研究では、球面ソフトクラスタリングを用いることで、文書分類精度の向上をめざす。
D1-43: 単語の極性を埋め込んだ分散表現
発表者: 中村拓; 田然; 乾健太郎 (東北大学; 産業技術総合研究所; 東北大学,理化学研究所)
概要: 単語分散表現は、単語の文脈的な類似性を捉える類義性や加法構成性においては有効性を示している。一方、単語の対義関係などの極性を分散表現から読み取ることは難しいとされている。本発表では、文脈的な類似性と単語の極性のような明確な対立性の両方を表現可能な分散表現を実現するため、周辺文脈の予測と同時に単語の極性を線形関数で分離するような分散表現モデルを提案する。
D1-44: 雑談チャットボットのための記憶注意付きSeq2Seqモデル
発表者: 伊藤駿汰; 井上真郷 (早稲田大学; 早稲田大学)
概要: RNNを用いた系列変換モデルであるSequence to Sequence (Seq2Seq)の雑談チャットボットへの適用が試みられている。本研究ではSeq2Seqにプロフィール情報などを記憶情報として保持して応答に反映する記憶注意を追加したモデルを提案する。これにより、より自然で個性的な応答をすることができる雑談チャットボットの作成を目指す。
D1-45: Word2Vecにおける負例Samplingの情報理論的一考察
発表者: 竹中誠; 小町守 (首都大学東京)
概要: Word2Vecの学習時には負例 Sampling という近似手法が用いられる。これは共起しない単語 (負例)の出現確率を、文脈を考慮しない単語の出現確率で近似する手法であるが、なぜこれで性能が良いのか、またどのくらい良いのかは明らかではない。本発表では共起を考慮した負例の確率分布を考えることにより、負例 Sampling を情報理論的に捉えられることを示し、負例分布の評価の可能性を議論する。
D1-46: 微分不可能な2段階最適化を用いたハイパーパラメータ学習について
発表者: 奥野貴之; 武田朗子; 川名哲裕 (理化学研究所革新知能統合研究センター; 東京大学; 東京工業大学)
概要: スパース最適化モデルにおいて、ハイパーパラメータは高い予測精度をもつモデルを構成する上で重要な役目をもつ。本研究では、Lp正則化項 (0<p<=1)を含むモデルに伴うハイパーパラメータの学習について考える。これを微分不可能な2段階最適化モデルとして定式化し、それに対して微分可能な近似問題を繰返し解く平滑化型手法を提案し、その理論的性質と実際の性能について既存手法との比較を通して論じる。
D1-47: 測定困難なデータに対する解析モデルベースの予測法の提案
発表者: 草地嵩; 高羽洋充 (工学院大学先進工学部環境化学科; 工学院大学先進工学部環境化学科)
概要: 複数の材料を組み合わせるデバイス評価には微細構造を定量化することが重要である。しかし、リアルタイムでこの微細構造を定量化することは困難であり、劣化様相を知ることはできない。どのような劣化を生じるか、それがどの程度改善された数値化できれば、材料開発の効率化に繋がる。本提案手法は、デバイスとしてリチウムイオン電池を対象として、微細構造を含む数値モデルを用いて測定可能な特性を予測、これをニューラルネットワークに学習させることで実測可能な特性から微細構造を予測した。
D1-48: 擬尤度の辺に対する最大化を通じたグラフィカルモデルの構造推定
発表者: 高品佑也; 中谷秀洋; 井上真郷 (早稲田大学; サイボウズ・ラボ(株); 早稲田大学)
概要: マルコフ確率場の構造推定を行う手法として、グラフィカルラッソのような特定の分布を仮定するものの他に、相互情報量を用いて変数間の条件付き独立性を判定するものがある。しかし、それらの多くでは目的関数が陽に定義されず、最適化問題が不明瞭だった。本発表では、構造推定を擬尤度の辺に対する最大化として定式化し、その貪欲解法を提案する。また、構造的正則化への応用や、他の組合せ最適化手法の適用についても考察する。
D1-49: Online Intention Learning
発表者: Yasuhisa Suzuki; Wemer Wee (NEC; NEC)
概要: A common approach to imitate expert decision making is to do manual tuning, but this requires domain knowledge and is time consuming. Recently, techniques that learn from expert data are getting popular. However, issues such as changing environments and small data remain. We propose an online intention learning method and demonstrate its performance using benchmark problems.
D1-50: Partial AUC最適化を用いたマルウェア感染端末の分類について
発表者: 西山泰史; 熊谷充敏; 神谷和憲; 谷川真樹 (NTTセキュアプラットフォーム研究所; NTTセキュアプラットフォーム研究所; NTTセキュアプラットフォーム研究所; NTTセキュアプラットフォーム研究所)
概要: セキュリティログ分析において、機械学習でマルウェア感染の有無を判定し、ログ分析対象を絞り込む技術が注目されている。実サービスでは、感染が疑われる通信ログのみをアナリストが詳細に分析することで運用されているため、稼動削減の観点から、低誤検知で運用した際の検知率が重視される。そこで、本研究では低誤検知率での検知率を最適化する手法の提案法/従来法をマルウェア感染端末の分類問題に適用し、その効果を示す。
D1-51: パレートフロントに対するベジエ単体を用いた小標本近似法
発表者: 小林健; 濱田直希; 三内顕義; 田中章詞; 坂内健一; 杉山将 (富士通研究所; 富士通研究所; 理研AIP; 理研AIP; 慶應義塾大学; 理研AIP)
概要: 多目的最適化問題のパレートフロントは目的数が増えると高次元となり、その全体を標本によって被覆することが困難になる。多くの場合、パレートフロントは曲がった単体をなし、その頂点、辺、面、…はもとの問題の部分問題のパレートフロントに対応する。本研究ではこの構造をもつパレートフロントをベジエ単体により任意の精度で近似できることを証明し、ベジエ単体を用いて小標本で近似する手法を提案する。
D1-52: 温度付きSoftmax関数を含む深層学習器の実験的性能評価
発表者: 岡田 莉奈; 長谷川 聡 (NTTセキュアプラットフォーム研究所; NTTセキュアプラットフォーム研究所)
概要: Distillation (蒸留)と呼ばれる小型の深層学習器生成方法にて用いられる「温度付きsoftmax関数を出力層に持つ学習器」の性能を、学習データの量と学習の収束速度の観点で、実験的に評価した。この評価結果を報告する。
D1-53: 機械学習に基づくペプチド由来イオンピークの新規検出手法
発表者: 守屋勇樹; 田畑剛; 岩崎未央; 河野信; 五斗進; 石濱泰; 瀧川一学; 吉沢明康 (DBCLS; 京都大学; 京都大学; DBCLS; DBCLS; 京都大学; 北海道大学; 京都大学)
概要: プロテオーム解析で用いる質量分析では、タンパク質由来のペプチド混合物をイオン化し、測定結果のマススペクトルから「ピーク検出」することでイオンの精密質量と電荷数を判定している。この検出精度はペプチドの同定に劇的に影響するが、異なるペプチドイオン由来のピークがスペクトル上で複雑に重なり合うなど、正確な検出が難しいことが多い。本研究では深層学習に基づくピーク検出を試み、既存手法よりも高い精度を得た。
D1-54: 知識グラフによる生成モデル学習の正則化
発表者: 武石 直也 (理化学研究所)
概要: データを生成したシステムに関する知識を知識グラフの形で記述できることがある。例えば、工場のセンサデータに関して、センサが取り付けられた機器同士の関係性をグラフとして記述できる。そのようなデータに対する確率的生成モデルの学習において、知識グラフを事前情報として利用したい。ここでは、間接的な知識を含む情報を活用するために、知識グラフの連続値埋め込みを学習の正則化に利用する方法を議論する。
D1-55: 低次元サポートをもつ分布の推定について
発表者: 南賢太郎 (東京大学)
概要: 近年、GAN (Goodfellow, et al. 2014) などの手法によって、画像などの生成分布を推定できると言われている。このように複雑かつ高次元のデータの生成を分布推定として統計的に定式化するには、分布の台が低次元であるという性質を考慮する必要がある。本発表では、像測度の推定におけるWasserstein損失の性質について考察を行う。特に、収束レートへの台の次元数の影響について議論したい。
D1-56: リカレントニューラルネットワークにおけるハイパパラメータの最適化と分析
発表者: 工藤一輝; 尾崎嘉彦; 大西正輝; 一色剛 (東京工業大学; 産業技術総合研究所・グリー株式会社; 産業技術総合研究所; 東京工業大学)
概要: Long Short-Term Memory (LSTM)は、自然言語処理等の分野において成功を収めている機械学習モデルである。しかし、LSTMはそのハイパパラメータに性能を大きく左右され、それらを手動で調整することは困難である。本研究では、LSTM言語モデルのハイパパラメータ調整に対し、近年注目されているベイズ最適化をはじめとしたブラックボックス最適化手法を適用し、結果の分析を行う。
D1-57: スパースモデリングの量子多体物理への応用
発表者: 本山裕一; 吉見一慶; 大槻純也; 品岡寛 (東大物性研; 東大物性研; 東北大理; 埼玉大理)
概要: 量子多体物理で重要な物理量のひとつであるスペクトル関数を、モンテカルロ法で計算しやすい温度グリーン関数から得るには、積分方程式を解く必要がある (逆問題)。これは統計誤差に対して不安定なため、これまで様々な計算手法が提案されてきた。本発表では、スパースモデリングを用いた最近の手法を紹介する。また、従来手法による結果を知識として利用することで非物理的な振舞いを抑える新手法についても述べる。
D1-58: Towards Rank-Loss Optimized Stochastic Block Model
発表者: Masafumi Oyamada; Koji Ichikawa (NEC; NEC)
概要: We investigate a way to incorporate rank-loss into stochastic block model. The intuition under our model is based on the Bayesian Personalized Ranking and the mixture-of-experts model. To integrate those incompatible concepts, we employ the Regularized Bayes method. Since the optimization problem is computationally intensive, we investigate an efficient optimization method.
D1-59: 水道事業における試行錯誤可能なダイナミクス学習
発表者: 加藤淳也; 比嘉亮太 (NEC; NEC)
概要: 水道事業では近年、運用オペレーションの高度化が必要になってきている。そこで本稿は、水道事業の運用支援やダウンサイジングを将来的に見据えた手法を紹介する。具体的には、運用計画、実データ (時系列)から観測された局所性、周期性に着目し、個別に学習が必要な運用パターン (アクション)の変化にも対応可能にする。これにより水道事業に適用でき、かつ強化学習に繋がる、試行錯誤可能なダイナミクス学習の手法を紹介する。
D1-60: Learning Temporally Coherent Video Representaions Using Group Fourier Analysis
発表者: Kohta Ishikawa; Yusuke Sekikawa; Ikuro Sato (Denso IT Laboratory, Inc.; Denso IT Laboratory, Inc.; Denso IT Laboratory, Inc. )
概要: A number of video representation learning adopts temporal coherence criteria like slowness or steadiness. We propose a class of spatiotemporal convolutional filters whose time evolution is described by the linearly changing group actions; therefore, it is temporally coherent. We show that convolution and its derivatives for such filters can be computed efficiently through group Fourier analysis.
D1-61: How Do Soft Lables Help Training DNNs?
発表者: Kohei Hayashi; Itto Higuchi; Ryo Karakida (PFN; UTokyo; AIST)
概要: In multiclass classification problems, labels are usually given as one hot. As common tricks to train DNNs, however, people alternatively use soft labels transformed from the original labels. Training with soft labels empirically improves the performance, but it remains unclear how/why they help for training DNNs. We introduce some preliminary results against the question.
D1-62: Spectral Parameter Estimation of Random Matrix Models
発表者: Tomohiro Hayase (The University of Tokyo)
概要: For random matrix models, the parameter estimation based on the likelihood is not straightforward when there is only one sample matrix. We introduce a new parameter optimization method of random matrix models which works even in such a case based on the spectral distribution. In addition, we propose a new dimensionality recovery method, which works even in the case the signal is not low rank.
D1-63: 人口データからの移動傾向推定の高速化について
発表者: 赤木康紀; 西村拓哉; 倉島健; 戸田浩之 (NTTサービスエボリューション研究所; NTTサービスエボリューション研究所; NTTサービスエボリューション研究所; NTTサービスエボリューション研究所)
概要: 群衆の位置情報を把握する上で、時刻別のエリア人口の形式のデータが注目を集めている。しかし、人口の形式では利用用途が限られるため、そこから移動傾向を推定する研究が活発に行われている。特に近年注目を集めているのがCollective Graphical Model を用いた手法であるが、推定時に大きな計算量が必要であるという問題点がある。本発表では、推定の高速化アプローチを提案し比較検討する。
D1-64: バイクラスタリングに基づいたがん進化のモデリングと体細胞変異検出への応用
発表者: 森山卓也; 山口類; 井元清哉; 宮野悟 (東京大学医科学研究所; 東京大学医科学研究所; 東京大学医科学研究所; 東京大学医科学研究所)
概要: がんは、様々なゲノム変異を獲得しつつ増大し、進化する。がん細胞で生じたゲノム変異 (体細胞変異)を検出することは、がん研究において標準的かつ重要な解析である。既存研究において、複数検体のがん組織データから推定されるがんの進化をモデル化し、体細胞変異検出への応用は十分にはなされていない。本研究では、がんの進化の過程をバイクラスタリングに基づいてモデル化を行い、体細胞変異の同定に応用する手法を発表する。
D1-65: 証明数探索を用いた化合物合成経路列挙アルゴリズム
発表者: 渋川亮祐; 石田祥一; 寺山慧; 美添一樹; 奥野恭史; 津田宏治 (東大; 京大; 理研/京大; 理研; 京大/理研; 東大/理研/物材機構)
概要: 有機化合物の合成経路を設計する問題は逆合成解析と呼ばれ、近年盛んに研究が行われている。しかし、既存のソフトウェアは単一の経路を出力するのみであり、信頼性の保証がないという問題があった。我々は、逆合成解析をAND-OR木で表現し、これに対する列挙アルゴリズムを開発することで問題の解決を試みた。本研究は、創薬・材料開発の分野における新規化合物の合成において有用だと考えられる。
D1-66: 患者情報の季節性と検索クエリに基づくトレンドを用いたインフルエンザ患者数予測
発表者: 村山太一; 若宮翔子; 荒牧英治 (NAIST; NAIST; NAIST)
概要: インフルエンザは多くの死者をもたらす感染症で、流行予測は重要な課題である。インフル予測に用いられるリソースは多岐に渡るが、近年はリアルタイムに情報を取得可能なユーザー生成コンテンツ (UGC) が用いられることが多い。一方で季節性の動きが強いことから過去の患者数のみでも高い精度で予測が可能である。本発表は、検索クエリと過去の患者情報という2つのデータを別々に学習し構築される新たな予測モデル提案を行う。
D1-67: GANの統計的決定問題による解釈とその安定化、高速化手法の提案
発表者: Kei Ikegami; Masaki Watanabe; Kohei Hayashi (UTokyo; PFN; PFN)
概要: 敵対的生成ネットワーク (GAN)の理論的性質を解明するため、本発表では統計的決定問題に基づく解釈を行う。これにより、Wasserstein GANアルゴリズムの不決定性が示される。さらに、目的関数を制約付き最適化問題に再定式化することで学習を安定化でき、また制約によって判明するゲームの値 (ミニマックス値)を利用して生成器の学習を加速できる。
D1-68: 表現論を用いた指数型分布族の構成法
発表者: 東條広一; 吉野太郎 (東京大学大学院数理科学研究科; 東京大学大学院数理科学研究科)
概要: 指数型分布族は、機械学習において有用な分布族である。その中でも空間の対称性と同等の対称性を持つ指数型分布族を表現論によって統一的に構成する手法を考案した。その手法により、多くの実用的な分布族 (正規分布、ガンマ分布、Bernoulli分布、カテゴリカル分布、Wishart分布、von Mises分布、Fisher-Bingham分布)や上半平面上でポアンカレ計量と相性の良い分布族を構成できる。
D1-69: Itemsetカーネルに対するランダム特徴
発表者: 新 恭兵; Subhransu Maji; 小山聡 (北海道大学; University of Massachusetts, Amherst; 北海道大学)
概要: カーネル法のデータ数に対してよくスケールしないという問題点を解決する方法とし て、ランダム特徴という方法が提案されている。本研究ではItemsetカーネルに対す るランダム特徴を提案する。Itemsetカーネルは特徴の組合せを扱う様々なカーネル の一般化となっており、提案法を用いた線形モデルはカーネル法だけでなくFactoriz ation Machine等の特徴の組合せを扱うモデルの良い代替となる。
D1-70: 深層ニューラルネットワークにおけるFisher情報行列の普遍性
発表者: 唐木田亮; 赤穂昭太郎; 甘利俊一 (産業技術総合研究所; 産業技術総合研究所; 理化学研究所)
概要: 深層モデルのFisher情報行列を調べることは、深層学習の統計的な性質や最適化の問題を明らかにするうえで重要である。本研究では、ランダムな結合パラメータを持つ深層モデルに平均場理論を適用することで、Fisher情報行列の固有値分布が歪んでおり、非常に多くの小さな固有値と少数の大きな固有値があることを示す。発表では、この固有値の性質が最適化に与える影響も議論する。
D1-71: Improved Mistake Bounds for Binary Matrix Completion
発表者: Liu Yaxiong; Ken-ichiro Moridmomi; Kohei Hatano; Eiji Takimoto (Kyushu University/RIKEN AIP; So-net Media Networks; Kyushu University/RIKEN AIP; Kyushu University)
概要: For the online binary matrix completion problem, we derive mistake bounds in terms of hinge loss the best matrices in hindsight. Our bounds improve the previous work of Herbster et al. in that (i) we prove an optimal bound and (ii) our result implies an offline generalization bound for the algorithm which is as good as that of SVMs with the best kernel.
D1-72: One-Class Collaborative Filtering based on Contents Similarity
発表者: Koji Ichikawa (NEC)
概要: We investigate weighted regularized matrix factorization (WRMF) for the one-class collaborative filtering. We propose a novel approach to incorporate confidence levels based on user awareness into the WRMF framework. We also propose efficient algorithms for several forms of the weight such as semi-uniform, low-rank, sparse, or a linear sum of them.
D1-73: 学習曲線の予測に基づくハイパーパラメータの最適化法
発表者: 北村寛; 前田新一; 佐野正太郎 (東京大学; Preferred Networks; Preferred Networks)
概要: ニューラルネットワークのハイパーパラメータが良いかどうかを判断するためには、そのハイパーパラメータのもとでのニューラルネットワークの学習を行う必要があり、評価に大きな計算時間がかかる。本研究発表では、将来の学習曲線の確率的な予測を行い、またその予測に基づいて有望なハイパーパラメータに対してのみ学習を進めることで、最適化を効率よく行う方法を提案する。
D1-74: マルチモーダルカテゴリ形成とSLAMの統合モデルによるオンライン学習と経路計画
発表者: 谷口彰; 萩原良信; 谷口忠大; 稲邑哲也 (立命館大学/日本学術振興会特別研究員PD; 立命館大学; 立命館大学; 国立情報学研究所/総合研究大学院大学)
概要: ロボットが人間の生活環境で様々なタスクを行うためには、空間認識や場所に関する知識獲得が重要である。我々は、マルチモーダル情報のカテゴリゼーションとSLAMおよび、音声からの単語分割を統合したベイズ確率的生成モデルSpCoSLAMを提案している。本発表では、提案モデルに基づくオンライン学習と音声命令からの経路計画のための確率推論法について議論する。
D1-75: Risk-Aware Reinforcement Learning
発表者: 綿引隼人; 前田新一; 岡田慎太郎 (東京大学; Preferred Networks; Preferred Networks)
概要: 学習過程や学習後の方策の安全性を保証した強化学習アルゴリズムに関心が集まっている。 本研究では、リスク関数を推定することで安全でかつ、将来の累積報酬を最大化できる方策を学習できることを示す。
D1-76: Robustness to Adversarial Perturbations in Learning from Incomplete Data
発表者: Amir Najafi; Shin-ichi Maeda; Takeru Miyato (Sharif University of Technology; Preferred Networks; Preferred Networks)
概要: In this study, we generalize the idea of distributionally robust learning to incomplete datasets such as partially labeled datasets. We have theoretically addressed computational tractability, convergence and generalization issues in accordance with our method and provided a rigorous mathematical framework for further analysis in this area.
D1-77: 異質な集団間の評価基準差を示すタスクの検出
発表者: 大橋英明; 清水敏之; 吉川正俊 (京都大学大学院情報学研究科; 京都大学大学院情報学研究科; 京都大学大学院情報学研究科)
概要: クラウドソーシングやピアレビューにおいて、評価基準が異質な集団が複数のタスクの評価を行うような状況を想定する。このとき、集団間の評価基準の差を強く示すタスクを検出できれば、集団の異質性の特定に役立つと考え、本研究は集団間の評価基準の差を強く示すタスクの検出を目的とする。
D1-78: 敵対的学習を利用した知識アラインメント
発表者: 黒川茂莉; 小林亜令; 萩原将文 (KDDI総合研究所,慶應義塾大学; KDDI総合研究所; 慶應義塾大学)
概要: 実体をノード、実体間関係をエッジとする知識グラフを用いて知識を表現し、未知の実体や実体間関係に関する知識を推論する技術があり、質問応答等に利用されている。本研究では、この発展として、複数の知識グラフの存在を前提とし、知識グラフ間で知識のアラインメントを行うように知識グラフの要素の埋め込みを学習する。とくに、敵対的学習を援用し良質なサンプルを生成することで、精度を高めることが可能かを評価する。
D1-79: 日時が曖昧に記録されたイベント列の解析
発表者: 勝木 孝行; 恐神 貴行;古関 聰; 大野 正樹; 工藤 道治; 牧野 真樹; 鈴木 敦詞 (IBM東京基礎研究所; IBM東京基礎研究所; IBM東京基礎研究所; IBM東京基礎研究所; IBM東京基礎研究所; 藤田保健衛生大学; 藤田保健衛生大学)
概要: 本発表では観測者の即時的な制御無しに受動的に観測されるイベント列の解析を扱う。この場合、記録されたタイムスタンプは曖昧であり、イベントが発生した日時を表すのではなく、単にそれが記録・観測された日時を表す。時間間隔は一定ではなく、タイムスタンプの不確実性も大きい。このモデル化のためのモデルを提案し、実データへの有効性を確認する。
D1-80: Variational Inference for Mixture of Finite Mixtures with Unknown Number of Components
発表者: Li JiYao; 狩野 裕 (大阪大学基礎工学研究科数理科学領域; 大阪大学基礎工学研究科数理科学領域)
概要: In mixture of finite mixtures (MFM), a prior is assumed on the unknown number of components. We propose a mean-field approximation algorithm for MFM with stick-breaking representation, as an alternative to conventional approaches which can result in slow convergence such as reversible jump Markov chain Monte Carlo.
D1-81: 敵対的複数選択バンディット問題のミニマックスリグレット
発表者: 伊藤 伸志; 波多野 大督; 澄田 範奈; 竹村 慧; 福永 拓郎; 垣村 尚徳; 河原林 健一 (NEC; 理研AIP; 首都大学東京; NEC; 理研AIP, JSTさきがけ; 慶應義塾大学; 国立情報学研究所)
概要: 各時刻に複数のアクションを同時に選択できる多腕バンディット問題を考察する。この問題に対しては劣線形なリグレット上界をもつアルゴリズム (OSMD法)が提案されている一方で、このリグレット上界を改善できるか否かは未解決問題だった。本研究では、OSMD法のリグレット上界に一致するリグレット下界を示すことで、OSMD法が最悪時リグレットの意味で最適であることを証明する。
D1-82: 組合せ線形バンディットに対するトンプソンサンプリング
発表者: 竹村 慧; 伊藤 伸志 (NEC; NEC)
概要: 各アクションに補助情報があり、かつ複数のアクションを同時に選択できるようなバンディット問題を扱う。この問題に対してはUCB方策が劣線形なリグレット上界をもつことが示されているが、アクションの集合がクラスタを形成するようなインスタンスにおいては得られる報酬がラウンドごとに大きく上下してしまう。そこで、本研究ではトンプソンサンプリングに基づく手法を提案し、理論と実験の両面からその有用性を示す。
D1-83: Adaptive Sample Space & Adaptive Probability (ASAP) Coding
発表者: 中西健; 前田新一; 宮戸岳; 小山雅典 (東京大学; Preferred Networks; Preferred Networks; Preferred Networks)
概要: 近年、ディープラーニングを使った非可逆圧縮手法が提案されており、非可逆画像圧縮の性能を大きく引き上げている。本研究では、量子化・符号化器をrate-distortion tradeoffの観点から最適化することでstate-of-the-artの性能を達成した。
D1-84: Relaxing Imbalance with Positiveness
発表者: 谷本 啓; 山田 聡; 竹之内 高志; 鹿島 久嗣 (NEC; NEC; 公立はこだて未来大学; 京都大学)
概要: 判別問題で正例の数が少ない不均衡データを扱うとき、通常正例の精度がより重要であることから、その重要度に応じて重み付けするコスト考慮型学習がよく用いられる。しかし、安全に関する分野において正例が事故のような稀な現象を意味するなど、正例数を増やすことが困難な場合があり、汎化性能のボトルネックとなる。一方で、正例の定義がセンサ値が一定値以上であるなど、「正例らしさ」の情報が得られ、かつ「一定程度正例らしい負例」、即ちニアミスサンプルが大量に得られる場合がある。このとき、正例らしさを用いることによって不均衡を緩和し推定分散を削減できることを理論的及び実験的に示す。
D1-85: 適応的な部分グラフ指示子の探索・選択に基づく非線形グラフ分類回帰
発表者: 白川 稜; 横山 侑政; 岡崎 文哉; 瀧川 一学 (北海道大学; 北海道大学; 北海道大学; 北海道大学)
概要: グラフ表現を直接入力とする分類回帰問題は様々な分野で応用されている。部分グラフ指示子は最も基本的な特徴量であるが、グラフサイズの増加に伴い可能な部分グラフ総数は組合せ的に巨大な数となるため、あらゆる部分グラフの指示子を用いることは困難である。本研究では、学習に用いる部分グラフを適応的に探索・選択する回帰木学習アルゴリズムと勾配ブースティングによるアンサンブル学習を提案する。
D1-86: Wasserstein距離を用いた転移学習の理論解析
発表者: 熊谷亘; 松井孝太 (理化学研究所; 理化学研究所)
概要: 転移学習において期待リスクの上界は様々な discrepancy を用いて評価することができる。本発表では典型的な上界評価の問題点を指摘し、それを改善したWasserstein距離を用いた評価を与える。また導出した上界を最小化するためのアルゴリズムに関しても言及する。
D1-87: 概況文作成支援のための予想天気図類似度算出法
発表者: 雲居玄道; 後藤正幸; 吉開朋弘 (早稲田大学; 早稲田大学; 日本気象協会)
概要: 気象予報においては、日々様々なデータが送信される。それらのデータを元に新聞記事やテレビ放送用原稿など用途に合わせて手作業で天気予報の概況文が作成される。これらは、発表から一定時間以内に作成する必要があり、作成に避ける時間は数分程度である。本研究においては、概況文作成を支援する目的で、過去の類似する日を特定することを目的とする。そのため、予想天気図を用いて類似度を算出する方法を提案する。
11月6日 13:30 – 16:00
D2-01: Lipschitz-Margin Training: Scalable Certification of Perturbation Invariance for Deep Neural Networks
発表者: Yusuke Tsuzuku; Issei Sato; Masashi Sugiyama (The University of Tokyo/RIKEN; The University of Tokyo/RIKEN; RIKEN/The University of Tokyo)
概要: ニューラルネットワークが入力ノイズに対して敏感に反応する問題に対し、その不安定性を抑制するためにモデルのリプシッツ定数を抑えつつパラメータを学習する手法を提案する。
D2-02: クラウドソーシングモデルのミニマックスエラー解析と、そのワーカークラスタリングモデルへの応用
発表者: 今村秀明; 佐藤一誠; 杉山将 (東京大学; 理研AIP)
概要: クラウドソーシングはデータをラベリングする手段として重要になりつつあるが、クラウドにより生成された信頼性の低いラベルに対しては、その真のラベルを推定することが重要である。本研究では、既存の解析方法よりもより広いクラウドソーシングのモデルに対して適用可能なミニマックスエラーレートの下界を導出し、この方法を実データに適用することで得られる下界と実データの経験損失の間に強い相関があることを示した。
D2-03: ニューラルネットワークを用いたグラフ埋め込みの表現定理とその拡張
発表者: 奥野彰文; Geewook Kim; 下平英寿 (京都大学・理研AIP; 京都大学・理研AIP; 京都大学・理研AIP)
概要: Okuno et al. (ICML2018)では、グラフ埋め込みで用いられるベクトル値NNの内積 (IPS)が任意の正定値類似度 (PD)を任意精度で近似できることを示した。本発表では、内積を拡張し、ポアンカレ距離なども含む条件付き正定値類似度 (CPD)を任意の精度で近似できるShifted IPS (SIPS)を新たに提案する。実データでの数値実験でも既存手法の性能を上回ることを示す。
D2-04: 単調集合関数制約付き最小化問題に対する貪欲法と射影勾配法
発表者: 坂上晋作 (NTTコミュニケーション科学基礎研究所)
概要: 近年、非凸スパース最適化の分野では貪欲法や射影勾配法などの凸緩和を用いない手法の解析が注目を集めている。本研究では、これらの手法を制約が非ゼロインデックスについての単調な集合関数によって与えられる場合に拡張し、それらの理論保証について議論する。
D2-05: 複数観測データによる熱波の時空間変動エミュレーション
発表者: 村上大輔; 松井知子; Gareth W. Peters (統計数理研究所 データ科学研究系; 統計数理研究所 データ科学研究系; Department of Actuarial Mathematics and Statistics, Heriot-Watt University)
概要: 熱波リスクの低減に向けた第一歩として、複数観測データを融合して熱波状況を時空間詳細にエミュレートするための手法を、時空間補間手法Spatial-Temporal best Linear Unbiased Estimatorを基軸として開発する。エミュレーション結果について、衛星観測データを用いて精度評価を行うとともにTukey g-and-h random processを用いた状況解析を試みる。
D2-06: 都心部を中心とした住宅地の地価予測アプローチの比較
発表者: JAEKEL Marc-Olivier; 中川帝人 (FPTソフトウェアジャパン株式会社; 株式会社オープンハウス)
概要: 不動産取引における正確な価格予測のために、都心部 (東京都23区、横浜市、川崎市、さいたま市、名古屋市)の住宅地を中心とした公示地価ベースの土地価格の予測を行った。ヘドニックアプローチ、GWRモデル、XGBoostなどの各種手法を比較を行った。
D2-07: 転移元データのラベルを活用した分布間距離に基づく教師なしドメイン適応
発表者: 黒木誠一; ノンタワット チャロエンパックティー; 包 含; 本多淳也; 佐藤一誠; 杉山将 (東京大学/理研; 東京大学; 東京大学/理研; 東京大学/理研; 東京大学/理研; 理研/東京大学)
概要: 教師なしドメイン適応とは転移元ドメインと転移先ドメインにおいてデータの生成分布が異なり、かつ転移先ドメインのラベルが全く手に入らないという問題設定である。上記設定での重要な課題の1つにドメイン間距離をどのように計測するかが挙げられる。本発表では、転移元ドメインのラベルを活用し、既存のドメイン間距離よりもタイトな汎化誤差バウンドを与えつつ推定における計算効率の良い分布間距離を提案する。
D2-08: 質的フィードバックを用いた比較バンディット
発表者: 徐立元; 本多淳也; 杉山将 (東京大学/理化学研究所; 東京大学/理化学研究所; 理化学研究所/東京大学)
概要: 多腕バンディット問題において、各腕を引いたときのフィードバックが質的なもの (例えば、薬の副作用の強さや検索でヒットした記事の良さ)である場合を考える。この設定はフィードバックに基づいた相対比較を行うことで比較バンディットとして定式化できる。本研究ではその定式化と同じリグレットの最小化を目指す一方で明示的な比較は行わないアルゴリズムを与え、その理論解析・実験的評価を行う。
D2-09: 打ち切り行列の補完:天井効果への処方箋
発表者: 手嶋毅志; Miao Xu; 佐藤一誠; 杉山将 (東京大学/理化学研究所; 理化学研究所; 東京大学/理化学研究所; 理化学研究所/東京大学)
概要: 閾値で打ち切られた低ランク行列の復元を考える。打ち切りは、多くの科学分野に共通する、統計解析の阻害要因である。しかし、既存の低ランク行列補完の理論保証は、打ち切りからの復元を保証しない。そこで本発表では「打ち切り行列補完」の実行可能性の理論的保証と、復元の実践的な手法を示す。また、本問題に適した正則化を提案し、復元誤差の確率的上界を与える。人工データと実データを用いた計算機実験の結果も示す。
D2-10: 平均値シフトの性質の解析と課題
発表者: 山崎遼也; 田中利幸 (京都大学; 京都大学)
概要: 我々は、モード推定やモードクラスタリングに用いられる代表的な手法の一つである平均値シフトアルゴリズムの性質について解析した。この研究で得られた結果を発表するとともに、現状未解明である平均値シフトの性質について議論する予定である。
D2-11: 敵対的生成ネットワークを用いた逆合成の経路探索
発表者: 福島真太朗; 本山裕一; 吉見一慶 (株式会社トヨタIT開発センター; 東京大学物性研究所; 東京大学物性研究所)
概要: 近年、物質を生成する経路の探索に機械学習を応用する研究が活発になっている。本研究では簡便なColeyらの方法に着目する。この方法は目標とする生成物と反応式のデータベースのマッチングを行い、一段階前の反応のランキングを出力する。この手法は既存手法に比べ高精度である一方、探索空間は過去に生じた反応に限定される。本研究ではこの問題点に着目し、探索空間を広げるために敵対的生成ネットワークを用いた手法を提案する。
D2-12: 新聞印刷工場のスマートファクトリー化
発表者: 六車浩二; 田中康一郎 (九州産業大学大学院情報科学研究科; 九州産業大学理工学部情報科学科)
概要: 新聞印刷工場の工程安定、品質向上、コスト削減のためにローコスト、スモールスタート、イージーメンテナンスをキーワードにした設備改善に取り組んでいる。IOT/AI技術を取り入れながら、RaspberrypiやArduinoなどの低価格マイコン、クラウドサービスを利用した改善事例を報告する。
D2-13: 広告配信における選択バイアスの学習とその補正
発表者: 鈴村真矢; 安部斉志; 平澤謙章; 盛岡玲資 (ヤフー株式会社; ヤフー株式会社; ヤフー株式会社; ヤフー株式会社)
概要: 広告配信おいて広告のCTR (クリック確率)を予測することは重要なタスクの一つとして知られている。このタスクが難しいのは、予測値に基づくランキングを考えたとき、偶然に予測が過大評価された広告が勝ちやすく、ランキングに勝ち残った条件のもとでは予測のCTRが真のCTRから偏りやすいことである。我々はこのような予測の偏りを学習させ、オンラインの広告配信時に偏りを補正することができるアルゴリズムを提案する。
D2-14: メタゲノム中のプラスミド配列検出システムの開発と検証
発表者: 原田誠史; 鈴木治夫; 冨田勝 (慶應義塾大学先端生命科学研究所; 慶應義塾大学先端生命科学研究所; 慶應義塾大学先端生命科学研究所)
概要: プラスミドは可動性遺伝因子として知られ微生物コミュニティにおける薬剤耐性や病原性の獲得に関与しているとされている。本研究ではプラスミドのゲノム配列をメタゲノムデータ中から検出するシステムの開発とその評価を行った。本システムは既存のツールと比較した際に高精度かつ高速にプラスミドを検出することができた。
D2-15: 高次元におけるk近傍法の漸近的性質とバイアス補正
発表者: 中山優吾 (筑波大学)
概要: 本研究では現代科学においてしばしば観測される高次元データの判別分析について考える。判別分析は機械学習で盛んに研究されているが、多くの手法が高次元におけるノイズの影響を強く受けてしまう。k近傍法もノイズの影響を受ける一例である。本研究では、k近傍法の高次元における漸近的性質を明らかにし、高次元のノイズを除去するために、改善手法を提案する。当日は遺伝子発現データを用いた解析例も示す。
D2-16: 順序付けICAによる実データ分析
発表者: 松田源立 (東京大学)
概要: 筆者らは、近年、独立成分分析 (ICA)の新手法である順序付けICAを提案した。順序付けICAは、源信号の2次元特徴空間上でのガウス分布近似を利用した手法であり、源信号の順序を一意に決定し、推定結果の安定性を高めることができる。また、源信号の個数の同定にも有効である。本研究では、順序付けICAを、脳のEEG信号等の実データに適用し、その実用的な有効性を検証する。
D2-17: 深層ガウス過程により表されたダイナミクスの安定性解析
発表者: 福永修一; 佐藤訓志 (東京都立産業技術高等専門学校; 大阪大学)
概要: 本発表では、深層ガウス過程により表された制御対象のダイナミクスモデルに対する安定性解析のためのアルゴリズムを提案する。制御対象の目標状態が与えられたとき、その目標状態に漸近収束することが保証される初期状態の領域を安定化領域とよぶ。このとき、提案アルゴリズムにより、深層ガウス過程により表されたダイナミクスモデルに対して、そのモデルの安定化領域を明示的に与えることが可能となる。
D2-18: グラフ埋め込みの次数補正とその応用
発表者: 田中卓磨; 奥野彰文; 下平英寿 (京都大学・理研AIP; 京都大学・理研AIP; 京都大学・理研AIP)
概要: 本発表では、グラフ埋め込みの確率モデルに各ノードでの次数補正を加えた新たなモデルを提案し比較する。ニューラルネットワークを用いて、実データを用いた数値実験を行い、補正前と比較して提案モデルの性能が向上することを示す。
D2-19: レビュアー特性を考慮した多次元項目反応モデルの提案
発表者: 八木嵩大; 宇都雅輝 (電気通信大学情報理工学部; 電気通信大学大学院情報理工学研究科)
概要: 近年、大学入試や教育評価など様々な評価場面において、パフォーマンス評価が注目されている。パフォーマンス評価での受験者の能力測定精度改善のため、レビュアーの特性を表すパラメータを付与した項目反応モデルが多数提案されてきた。本研究では、パフォーマンス評価における測定対象能力に多次元性を仮定した新たな項目反応モデルを提案する。さらに、シミュレーション実験及び実データ実験により提案モデルの有効性を示す。
D2-20: 半解析的ブートストラップ法とその応用
発表者: 小渕智之; 樺島祥介 (東工大情報理工; 東工大情報理工)
概要: ブートストラップ法は、推定値に関する統計的ゆらぎを単一のサンプルセットから評価する手法であり、データやモデルを問わず使える強力な手法である。一方で計算量的負荷が高く、スパース推定や複雑な機械学習モデルに対しては実用性が低かった。我々はこの計算量的負荷を回避することを、半解析的にブートストラップ平均を取る近似公式を開発することで可能にした。L1正則化付き線形回帰を例にその威力と可能な応用例に関して議論する。
D2-21: 深層ベイズ学習に基づく単チャネル音源分離の教師なし学習
発表者: 坂東宜昭; 佐々木洋子 (産業技術総合研究所; 産業技術総合研究所)
概要: 本研究では、マイクアレイを日常生活中に放置して大量の混合音信号を収録するだけで、特殊なハードが不要な単チャネル音源分離を獲得できる枠組みを目指している。音源信号が空間的に重畳した多チャネル混合音として観測される確率モデルに対し、その事後分布をDNNで近似するように学習すれば、正解データがなくとも混合音から各音源を抽出する音源分離が教師なし学習できる。
D2-22: ボルツマンマシンによる強化学習
発表者: 内垣内洋; 山岡雅直 (日立製作所; 日立製作所)
概要: 近年、アニーリングマシンの研究が盛んであり、ボルツマンマシンを用いた強化学習によって、ニューラルネットワークよりも高速に解ける問題もみつかっている。本発表では、ボルツマンマシンへの入力変換を行うことで、3種類の問題 (制御、画像、離散)を解くことができることを示し、DQNと比べて学習に必要なパラメタ (ネットワークの接続係数)の更新回数を1/3?2/3に減らせることを紹介する。
D2-23: 転移学習のための実験計画的ドメイン選択
発表者: 松井孝太; 熊谷亘; 福地一斗; 竹内一郎 (理化学研究所 革新知能統合研究センター; 理化学研究所 革新知能統合研究センター; 理化学研究所 革新知能統合研究センター; 名古屋工業大学, 理化学研究所 革新知能統合研究センター, 物質材料研究機構)
概要: 本研究では、目標ドメインにおけるタスク性能を最大にするために多数の候補から転移元となるドメインを選択する問題を考察する。候補ドメインでのデータ取得コストが大きい場合、どのドメインからどのデータを取得して評価するかを適切に計画してドメインの探索を行う必要があるが、我々はドメインの不一致度と期待リスクという2つの指標に基づき、少ない探索コストで最適な元ドメインの組を発見するアプローチを提案する。
D2-24: 複数データセットを用いたGANによるデータ拡張手法の検討
発表者: 山口真弥; 村松沙那恵; 江田毅晴 (NTT Software Innovation Center)
概要: 本研究では、少量データでの効率的な学習を目的とした敵対的生成ネットワーク (GAN) ベースのデータ拡張手法を提案する。通常のGANの学習と異なり、本手法は、複数のデータセットを一つのGANで同時に学習させ、他のデータセットから多様な属性を輸入する。生成されたデータを学習対象のモデルの学習に利用することで精度の向上を目指す。本発表ではアイデアの有効性を確認する予備実験結果を紹介し、課題の検討を行う。
D2-25: マルチエージェント自動交渉における調停プロトコルとベイズ統計の関係
発表者: 山崎啓介; 藤田桂英 (産業技術総合研究所; 東京農工大学)
概要: 複数エージェントの自動交渉における調停において、エージェントが複雑な効用関数を持つ場合には最適な合意案に達することが難しく様々なプロトコルが提案されている。本発表ではMCMCを基にしたプロトコルを提案しベイズ統計との関連性を示す。これにより最適な合意案への収束特性をベイズ事後分布の漸近形で説明可能となった。
D2-26: Adaptive Intention Learning
発表者: 比嘉亮太 (NEC 中央研究所)
概要: 自立的な試行錯誤により報酬を最大化する強化学習の実社会応用の課題の1つとして、環境変化の取り扱いがあげられる。我々は、環境変化を考慮した報酬設計に基づく手法を提案する。報酬の設計に環境変化を繰り込むアルゴリズムと、幾つかの数値実験による評価を紹介する。
D2-27: 深層学習におけるskip結合とその表現集合
発表者: 長瀬准平 (芝浦工業大学大学院理工学研究科)
概要: 近年、深層学習分野の研究は盛んに行われており、実社会への応用も含めて多くの関心が寄せられている。一方で、理論的な解析や体系的な議論はその需要に反して多くない。本研究では、2015年に提案されて以来重要な働きをしているskip結合という機構について「表現集合」という観点から議論し、ResNetとDenseNetという二つのニューラルネットモデルの対応関係を説明する。
D2-28: バイオ配列のための編集不変ニューラルネットワーク
発表者: 小出智士; 河野圭祐; 沓名拓郎 (豊田中央研究所; 豊田中央研究所; 豊田中央研究所)
概要: 本研究ではタンパク質やDNAなどのバイオ配列データに対する、ニューラルネットワークを用いたモデル化の問題を取り扱う。我々はバイオ配列の機能や構造が文字列の編集操作 (置換・挿入・欠損)に対して (弱い)不変性を持つ、という仮定に立脚し、これらの編集操作を行っても出力の変化が小さくなるようなアーキテクチャを提案する。提案モデルをタンパク質の二次構造予測問題に適用し、アプローチの妥当性を確認した。
D2-29: 動径分布関数のカーネル密度推定
発表者: 徳田 悟; 平田 秋彦 (産業技術総合研究所MathAM-OIL; 産業技術総合研究所MathAM-OIL・早稲田大学理工学術院)
概要: 動径分布関数g(r)はある粒子から距離rに他の粒子が存在する度合いを表す。ある粒子からの半径rと幅Δrで定まる球殻 (ビン)を考え、各ビンの粒子数を数え上げたヒストグラムで表される。しかし、少数の粒子集団すなわちサンプルに対して構成されるヒストグラムの形状が、ビン幅に大きく依存することは常に問題である。本発表ではカーネル密度推定に基づき、ヒストグラムとは異なる形で、g(r)を計算する方法を提案する。
D2-30: カネール平均埋め込みによる尤度なし関数を用いた共変量シフト下での回帰手法
発表者: 木佐森慶一; 山崎啓介 (産総研/NEC; 産総研)
概要: 尤度が解析的に書けないシミュレーションモデルを回帰関数をとしたデータ同化の手法として、カーネル平均埋め込みによる回帰手法を開発した。さらに、物理法則や制約を実装しているシミュレーションを外挿領域に対する回帰関数として用いるために共変量シフトへの拡張を行った。精度評価と、生産工程における実問題を模擬した生産シミュレータに適用した実験結果を紹介する。
D2-31: 強低ノイズ条件下識別問題に対する確率的勾配降下法の線形収束性
発表者: 二反田篤史; 鈴木大慈 (東京大学/理研AIP; 東京大学/理研AIP)
概要: 識別問題に対する確率的勾配降下法の収束性を調べる。期待識別誤差とその最適値とのギャップの収束率は劣線形である事が知られているが、適当な条件下でより高速な収束が達成可能か否かという問題は大変興味深い。近年、強低ノイズ条件下で二乗損失を用いた場合に劣線形より圧倒的に高速な線形収束する事が示された。本研究では、ロジスティック損失等を含む識別問題により適切な損失関数クラスで、同様な線形収束性を示す。
D2-32: 類似探索に基づく音源分離
発表者: 澤田 宏; 青山 一生 (日本電信電話 (株)NTTコミュニケーション科学基礎研究所; 日本電信電話 (株)NTTコミュニケーション科学基礎研究所)
概要: 空間で混合された音を複数マイクロホンでの観測音から分離する音源分離の手法が数多く提案されている。本発表では、クリーン音声を用いて事前にデータベースを構築しておき、実行時にはそのデータベースに対して類似探索を行うことで音源分離を行う手法を提案する。
D2-33: 識別と再構成を行うマルチタスク Deep Convolutional Neural Network の検討
発表者: 小林源太; 庄野逸 (電気通信大学 情報理工学部 総合情報学科; 電気通信大学 大学院情報理工学研究科 総合情報学専攻)
概要: 脳は概念から具体的な例を想起できることなどから、認識課題とイメージの再構成を同時に解く能力があると考えられる。一方、CNNは視覚野をヒントに構築されており、識別課題に有効であることが示されている。再構成課題に対するCNNも提案されているが、識別問題に関連させた研究は多くない。本研究では、CNNに識別と再構成課題のマルチタスク学習モデルを構築し、相互の課題の関連性について検討する。
D2-34: マルチモーダルな特徴量を用いた TVCM 動画の評価予測
発表者: 熊谷雄介; 田原將志; 黄橙白; 道本龍 (株式会社博報堂; 株式会社博報堂; 株式会社博報堂; 株式会社博報堂)
概要: 動画、音声、出演キャストや企業などのメタ情報といったマルチモーダルな特徴量から構成されるTVCM動画を入力とし、我々が独自に行なっているTVCM定点観測調査によって得られたTVCM評価データを学習・予測するモデルの検討を行う。
D2-35: 構造が時間に依存して変化するデータの埋め込み
発表者: 布施拓馬; 日野英逸; 赤穂昭太郎; 村田昇 (早稲田大学; 統計数理研; 産総研; 早稲田大学)
概要: 単語などの対象間の距離関係が与えられている時、対象に対し最適な座標を配置する問題は埋め込みと呼ばれ、SNEを始めとする多くの埋め込み手法が提案されている。本稿ではSNEにword2vecのアイディアを導入し、構造が時間に依存して変化するデータの埋め込み手法を提案する。また、情報幾何的な解釈から計算量が削減できることを示す。さらに実データ実験によって対象間の関係の時間変化が抽出できることを確認する。
D2-36: Weighted Jensen-Shannon Divergence規準のランダムフォレストを用いた条件付き分布の推定
発表者: 五十嵐里紗; 關翼人; 日野英逸; 赤穂昭太郎; 村田昇 (早稲田大学; 早稲田大学; 統計数理研; 産総研; 早稲田大学)
概要: 回帰分析における目的変数の条件付き分布をノンパラメトリックに推定する手法を提案する。具体的には与えられたデータ点の重み付き集合で条件付き分布を構成する粒子近似において、データ点の重み付けはランダムフォレストを利用する。分割されるデータ分布間の距離をweighted Jensen-Shannon divergenceで測り、これを決定木の分割規準として採用することで分布の意味での近傍点を纏める.
D2-37: 多様な解像度の補助空間データを用いた空間データの高解像度化
発表者: 田中佑典; 岩田具治; 田中利幸; 倉島健; 大川真耶; 戸田浩之 (NTT サービスエボリューション研究所; NTT コミュニケーション科学基礎研究所; 京都大学 情報学研究科; NTT サービスエボリューション研究所; NTT サービスエボリューション研究 所; NTT サービスエボリューション研究所)
概要: 多種多様な空間データを補助的に活用することにより、対象とする空間データを高解像度化するための確率モデルを提案する。公開されている空間データは、その種類毎に様々な解像度で分割された地図に紐づいている。提案モデルは、ガウス過程回帰を基礎として、補助空間データの予測における不確実性を階層的に組み込むことにより、様々な解像度を持つ補助空間データを効果的に活用することができる。
D2-38: 小型霊長類における動作のマーカレス測定と時空間モデリング
発表者: 三村 喬生; 松本 惇平; 持橋 大地; 島谷 健一郎; 中村 友昭; 長井 隆行; 西条 寿夫; 須原 哲也; 南本 敬史 (量子科学技術研究開発機構; 富山大学; 統計数理研; 統計数理研; 電気通信大学; 電気通信大学; 富山大学; 量子科学技術研究開発機構; 量子科学技術研究開発機構)
概要: 社会的交流は、感情や意図など内部状態の出力と、その内部状態の逆推定からなる。中でも理解の進んでいない非言語プロセスを定量評価するため、脳神経科学分野で社会性モデルとして着目されるマーモセットにおいて、モーションキャプチャ技術を開発した。結果、空間的な視線の向き・身体部位の位置の高解像度測定に成功した。更に、時系列的分節解析により動作単位の教師なし抽出を試みたので、その結果を合わせて報告する。
D2-39: カーネル求積による積分変換の計算
発表者: 園田翔 (理研AIP)
概要: カーネル求積は事後平均を計算するために開発された数値計算法です。カーネル求積では数値計算誤差に対する一様評価が得られます。これを応用して誤差評価付きの積分変換の計算法を提案し、数値実験によって性能を評価します。
D2-40: New Framework of Estimating Labels via Label Propagation and Geodesic k-Nearest Neighbor in Semi-supervised Learning
発表者: Yuichiro WADA; Siqiang SU; Takafumi KANAMORI (Nagoya University; Hong Kong Polytechnic University; Tokyo Institute of Technology)
概要: This paper proposes new label estimating framework in semi-supervised learning. Our method is computationally efficient, and returns more accurate estimation compared to existing methods.
D2-41: Generative Adversarial Networkを用いた複数モードを持つネットワークトラヒックの異常検知
発表者: 浅野秀平; 大木基至 (NTTコミュニケーションズ株式会社; NTTコミュニケーションズ株式会社)
概要: ネットワーク事業者はサービスの安定提供のため、トラヒックの急激な増減を検知したい。しかし、トラヒックのような揺らぎが大きく、複数のモードを持つ時系列データでは、確率密度の推定に基づいた異常検知が難しい。そこで、確率密度の推定を回避し、異常度を直接データから算出する手法としてGenerative Adversarial Network (GAN)に基づく手法を提案する。
D2-42: VGGモデルの視覚野的解釈における解析の検討
発表者: 寺元陶冶; 庄野逸 (電気通信大学; 電気通信大学)
概要: 深層畳み込みニューラルネットワークは哺乳類初期視覚野の知見から構築されたモデルで高い性能を示す。Suzukiら (2017)はNetwork In Network (NIN)[Lin+13]モデルを哺乳類視覚野の方位連続性と関連させた解析を行った。本研究では、VGGモデル[Simonyan+14]の単位構造がNINと類似の構造を持つことに着目し、同様の解析を行う
D2-43: 乱流火災の時空構造の基礎的解明
発表者: 冨上拓光; 八條貴誉 (東京理科大学 工学部 機械工学科; 東京理科大学大学院 工学研究科 機械工学専攻)
概要: 浮力によって誘起される乱流火災の時空構造を解明することは防災工学において非常に重要である。しかし、流体・熱・化学反応などが複雑に作用しあう火災現象に対して、従来では周波数特性に注目した研究が中心となっており、非線形動力学や機械学習を組み合わせた研究例は少ない。そこで、本研究では因果性解析や情報理論、機械学習の観点から乱流火災のダイナミクスの解明を行うことを目的とする。
D2-44: ベイズ的変数選択法に基づく分光スペクトル分解
発表者: 川島 貴大; 庄野 逸 (電気通信大学 情報理工学部; 電気通信大学大学院 情報理工学研究科)
概要: 分光スペクトルのピーク分離に関して、Nagataら (2012)はベイズアプローチに基づいたパラメータ推定法とピーク数選択法を提案した。本研究ではNagataらのモデルを拡張して各ピーク強度のパラメータにspike and slab事前分布を設定し、ベイズ的変数選択の枠組みに基づいてモデリングすることで、ピーク数とパラメータを同時推定することを検討した。
D2-45: 時系列を学習した潜在変数空間を持つVAEと動画のフレーム補間への応用
発表者: 下平 勇斗; 河合 新; 延原 肇 (筑波大学 大学院 システム情報工学研究科 知能機能システム専攻; 筑波大学 システム情報系; 筑波大学 システム情報系)
概要: フレーム間を補間するような画像を生成するために、潜在変数空間が時系列情報を含むように学習させた生成モデルであるVAE型のニューラルネットワークを提案する。提案ネットワークには、補間させたいフレーム間の画像を入力し、潜在変数空間上でその2フレーム間を連続的にサンプリングすることで、フレーム間の補間を実現する。
D2-46: Monte-Carlo Search in Growing Single Rooted Directed Acyclic Graph by Best Arm Identication
発表者: Aurelien PELISSIER; Atsuyoshi Nakamura; Koji Tabata (Hokkaido University; Hokkaido University; Hokkaido University)
概要: We extend MCTS to single rooted directed acyclic graph (SR-DAG), and consider the best arm identification (BAI) problem at the root of both fixed and growing SR-DAG of arbitrary depth.
D2-47: 履歴依存方策と定常方策の組み合わせによる近似モデルベース・ベイジアン強化学習アプローチ
発表者: 菱沼徹; 泉田啓 (京都大学; 京都大学)
概要: ベイズ適応的MDP問題の近似解を得るために、方策空間が制約された問題を扱う。具体的には、エージェントはある時刻までは履歴依存方策を用いることができるが、それ以降では定常方策の集合から一つの方策を選んで用い続けなければならないと制約する。本研究では、履歴依存方策を固定した定常方策の集合の改善・定常方策集合を固定した履歴依存方策の改善の2つの反復により近似解を得る方法を提案し、数値例を通じて検証する。
D2-48: パスワイズ比較によるベイズ最適化
発表者: 山下拓真; 小山裕己; 佐藤一誠 (東京大学大学院情報理工学系研究科; AIST; 東京大学大学院新領域創成科学研究科)
概要: 人間の相対評価をフィードバックとして最適化を行うベイズ最適化に関する研究について発表する。今回、人間がスライダーを使ってフィードバックを返すような状況にに注目し、新たなアルゴリズムを提案した。以前のアルゴリズムでは直線上でしかパラメータを比較できなかったが、本研究ではパラメータが直線に限らない経路の上で比較されるような新たな対話型ベイズ最適化のアルゴリズムを提案し、実験によってその性能を検証した。
D2-49: 行列式強化学習
発表者: Takayuki Osogami; Rudy Raymond (IBM Research – Tokyo; IBM Research – Tokyo)
概要: 複数のエージェントを協調させる強化学習においては、個々のエージェントがそれぞれ適切な行動をするのでは不十分で、それらの行動に多様性が必要なことがある。そこで、半正定値行列の行列式を用いて行動価値関数を近似し、行動の適切さと多様性を表すように行列を学習する手法を提案する。
D2-50: 化学構造式のためのハイパーグラフ文法と分子の最適化への応用
発表者: 梶野洸 (日本アイ・ビー・エム株式会社)
概要: 本研究は、所望の物性を持つ新たな分子の構造の候補を機械学習を用いて発見することを目的とする。変分オートエンコーダ (VAE)を用いることで分子構造の最適化を連続最適化問題として解けるが、この方針では分子グラフを生成するモデルに関して、例えば原子価に関する制約を守ったり三次元的な構造情報を表現する点で課題があった。本研究はグラフ文法を用いてこれらの課題を解決する。
D2-51: Selective Inferenceによる画像セグメンテーション結果の統計的有意性検定
発表者: 谷崎光祐; 稲津佑; 橋本典明; 本谷秀堅; 竹内一郎 (名古屋工業大学; 理化学研究所; 名古屋工業大学; 名古屋工業大学; 名古屋工業大学,理化学研究所,物質・材料研究機構)
概要: 画像データ解析における手法としてセグメンテーションがある。セグメンテーションにより、画像内で似た特徴量を持つグループごとに領域をまとめ、複数の領域に分割することで、特定グループの抽出やグループ単位での解析が可能になる。本研究では、Graph Cutsというセグメンテーション手法適用後の各領域の特徴に関する仮説検定を、Selective Inferenceの枠組みで議論する。
D2-52: 汎化誤差評価によるGANの原理解析
発表者: 今泉允聡; 福水健次 (統計数理研究所; 統計数理研究所)
概要: 本研究では、GAN (Generative Adversarial Network: 敵対的生成ネットワーク)の理解を目指し、理論的な誤差評価を行う。GANは観測データからそれらを生成する測度を推定し新しくデータの生成を行うが、その生成されたデータは特徴量を良く抽出できることが知られている。本研究はデータを生成する測度の性質に注目し、GANが他手法に比べて良く特徴を抽出できる原理の解析を行った。
D2-53: 貪欲法によるマルチタスク特徴選択
発表者: 藤井海斗 (東京大学)
概要: 関連する複数のスパース回帰のタスクを同時に解く問題を考える。この問題は、特徴全体の集合からいくつかの特徴を選び、さらにその中から各タスクのための特徴を選ぶという二段階の最適化問題として定式化できる。既存研究ではこれらを一段階ずつ解くアプローチが用いられていた。本研究では、これらを同時に解く高速な貪欲アルゴリズムを提案し、近似比の保証を与える。さらに、実験によって既存手法に対する優位性を示す。
D2-54: 反復型ラベルなし・ラベルなし分類によるラベルなしデータのみからの二値分類
発表者: 梶 洋隆; 杉山 将 (トヨタ自動車; 理研/東京大学)
概要: ラベルなし・ラベルなし分類 (UU分類)では異なるクラス事前確率を持つ二つのラベルなしデータから二値分類を行う。本論文ではこれを拡張し、一つのラベルなしデータからの分類を試みる。提案手法では、一つのラベルなしデータセットを二つに分割してUU分類を適用し、その結果に対して再びUU分類を適用する、という手続きを収束するまで繰返す。提案手法を数値実験および実問題である眠気予測問題に適用し、その効果を示す。
D2-55: Softmax Bottleneckの再考
発表者: 金井関利; 藤原靖宏; 山中友貴; 足立修一 (NTT ソフトウェアイノベーションセンタ/慶應義塾大学; NTT ソフトウェアイノベーションセンタ; NTT セキュアプラットフォーム研究所; 慶應義塾大学)
概要: 深層学習では出力の活性化関数にsoftmaxが使われている。しかし言語モデルにおいてsoftmaxがモデルの表現能力のボトルネックとなりうることが示唆されている (softmax bottleneck)。本発表ではsoftmax bottleneckを関数の値域から再考しその原因を明らかにする。またこの解析からボトルネックを解消する出力関数を検討する。
D2-56: ベイズ最適化を用いた高感度計測のためのESIパラメータ最適化法の検討
発表者: 石川勇樹 (株式会社島津製作所)
概要: 質量分析装置であるLCMSでは、高感度計測のために化合物毎に各種装置パラメータを最適化する必要があり、パラメータ探索の効率化が望まれている。今回実計測データに対してベイズ最適化の適用を検討し、観測ノイズに対してロバストな探索ができるよう対策し、さらに、感度特性がある程度分かっている条件においてマルチタスクベイズ最適化を適用したことで網羅計測に比べて30倍程効率探索できることを確認した。
D2-57: リーマン多様体上における多変量低ランク回帰モデルの推定
発表者: 吉川 剛平; 川野 秀一 (電気通信大学情報理工学部; 電気通信大学大学院情報理工学研究科)
概要: 多変量回帰モデルにおいて変数選択問題は重要な課題である。本研究の目的は従来手法の推定アルゴリズムの不安定性の改善と推定精度の向上である。本研究では、多変量回帰モデルの枠組みで、低ランク回帰モデルを因子分析の観点からリーマン多様体上でスパース推定をする手法を提案する。実験結果より、提案手法はモデルの変化に対して、より安定した推定精度を示し、提案モデルの有効性が示された。
D2-58: セーフスクリーニングによる最適ルールフィットモデルの学習
発表者: 加藤宏樹; 花田博幸; 竹内一郎 (名古屋工業大学; 名古屋工業大学; 名古屋工業大学,理化学研究所,物質・材料研究機構)
概要: 入力空間中の超直方体で定義される指示関数「ルール」のスパースな線型結合で表される予測モデルの学習について考える。学習データから生成される全てのルール数は膨大であるため、その全てを用いて学習することは困難である。そこで本研究では、凸最適化の枠組みの中でこの問題を解決する手法を提案する。本手法では、提案するセーフスクリーニング法により、得られるモデルの最適性を保証しつつ効率的な学習を可能にした。
D2-59: 高次元L1-ball上でMinimax Regretを達成する新しい事前分布
発表者: 宮口航平; 山西健司 (東京大学; 東京大学)
概要: Minimax regret (MMR)とは仮説集合の複雑さの指標であり、学習問題の難しさを測る上で重要な量である。低次元漸近論においてはJeffreys事前分布がMMRを達成することが知られている。本研究ではL1-ball上の高次元漸近論においてJeffreys事前分布の非最適性を示し、最適レートを達成する新しい事前分布を提案する。応用として、高次元モデルに適した汎化誤差上界を導出する。
D2-60: 双曲空間における測地線更新アルゴリズム
発表者: 榎田洋介; 鈴木惇; 山西健司 (東京大学情報理工学系研究科創造情報学専攻; 東京大学情報理工学系研究科数理情報学専攻; 東京大学情報理工学系研究科数理情報学専攻)
概要: 双曲空間と呼ばれるリーマン多様体が、機械学習において近年注目を集めている。この空間を用いることで、閉路を含まないグラフを構造を保ちつつ、ユークリッド空間よりはるかに低次元の空間へ埋め込んでベクトル表現を得ることができる。本研究ではこの空間での最適化を測地線に沿って更新することを提案し、いわゆる「自然勾配法」との比較を行う。
D2-61: 確率的勾配降下法の収束性について
発表者: 川島孝行; 藤澤洋徳 (総合研究大学院; 統計数理研究所)
概要: 非凸な損失関数および非凸な正則化項の和からなる目的関数を対象とした確率的勾配降下法の大域的収束性について発表を行う。特に、非凸の中でも準凸なクラスの正則化項に注目することで、収束性を証明することが可能になる。また、準凸な正則化項はl0正則化項を含む多くの重要な非凸正則化項を含む。
D2-62: Bidirectional LSTMを用いた日本語氏名の姓名分割
発表者: 奥田裕樹; 髙橋寛治 (Sansan株式会社; Sansan株式会社)
概要: 氏名を構成する名字や名前は個人を特定する上で最も重要な要素であり、誤った姓名の登録や利用はサービス提供者および利用者双方に不利益を及ぼす。本発表では、氏名の文字列に対して正確に分割することを目的として、Bidirectional LSTMを用いた氏名の分割位置の推定を行う。また、実サービスにおいて生じるミドルネームの扱いや多言語対応への展開を論じる。
D2-63: Statistical Logical Relationship Analysis Using Tarone’s Multiple Testing Correction
発表者: 福永津嵩; 岩崎渉 (東京大学大学院情報理工学系研究科コンピュータ科学専攻; 東京大学大学院理学系研究科生物科学専攻)
概要: アイテムの共起関係に基づくデータ解析は、生命情報解析を始め様々な分野で利用される。多数のアイテム間関係を解析する手法としては相関ルール解析が盛んに研究されているが、アイテムの三項間論理関係 (例: AがなくBがある時にCがある。C = (not A) and B)に着目した研究例は限られている。本研究では、Taroneの多重検定補正法を用いて、三項間論理関係を統計的に抽出する手法を提案する。
D2-64: Attention機構を用いた集合データに対する確率的ニューラル回帰モデル
発表者: 武田悠佑; 岩田具治; 澤田宏 (奈良先端科学技術大学院大学; NTTコミュニケーション科学基礎研究所; NTTコミュニケーション科学基礎研究所)
概要: 集合データに対して実数値を与える回帰問題を考える。提案法では、集合の要素ごとに潜在ベクトルを与えてそれらの和を非線形変換するニューラルネットワークに対して、潜在ベクトルの生成を確率的なものへと変更し事前分布を設定することで集合データのスパース性への対応を、Attention機構を導入することで要素間の相互作用を反映した回帰の学習を試みる。
D2-65: Long Short-Term Memoryアンサンブルによる学習曲線の予測
発表者: 尾崎嘉彦; 大西正輝 (産業技術総合研究所・グリー株式会社; 産業技術総合研究所)
概要: 機械学習モデルのハイパパラメータ最適化において、目的関数の評価、すなわちモデルの学習と性能の検証は実行時間に対する支配的な要素である。
本研究は、系列データの回帰に優れたLong Short-Term Memoryをアンサンブルすることにより、機械学習モデルの過去の学習曲線データと現在の学習経過から学習完了時の性能を予測する手法を提案する。
D2-66: Canonical Time Warpingにおける勾配法によるパラメータ最適化の提案
発表者: 河野 圭祐; 小出智士; 沓名拓郎 (豊田中央研究所)
概要: アライメントとは、複数の系列データについて時間方向の伸縮やフレーム落ちなどを考慮して、フレームを揃える操作を指す。次元の異なる2つの多変量データのアライメント手法としてCanonical Time Warping (CTW) が提案されている。既存のCTWでは、Dynamic Time WarpingとCanonical Correlation Analysisを交互に解くことでアライメントを求める。本研究では新たにend-to-endの勾配法によってCTWを解く方法を提案する。人工データを用いた実験により、提案法が既存手法と同程度の解に収束することを確認した。
D2-67: 分布間距離を用いたXNOR-Netの学習手法の改善
発表者: 河野 慎; 大屋 優; 八木 哲志; 中澤 仁 (慶應義塾大学; 日本電信電話株式会社; 日本電信電話株式会社; 慶應義塾大学)
概要: DNNの各層では重みと信号の線形結合が行われている。その効率化のために重みのみ二値化するBWN、重みと信号両方を二値化するBNNが注目されているが、性能悪化の問題がある。BWNとDNNの各層の信号の二乗誤差を小さくする性能改善手法があるが、信号値も二値化するBNNには適用できない。本研究では最も計算効率の高いBNNを性能改善すべく、DNNとBNNとの距離誤差を小さくする手法を提案し、XNOR-Netに適用したときの性能を評価する。
D2-68: 周辺尤度を用いたベイジアンネットワーク分類器のアンサンブル法
発表者: 青見 樹; 植野 真臣 (電気通信大学情報理工学部; 電気通信大学大学院情報理工学研究科)
概要: ベイジアンネットワーク分類器において、サンプル数が十分でないデータセットの分類精度の劣化が問題となっている。本研究では、ベイジアンネットワーク分類器のアンサンブル学習によるベイジアンモデル平均を提案する。複数の分類器を周辺尤度を用いたアンサンブルによって構造を複数学習し、そのベイジアンモデル平均によりクラスを推定することで、評価実験からサンプル数が十分でないデータでの有効性を示すことができた。
D2-69: グラフ上のNP-Hard問題における難しいインスタンスの生成
発表者: 佐藤竜馬; 鹿島久嗣 (京都大学; 京都大学)
概要: NP-hard 問題に対する探索ベースの効率的なアルゴリズムは、多くのインスタンスに対しては高速に動作するが、一部のインスタンスに対しては指数的に大きな時間がかかる。そのようなインスタンスを見つけることは、アルゴリズムの解析やベンチマークの構築にとって有用である。本研究では、評価にかかるステップ数を直接最適化することで難しいインスタンスを生成することを提案する。
D2-70: 潜在ドメインベクトルを用いたゼロショットドメイン適応
発表者: 熊谷充敏; 岩田具治 (NTT; NTT)
概要: 多くの実問題では、学習とテストでデータ分布が変わり得る。これに起因する性能劣化を防ぐため、従来のドメイン適応では、学習時に目標ドメインのデータが利用できることや、目標ドメインを特徴づける付加情報の存在を仮定していた。本研究では、各ドメインを表現する潜在ドメインベクトルを新たに導入することで、目標ドメインの学習データや付加情報がなくとも、目標ドメインに適した教師ありモデルを推論可能な手法を提案する。
D2-71: 敵対強化学習におけるゲームの複雑性の定量評価
発表者: 大嶋真理絵; 中田亨 (産業技術総合研究所 NEC-産総研AI連携研究室; 産業技術総合研究所 NEC-産総研AI連携研究室)
概要: ゲームのルールが増えれば、ゲームの複雑性が増えることは予想がつくが、その量を一般的に論じることは難しい。本発表では、具体例として、鬼ごっこゲームでの敵対強化学習において、ルールを増やした場合にエージェントの学習する方策がどのように異なったか、実験結果を報告する。また、異なるルールにおいてエージェントが獲得した各方策を比較し、ゲームのルールと学習した方策の複雑性の関係と検討方法について考察する。
D2-72: 教師付解釈学習
発表者: Hirotaka Akita; Hisashi Kashima (Kyoto University; Kyoto University)
概要: 深層学習の課題の一つに解釈困難性が挙げられる。現在では解釈性を高めるさまざまな方法が開発されており、その一つに予測の根拠を示すという手法がある。我々は、予測対象のラベルと併せてその根拠が訓練データとして与えられる状況を想定し、両者から予測精度と解釈性の両方を高めるように学習する「教師付解釈学習」問題を考え、いくつかのアプローチを実験的に比較する。
D2-73: トラッキングズレを含むデータのマイニング
発表者: 楜澤信 (AGC株式会社)
概要: 製造工程の欠点の解析において、個々の製品の検査結果と加工データの紐付けが必須であるが、トラッキングのズレによりその紐付けがずれてしまうことがある。本研究では、正しいアノテーションができている方が、欠点と良品の弁別性が上がるという仮定のもと、最適化手法によりトラッキングズレを推定する手法を提案し、モデルデータにより可能性を検証を行った。
D2-74: クラウドソーシングを利用した階層マルチラベル分類の品質管理
発表者: 竹岡邦紘; 小山田昌史 (NEC; NEC)
概要: 階層マルチラベル分類ではラベル数が膨大となる場合があり、クラウドソーシングのプラットフォーム上でアノテータがすべてのラベルを付与することは困難である。アノテータがつけたラベルの品質を改善するために、ラベル間の階層構造を利用して、各サンプルに対応するラベルの推定と、アノテータとタスクの特徴の推定を交互に行う。本発表では、この課題に対するモデルと推論方式を提案する。
D2-75: 過剰エントロピー生成最小化としての拡張Contrastive Divergence法によるRNNの学習
発表者: 山本峻平; 金子邦彦 (東大総合文化研究科)
概要: 近年、ボルツマンマシンの学習に用いられるContrastive Divergence (CD)法が、統計力学の観点からは、入力分布から平衡状態への緩和過程のエントロピー生成の最小化と見なせることが分かってきた。我々はこの観点から、非平衡定常状態への緩和の不可逆性の指標となる過剰エントロピー生成と呼ばれる量を擬似的に最小化することでCD法を拡張しRNNの学習を行う手法を提案する。
D2-76: Direct Feedback Alignmentの解析
発表者: 市川航平; 金子邦彦 (東京大学総合文化研究科; 東京大学総合文化研究科)
概要: 深層学習において近年、誤差逆伝播法に代わる生物学的に妥当性の高い学習アルゴリズムの研究が活発になっている。その中にDirect Feedback Alignmentと呼ばれるアルゴリズムがあるが、それがどのようなメカニズムで学習を成功させているのかについては未解明な部分が多い。今回は学習途中のダイナミクスに着目することでDFAがどのような情報処理を実現させているのかについて議論したい。
D2-77: On the Minimal Supervision for Training Any Binary Classifier from Only Unlabeled Data
発表者: Nan Lu; Gang Niu; Aditya K. Menon; Masashi Sugiyama (The University of Tokyo; RIKEN; Australian National University; RIKEN)
概要: We study training binary classifier from only unlabeled (U) data by Empirical risk minimization (ERM). We propose an ERM-based learning method from two sets of U data, and then prove it is consistent. Experiments demonstrate the proposed method could train deep models and outperform state-of-the-art methods for learning from two sets of U data.
D2-78: Co-teaching: Robust Training Deep Neural Networks with Extremely Noisy Labels
発表者: Bo Han, Quanming Yao, Xingrui Yu, Gang Niu, Miao Xu, Weihua Hu, Ivor Tsang, Masashi Sugiyama (1Center for Artificial Intelligence, University of Technology Sydney 2Australia Center for Advanced Intelligence Project, RIKEN, Japan 3 4Paradigm Inc., Beijing, China 4Graduate School of Frontier Sciences, University of Tokyo, Japan)
概要: In this paper, we present a new paradigm called “Co-teaching” combating with noisy labels. We train two networks simultaneously. First, in each mini-batch data, each network filters noisy instances based on memorization effects. Then, it teaches the remained
instances to its peer network for updating the parameters.
D2-79: Masking: A New Perspective of Noisy Supervision
発表者: Bo Han, Jiangchao Yao, Gang Niu, Mingyuan Zhou, Ivor Tsang, Ya Zhang, Masashi Sugiyama (1Center for Artificial Intelligence, University of Technology Sydney, Australia 2Center for Advanced Intelligence Project, RIKEN, Japan 3Cooperative Medianet Innovation Center, Shanghai Jiao Tong University, China 4McCombs School of Business, The University of Texas at Austin, USA 5Graduate School of Frontier Sciences, University of Tokyo, Japan)
概要: It is important to learn classifiers under noisy labels due to their ubiquities. In this paper, we present a human-assisted approach called masking which conveys human cognition of invalid class transitions, and naturally speculates the structure of the noise transition matrix. Given the structure information, we only learn the noise transition probability to reduce the estimation burden.
D2-80: ベイズ最適化を用いた多次元ヒストグラムのビン数最適化
発表者: 武藤健介; 坂本浩隆; 永田賢二; 有馬孝尚; 岡田真人 (東大; 東大; 産総研; 東大; 東大)
概要: J-PARCのチョッパー分光器による中性子散乱実験により、4次元中性子散乱イベントデータが大量に得られている。得られたデータの前処理として、従来は研究者が経験的にビン数を決め、データのヒストグラム化を行ってきた。そこで本研究では、ベイズ最適化を用いた多次元ヒストグラムのビン数最適化手法の提案を行う。本研究では、4次元人工データに対しビン数最適化を行い、ベイズ最適化の適用により削減できる計算量について論じる。
D2-81: 単語ベクトルを利用した文書の教師なし行列表現
発表者: 福井一輝; 下平英寿 (京都大学/理研AIP; 京都大学/理研AIP)
概要: 訓練済みの単語ベクトルを使用した文書の教師なしベクトル表現を得る手法として、文書を構成する単語のベクトルの重み付け和を用いる手法などが提案されている。本発表では、文書を構成する単語ベクトルを並べた行列に対して左右から次元削減を行うことで文書を比較的小さい行列で表現する方法を提案する。これは、既存研究における単語ベクトルの重み付け和を用いたベクトル表現の拡張としても解釈できる。
D2-82: テクスチャ画像識別問題に対するフーリエ変換を用いたデータ拡張の検討
発表者: 新田大悟; 庄野逸 (電気通信大学)
概要: CT画像等の医療画像は十分な量のラベル付き学習データを確保するのが難しく、深層学習に適用困難なケースも多い。本研究では、この問題に対応するためにCT画像のようなテクスチャ画像に対するデータ拡張手法を検討する。ここでは、学習データ画像をフーリエ空間で分解し、合成の組み合わせでデータ拡張を行うことを提案する。この手法を用いて識別の学習を行った結果、通常の線形変換と同等の性能が得られた。
D2-83: 強化学習における未知環境での最適状態価値関数の効率的推論に向けた検討
発表者: 榎本昌文; 岡留剛 (関西学院大学; 関西学院大学)
概要: 有限マルコフ決定過程 (MDP)において、遷移確率の変化によって最適状態価値がどれほど変化するかを調べるためには、実際に最適状態価値を求める必要がある。本研究では実際の最適状態価値を使用せずに、異なる遷移確率を持つ有限MDP間の最適状態価値に関する類似度指標を提案する。簡単な実験を通じて、提案する類似度指標の有効性を示す。また遷移確率の変化と類似度指標との対応関係について議論する。
D2-84: Total Stochastic Gradient Algorithms with Application to Model-based Reinforcement Learning
発表者: Paavo Parmas (Okinawa Institute of Science and Technology Graduate University)
概要: I discuss my ICML’18 and NIPS’18 papers about model-based reinforcement learning using Monte Carlo particle predictions. I created an intuitive graphical framework for deriving gradient estimators on graphs and describe novel policy gradients. The methods are robust to issues with chaotic dynamics, sometimes improving the gradient accuracy by 10^6 times, and allow reliable and efficient learning.
D2-85: テンソルネットワークを用いた教師あり学習
発表者: 新谷祐矢; 笹川佳則 (神戸大学; 神戸大学)
概要: テンソルネットワークは高次元テンソルの効率的な表現手法である。近年、量子多体物理学の分野で考案されたこの手法が機械学習の分野でも注目されている。その一例が、非線形カーネル学習で現れる高次元テンソルをテンソルネットワークを用いて表現する学習手法である。本研究では、テンソルネットワークによる教師あり学習について、回帰と分類のそれぞれのタスクについて評価を行う。
D2-86: ガウス過程回帰を用いた適応的物性スペクトル測定
発表者: 大塚琢馬; 若林勇希; 谷保芳孝; 山本秀樹; 澤田宏 (NTT; NTT; NTT; NTT; NTT)
概要: 新規物質の創成には合成した物質の物性を効率よく測定することが重要である。本発表では物性を表すスペクトルの測定に際し、ガウス過程による予測に基づいて適応的に測定点を選択する手法について述べる。物性測定にはスペクトルのピーク構造が特に重要なため、少ない測定点でピーク構造を捉える手法が望ましい。さまざまな種類の物質や測定法のスペクトルを用いた実験を通じて有効な測定点の選択基準を議論する。