ポスターセッション


ポスターセッション1 (11/17 (月) 17:00 – 20:00)

ポスター番号 タイトル
著者
T-01 部分並列干渉除去法の疎信号復元問題への応用
竹田晃人(茨城大)・田中利幸(京大)
プレビュー資料
T-02 Restricted Boltzmann Machineを用いた画像分類のための特徴抽出
須田玲輝・竹田晃人(茨城大)
プレビュー資料
T-03 標本マハラノビス距離の主成分要素の確率分布の近似モデル ~ 個々の主成分要素とその部分和について ~
小林靖之(帝京大)
プレビュー資料
T-04 経験最尤法および経験部分ベイズ学習法の理論解析
中島伸一(ベルリン工大)・杉山 将(東大)
プレビュー資料
T-05 確率質量関数の二次展開と単回帰に基づくエントロピー推定
日野英逸(筑波大)・越島健介(リクルート)・村田 昇(早大)
プレビュー資料
T-06 Importance-Weighted Covariance Estimation for Robust Common Spatial Pattern

Alessandro Balzi(PoliMi)・Florian Yger・Masashi Sugiyama(UTokyo)
プレビュー資料
T-07 Breakdown Point of Robust Support Vector Machine
Takafumi Kanamori(Nagoya Univ.)・Fujiwara Shuhei・Akiko Takeda(Univ. of Tokyo)
プレビュー資料
T-08 Unweighted graphに対する機械学習の限界と可能性 ~ Random geometric graphの観点から ~
寺田吉壱(NICT)・Ulrike von Luxburg(UHH)
プレビュー資料
T-09 Wolfe の最小ノルム点アルゴリズムによる SVM 学習
北村昌士・武田朗子・岩田 覚(東大)
プレビュー資料
T-10 二次正則化分類学習のためのLeave-one-out cross-validationの高速化
奥村翔太・鈴木良規・小川晃平・新村祐紀・竹内一郎(名工大)
プレビュー資料
T-11 フィッシャーの線型判別分析の幾何学
藤木 淳・田中 勝(福岡大)・坂野 鋭(NTTデータ)・木村昭悟(NTT)
プレビュー資料
T-12 Heuristic principal component analysis based unsupervised feature extraction and its application to bioinformatics
Y-h. Taguchi(Chuo Univ)
プレビュー資料
T-13 クラウドセンシングにおける差分プライバシーを保証した線形回帰モデル学習
チャン クワン カイ・福地一斗・佐久間 淳(筑波大)
プレビュー資料
T-14 文脈自由文法に基づいた復元的ニューラルネット
濱口拓男・新保 仁・松本裕治(奈良先端大)
プレビュー資料
T-15 Multitask learning meets tensor factorization: task imputation via convex optimization
Kishan Wimalawarne(Tokyo Tech)・Masashi Sugiyama(UTokyo)・Ryota Tomioka(TTIC)
プレビュー資料
T-16 過完備基底を用いた歪有圧縮の統計力学的解析
中西 (大野 義典(東大)・小渕智之(東工大)・岡田真人(東大)・樺島祥介(東工大) )
プレビュー資料
T-17 Direct density ratio estimation using convolutional neural networks with application in outlier detection
Hyunha Nam(Tokyo Tech)・Masashi Sugiyama(UTokyo)
プレビュー資料
T-18 密度微分推定とKLダイバージェンス近似への応用
佐々木博昭(東大)・Yung-Kyun Noh(KAIST)・杉山 将(東大)
プレビュー資料
T-19 An Online Policy Gradient Algorithm for Continuous State and Action Markov Decision Processes with Bandit Feedback
Yao Ma(Tokyo Tech)・Masashi Sugiyama(UTokyo)
プレビュー資料
T-20 確率伝搬法の効率的な計算法とCDMAマルチユーザ検出への適用
栗谷亜理世・田中利幸(京大)
プレビュー資料
T-21 Target Shift Adaptation for Conditional Density Estimation and Regression
Duong Tuan Nguyen(TokyoTech)・Marthinus Christoffel du Plessis・Masashi Sugiyama(UTokyo)
プレビュー資料
T-22 補助関数法に基づく制約付きボルツマンマシンの学習アルゴリズム
高宗典玄(東大)・亀岡弘和(東大/NTT)
プレビュー資料
T-23 多チャンネル階乗隠れマルコフモデルによる音響情景分析のための統合的アプローチ
樋口卓哉(東大)・亀岡弘和(東大/NTT)
プレビュー資料
T-24 Regularized multi-task learning for multi-dimensional log-density gradient estimation
Ikko Yamane(Tokyo Tech)・Hiroaki Sasaki・Masashi Sugiyama(UTokyo)
プレビュー資料
T-25 Online Direct Density-ratio Estimation under the Kullback-Leibler Loss
Marthinus Christoffel du Plessis(UTokyo)・ Hiroaki Shiino(TokyoTech)・Masashi Sugiyama(UTokyo)
プレビュー資料
D-01 Analysis of Fraudulent Bidder’s Behaviors
Phiradet Bangcharoensap (Tokyo Institute of Technology)・ Hayato Kobayashi ( Yahoo Japan Corporation)・ Nobuyuki Shimizu ( Yahoo Japan Corporation)・ Satoshi Yamauchi ( Yahoo Japan Corporation)
概要 表示/非表示 | プレビュー資料

This research evaluates the potential of bidders to be a fraudster.
Fraudsters frequently bid in auctions hosted by particular sellers. We
hypothesize they can be revealed via pseudo-clique structure.

D-02 Bag-of-Wordsデータ分類のための潜在サポートメジャーマシン
吉川友也 (奈良先端科学技術大学院大学)・岩田具治 (NTTコミュニケーション科学基礎研究所)・澤田宏 (NTTサービスエボリューション研究所)
概要 表示/非表示 | プレビュー資料

BoWデータのための非線形識別学習法を提案する。
提案法では,各単語に潜在ベクトルを割当て,BoWで表現される文書データを単語の潜在ベクトルの分布として表現する。
単語の潜在ベクトルと分布間のカーネルに基づく識別関数を識別性能を向上させるように同時に学習することにより,問題に対して適切な単語のベクトル表現を得るとともに,未知データへの高い識別性能を達成することを示す。

D-03 Bandit-Based Task Assignment for Heterogeneous Crowdsourcing
Hao Zhang (Tokyo Institute of Technology)・ Masashi Sugiyama ( University of Tokyo)
概要 表示/非表示 | プレビュー資料

We consider a task assignment problem in heterogeneous crowdsourcing and propose a contextual bandit formulation to deal with the exploration-exploitation trade-off for worker selection.

D-04 DeepAutoencoderとRNNを併用した,加速度データからの行動認識
横山晃 (関西学院大学理工学部人間システム工学科)・角所考 (同)・岡留剛 (同)
概要 表示/非表示 | プレビュー資料

リカレントニューラルネットワーク(=RNN)は時系列情報を処理することが出来, 行動データの認識に有用であると考えられる.しかしながらRNNの学習には入力次元数と時系列長に対して膨大な計算時間が必要である.本研究ではDeepAutoencoderにより次元数を圧縮したデータをRNNの入力とすることで実用可能な計算時間で行動加速度データの分類を行い,その結果高い正答率を達成した.

D-05 確率分布の変化開始点の検知について
宮口 航平 (東京大学)・ 山西 健司 ( 東京大学)
概要 表示/非表示 | プレビュー資料

時系列データからの変化点検知研究において, 従来では変化が突発的に起こる場合を問題にしていた. しかし, 変化が緩やかに起こる場合に, その開始点を精度良く検知することは困難であった. 本研究では, 確率分布のパラメタとその変化を同時に推定し, 新たな変化スコアを定義することにより, 変化の開始点を精度良く検知する新しいアルゴリズムを提案する.また既存手法との比較により, 本手法の有効性を示す.

D-06 DNF列挙を用いた論理2値属性の自動生成
楠村幸貴 (NEC)・和佐州洋 (北海道大学)・藤巻遼平 (NEC)
概要 表示/非表示 | プレビュー資料

本発表では,予測問題において,解釈性の高い属性を自動的に生成することを目的とし,2値属性を論理演算子で結合したDNF属性を列挙しつつ有効なものを自動生成するフレームを提案する.このためには,DNF列挙と属性選択を効率良く行う必要がある.本発表では,DNFの列挙を省メモリで高速に実現するBaloons法を示し,オンライン属性選択手法であるGraftingを用いた実験結果を報告する.

D-07 Fully-Automatic Bayesian Piecewise Sparse Linear Models
江藤 力 (NEC)・ 藤巻 遼平 ( NEC)・ 森永 聡 ( NEC)・ 玉野 浩嗣 ( NEC)
概要 表示/非表示 | プレビュー資料

区分線形モデルは解釈性と予測精度のバランスが良く,精度の保守や知識発見などの観点から,予測分析事業では広く用いられている.このモデルは分割構造の推定と線形モデル内での属性選択という2つのモデル選択問題を同時に解く必要があり,本研究では因子化漸近ベイズ推論を拡張することでこれを解決する.また,予測精度を向上させるための事後確率最適化法の提案,ベンチマークテスト結果や電力消費量予測への適用結果を示す.

D-08 gplsによる薬の候補探索
邵正 (九州工業大学大学院)・ 西郷浩人 ( 大学院情報工学研究院)
概要 表示/非表示 | プレビュー資料

薬を設計する過程の一つにバーチャルスクリーニングというものがある。計算機によって予測された活性の高い,薬になりそうな化合物だけを生成する方法が必要である。本研究は複数のターゲットを利用出来るような部分最小二乗回帰(PLS)に基づくグラフマイニング手法を開発した。その結果,構築したモデル は,実際の相互作用の多い薬に発見した。

D-09 Implicit feedbackにおける人気バイアスを考慮した推薦システム
風間正弘 (東京大学大学院学際情報学府)・谷田部治明 (リクルートキャリア)・佐藤一誠 (東京大学情報基盤センター)・中川裕志 (東京大学情報基盤センター)
概要 表示/非表示 | プレビュー資料

Implicit feedbackとは,Web上での閲覧履歴などのユーザの行動履歴のことである。近年,データベースの発展に伴い,これらのデータが大量に集まるようになり,推薦システムの構築にも用いられるようになった。しかし,構築された推薦システムは,人気のあるアイテムを過剰に推薦してしまうという問題がある。本研究では,この人気バイアスに対処した推薦システムを提案する。

D-10 Intrinsic Principal Component Analysis for Symmetric Positive Definite Matrices
Inbal Horev (Tokyo Institue of Technology)・ Florian Yger ( University of Tokyo )・ Masashi Sugiyama (UTokyo)
概要 表示/非表示 | プレビュー資料

We discuss an intrinsic PCA for SPD matrices compressing but retaing the Riemannian manifold structure of this features. Such an algorithm should be usefull for EEG and images processing applications.

D-11 i-vectorを用いたスペクトラルクラスタリングによる雑音環境下話者クラスタリング
俵直弘 (早稲田大学)・ 小川哲司 (早稲田大学)・ 小林哲則 (早稲田大学)
概要 表示/非表示 | プレビュー資料

雑音環境下における話者クラスタリングを実現するため,発話から算出したi-vector間のコサイン類似度を尺度として用いたスペクトラルクラスタリング法を導入した.日本語話し言葉コーパスにノイズを人工的に付加し作成した擬似的な雑音環境下音声に対し本手法を適用することで,本手法がクリーンな環境下と同等の精度で雑音環境下の音声をクラスタリングできることを示した.

D-12 Jubatusを用いた運転行動データの継続的収集と利用のための情報処理基盤
竹中一仁 (株式会社デンソー)・坂東誉司 (株式会社デンソー)・森真貴 (株式会社デンソー)
概要 表示/非表示 | プレビュー資料

多様なセンサの車両への搭載が進むにつれ,日常的な運転行動データを収集および解析する自然主義的運転行動研究や,データに基づいてより先進的な運転支援を目指すデータセントリックITSが盛んになってきた.ここでは,そのような大規模な運転行動データを継続的に収集し利用するための処理基盤として,ノンパラメトリックな記号化アプローチに基づきデータの処理と蓄積を行うフレームワークを提案する.

D-13 K-SVDと空間プーリングを特徴抽出に用いたパターン認識器
杉田 寛樹 (電気通信大学)・佐々木 博昭 (東京大学)・庄野 逸 (電気通信大学)
概要 表示/非表示 | プレビュー資料

パターン認識システムにおける特徴抽出器は入力の性質に基づき提案されることが望ましいが,データの次元が大きくなると,ハンドメイドで設計するには困難が伴う.このため特徴をデータから自動的に抽出する方法が必要である.本研究では,この特徴抽出器の設計問題に対して K-SVDと呼ばれる辞書学習の手法を導入し,得られた表現に空間プーリングを用いて次元圧縮したものを特徴として用いることを試みた.

D-14 L2,1+L2正則化付きParametric Task Learning を用いた分位点回帰分析
加藤寛揮,鈴村真矢,竹内一郎 (第一著者所属)
概要 表示/非表示 | プレビュー資料

本論文では複数の分位点回帰分析の同時推定を行う問題を考察する. マルチタスク学習(MTL) の拡張手法であるパラメトリックタスク学習(PTL) にL2,1+L2正則化を加えたアプローチを提案しその有効性を検証する .

D-15 maf: 機械学習・データマイニング実験ビルドシステム
得居誠也 (株式会社Preferred Networks)・能地宏 (総合研究大学院大学/国立情報学研究所)・大野健太 (株式会社Preferred Networks )
概要 表示/非表示 | プレビュー資料

機械学習では実験手順をスクリプトで記述するのが一般的だが,その品質は軽視されがちである。メンテナンス性の悪い実験スクリプトは,効率的な試行錯誤の障壁となる。mafは機械学習の典型的で煩雑な作業を簡略化する実験ビルドツールである。データセット分割,様々なパラメータでの交差検定,結果可視化の一連の作業を10数行で実現できる。今回はmafの基本機能を解説し,自然言語処理,深層学習での利用例を紹介する。

D-16 Nonlinear Tensor Decomposition using Generative Topographic Mapping
比嘉 一志 (九州工業大学大学院生命体工学研究科)・岩崎 亘 (九州工業大学大学院生命体工学研究科)・古川 徹生 (九州工業大学大学院生命体工学研究科)
概要 表示/非表示 | プレビュー資料

生成位相写像(GTM)は非線形の構造を持つベクトルの集合から多様体を学習し,その生成元の地形図を獲得するアルゴリズムである.本研究では,GTMを拡張し非線形テンソル分解手法の開発を行う.本稿では,複数の独立した潜在空間を仮定し,EMアルゴリズムによる近似を用いてアルゴリズムの導出を行った.また,実データへの応用として,アンケートデータの解析を行った.

D-17 Paragraph Vectorを用いたウェブユーザーのモデリング
田頭幸浩 (ヤフー株式会社)・小野真吾 (ヤフー株式会社)・田島玲 (ヤフー株式会社)
概要 表示/非表示 | プレビュー資料

大規模なウェブサイトには多岐にわたる内容のウェブページが存在し,日々多くのユーザーが訪れている。本発表ではParagraph Vector (Le & Mikorov 2014) を用いて,ウェブページ訪問の系列からユーザーの分散表現を獲得する手法を提案する。得られた分散表現をさまざまな分類タスクに適用し,その有用性を確認した。

D-18 Ratio Matching法の拡張
木脇太一 (東京大学工学系研究科)・合原一幸 (東京大学生産技術研究所)
概要 表示/非表示 | プレビュー資料

Ratio Matching(RM)は分配関数の評価を必要としない離散状態確率モデル学習法である.RMは近傍探索に基づいており,任意の状態をとる確率が非零となる場合に最尤推定に一致する.しかし多モードからなるデータでは,モードの比を学習することが困難となる.本研究では近傍探索に加え異なるデータ点の確率の差を評価することで最尤推定との理論的な一致性を維持しつつ,モード比の学習が可能となることを示す.

D-19 SNP間相互作用を効率的に検出するアルゴリズム開発
山口拓郎 (九州工業大学大学院情報工学府情報創成専攻)・西郷浩人 (九州工業大学大学院情報工学研究院 生命情報工学研究系准教授)
概要 表示/非表示 | プレビュー資料

ヒトのDNA配列全体の約0.1 %はSNPと呼ばれ,SNP複数個の組み合せが,個体差や遺伝子疾患の原因の一つと考えられている。SNPの組み合わせを全て調べることが出来れば,個体差の原因SNPを発見できるが,全ての組み合わせを網羅するには膨大な時間がかかってしまう。本研究では,SNP間相互作用がありそうな組み合わせだけを検出するアルゴリズムを開発し,演算時間の短縮を目指す。

D-20 Soft-ProjectionによるGRNNの制限付きオンライン学習法
加藤晶久 (中部大学工学部情報工学科)・山内康一郎 (中部大学工学部情報工学科)
概要 表示/非表示 | プレビュー資料

従来のオンライン学習法では,カーネル数が限界に達すると,カーネルの置き換えや既存のカーネル空間に学習サンプルを射影するなどの手法を用いて学習を進めてきた。しかし,この射影による忘却を防ぐことはできない。そこで本手法ではこの射影の度合いを調節することにより古い記憶の忘却と新しく学習する記憶とのバランスを計算し学習を進めることで累積誤差の低減を目指す。

D-21 Sparse Latent Dirichlet Allocation with Collapsed Factorized Asymptotic Bayesian Inference
Yusuke Muraoka (NEC Corporation)・ Ryohei Fujimaki ( NEC Laboratories America)・ Issei Sato ( University of Tokyo)
概要 表示/非表示 | プレビュー資料

各トピックの疎性を表現したトピックモデル(Wang(2009)と類似のモデル)に対する効率的なモデル選択アルゴリズムを提案する。Fujimaki(2012)で提案されたfactorized asymptotic Bayesian (FAB) inferenceを拡張することでトピックモデルに適用可能にし,計算量,perplexityの面で優れることを確認した。

D-22 tanh関数を正則化項に用いた圧縮センシングの信号復元法
宇田新介 (九州大学 生体防御医学研究所 )
概要 表示/非表示 | プレビュー資料

圧縮センシングでは,原信号がゼロ成分を多く含む疎らな信号であることを事前知識として用いて圧縮表現から原信号を復元するが,主な復元法のひとつにl1ノルム正則化を用いる方法がある.本研究では,l1ノルム正則化項内にtanh関数を適用し,shooting法に基づく復元アルゴリズムを開発した.数値実験による性能評価を行い,復元信号の平均2乗誤差がl1ノルム正則化より本手法の方が小さい結果が得られた.

D-23 Thompson Samplingによるベイズ的最適化
南 賢太郎 (東京大学大学院情報理工学系研究科)・小宮山 純平 (東京大学大学院情報理工学系研究科)・佐藤 一誠 (東京大学情報基盤センター)・中川 裕志 (東京大学情報基盤センター)
概要 表示/非表示 | プレビュー資料

本研究では,多腕バンディット問題におけるThompson samplingに類似した,事後確率からのサンプリングによるベイズ的最適化アルゴリズムを提案し,その性能について論じる。提案手法の特徴としては,既存のGP-UCB [Srinivas+2010] 等のアルゴリズムと比較すると,実行に際してパラメータを設定する必要がないことが挙げられる。

D-24 αダイバージェンスを用いたボルツマンマシンのパラメーター推定
竹之内高志 (はこだて未来大学)
概要 表示/非表示 | プレビュー資料

ボルツマンマシンに対する最尤推定量は陽には求まらないため勾配法を用いることになるが, 勾配の計算に必要な正規化項を求めるためには指数オーダーの計算量が必要となる. 本研究では, αダイバージェンスを用いることで, 正規化項の計算をすることなく構成可能なボルツマンマシンのパラメーターの推定量を提案する.

D-25 カーネルに基づく特徴表現学習による遺伝子エッセンシャリティ予測:ドリームチャレンジ2014参加報告
烏山昌幸 (京都大学)・馬見塚拓 (京都大学)
概要 表示/非表示 | プレビュー資料

ドリームチャレンジはバイオインフォマティクス,システムズバイオロジー分野における世界最高水準の国際データ解析コンペティションである.筆者らのチームはドリームチャレンジ2014遺伝子エッセンシャリティ予測に参加し,カーネルに基づく特徴表現学習を用いて予測精度の部門において【第1位】を記録した.本発表ではチャレンジの機械学習としての問題設定と我々のアプローチについて議論する.

D-26 カーネル密度推定と融合した最適非線形フィルタの提案
田所 幸浩 (株式会社豊田中央研究所)
概要 表示/非表示 | プレビュー資料

非常に強い雑音環境から微弱な信号を取り出す問題に対して,理論限界を達成する最適な非線形フィルタが提案されている。本フィルタ特性を決めるためには雑音の確率密度関数の推定が必要となる。本検討では,Epanechnikovカーネルを用いたカーネル密度推定という,本フィルタに適した推定手段を議論する。特に,推定精度を決めるバンド幅について,最大精度を与える本フィルタの特徴を活かした決定方法を示す。

D-27 スパース学習による主成分回帰モデル
川野秀一 (電気通信大学)・藤澤洋徳 (統計数理研究所)・高田豊行 (国立遺伝学研究所)・城石俊彦 (国立遺伝学研究所)
概要 表示/非表示 | プレビュー資料

主成分回帰とは,主成分分析を実行し説明変数の個数をある程度まで減らしてから回帰分析を行うという2段階法である.本報告では,主成分分析に関連した損失関数と回帰誤差の損失関数の重み付き和を全体の損失関数とし,適当なL1型正則化法を導入することにより,1段階法による主成分スコアを説明変数にした回帰モデルを提案する.また,数値実験を通して提案手法の有効性を検証する.

D-28 ディスプレイ広告の画像特徴量を用いたクリック率予測
山元浩平 (東京大学)・茂木哲矢 (ヤフー株式会社)・田頭幸浩 (ヤフー株式会社)・小林隼人 (ヤフー株式会社)・小野真吾 (ヤフー株式会社)
概要 表示/非表示 | プレビュー資料

コンテンツ連動型広告において,コールドスタート問題は主要な問題の一つである.本発表では,広告画像から畳み込みニューラルネットワーク等により画像特徴量を抽出し,それらを用いて画像広告のクリック率やユーザプロファイルを推定・補完することで,履歴の乏しい広告やユーザに対しても有効にクリック率予測を行う手法を提案する.また,公開されているデータセットを用いて評価実験を行ない,提案手法の有効性を確認した.

D-29 データの能動的獲得に基づく一般化情報量最大化学習
早川隆 (京大医)・青柳富誌生 (京大情報)
概要 表示/非表示 | プレビュー資料

情報量最大化学習は与えられたデータから情報理論的に最適な特徴抽出を得る方法であり,様々な応用が考えられている。しかしながらデータを能動的に獲得する能動学習や強化学習の文脈では,得られる情報量が特徴抽出の性能だけでなくデータの獲得方法にも依存するため,既存のアルゴリズムは適用できない。そこで発表者は,データ獲得方法と特徴抽出の両方を同時に最適化する情報量最大化アルゴリズムを導出したので報告する。

D-30 ノードの情報を考慮したネットワークのコミュニティ構造抽出
小林 拓人 (東北大学大学院情報科学研究科)・ 片岡 駿 ( 東北大学大学院情報科学研究科)・ 安田宗樹 ( 山形大学大学院理工学研究科)・ 田中和之 ( 東北大学大学院情報科学研究科)
概要 表示/非表示 | プレビュー資料

実在するネットワークではそれを構成する各ノードは無個性なものでなく,それぞれが少なくない情報を持っている.
本研究ではノード同士の繋がり方だけでなく各ノードが持つ情報も特徴値として確率モデルに組み込み,より効果的なコミュニティ構造の抽出を行う.
計算にはEMアルゴリズム及び確率伝搬法と呼ばれる近似計算手法を用いており,大規模なネットワークに対しても現実的な時間で計算を行える.

D-31 ブロック座標降下法による画像の領域分割と密なステレオ視差の同時推定
山口晃一郎 (株式会社豊田中央研究所)・ David McAllester ( Toyota Technological Institute at Chicago)・ Raquel Urtasun ( University of Toronto)
概要 表示/非表示 | プレビュー資料

本稿では,ステレオ画像から領域分割と密な視差を同時に推定する方法を提案する.提案手法では,離散変数で表される領域分割問題と,連続変数で表されるステレオ視差推定問題を同時に最適化するため,統合エネルギー関数を定義し,ブロック座標降下法により同時推定する。実ステレオ画像データを用いた実験において,高精度な推定を効率的に計算可能であることを確認した.

D-32 ベイズ的最適化に基づく能動学習の性能改善
梁 曽漢 (東京大学大学院情報理工学系研究科)・小宮山 純平 (東京大学大学院情報理工学系研究科)・佐藤 一誠 (東京大学情報基盤センター)・中川 裕志 (東京大学情報基盤センター)
概要 表示/非表示 | プレビュー資料

従来の一括型能動学習では, 学習器のハイパーパラメタが固定された前提でデータ点を逐次的に取得するが, 取得されたデータ集合に対し適切なハイパーパラメタをその都度チューニングを行うのが望ましいと考えられる.
本研究では, 一括型能動学習に対しベイズ的最適化を用いたハイパーパラメタチューニング手法を提案し, その汎化性能に関する考察を行い, さらに実データにおける優位性を実験的に確認した.

D-33 ベイズ的最適化を用いたDeep Learningによる医用画像からの病変検出
牛丸 太希 (東京大学情報理工学系研究科)・ 佐藤 一誠 ( 東京大学情報理工学系研究科)・ 中川裕志 ( 東京大学情報理工学系研究科)・ 小宮山純平 ( 東京大学情報理工学系研究科)・野村 行弘 ( 東京大学医学部附属病院 コンピュータ画像診断学/予防医学講座)・ 花岡 昇平 ( 東京大学医学部附属病院 放射線科)・ 根本 充貴 ( 東京大学医学部附属病院 コンピュータ画像診断学/予防医学講座)・ 林 直人 ( 東京大学医学部附属病院 コンピュータ画像診断学/予防医学講座)
概要 表示/非表示 | プレビュー資料

CTやMRIによって得られる人体の3D画像から病変を自動的に計算するシステムが現在注目されている。本研究ではDeepLearningによって3D画像から特徴量を自動的に学習することによって検出率の向上を目指す。またDeepLearningのハイパーパラメータのチューニングに際しては,ベイズ的最適化を用いた自動チューニングを採用した。

D-34 マルチタスク学習を使用したテキスト広告のクリック率予測精度向上
高木 潤 (ヤフー株式会社)・田頭 幸浩 (ヤフー株式会社)・山本 浩司 (ヤフー株式会社)・小野 真吾 (ヤフー株式会社)・堀田 徹 (ヤフー株式会社)・田島 玲 (ヤフー株式会社)
概要 表示/非表示 | プレビュー資料

本研究では,アドネットワークの配信広告のクリック率予測の問題に対し,マルチタスク学習を用いた予測手法を提案する。
アドネットワークが抱える配信先サイトは,サイト毎に記事の内容やユーザ層が異なるため,同じ広告を配信した場合のクリック率も変わってくる。
本研究では,素性ハッシングを使ったマルチタスク学習により,サイト毎の特徴を反映したモデルを作ることでこの問題に対処し,実験によりその有用性を示した。

D-35 マルチタスク学習を用いた多様な特徴をもつ緑内障の進行予測
真矢滋 (東京大学大学院情報理工学系研究科)・森野佳生 (東京大学大学院情報理工学系研究科)・山西健司 (東京大学大学院情報理工学系研究科)
概要 表示/非表示 | プレビュー資料

緑内障は慢性疾患であり,その早期進行予測は重要だが診断回数が少ない場合 に患者一人毎に良い予測器を構成することは難しい。
その為,他の患者データを活用して予測精度を向上する研究が行われてきた。最近,我々はガウシアンカーネルや線形関数などの類似度を用いた行列補完による予測手法をマルチタスク学習の観点から提案し,緑内障患者データが持つ特徴を捉えることで視野の予測精度の向上を示した。本手法を紹介する。

D-36 ランダムRNNと深層学習による時系列高次構造抽出
松元叡一 (東京大学大学院総合文化研究科)・ 金子邦彦 ( 東京大学大学院総合文化研究科)
概要 表示/非表示 | プレビュー資料

音声などの時系列では,しばしばタイムスケールが大きく異なるパターンが混在し,さらにそれらの長短のパターンが独立でないため,特定のスケールだけ見ても正確な解析を行うことが出来ない。
本研究では,タイムスケールの異なるランダムRNNを多層用意し,層間の結合をオートエンコーダで学習することで,
長いスケールのパターンが短いパターンを組み合わせて作られているような階層構造を持つ時系列の解析を目指す。

D-37 ランダム行列のモーメントのゆらぎを用いた時系列パラメータの検定
長谷川彩子 (お茶の水女子大学)・ 佐久間紀佳 ( 愛知教育大学)・ 吉田裕亮 ( お茶の水女子大学)
概要 表示/非表示 | プレビュー資料

本研究では, 1次元および2次元時系列について, 標本自己共分散行列のモーメント(固有値のモーメント)と, 与えられたデータを表現する時系列モデルに付随して定まるランダム行列のモーメントとの関係について述べる. さらに, 上記の関係に基づき, 時系列モデルのパラメータについて, Wishart型ランダム行列のモーメントのゆらぎの漸近正規性を用いた検定手法を提案する.

D-38 ロバストサポートベクターマシンの拡張に対する DC アルゴリズムの適用
藤原秀平 (東京大学)・武田朗子 (東京大学)・金森敬文 (名古屋大学)
概要 表示/非表示 | プレビュー資料

本発表ではロバストサポートベクターマシンとその自然な拡張が, 2つのConditional Value-at-Risk (CVaR) の差をノルム制約上で最小化する問題として表現されることを示す.
この問題は目的関数・制約のいずれも非凸であるが, 両者を上手く扱い, 局所解の必要条件を充たす点を得るためのアルゴリズムを紹介する.

ポスターセッション2 (11/18 (水) 15:00 – 18:00)

ポスター番号 タイトル
著者
T-26 音楽音響信号解析のためのガンマ過程に基づく無限重畳離散全極モデル
吉井和佳・糸山克寿(京大)・後藤真孝(産総研)
プレビュー資料
T-27 A note on least angle regression in orthogonal case
Katsuyuki Hagiwara(Mie Univ.)
プレビュー資料
T-28 双方向再帰型制限付きボルツマンマシンによる高次元時系列信号の雑音抑圧
金子昌賢(ヤマハ)
プレビュー資料
T-29 情報量規準WAICを用いたLASSOハイパーパラメータの最適化法
宮崎 大・渡辺澄夫(東工大)
プレビュー資料
T-30 変分ベイズLDAの漸近解析
中島伸一(ベルリン工大)・佐藤一誠・杉山 将(東大)・渡辺一帆(豊橋技科大)・小林寛子(ニコン)
プレビュー資料
T-31 Learning from Positive and Unlabeled Data 1: — Classifier Training and Theoretical Analysis —
Marthinus Christoffel du Plessis(UTokyo)・Gang Niu(Baidu Inc.)・Masashi Sugiyama(UTokyo)
プレビュー資料
T-32 Learning from Positive and Unlabeled Data 2: — Computationally Efficient Estimation of Class Priors —
Marthinus Christoffel du Plessis(UTokyo)・Gang Niu(Baidu Inc.)・Masashi Sugiyama(UTokyo)
プレビュー資料
T-33 Parallel Distributed Block Coordinate Descent Methods based on Pairwise Comparison Oracle
Kota Matsui(Nitech)・Wataru Kumagai(Kanagawa Univ.)・Takafumi Kanamori(Nagoya Univ.)
プレビュー資料
T-34 Robust Estimation under Heavy Contamination using Unnormalized Models
Takafumi Kanamori(Nagoya Univ.)・Hironori Fujisawa(ISM)
プレビュー資料
T-35 Unsupervised Dimension Reduction via Least-Squares Quadratic Mutual Information
Janya Sainui(TokyoTech)・Masashi Sugiyama(UTokyo)
プレビュー資料
T-36 Support consistency of direct sparse-change learning in Markov networks
Song Liu・Taiji Suzuki(Tokyo Tech)・Masashi Sugiyama(UTokyo)
プレビュー資料
T-37 分類問題におけるクラスバランス変化への対処法 ~ エネルギー距離を用いたクラス事前確率の推定 ~
川久保秀子(東工大)・ドゥ・プレシ マーティヌス・クリストフェル・杉山 将(東大)
プレビュー資料
T-38 測度空間上のゲージ理論 ~ τ-情報幾何学 ~
田中 勝(福岡大)
プレビュー資料
T-39 Combination of LSTM and CNN on recognizing mathematical symbols
Nguyen Dai Hai・Le Duc Anh・Nakagawa Masaki(TUAT)
プレビュー資料
T-40 極座標上に分布するデータのためのクラスタリング手法
藤原勇二(津山高専)・藤田一寿(津山高専/電通大)
プレビュー資料
T-41 Tensor Regression and Classification with Latent and Scaled Latent Norms
Kishan Wimalawarne(Tokyo Tech)・Masashi Sugiyama(UTokyo)・Ryota Tomioka(TTIC)
プレビュー資料
T-42 対数線形モデル高速学習のための基底関数
高畠一哉・赤穂昭太郎(産総研)
プレビュー資料
T-43 無限交換可能長方形分割
中野允裕・石黒勝彦・木村昭悟・山田武士・上田修功(NTT)
プレビュー資料
T-44 全経路探索アルゴリズムsimpathを応用した複数巡回セールスマン問題の解の全列挙と最適解探索
小川将史・井上真郷(早大)
プレビュー資料
T-45 Direct Estimation of Derivatives of Quadratic Mutual Information with Application in Sufficient Dimension Reduction
タンカラット ブット(東工大)・佐々木博昭・杉山 将(東大)
プレビュー資料
T-46 大規模運転行動コーパスのための記号化アプローチ
坂東誉司・竹中一仁・森 真貴(デンソー)・谷口忠大(立命館大)・宮島千代美・武田一哉(名大)
プレビュー資料
T-47 深層学習による非線形回帰
内山 航・田中利幸(京大)
プレビュー資料
T-48 疎結合を持つモジュラー型自己連想ニューラルネットワークの特性解析
山根敏志(IBM東京基礎研)・田中剛平(東大)・中野大樹(IBM東京基礎研)・中根了昌(東大)・片山泰尚(IBM東京基礎研)
プレビュー資料
T-49 非線形コンバイナ型乱数生成器に対するSum-Product Algorithmを用いる攻撃に関する一考察
久保航汰・齋藤翔太・鎌塚 明・松嶋敏泰(早大)
プレビュー資料
T-50 低ランク双線形モデルによる活動イベント発生密度推定
前田啓輔・下坂正倫(東大)・坪内孝太(Yahoo!JAPAN)
プレビュー資料
D-39 異粒度複数行列の制約付き非負値因子分解について
幸島匡宏 (NTT)・松林達史 (NTT)・澤田宏 (NTT)
概要 表示/非表示 | プレビュー資料

近年のデータ解析ではプライバシー保護等の観点から,全データに対してユーザ情報が利用できず,一方でユーザ属性情報や統計情報が利用可能な場合がある.本研究では,異なる情報粒度をもつデータ集合を統合的に効率よく解析するという課題に着目した, 新たな非負値行列分解手法を提案する. 異なる期間の実購買データより作成したユーザ個人単位・属性単位の購買データへの適用を通して提案手法の有効性の検証を行った.

D-40 化学反応シミュレーションの結果から最適反応温度を求めるための予備研究
城 真範 (産総研)・赤穗 昭太郎 (産総研 )
概要 表示/非表示 | プレビュー資料

様々な化学反応シミュレーションが行われているが,時間に逆行して,結果から原料や反応条件を最適化する研究は多く行われていない。我々は簡単な順方向シミュレータの他に時間逆方向の問題も解く検討を進めている。今回は物質Aが高温で分解する物質Bに変化する反応系を仮定し,離散的な温度変化によって物質Bの収率をシミュレートし,その結果から物質Bの収率を最大にする最適温度を求める。

D-41 画像広告におけるクリック率予測モデルの素性評価
茂木 哲矢 (ヤフー株式会社)・ 田頭 幸浩 (ヤフー株式会社)・ 小野 真吾 (ヤフー株式会社)
概要 表示/非表示 | プレビュー資料

ヤフー!ディスプレイアドネットワークの画像広告についての取り組みを紹介する
特に画像広告で用いられている線型分類器によるクリック予測モデルの素性を評価し,
その有効性に関して検証を行う
また得られた結果について,定量・定性的な分析を行い,その結果を報告する

D-42 階層化Pitman-Yor過程を用いた文脈を考慮した確率文脈自由文法の推定-分布学習の実データへの適用にむけて-
柴田千尋 (東京工科大学)
概要 表示/非表示 | プレビュー資料

文を文脈と部分文字列とにわけ,そこから形式文法を学習する枠組みは「分布学習」と呼ばれる。分布学習のアイデアに基づいた実データへの適用手法の構築へむけた第一歩として,文脈を考慮した確率文脈自由文を表す階層化Pitman-Yor過程を構成し推定する実験を行った。その結果,計算コストは非 常に大きいものの,スムージングを適用したn-gramモデルと同等以上の予測精度を得ることができることがわかった。

D-43 階層構造を持つ文書集合に対するトピックモデル
清水琢也 (関西学院大学大学院)・大村政博 (関西学院大学大学院)・岡留剛 (関西学院大学大学院)
概要 表示/非表示 | プレビュー資料

新聞などの文書集合は,スポーツ欄にサッカーや野球の記事,政治欄に選挙や国会の記事,といったような階層構造を持つ。つまり,サッカーや野球をトピックと仮定したときに,その一階層上にはスポーツというセクションが存在する。そこで本研究では,この階層構造を考慮し,セクション及びトピックを抽出するためにLatente-Dirichlet-Allocationを多段化させたトピックモデルを提案する。

D-45 完全変数化を用いたRBMのモデル選択
宮口 航平 (東京大学)・ 山西 健司 ( 東京大学)
概要 表示/非表示 | プレビュー資料

近年深層学習の基礎モデルとしてRBMが注目を集めている.RBMの最適な隠れ素子の数を設計する問題は重要であるが,有効なモデル選択規準は得られていない.これはRBMが非正則モデルであることと,尤度の計算量が大きいことが一因である.本研究では,完全変数化を用いてRBMを正則なモデルとみなし,効率的な尤度の近似計算を用いることで,RBMのモデル選択規準を提案する.またその有効性を数値実験で実証する.

D-46 眼圧に基づく状態区分を用いた緑内障進行予測
友田恭輔 (東京大学)・森野佳生 (東京大学)・村田博史 (東京大学)・朝岡亮 (東京大学)・山西健司 (東京大学)
概要 表示/非表示 | プレビュー資料

緑内障は視野が欠損する疾患であり,進行の早期予測は治療方針の決定に重要である。対象患者のデータのみを用いた線型回帰による早期予測では観測データが少ない為予測精度は十分ではなく,他の患者の視野データを援用して視野欠損の予測精度を向上する手法が提案されてきた。今回我々は緑内障進行の有力因子である眼圧に基づき進行の状態を区分し,これに基づいて進行度の推定を行うモデルを構築し進行予測をする手法を提案する。

D-47 共起トピックモデルによる検索クエリのパターン推定
小西卓哉 (奈良先端科学技術大学院大学)・大輪拓也 (国立情報学研究所(ERATO))・藤田澄男 (Yahoo! JAPAN研究所)・池田和司 (奈良先端科学技術大学院大学)・林浩平 (国立情報学研究所(ERATO))
概要 表示/非表示 | プレビュー資料

本研究は「名古屋 ホテル」といった検索クエリに頻出する
潜在パターンをトピックの共起で表現する確率モデルを提案する.
個々のクエリから単語ペアを生成しトピックの共起情報を推定
することで計算コストを抑えつつ解釈性の高い単語クラスタを
学習する.実際のクエリログデータに適用し,単語推薦精度の
評価とクラウドソーシングによるトピックの評価を行った.

D-48 教師あり学習における中立化指標のf-ダイバージェンスによる統一的理解
福地 一斗 (筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻)・佐久間 淳 (筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻)
概要 表示/非表示 | プレビュー資料

機械学習により行う予測から差別,不公平,偏見を排除するために,差別,不公平,偏見の要因となるような属性と,出力が相関しないような分類機を学習する手法である中立化の手法が研究されてきた.既存の中立化の研究では,相関性を評価する指標である中立性指標がいくつか提案されている.本発表では,f-ダイバージェンスによるそれらを統一的に扱えるような中立性指標を提案し,中立性指標の差異について議論する.

D-49 近似ベイズ推論としてのdropoutとその最適化
前田新一 (京都大学)
概要 表示/非表示 | プレビュー資料

深層学習において,dropoutは複数のモデルのアンサンブルをとることで汎化性能を向上させる技術として認識されている。これまでdropoutを用いた学習は,正則化の観点から解釈されることが多かったが,本発表では近似ベイズ推論として解釈することでdropout rateが最適化できることを示す。

D-50 誤差構造正則化Denoising Autoencoderを用いた故障検知・要因解析
田川 貴章 (株式会社豊田中央研究所)・ 田所 幸浩 ( 株式会社豊田中央研究所)・ 矢入健久 ( 東京大学先端科学技術研究センター)
概要 表示/非表示 | プレビュー資料

従来のデータ駆動アプローチは過剰適合に,モデル駆動アプローチは設計コストに問題があった。そこでこれら問題に対処するためDenoising Autoencoder(DA)をベースにした誤差構造正則化DAを提案する。本手法はシンプルかつ多少曖昧な事前知識のみを用いて故障検知・要因解析性能を向上させる。車両走行データによる模擬異常検知実験により,従来手法に対して提案手法が優位な結果を得た。

D-51 交通流モデルZRPにおける変分ベイズ法について
中村文士 (東京工業大学)・山崎啓介 (東京工業大学)
概要 表示/非表示 | プレビュー資料

セルオートマトン(CA)を用いた交通流モデルは渋滞原理の解明や
都市交通シミュレーションに利用されている。
Zero Range Process (ZRP)は前の車両との車間距離をもとに速度制御を行うCA交通流モデルである。
本研究ではZRPにおける変分ベイズアルゴリズムを導出し,
それを用いて車両のクラスタリングを行う手法を提案する。

D-52 広告配信元における収益の周期性分析
土田喜幸 (株式会社 VOYAGE GROUP)
概要 表示/非表示 | プレビュー資料

Supply-Side Platform(SSP)は,広告を提供する複数の広告配信元を,収益が最大化されるよう選択するのが目的の一つである。本研究では,その広告配信元毎の時間単位の収益実績から周期性分析を行った。その結果,広告配信元毎に特徴的な周期性(例えば,時間帯により収益性が数倍異なる)を確認した。

D-53 高次元小標本におけるナイーブな正準相関係数を用いた特徴選択手法の提案
玉谷 充 (島根大学大学院総合理工学研究科)
概要 表示/非表示 | プレビュー資料

高次元小標本における2クラス判別問題を扱う。その際に,特徴選択を行うことにより識別精度を向上させることを目標とする。本発表では,ナイーブな正準相関から導かれる判別方向ベクトルに基づく特徴選択手法を提案する。その中で,特徴の選択個数の改善を図るために,ナイーブな正準相関係数の漸近挙動に着目をした新たな手法を導入する。シミュレーションや実データへの適用を通して既存の手法と比較し,その結果を報告する。

D-54 高次元説明変数に基づく風力発電ランプ予測に関する基礎検討
藤本悠 (早稲田大学)・高橋由佳 (早稲田大学)・林泰弘 (早稲田大学)
概要 表示/非表示 | プレビュー資料

広範な地域における多点において観測・蓄積された気象観測量の時系列データを用い,風力発電量の急変(ランプ)現象の予測を目的としたノンパラメトリック回帰の枠組みの基礎的検討を行う.特に時空間的に比較的広範にわたって蓄積されたデータを利用することで得られる膨大な説明変数を用いて回帰を行う際の問題点や対応についての検討結果を報告する.

D-55 混合 Normal Inverse Gaussian 分布モデルの変分ベイズ解法
竹川高志 (工学院大学)
概要 表示/非表示 | プレビュー資料

混合 Normal Inverse Gaussian (NIG) 分布モデルのベイズ推定に関する新しい変分ベイズ解法を導出した.NIG は正規分布に対して,ロバスト性と非心性を導入したモデルであるが,Student’s t 分布などとは違い共役事前分布が存在するため,変分ベイズ解法における計算や収束が速い.また,非心性の導入により多くの非定常データに対して精度の向上が期待できる.

D-56 疾患参考文献の生成に向けた文書分類アルゴリズムの検討
田中宏明 (東京大学)・建石由佳 (国立情報学研究所)・奥村貴史 (国立保健医療科学院)
概要 表示/非表示 | プレビュー資料

医療の臨床の現場では医師が診断困難な症例に出会ってしまうケースが時折存在するため,このような状況での診断を支援するための診断支援システムの開発を進めている。このシステムでは,症例から疾患を予測し,参考文献とともに提示する。その参考文献となるWebサイトを選定するため,いくつかの文書分類アルゴリズムについて検証を行った。その検証結果について本発表では紹介する。

D-57 順列に対するバンディット問題
Nir Ailon (Technion)・ 畑埜 晃平 ( 九州大学)・ 瀧本 英二 ( 九州大学)
概要 表示/非表示 | プレビュー資料

本研究では順列(ランキング)のバンディット型オンライン予測問題を考える.応用例としてプライバシー保護を意識したオンラインランキング問題等が挙げられる.プレイヤーの目的は最適な固定の順列に対するリグレットの最小化である.本研究では敵対的な環境に対して,2つの異なる仮定の下で,それぞれほぼ最適なリグレットを達成するオンライン予測手法を提案する.

D-58 潜在変数モデルのモデル選択に基づく,非負値行列因子分解のランク決定手法
伊藤優 (東京大学)・大枝真一 (木更津工業高等専門学校)・山西健司 (東京大学)
概要 表示/非表示 | プレビュー資料

機械学習において,潜在変数モデルは多くの分野で提案されており,潜在構造を推定するモデル選択の研究も盛んである.一方,非負値行列因子分解は行列データを低ランク近似する手法として多様なデータに用いられているが,分解行列のランクを決定する方法については多くの議論がなされている.本発表では,行列分解に対応する確率モデルに潜在変数を交えた解釈を導入し,そのMDL規準に基づく新たなモデル選択手法を提案する.

D-59 疎な損失行列に対する行列のオンライン予測
森富賢一郎 (九州大学)・畑埜晃平 (九州大学)・瀧本英二 (九州大学)・津田宏治 (東京大学)
概要 表示/非表示 プレビュー資料

行列のオンライン予測問題を考える.オンライン予測では,正則化項と累積損失を同時に最小化するように予測を行う手法が知られている.本研究では,行列式の対数を正則化項として用い,予測と疎な損失行列との内積で損失が与えられる場合のリグレット上界を示す.本研究は,オンライン協調フィルタリング問題へ応用でき,Hazan et al. (2012)で示されたリグレット下界と一致するリグレット上界を達成した.

D-60 疎性モデリングに基づく部分グラフ特徴学習
瀧川 一学 (北海道大学)
概要 表示/非表示 | プレビュー資料

多数のグラフデータがあり,各々のグラフgに何か関連値yが付与されている場合に,(g,y)の多数事例に基づく対応g→yの教師付き学習を考える。このとき,説明変数として全ての可能な部分グラフ特徴を考えた場合でも,実際に有効な特徴はほんの一部のみで十分な場合が多い。本発表では疎学習に基づき全ての可能な部分グラフ特徴から必要な特徴部分集合の学習を線形モデルの学習と同時に行う方式について報告する。

D-61 双対分解を用いたマルチタスク最大マージントピックモデル
上野良輔 (神戸大学大学院)・江口浩二 (神戸大学大学院)
概要 表示/非表示 | プレビュー資料

マルチタスク分析へのアプローチの一つに潜在トピックを用いた方法がある。最近になって,GibbsMedLDAと呼ばれる最大マージン識別と潜在トピックモデルを統合した手法が提案されている。
本稿ではこれを拡張することにより,マルチタスク分析の実現を試みる。さらに,本稿では双対分解を用いた最適化を用いることで高い予測性能を目指す。

D-62 相互情報量を用いた移動ロボットの自己位置推定
入江清 (千葉工大/東工大)・杉山将 (東大)・友納正裕 (千葉工大)
概要 表示/非表示 | プレビュー資料

精度の高い自己位置推定はロボットの自律走行にとって重要な技術である。これまでの自律走行では,ロボットに搭載したセンサにより,ロボット専用の詳細な地図を構築して自己位置推定する手法が広く用いられてきた。本発表では既存の市街地図を用いて自己位置推定を行う手法を提案する。市街地図を用いる場合にはセンサデータと地図との対応付けが問題となる。提案手法では相互情報量に類する基準を用いてこの問題を解決する。

D-63 単語の多義性を考慮した文書可視化
近藤雅芳 (奈良先端科学技術大学院大学)・岩田具治 (NTTコミュニケーション科学基礎研究所)・澤田宏 (NTTコミュニケーション科学基礎研究所)・山田武士 (NTTコミュニケーション科学基礎研究所)
概要 表示/非表示 | プレビュー資料

文書データのための可視化手法を提案する.提案法では,文書および単語が低次元ユークリッド可視化空間に座標を持つと仮定し,それらの座標から文書データが生成される過程をモデル化する.多義語には複数の座標を持たせることで,多義性を考慮した可視化を得る.実データによる可視化結果を示す.

D-64 転移学習を用いた並列分散環境におけるRandom Forest学習
若山涼至 (中部大学)・木村昭悟 (NTTコミュニケーション科学基礎研究所)・山下隆義 (中部大学)・山内悠嗣 (中部大学)・藤吉弘亘 (中部大学)
概要 表示/非表示 | プレビュー資料

Random Forestは多数の独立な決定木で構成されるため,並列分散環境での学習に適しているが,各分散環境に与えられるデータのバイアスが強い場合には,過学習から分類性能が低下する問題がある.本発表では,Random Forestに共変量シフトを導入したTransfer Forestを適用することにより,データバイアスによる分類性能の低下を抑制する方法を提案する.

D-65 糖尿病罹患のボディマス指数層別死亡率の相対危険
兼村厚範 (AIST)・Gerard Lipowski (AIST/Quintesensia)・赤穂昭太郎 (AIST)
概要 表示/非表示 | プレビュー資料

2型糖尿病は高ボディマス指数(BMI)群で罹患リスクが高いが,罹患者の死亡率は高BMI群の方が正常BMI群よりも低いというパラドックスが報告されてきた。本研究では,50万人規模のUK Biobankデータを使い,同様の傾向を確認するとともに非罹患者との相対危険ではさらにパラドックス傾向が強調されることを報告する。

D-66 統計力学的貪欲法による特徴空間のスパース表現
坂田綾香 (理研)・ 樺島祥介 ( 東京工業大学)
概要 表示/非表示 | プレビュー資料

これまで我々はdictionary learningなどの行列分解問題に対して
belief propagationアルゴリズムを構成した。
今回は,カーネル関数で指定される特徴空間において
スパース表現を得る問題に対して,
belief propagationを基本としたgreedy algorithmを適用する。

D-67 特徴ストリームからの大規模疎学習スキーム
松島慎 (東京大学)・飯田紘士 (東京大学)・中川裕志 (東京大学)
概要 表示/非表示 | プレビュー資料

大量の特徴を持つためにデータサイズがメモリ容量よりも大きい場合,
または特徴抽出後のデータサイズが
メモリ容量よりも大きく学習前のデータからの特徴抽出が困難な場合,
現実的な計算時間で疎学習を行うことは困難である。
このような場合に,不要な特徴を削り優先的に重要な特徴を
メモリに残しながら学習を行うことで,
メモリ容量を大きく超えたデータサイズのデータからの疎学習を可能にするスキームを提案する。

D-68 二乗損失相互情報量を用いた画像位置合わせ法
坂井智哉(東京工業大学),杉山将 (東京大学)
概要 表示/非表示 | プレビュー資料

ある画像を変形して,もう一枚の良く似た画像に近づけるような画像変換を求めることによって,半導体の異なる階層の断面画像からの三次元再構成や,異なる撮像装置による医療画像からの診療支援ができる.本発表では,画像同士の近さを測る類似性尺度として,従来用いられてきた相互情報量よりも雑音や異常値に対して頑健な,二乗損失相互情報量を用いることを提案し,その有用性を実験的に示す.

D-69 能動学習による多関係データセットの構築
梶野 洸 (東京大学)・ 岸本 章宏 ( IBM Research – Ireland)・ Adi Botea ( IBM Research – Ireland)・ Elizabeth Daly ( IBM Research – Ireland)・ Spyros Kotoulas ( IBM Research – Ireland)
概要 表示/非表示 | プレビュー資料

セマンティックウェブ,知識ベースなど,様々なデータは,二主体間の複数種類の有向関係で記述できる。これを多関係データと呼ぶ。ウェブや科学論文から多関係データセットを自動抽出する研究が多く行われているが,常識的な知識などが抽出できないという欠点がある。本研究では,能動的に人に関係の有無を尋ねる能動学習を用いて多関係データセットを構築する手法を提案する。実データを用いた実験により手法の有効性を確認する。

D-70 半教師付き学習の影響関数からの推定方程式の復元について
川喜田雅則 (九州大学)・ 藤澤洋徳 ( 統計数理研究所)
概要 表示/非表示 | プレビュー資料

正則かつ漸近線形な半教師付き推定量について,その影響関数のクラス全体を導出し,最有効影響関数を導く.また影響関数が与えられたとき,その影響関数を持つような推定量を与える推定方程式を復元する問題について考察する.

D-71 非同期かつ欠損時系列試験結果からの行列分解による潜在スキル構造の抽出
大枝真一 (木更津工業高等専門学校 情報工学科)・伊藤優 (東京大学大学院 情報理工学系研究科)・山西健司 (東京大学大学院 情報理工学系研究科)
概要 表示/非表示 | プレビュー資料

行列分解を用いて試験結果行列から設問とスキルの関係行列を抽出する研究が行われている.我々は時系列試験結果行列からスキル行列を抽出する手法を提案した.本研究ではこれを実システムで取得されるデータに対応できるように拡張する.すなわちユーザの解答結果を同じ解答回数毎に集積して行列を作成し,欠測のあるこの行列には重み付きNMFによって行列分解を行う.提案手法により学習者の潜在スキルの習得過程を可視化した.

D-72 非同期並列ベイズ的最適化
小宮山純平 (東京大学)・馬騰飛 (東京大学)・佐藤一誠 (東京大学)・南賢太郎 (東京大学)・中川裕志 (東京大学)
概要 表示/非表示 | プレビュー資料

本研究では,従来単一ノードで行われてきたベイズ的最適化の非同期並列アーキテクチャへの拡張を行う。
また,単一ノードで動くベイズ的最適化の標準的なアルゴリズムであるExpected Improvementをこの非同期並列アーキテクチャ上で動くように拡張する。
提案アルゴリズムの実験による検証を行う。

D-73 変分ベイズ法における潜在変数推定の精度について
山崎啓介 (東京工業大学)・中村文士 (東京工業大学)
概要 表示/非表示 | プレビュー資料

近年,潜在変数推定の精度に関する研究が行われ,KLダイバージェンスで定義された誤差について最尤法とベイズ法における漸近形が導出された。
しかしながら変分ベイズ法の精度は未だ知られていない。
本発表では混合二項分布における潜在変数推定について,変分ベイズ法のKL誤差を実験的に算出し,ベイズ法や最尤法との比較を行った結果を紹介する。

D-74 変分ベイズ法をロバストにする勾配ベイズ法の提案
石神孝容 (京都大学)・藤本健治 (京都大学)・西田吉晴 (神戸製鋼所)
概要 表示/非表示 | プレビュー資料

変分ベイズ法は,確率モデルのベイズ推定を行うための近似解法である.この方法は,複数あるパラメータの停留条件を反復的に用いて推定を行う.しかし近似的な停留条件を反復利用することからアルゴリズムが数値的に不安定になることがある.本論文では,停留条件を勾配法に置き換えた手法を提案し,各パラメータの収束速度の調整を可能にする.特異摂動法の観点から,この自由度によりアルゴリズムをロバストにすることができる.

D-75 粒子モンテカルロ法による時間逆転シミュレーション
高柳 慎一 (総研大)・ 伊庭幸人 (統計数理研究所)
概要 表示/非表示 | プレビュー資料

マルコフ連鎖や自己回帰モデルで定義されたシミュレーションについて,時間を反転して,到達点から逆方向に軌跡をたどり,かつ,正しい条件つき確率で軌跡を生成する問題を考える。具体的には,確率台風モデルで生成された台風が特定の場所を直撃する確率とその条件のもとでの軌跡のサンプルを求めることを目標とする。提案手法の考え方は終点の事象が与えられているときのレアイベントサンプリング一般に利用できる可能性がある。

D-76 連続離散混在データに対する潜在変数モデルを用いた異常検知
武石直也 (東京大学)・矢入健久 (東京大学)
概要 表示/非表示 | プレビュー資料

各種工学システムで得られるデータから,システムの変化や異常を検出したい。そのために正常時のモデルを学習する必要があり,本研究では特に連続潜在変数モデルを用いる。ただし,多くの工学システムでは連続値と離散値(カテゴリ値)の混在するデータが得られるため,全変量の相関・関連を適切に捉えるためには連続値・離散値に共通する潜在変数を考えるべきである。そのようなモデルの異常検知における効果や問題などを論じる。