テクニカルトラック・セッション1日目

ポスタープレビュー

概要集

T1-01: 音楽音響信号解析のためのガンマ過程に基づく無限相関テンソル分解

発表者:吉井和佳 (京大/理研)

概要:本稿では,非負値行列分解 (NMF) 、半正定値テンソル分解 (PSDTF)、非負値テンソル分解 (NTF) などを特殊系に含む、非負値性あるいは半正定値性に基づく究極のテンソル分解技法である相関テンソル分解 (CTF) を提案する。本手法を音源分離に適用すると、すべての時間周波数ビン間の相関を考慮したウィナーフィルタを用いて、音源信号の複素スペクトログラムを一挙に推定することが可能となる。

T1-02: オンライン型t-SNEによる分布構造変化の抽出

発表者:梶 大介 (デンソー),小林真佐大 (豊橋技科大),渡辺一帆 (豊橋技科大)

概要:高次元データの非線形な可視化手法として注目されているtSNEのオンラインアルゴリズム
へのカーネル回帰を用いた拡張を行い、必要となるパラメータの設計方法について述べる。
また、オンライン化アルゴリズムの特徴およびパラメータ設計の効果を実験により示す。

T1-03: 角転送行列繰り込み群法を用いた格子状マルコフ確率場の計算手法の提案

発表者:吉田智晴 (豊橋技科大),渡辺一帆 (豊橋技科大),梅村恭司 (豊橋技科大)

概要:確率的画像処理で用いられる格子状マルコフ確率場の周辺分布の計算は、組み合わせ爆発による計算量的困難がある。先行研究では, 物性研究で使われる手法を基にした角転送行列法を用いることで、従来より少ない計算量で、より大きなモデルの厳密計算が可能であることが示されている. 本研究では、角転送行列法の計算過程に特異値分解の低ランク近似を取り入れることで、多項式オーダーの近似計算手法を提案し、画像処理のタスクにおける精度と計算効率の有効性を周辺分布計算の代表的近似手法であるLoopy Belief Propagationと比較することで検証する。

T1-04: 確率行列分解の実対数閾値とBayes学習への応用

発表者:林 直輝 (東工大),渡辺澄夫 (東工大)

概要:確率行列分解においては,観測された確率行列を二つの確率行列の積として統計的に推測する問題が扱われる.これはMarkov連鎖などにおける遷移確率行列を,より低ランクの確率行列で記述する際にそのランクを統計的推測する問題と同等である.確率モデルとしてはパラメータから確率分布への写像が一対一でないために統計的な正則性を持たず,その理論的な推測精度は解明されていなかった.本論文では,確率行列分解における実対数閾値のバウンドの評価を数学的に行い,Bayes学習を行った場合の汎化誤差の上界を与える.

T1-05: 経験ベイズ木

発表者:関野正志 (SMN)

概要:決定木において、葉ノードの出力を確率分布でモデル化し、周辺尤度を規準に分割していく決定木学習アルゴリズム『経験ベイズ木(Empirical Bayesian Tree:EBT)』と、EBTを学習器とするRandom Forest『Random Empirical Bayesian Trees:REBT』を提案する。
出力の分布として指数型分布族を用いることで、周辺尤度は十分統計量の更新により計算でき、効率的に決定木を構築できる。
また、周辺尤度を規準とすることで、二分木の枝刈りや連続値のMulti-splitによる多分木が可能となり、木の複雑さを自動的に調整することができる。
従来の決定木における二値分類に対応するベルヌーイ分布や、二乗誤差に基づく回帰に対応する正規分布だけでなく、ポアソン分布や指数分布なども用いることができる。

T1-06: Semi-Supervised AUC Optimization based on Positive-Unlabeled Learning

発表者:Tomoya Sakai (UTokyo/RIKEN),Gang Niu (UTokyo/RIKEN),Masashi Sugiyama (RIKEN/UTokyo)

概要:二値分類において,各クラスのデータ数に大きく偏りがある場合に役立つ半教師付き分類の手法を提案する.具体的には,近年提案された,正例とラベルなしデータからの学習に基づく半教師付き分類の方法を,AUC最大化により分類器を訓練する方法へと拡張する.提案手法は,従来の半教師付き分類手法と異なり,クラスタ仮定のようなデータ分布に対する強い仮定を必要とすることなくラベルなしデータを学習に利用することができる.

T1-07: 少数データに対する転移学習技術の提案と公開データによる評価

発表者:福島亜梨花 (東芝),矢野 亨 (東芝),今原修一郎 (東芝),愛須英之 (東芝)

概要:機械学習技術において、推定のための高精度なモデルを構築するためには数百から数千の学習データを必要とするため、学習データが少ない場合は高精度なモデルの構築が困難であるという課題があった。そこで我々は少数の学習データにおける推定問題と類似した十分な学習データを保持する推定問題を利用することでこの課題の解決を狙、その効果を評価する。

T1-08: 新Kyoto2006+によるサイバー攻撃検知のための機械学習手法の評価

発表者:高原尚志 (UNP)

概要:機械学習の各手法をサイバー攻撃検知に用いる場合の評価を2015年12月までの攻撃を含むデータセットである新Kyoto2006+にて行い、NSL-KDDでの評価と比較する。その際、著者らが提案しているRandom ForestとK-Meansを組み合わせたハイブリッド手法についても合わせて評価し、その有効性を検証する。

T1-09: ガウス過程を用いた全状態探索法(ES-GP)による蓄電池の電解液材料探索

発表者:中山智文 (東大),五十嵐康彦 (物質・材料研究機構),袖山慶太郎 (物質・材料研究機構),岡田真人 (東大)

概要:予測モデルを作成する際に,有効な説明変数を見出すことは重要である.
変数選択を厳密に行うためには,目的に応じて適切な基準を決めたうえで,説明変数の組み合わせの全てを評価比較する全状態探索を行うことが必要である.
本研究では,リチウムイオン電池の機能を予測するタスクとして,ガウス過程を用いた全状態探索(Exhaustive Search with Gaussian Process,ES-GP)を適用し,その結果を全変数を用いた多変数回帰やLASSO,線形回帰を用いた全状態探索といった,先行研究と比べて大幅な予測精度の向上を実現した.

T1-10: ヘテロジニアスなデータに対するクラスタリング後の推論

発表者:井上茂乗 (名工大),梅津佑太 (名工大),坪田庄真 (名大),竹内一郎 (名工大/理研/物質・材料研究機構)

概要:ある疾患を持つ患者ごとの遺伝子発現量など,異質性を持つ多変量データが得られたとし,その異質性を特徴づける変数を特定することを考える.通常,このような状況では,標本に対してクラスタリングを行い,変数ごとにクラスタ間の差を検証する.しかし,クラスタリング後の統計的推論では,選択バイアスの問題が生じるため,検定の妥当性が失われる.本研究では,Selective Inferenceの考え方を応用することで対処する.

T1-11: マルコフ確率場を用いたロバストな一次元位相アンラッピング

発表者:中嶋恭久 (東大),五十嵐康彦 (JST),成瀬 康 (NICT),岡田真人 (東大)

概要:衛星のセンサーを用いた地殻変動の計測などでは,-πからπの間に畳み込まれた位相しか計測できないため,その位相から元の連続的な変動量を復元する必要がある.本研究では,この位相アンラッピング問題をマルコフ確率場と呼ばれる確率モデルにより定式化し,ベイズ推論に基づいた推定法を提案する.人工データを用いた数値実験を行い,提案法を用いることで,従来法と比較して安定した精度で推定できることを示す.

T1-12: Regression Method for Noisy Inputs based on Naradaya-Watson Estimator constructed from Noiseless Training Data

発表者:Ryo Hanafusa (Kwansei Gakuin Univ.),Takeshi Okadome (Kwansei Gakuin Univ.)

概要:We propose a regression method for noisy inputs that the regression function minimizes the expected squared loss of the prediction. Given a noisy input u = x + η, where η is noise and x is the noise-free constituent of u, the method estimates the posterior p(x|u) represented by the noise distribution p(η). The method produces the expected value, on p(x|u), of the Nadaraya-Watson estimator for noiseless inputs. From a single noisy input u, it enables us to determine p(η) parametrically by using an HMM that represents a time series given as a noiseless training data. Some experiments with artificial and real datasets show that the method suppresses the overfitting of the regression function and the RMSEs of the predictions are smaller compared with those of an existing method.

T1-13: 一般化$ell_1$正則化問題に対するオンライン最適化手法

発表者:中里佳央 (筑波大),福地一斗 (筑波大),佐久間 淳 (筑波大/理研/JST)

概要:鏡像降下法やAdaGRAD等の最適化手法ではパラメータ空間の情報を用いて特徴量数が多い問題に対して収束を早めている.本研究では近接平均法をユークリッドノルムからブレグマンダイバージェンスに拡張することで、複雑な正則化を用いた特定の問題に対して収束が早くなることを示す.

T1-14: 和音系列に対するPCFGのベイズ学習とSplit-Mergeサンプリングを用いたメロディへの和声付け

発表者:津島啓晃 (京大),中村栄太 (京大),糸山克寿 (京大),吉井和佳 (京大/理研)

概要:本稿ではメロディ(音符系列)に対して既存の音楽スタイルにおけるコード進行を反映した和声付けを行う手法を示す.

T1-15: 複数系列における重複状態を表現可能な隠れセミマルコフモデルの提案

発表者:成松宏美 (電通大),笠井裕之 (電通大)

概要:隠れセミマルコフモデル(HSMM)をベースとして,複数系列の入力をモデル化するための重複状態考慮隠れセミマルコフモデルを提案する.近年,同一のものに対して多種のセンサを付与するなど,複数の系列で1つのグループを構成するようなデータの収集が容易になり,それらを扱えるモデルに期待が高まっている.本稿では,複数系列をグループ化して扱う上で発生する系列の重複を,HSMMの状態の重複として捉え,それを1つのモデルで表現する手法を提案する.

T1-16: エンタングルメントエントロピーに基づく機械学習

発表者:田中 勝 (福岡大)

概要:画像識別ではCNNが大成功を収めているが,ここでは他分野との関わりに焦点を当てて見直してみたい。特に,画像を入力とする場合,画像中の各ピクセルは独立である事が暗に仮定されていたりするが,これを一種の波動関数とみなし,入力前の前処理として画像のエンタングルメントエントロピーを計算し,そのドミナントな特異値のみを用いいて画像を再構成しそれを入力とする場合(余分な情報が落ちる事が期待できるので過学習をむしろ起こさせる事が良い結果を生む事になるのではないかと予想される),また入力画像はそのまま入力として用い,畳み込み後の出力結果を波動関数が変換されたものとみなしエンタングルメントエントロピーを計算し,そのドミナントな特異値のみを用いて再構成し後段への入力とする場合の2種類について理論的な解説を行う。実際のシミュレーション結果については,大学院生の江口くんが,本研究会(IBIS2017)において発表する予定である。

T1-17: Nonconvex Sparse Optimization with Submodularity

発表者:Naoki Marumo (NTT),Tomoharu Iwata (NTT)

概要:制約に劣モジュラ構造があるスパース最適化問題は,機械学習に数多くの応用を持つ.
本研究では,そのような問題を効率的に解く非凸最適化アルゴリズムを提案し,その理論保証を行う.
また,簡単な数値実験によってアルゴリズムの有効性を確認する.

T1-18: CS-SENSE法における事後平均推定近似での学習パラメタの正則化

発表者:原田 賢 (早大),井上真郷 (早大),富樫かおり (京大)

概要:我々は以前の研究で高速撮像MR画像再構成の手法の一つであるCS-SENSE法をPM推定近似する手法を提案し,評価値を大幅に改善した.しかし,この手法では学習したパラメタの非ゼロ要素数に比例して計算時間が長くなってしまうという問題がある.本研究ではパラメタ学習時にL2正則化やL1正則化,SCAD正則化などを導入し,そのときの精度とパラメタの非ゼロ要素数を比較した.

T1-19: 結果的公平な文脈付きバンディット学習

発表者:福地一斗 (筑波大),佐久間 淳 (筑波大/JST/理研)

概要:機械学習における公平性が,重要な分野として認識されてきている.公平であるとは,機械学習によって行われた意思決定が個人のセンシティブな属性に対して偏らないことである.本論文では,新しい公平性の概念として,結果的公平性を紹介し,その制約を設けた順次意思決定問題を取り扱う.結果的公平性は,ほとんど確実に公平性が満たされることを要求する.具体的には,意思決定を有限回の行った結果,不公平な決定が与えられた閾値$eta$をほとんど確実に超えないことを要求する.本稿でははじめに,敵対的文脈と最悪ケースの分配的文脈に対する2つの不可能性をしめすことで,これらの問題が本質的に難しいことを示す.有意義な結果は,均一的な分配的文脈を考えることで得られる.均一条件を満たす分配的文脈において,$O(max{ln T,min{eta,T/eta}})$のレグレットを達成するアルゴリズムFairUcbを紹介し,$eta le o(ln T)$であるときにはこのレグレットが最適であることを示す.

T1-20: 調とリズムを考慮した階層隠れセミマルコフモデルに基づく歌声の自動採譜

発表者:錦見 亮 (京大/理研),中村栄太 (京大),後藤真孝 (産総研),糸山克寿 (京大),吉井和佳 (京大)

概要:歌声F0軌跡から楽曲の主旋律の音符系列を推定する統計的手法を示す.調やリズムに依存して生成される音符系列に対して,時間・周波数方向の変動が付与されることで歌声F0軌跡が生成される過程を表現する,階層隠れセミマルコフモデルを構築した.

T1-21: 事後分布推定されたガウス過程間のKLダイバージェンスは有限次元の正規分布間のKLダイバージェンスで評価できる

発表者:石橋英朗 (九工大),古川徹生 (九工大),赤穂昭太郎 (産総研)

概要:ガウス過程を用いた回帰や次元削減のタスクはガウス過程の事後分布推定として解かれる.本研究ではそのように事後分布推定されたガウス過程間のKLダイバージェンスが有限次元のガウス分布間のKLダイバージェンスで評価できることを示す.この結果から回帰や次元削減をガウス過程を用いて推定したときの結果の類似性を評価できるようになるため,マルチタスク学習などへの利用が期待できる.本研究では一例として,実際にこの結果を用いてガウス過程集合を主成分分析するアルゴリズムを開発した.

T1-22: 病名の共起頻度に基づく医療診断支援システムの構築 ~ 人工知能による医療ビックテキストデータの利活用 ~

発表者:矢野 憲 (奈良先端大),荒牧英治 (奈良先端大)

概要:医療抄録 ( Medical Case Reports ) などの医療テキストは患者についての診断の結果や診察の履歴などの豊富な医療情報が含まれている.これらの医療ビックテキストデータを人工知能を用いて2次利用し,医療診断支援 ( Clinical Decision Support Systems ) などに用いる試みが注目されている.
本稿では,44760件の医療抄録を用いて,人工知能による医療診断支援システムを提案し,その実用可能性について評価を行ったので報告する.

T1-23: 勾配上昇降下法を用いた効率的なモード回帰

発表者:山崎遼也 (京大),田中利幸 (京大)

概要:本研究では, 条件付き密度関数p(y|x)の極大値を調べる局所モード回帰の効率的な実装を提案する. 既存手法では, まずx,yの結合密度推定を行い, 推定された結合密度のyに関する勾配情報を使用して, 各xに対し勾配上昇法により条件付き極大値を探索する. 提案手法はyが1次元である場合に適用でき,各xに対して,推定された結合密度のyに関する勾配上昇, 降下を繰り返すことで, 条件付き極大値だけでなく条件付き極小値も含めて既存手法よりも効率よく推定できる.

T1-24: Bayes factorに基づくRAIアルゴリズムを用いた大規模ベイジアンネットワーク学習

発表者:名取和樹 (電通大),宇都雅輝 (電通大),植野真臣 (電通大)

概要:漸近一致性を持つベイジアンネットワークの構造学習はNP困難であり,最先端アルゴリズムを用いても60ノード程度の学習が限界であった.この問題を解決するために,本研究では,計算効率を画期的に改善した新たな構造学習手法を提案する.具体的には,漸近一致性を有するBayes factorを用いた条件付き独立性テストをRAIアルゴリズムに組み込んだ手法を提案する.また,提案手法が1000ノード以上のネットワークを学習できることを実験から示す.

T1-25: 連続な無限因子モデル

発表者:中野允裕 (NTT),持橋大地 (ISM),松井知子 (ISM),柏野邦夫 (NTT)

概要:本研究は因子解析のための統計的確率モデルとして、ポリア木と多重解像度ガンマ過程を用いた非可算無限の因子を潜在的に持つ確率過程を提案する。提案モデルはニューラルネットワークや非負値行列因子分解などにおける因子の複雑度の事前設定の問題への対策を動機としている。

T1-26: 二分決定図を用いた区間値公開時のプライバシ安全性下限の高速計算

発表者:竹内聖悟 (東大),草野光亮 (筑波大),津田宏治 (東大),佐久間 淳 (筑波大)

概要:個人情報を入力値として予測値を提供するようなサービスにおいて,第三者が予測値を得た場合に個人情報である入力値を推定される可能性がある.予測値を区間値とした時の推定についての安全性が定義されている.その計算には全てのパタンを列挙し確率や数を調べる必要があったが,正確な値ではなく下限が大きければ十分安全と言える.本研究では,二分決定図を用い,解集合の全列挙ではなく,下位集合と上位集合を得ることで安全性下限の計算を効率的に行う手法を提案する.

T1-27: 劣モジュラ最大化に対する高速な最良優先探索

発表者:坂上晋作 (NTT),石畠正和 (北大)

概要:ナップサック制約付きの単調劣モジュラ最大化問題に対し,高速な最良優先探索法を提案する.提案法は指数的な計算量を必要とし得る一方で,任意のa (0<=a<=1) に対しa-近似解を出力することができる.提案法では探索時に用いるヒューリスティック関数値の計算を劣モジュラ最大化問題に帰着し,その上界値を高精度に計算する方法を用いて高速化を実現する.