招待講演
Deep convolutional network ネオコグニトロンによる視覚パターン認識: その原理と学習手法
福島邦彦(ファジィシステム研究所)
11/17 (月), 14:00-15:00
「ネオコグニトロン」は,階層的な構造を持つ deep convolutional network で,頑強な視覚パターン認識能力を持つ.しかし細かいところでは,いわゆる deep network とは異なる箇所がいくつか存在する.その相違点に注目しなが ら,ネオコグニトロンによる頑強なパターン認識の原理を説明する.
ネオコグニトロンでは,多層回路の中間層で,特徴の抽出と統合を繰り返しな がら次第に高次の特徴を抽出していく.最近のネオコグニトロンでは,中間層の 学習に add-if-silent 則を用いている.add-if-silent では,いわゆる deep learning とは異なり gradient descent 的な手法は用いない.学習セット内の 各パターンを1回提示するだけでよいので,学習は短時間で完了する.
最上位層では,抽出された特徴をもとにパターン識別を行なう.最近のネオコ グニトロンではパターンの識別に内挿ベクトル法を用いており,いわゆる winner-take-all や SVM などよりも小さい回路規模(少ない演算コスト)で, 高い認識能力が得られる.
Deep learning: scaling and applications
Nando de Freitas (Professor of Computer Science, Oxford University)
11/17 (月), 15:00 – 16:00 [Slide]
In this talk, I will present an overview of deep neural networks and their application to computer vision, speech recognition, natural language processing and imitation learning tasks. Much of the talk will be dedicated to the challenge of scaling deep neural networks to big data and big parameter spaces.
Current and Future Trends in Computer Vision
David McAllester (Toyota Technological Institute at Chicago)
11/18 (火), 13:00 – 14:00 [Slide, Movie1, Movie2]
Computer science is currently undergoing a neural network revolution. Speech recognition and computer vision have largely shifted to neural network methods and neural networks are becoming more prominent in computational linguistics applications such as machine translation. For neural network approaches to computer vision a major issue is the need for labeled training data. This talk will describe an approach to training neural networks, and other vision systems, using only sensor data — images and range finder information. We will describe a public evaluation and leader board for vision tasks based directly on using laser range finding data for both the training and evaluation of vision systems.
企画セッション1:離散アルゴリズムの機械学習応用
モンテカルロ木探索の理論と実践
美添一樹 (東京大学)
11/17(月), 10:30 – 12:30 [発表資料]
モンテカルロ木探索(Monte-Carlo Tree Seach, MCTS)はコンピュータ囲碁の棋力を飛躍的に向上させたことで有名な確率的な木探索アルゴリズムである. 従来は評価 関数を用いて探索順序を決定することが必要であったが、MCTS は評価関数がない場合 にも効率の良い探索を可能とする. 本講演ではまず MCTS の成立の過程および理論的 背景に触れる. その後, MCTS による囲碁プログラムが実際どのように作成されている のか, および他の問題への MCTS の適用例についてのべ, いくつかの例を通じてMCTSのアルゴリズムの性質を示す。
離散構造と離散分布
石畠正和 ( NTTコミュニケーション科学基礎研究所)
11/17(月), 10:30 – 12:30 [発表資料]
論理やグラフに代表される離散構造は, その表現力の高さや解釈のしやすさから人工知能の分野で古くから研究されている. 一方, 統計的機械学習の分野では、これら人工知能の技術を確率計算に応用することで, 確率モデルの推論や学習を効率的に行う研究が行われている. 本発表ではその中でも特に最近注目を集めているLifted Inferenceの話題を中心に紹介する.
大規模グラフ解析のための乱択スケッチ技法
秋葉拓哉 (東京大学)
11/17(月), 10:30 – 12:30 [発表資料]
頂点の重要度や頂点間の距離・関連度を求めることは, グラフ解析における最も基礎的
な処理である. 本講演では, 集合に対する乱択スケッチ技法であるMin-wise Hashing (MinHash)をグラフに向け拡張したAll-Distances Sketches (ADS)を紹介する.ADSはグラフの大きさに対しほぼ線形時間で全ての頂点について計算を行うことができ,ADS を用いると,頂点の重要度(Closeness Centrality),頂点間の関連度(Closeness Similarity),頂点間の距離,グラフの有効径(Effective Diameter) などの推定を,誤差の理論的保証を伴って行うことができる.MinHashの復習やADSの基礎的な定義から始め,近年提案された最新の改善,及び今後の課題についても言及する.
企画セッション2: 学習理論
空間結合符号
笠井健太 (東京工業大学)
11/18(火), 9:30 – 11:30 [発表資料]
新しい誤り訂正符号である空間結合符号に関して講演を行う.空間結合符号は複数のLDPC符号を結合することで構成され,そのBP復号性能は個々のLDPC符号のMAP復号性能と一致するという驚くべき性質から近年注目されている.構成法,復号法,性能解析,噴水符号(レートレス符号)への応用,万能性,MacKay-Neal符号への拡張について述べる.
Wasserstein幾何とφ-正規分布族
高津飛鳥 (名古屋大学)
11/18(火), 9:30 – 11:30 [発表資料]
φ-正規分布族とは正規分布を、正数上の正値連続増加関数φを用いて一般化した物である。ここでφが恒等関数ならばφ-正規分布は正規分布、φが冪関数ならばφ-正規分布は冪分布となる。また、Wasserstein幾何とは確率測度のなす空間上の距離の幾何である。
そしてWasserstein幾何は一般に情報幾何と異なるが全く相関が無いわけではなく、例えばWassrestein距離とダイバージェンスを比較するTalagrand型の不等式による結付きがある。本講演ではこの結付き及びそこにおけるφ-正規分布族の役割を説明する。
多腕バンディット問題の理論とアルゴリズム
本多淳也 (東京大学)
11/18(火), 9:30 – 11:30 [発表資料]
多腕バンディット問題とは複数台のスロットマシンをプレイするギャンブラーのモデルであり,ギャンブラーは各マシンからの報酬についてオンラインで学習することにより総報酬を最大化することを目指す.この問題においては従来では尤度や信頼区間の計算に基づくアルゴリズムが一般的であったが,最近では事後分布に基づくランダムアルゴリズムがその適用範囲の広さと性能から広く用いられるようになっている.本講演ではこれらのアルゴリズムについて説明し,互いの理論的な関係について解説する.また,総報酬の最大化ではなく期待値最大のマシンの判別を目的とする最適腕識別の問題との関連性についても述べる.
企画セッション3: ビッグデータ利用の社会的側面
産業領域におけるデータ活用への期待と現状
鈴木良介 (野村総合研究所)
11/19(水), 9:30 – 11:30 [公開発表資料なし]
民間企業においてビッグデータという言葉が使われるようになって5年が経ちました。単なるはやり言葉の段階を過ぎ、事業計画に組み込まれている企業も少なくありません。販売促進や、機器・設備の予防保全、顧客の新たなニーズの探索などへの活用が期待されています。一方で、投資対効果や、プライバシなどに関する不安も少なくありません。データ活用に対して漠然と持たれている期待と、課題とされている点について概観します。
情報保護の統計モデル
星野伸明 (金沢大学)
11/19(水), 9:30 – 11:30 [発表資料]
データを社会で利用する際の問題の一つは、情報保護である。しかしその技術的研究は社会的要請との対応がしばしば見えにくく、研究成果は十分活用されていない。従って情報保護研究に求められているのは、社会的要請を技術的な問題へ直接に「翻訳」することではないか。法的な情報保護の要件は個体識別が不可能なことなので、本講演では個体識別の可能性を技術的に考察する。実はそのような可能性の計量は、疎な分割表内で度数が小さいセルの計数に帰着させられる。故にそのような分割表の統計モデルや、小さいセル数の分布などを説明する。
ゲノムプライバシの保護と個別化医療への展開
佐久間淳 (筑波大学)
11/19(水), 9:30 – 11:30 [発表資料]
個人ゲノムは, 次世代シーケンサーの発展により安価に個人レベルで入手可能になりつつある新種の個人情報である. 個人ゲノム利用が産むメリットは科学上も社会的にも莫大であるが,「究極の個人情報」とも呼ばれる個人ゲノムには, ゲノム差別やゲノム犯罪等,従来のプライバシデータ利用では認識されていない顕著なリスクが存在し,取り扱いが非常に難しいデータでもある。反面、生活習慣病や癌等を対象とした個別化医療やの発展と実現するためには、個人ゲノムの大規模な蓄積・管理・共有・流通が必要である。講演では、秘密計算と呼ばれる暗号理論上の基盤技術を利用したゲノムプライバシの保護と活用について展望を述べる。
企画セッション4: 機械学習のウェブデータおよびマルチメディア活用
大規模言語データに基づく自然言語処理とその応用
岡崎直観 (東北大学)
11/19(水), 13:00 – 15:00 [発表資料]
自然言語処理の分野では十数年前からウェブ等の大量のコーパスを知識を獲得し,
言語解析を高度化する取り組みが進められてきた.数千万~数十億文書の
テキストデータから,同義語や関係事例などの知識を獲得する研究と,その研究を
支える基盤技術を紹介する.さらに,ソーシャルメディアから得られる言語データを
解析し,世の中の意見や動きを分析する応用事例を紹介し,自然言語処理の今後の
展望について述べる.
クラウドソーシング・デマ・MOOC
鹿島久嗣 (京都大学)
11/19(水), 13:00 – 15:00 [発表資料]
データの信頼性評価は多くの場面で現れる普遍的な課題である。このような問題は、たとえばネット上の不特定多数の人に作業を依頼するクラウドソーシングにおいて、得られたデータの信頼性をいかに担保するかは主要な課題のひとつとして重要視されている。また、ソーシャルメディア等を飛び交う様々な真偽定かでない情報の中から正しい情報を見つけ出すことは、情報に溢れる現代を生きる必須の知恵といえる。一方、世界中の多くの人々に教育の機会をもたらすものとして期待されているMOOC(大規模公開オンライン講座)では、今、その大勢の受講者の評価がボトルネックとなっている。本講演では、クラウドソーシングの品質保証問題、Web上の情報の信頼性評価、MOOCにおける相互評価の問題といった3つの問題を取り上げ、これらが極めて類似した考えに基づく確率モデルによってアプローチできることをみるとともに、その共通点・相違点、そして今後の展望について論じる。
ウェブ上のユーザ行動の分析による消費インテリジェンス
松尾豊 (東京大学)
11/19(水), 13:00 – 15:00 [発表資料]
本講演では、さまざまなウェブサイト上における商品の購買等のユーザ行動の分析の研究を紹介する。どういったユーザがどのようなページを閲覧しているか等の情報を用いることで、消費者を特徴づけたり、閲覧されているアイテムを特徴づけることができる。また、近年注目されているウェブサイトのA/Bテスト等の最適化技術の高度化や、レコメンデーション等の技術についても述べる。消費データを積極的に活用し消費者を幅広く体系的に理解することを消費インテリジェンスと呼び、そのための方法論を整理する。