第7回 IBISMLチュートリアル

チュートリアル(有料) 2018年11月4日 (日)

場所: 北大 工学部 オープンホール

「深層学習入門」 園田 翔(理研AIP) 10:00-11:30

深層学習とは何だろうか。字義通りには、深層ニューラルネットの学習法のことである。しかし、多くの人が肌で感じている通り、現実には、深層学習という単語の指す範疇はもっと多様化している。2006年に最初の深層学習が登場してから約10年が経ち、ICML2018では10,000層のニューラルネットが登場した。単に深いネットワークを訓練する技術は、そろそろ成熟しつつあるように思われる。一方、2012年にAlexNetが画像認識で大成功をおさめてから約5年の間に、深層ニューラルネットは画像の認識だけでなく生成ができるようになり、囲碁や将棋で人間に打ち勝つようになった。画像処理、音声音響信号処理や自然言語処理の各分野で、深層学習は独自の発展を遂げている。応用に限らず、近年は理論研究も盛況である。本チュートリアルでは、はじめに今日の典型的な深層学習を概観し、深層ニューラルネットの要素技術を解説した後、理論面において分かってきたこと、分かっていないことを整理する。

  • 前提知識:合成関数の微分法則(連鎖律)・機械学習の経験
  • 対象とする聴衆:ディープラーニング(の数理的側面)に興味のある大学生および社会人

「転移学習:基礎と応用」 山田 誠 (京大・理研AIP) 13:00-14:30

本チュートリアルでは、初めに一般的な転移学習の枠組みについて説明し、教師無し転移学習である共変量シフト適応や教師あり転移学習手法であるFrustratingly Easy Domain Adaptationといった手法を紹介する。そして、3次元人物姿勢推定やジェスチャー推定等のタスクにおける転移学習の応用例を紹介する。

  • 前提知識:教師付き学習・線形代数
  • 対象とする聴衆:修士課程1年以上程度

「データ駆動型科学のための統計的推論法」 竹内 一郎(名工大・理研AIP) 14:45-16:15

さまざまな科学技術分野において大規模データを取得できるようになった。例えば、生命科学分野では数万次元に及ぶ遺伝情報の計測が可能となり、これらの遺伝情報を用いて疾患リスクや薬剤効果の予測などが行われている。このようなアプローチはデータ駆動型科学と呼ばれ、実験・理論・計算(シミュレーション)に次ぐ第4のアプローチとして注目を集めている。データ駆動型科学では、機械学習を用いて「データ駆動型仮説」を生成する。これにより、従来のような研究者の知識に基づく「知識駆動型仮説」とはまったく異なった新たな仮説を見い出せる可能性がある。一方、データ駆動型仮説の統計的推論では注意が必要となる。データ駆動型アプローチでは、機械学習によって仮説が生成されるため、たとえノイズしか含まない無意味なデータからでも、もっともらしい仮説が生成されてしまうリスクがある。このようなバイアスを回避するため、ランダム化に基づくアプローチ、多重検定補正に基づくアプローチなどが提案されているが、その適用範囲は限定され、様々な課題が指摘されている。近年、データ駆動型仮説のバイアスを補正するための新たなアプローチとして、「Selective Inference」とよばれる枠組が注目されている。本チュートリアルでは、データ駆動科学において、機械学習アルゴリズムによって生成された仮説をいかに評価すべきかを議論する。従来のランダム化に基づくアプローチや多重検定補正に基づくアプローチの説明に加え、Selective Inferenceの基本的な考え方や方法論をわかりやすく解説する。また、最近の研究例を含め、Selective Inferenceの実用例をいくつか紹介する。

  • 前提知識:学部レベルの確率・統計と機械学習の知識
  • 対象とする聴衆:機械学習の研究者に加え,さまざまな専門分野でのデータ駆動型アプローチに興味のある実務家

「クエリ可能な確率的組合せ最適化問題」 前原 貴憲 (理研AIP) 16:30-18:00

実世界に現れる多くの意思決定問題は組合せ最適化問題として表現できる。そのような問題の多くは「組合せ構造は正確にわかるが、数値情報に不確実性がある」といった構造をもっている。このような問題を扱うため、不確実な数値情報をパラメタとして表現し、パラメタの不確実性を考慮して最適化するタイプの手法が研究されてきた。特に最近は,適当なコストを払ってクエリを発行することでパラメタの不確実性を部分的に解消できるという設定のもと、どのようにクエリ発行戦略を最適化する問題(クエリ可能な最適化問題)に対する研究が注目を集めている。この設定は臓器交換・オンラインデーティングなどに応用をもつ。本チュートリアルではクエリ可能最適化問題の基礎からスタートし、基本的な解析手法を解説する。

  • 前提知識:
    [必須] 確率の基礎(「確率」や「期待値」などの用語は説明せずに用います)
    [必須] アルゴリズムの基礎(「計算量」などの用語は説明せずに用います)
    [推奨] 最適化の基礎(目的関数・実行可能領域,といった言葉を聞いたことがあると望ましい)