企画セッション 3: 深層学習の理論 (09:30 – 11:30)
企画担当: 今泉 允聡(統計数理研究所 / 理化学研究所 / JST) オープニングスライド
深層学習の汎化誤差のための近似性能と複雑性解析 スライド
講演者1: 今泉允聡(統計数理研究所 / 理化学研究所 / JST)
概要:深層学習の汎化誤差を理論的に評価するにあたって、既存の理論は深層学習の実際と乖離する点が多く残っている。そのギャップを埋めるため、実状を説明できるように理論を拡張する研究が盛んに行われている。本講演では、汎化誤差の評価に必要な重要な要素のうち、(1) 近似誤差および (2) 複雑性誤差に注目し、それらの研究動向を紹介する。具体的には、深層ニューラルネットワークが相対的に優れた近似性能を発揮する状況の解析、および仮設集合全体の複雑性に依存しない誤差の解析を扱う。また、それらのアプローチの現状の達成点と限界について述べ、今後の研究の方針を議論する。
学習アルゴリズムの大域収束性と帰納的バイアス
講演者2: 二反田篤史(東京大学 / 理化学研究所 / JST)スライド
概要:深層学習モデルを含む巨大ニューラルネットは多大な成功を収めているが、その成功を理論的に説明する為には次の二つの問題に取り組む必要がある:(I) 非凸最適化問題に対する学習アルゴリズムの大域収束性、(II)得られたパラメータに対する汎化性能解析。これらは機械学習モデルの最適化研究における重要問題であるが、最も単純かつ代表的な学習アルゴリズムである(確率的)勾配降下法に対して部分的に解決されはじめている。本講演では鍵となる概念(ニューラルタンジェントカーネル、ワッサースタイン勾配流、帰納的バイアス)を紹介しつつ上記二つの問題に対する近年の研究動向を概説する。
群対称性を用いた深層学習
講演者3: 三内顕義(理化学研究所 / 慶應大学 )スライド
概要:ポイントクラウドの分類問題やグラフ上の関数近似など、データとして扱うために人工的なラベル付けを余儀なくされる局面は多い。このようなラベル付けの曖昧さは数学的には群不変性や群同変性の言葉によって記述することができる。Zaheerらによって2017年に提案された、群対称性を持つ深層ニューラルネットの理論をその後の発展と共に解説する。
企画セッション4: 機械学習工学( 13:00 – 15:00 )
企画担当: 比戸 将平(Preferred Networks)
機械学習に対するソフトウェア工学の技術動向
講演者1: 石川 冬樹(国立情報学研究所) スライド
機械学習を用いたシステムは、データに基づき振る舞いが定まるため、従来のソフトウェア工学のアプローチが通じない部分がある。これに対し国内・海外ともに、開発・運用・品質保証をどう支援していくか、非常に盛んな研究開発や議論がなされている。本講演では、特にテスティング分野や自動運転分野における「品質」の観点を中心として、ソフトウェア工学の観点から機械学習工学の技術動向を紹介する。
機械学習と知財・契約
講演者2: 柿沼 太一(STORIA法律事務所) スライド
機械学習と知財・契約に関しては、①学習に利用するデータをどのようにして適法に収集するか(主として著作権、個人情報保護法、肖像権)の問題と、②学習過程や学習結果で生成された中間成果物や成果物(学習用データセット、学習用プログラム、学習済みモデル、パラメータ、ハイパーパラメーター、ノウハウ等)について、データ提供者と開発者との間でどのように合理的に帰属・利用条件を設定するかという問題に二分される。本講演では、①についての近時の法改正を含めた基礎的な知識、及び②についての実務における現状と工夫について紹介する。
継続的改善をし続けるための機械学習基盤の課題
講演者3: 有賀 康顕( Arm Treasure Data ) スライド
機械学習の学習や推論といったパイプラインを実行するにあたって、それを支えるシステムや機械学習基盤はアプリケーションの目的、データ量、レイテンシなど求められる特性や要件に応じて多様である。一方、産業界では各社それぞれの機械学習基盤を構築しているが、多くはエンジニアリングによる取組のためシステムデザイン自体を論文等で共有するインセンティブは少なく、機械学習基盤特有の課題やそれを克服するシステムアーキテクチャのパターンは明らかになっていない。本発表では、エンジニアリングとしての機械学習基盤、特に本番環境で継続的に予測し続けるためのシステムの課題やそれらに対するアプローチをオープンソースを中心に紹介をする。
招待講演3: 日本におけるデータサイエンスの現状と今後( 15:15 – 16:15 )
講演者:竹村彰通(滋賀大)
データサイエンスを取り巻く状況がますます流動的になってきている。今年の6月に政府が決定した「AI戦略2019」では「数理・データサイエンス・AI」という用語が使われ、これらがデジタル社会の基礎知識であるとしている。そして大学教育については、「文理を問わず、全ての大学・高専生(約50万人卒/年)が、課程にて初級レベルの数理・データサイエンス・AIを習得」という目標を掲げている。しかし大学教員の実態から考えれば、このような目標は現実的ではないと思われる。この講演では、データサイエンスの現状と今後のより現実的な見通しについて考える。