第2回IBISMLチュートリアル


お知らせ

  • 2013/11/11:本チュートリアルは盛況のうちに終了しました.ご参加いただきありがとうございました.
  • 2013/11/01:参加募集を締め切りました
  • 2013/10/01:参加募集を掲載しました
  • 2013/09/10:開催概要を掲載しました

第2回IBISMLチュートリアル

情報通信技術の進展に伴って大量のデータが流通・蓄積されるようになりました.例えば,ソーシャルネットワークなどのインターネット上では多くの評判情報がやりとりされたり,クラウドを利用して情報の収集をしたりしています.これらのデータは,ビッグデータなどと呼ばれています.

これらのデータを活用するためには,機械学習や統計の分析技術が必要になります.そこで,情報論的学習理論と機械学習研究会 (IBISML)ではこれらのデータ分析技術について,入門的な内容から,最新の高度な技術までを知ることができるチュートリアルを企画しました.

このIBISMLチュートリアルは,機械学習の先端分野で活躍中の4人の講師による,魅力的な講演で構成されています.各講演とも,データ分析がどんなものかという入門的な内容と,IBISMLチュートリアルならではでの機械学習分野の先端の両方で構成されています.そのため,これからデータ分析をはじめたいという方々から,すでにデータ分析している方々まで,有用な情報を得ることができるような構成としました.

今回の第2回IBISMLチュートリアルは,第16回情報論的学習理論ワークショップ (IBIS2013)と連続開催です.このワークショップは無料ですが,本チュートリアルは下記の『開催情報』にありますように,有料となっています.チュートリアルの参加には,IBISワークショップ(IBISワークショップ参加募集)とは別に下記の参加登録が必要となります.

2013年11月10日と11日の二日間の開催で,10日は一日を通じてチュートリアルですが,11日はチュートリアルは午前のみで,午後はIBISワークショップとなります.11日の午前と午後を通じて参加するには,チュートリアルとワークショップの両方の登録が必要となります.

開催情報

なお,過去の開催記録についてはIBISMLチュートリアルのページをご覧下さい.

参加申込

第2回IBISMLチュートリアル申込(Googleフォームのページに移動します)

参加申込を締切ました:2013年11月1日

申込手順

以下の手順によりお申し込み下さい.

  1. 第2回IBISMLチュートリアル申込(Googleフォームのページに移動します)』より,必要事項を入力し,仮申込をして下さい.
  2. 自動返信メールに書かれている申込番号をご確認下さい.
  3. 次の口座に,一般:2万円,学生:5千円(いずれも税込み)をお振込下さい.
    銀行名: みずほ銀行【銀行番号:0001】
    支店名 :大岡山支店【支店番号:0145】
    普通口座: 2205293
    口座名義: IEICEIBISML研究専門委員会【IEICEIBISMLケンキュウセンモンイインカイ】
  4. お振込は11/8日には確認できるように,電信の場合はその前日にはお振り込み下さい.
    • 『学生』とはフルタイムの学生で,社会人ドクターなどは含みません.
    • お振り込みいただく時には,できるだけ振込人名の後に申込番号を追加して下さい.
    • お振込は入力いただいた『お名前』,もしくは『振込名義』の一致により確認させていただきます.振込名義はカタカナで入力して下さい.
    • フォームより仮申込いただくとメールが返信されます.1日以上メールが届かない場合はメールにてお問い合わせ下さい.
  5. 担当者がお振込を確認いたしましたら,本申込の完了をお知らせするメールをお送りいたします.
    • 仮申込後,入金期限の11/8になっても入金が確認できない場合は,参加者がキャンセルなされたものとして扱わせていただきます.
    • お振込いただいたのち,3営業日たっても本申込の確認メールが届かない場合はメールにてお問い合わせ下さい.

お申込に関する注意点

一般情報

  • 電子情報通信学会の会員でない方もご参加いただけます.
  • 参加当日には印刷した講義資料の冊子をお渡しします.この冊子は参加証を兼ねておりますので,会場へは係員に呈示いただいて入場してください.
  • 講義中に他の参加者のご迷惑となる行為をされる方は,ご退場いただく場合があります.その際には返金はいたしません.

参加費

  • 参加費の決済手段は上記の銀行振込のみとさせていただきます.カードでのお支払いや,当日の現金払いはお受けできません.
  • 参加費(一般:2万円,学生:5千円)は税込みの金額です.
  • 参加者のご都合によりキャンセルされる場合には,振込手数料を差し引いた金額を返金させていただきますこと,ご承知おき下さい.
  • 返金の手段は銀行振込に限らせていただきますこと,事前にご承知おき下さい.
  • 返金の際には,申込時にご記入のアドレスにメールでご連絡を取らせていただきます.メールが通じない,2週間以上お返事をいただけない,もしくは銀行口座への送金が何らかの理由で行えない場合は,返金を放棄されたものとして扱わせていただきます.

領収書

  • 参加者のみなさんには,2013年11月10日付けの領収書を,開催当日にお渡しします.
  • 領収書の宛名は,仮申込のときの『お名前』とさせていただきます.他の名義をご希望のときは,その旨を通信欄にお書き添え下さい.

請求書

  • 請求書は,通信欄にて特にご連絡いただいた参加者の方にのみ発行させていただきます.
  • 請求書は,当日に領収書と共にお渡しします.事前の送付をご希望の場合は,印鑑のないものをPDFでメールにてお送りすることは可能です.ご希望される場合は,その旨を通信欄にお書き添え下さい.
  • 郵送などその他の手段による事前送付はお受けできません.
  • 請求書の宛名は,仮申込のときの『お名前』とさせていただきます.他の名義をご希望のときは,その旨を通信欄にお書き添え下さい.

プログラム

全体概要

日時 演題 講師
11月10日 10:00−12:00 機械学習概要 村田 昇(早稲田大学)
11月10日 13:30−15:30 機械学習に基づく自然言語処理 ― 全体概要と教師つき学習 松本 裕治(奈良先端科学技術大学院大学)
11月10日 16:00-18:00 機械学習に基づく自然言語処理 ― 教師なし学習と最近の話題 持橋 大地(統計数理研究所)
11月11日 10:00-12:00 機械学習とクラウドソーシング — 機械の知と人間の知の融合 鹿島 久嗣(東京大学)

機械学習概要

  • 日時:11月10日 10:00-12:00
  • 講師:村田 昇(早稲田大学)
  • キーワード:期待損失,教師あり学習,教師なし学習,オンライン学習,バッチ学習,正則化
  • 応用分野:パターン認識,信号処理,多変量データ解析

データが生成される確率的な規則や,データを分類するための基準などを総称して学習モデルと呼びます.集めたデータの本来の性質を上手く再現するように学習モデルを推定するのが機械学習です.通常はどれだけ良いかを決めるより,どれだけ悪いかを決める方が考え易いので,学習モデルの再現の悪さを測るための損失を考え,全てのデータに対する損失の平均(期待値)である期待損失を最小化するというアプローチをとります.機械学習はこの期待損失を最小化するという枠組みで一貫した扱いができるようになります.

本チュートリアルでは,よい推定をするには損失にどういう性質が必要となるのか,分析方法によって損失をどう選べばいいのか,損失を変えると将来の予測の精度はどう変わるのかといった,機械学習における基本的な話題を解説します.

機械学習に基づく自然言語処理 ― 全体概要と教師つき学習

  • 日時:11月10日 13:30-15:30
  • 講師:松本 裕治(奈良先端科学技術大学院大学)
  • キーワード:自然言語処理,教師つき学習,構造学習
  • 応用分野:テキストやWebページの分類や,その性質の分析

日本語や英語などのテキストを解析し,その構造や意味を得る方法およびその応用を目指した自然言語処理研究は,過去20年の言語データの爆発的な増加により,文法などの規則に基づく解析から大規模データに基づいた統計的機械学習に基づく方法へと進展しました.手法としては,言語データの解析結果を人手によって解析した結果を用意し,機械学習を適用することによって自動解析プログラムを作成しようというアプローチである教師つき学習を用いる手法と,大規模な未解析言語データを利用する教師なし学習による手法に大別できます.また,問題の性質により,分類学習,構造学習,複数の手法を用いた同時学習など,様々な形の学習法が利用されます.

本チュートリアルでは,代表的な言語解析問題に対する機械学習の適用事例を紹介します.

機械学習に基づく自然言語処理 ― 教師なし学習と最近の話題

  • 日時:11月10日 16:00-18:00
  • 講師:持橋 大地(統計数理研究所)
  • キーワード:自然言語処理,教師なし学習,潜在変数モデル,オンライン学習
  • 応用分野:テキストや文書の内容解析や分類,情報推薦,クラスタリング

大量のデータに基づく統計的機械学習によって自然言語処理は大きな成功を収めました.しかし,そのために必要とされる『正解』を人手で入力した教師ありデータを大量に作成し,その品質を保持するには莫大な手間がかかる上,教師データが自然に定義されない問題(感情や意味など)も多く存在します.

本チュートリアルでは,このような場合でも生の言語データさえあれば適用できる,自然言語処理の教師なし学習の手法について解説します.大規模データに対しても適用できるオンライン学習についても紹介する予定です.さらに,単純な統計モデルを超えて最前線で行われている自然言語の機械学習の風景を紹介し,統計的機械学習の幅を感じてもらうことを目的としています.

機械学習とクラウドソーシング — 機械の知と人間の知の融合

  • 日時:11月11日 10:00-12:00
  • 講師:鹿島 久嗣(東京大学)
  • キーワード:ヒューマンコンピュテーション,データサイエンティスト,品質保証,データ収集
  • 応用分野:ビジネス,メディア処理,バイオ等の様々な分野を対象とした機械学習の応用システム

数多くの分野で成功を収めてきた機械学習は,ビッグデータの隆盛を背景としてその適用範囲をさらに拡大しつつあります.しかしながら,学習アルゴリズムや計算機の処理能力の進歩とは対照的に,解析にかかわる人間による作業が,全体の分析処理のボトルネックとなるケースが浮き彫りになってきています.今後,機械学習の一層の有効利用を考えるにあたっては,機械による計算と人間による判断・作業との関わりを明確に意識することが重要となっていくでしょう.

こうした状況を背景に,インターネットを介して不特定多数の人々に作業を依頼する「クラウドソーシング」とよばれる考え方が浸透しつつあります.クラウドソーシングを利用することで,今までは膨大な手間が必要であった学習用データの収集を安価かつ迅速に行うことができます.さらに,データ解析そのものをクラウドソーシングを利用して行うようなケースも現れています.本チュートリアルでは,データ解析の諸問題においてどのようにクラウドソーシングを利用できるか,あるいは人間(の集団)による意思決定に機械学習がどのように利用できるかについて,その考え方とアプローチについて解説します.