第1回IBISML研究会 | 情報論的学習理論と機械学習 (IBISML) 研究会

第1回研究会は大盛況のうちに終了いたしました。ご講演の先生方、参加された皆様、すべてに心から御礼申し上げます。

参加者の方から頂いたフィードバックの集計結果をこちらに載せました。全てのコメントも運営側で共有し、今後の企画の改善につなげたいと思います。ご協力どうもありがとうございました。

日程： 2010年6月14日(月)-15日(火)
場所：東京大学武田先端知ビル 5F 武田ホール (東京都文京区)
- 写真入りの地図
主催：電子情報通信学会情報論的学習理論と機械学習研究会（IBISML）
連続開催
- 第1回 Latent Dynamics Workshop
担当幹事：山西健司（東京大学)、井手剛（IBM東京基礎研究所）
参加費：無料
- プログラム（アブストラクトの一括ダウンロード等）
- 予稿集に関しましては会場にて購入できます。
参加登録：不要
- 発表なしの聴講参加に関しては、事前の参加登録は不要です。当日会場へ直接お越し下さい。
- ~~懇親会の申し込みは締め切りました。~~会場の容量の都合により、当日受付の予定はありませんのでご了承ください。

2010年4月より、IBISML（あいびす・えむえる: Information-Based Induction Sciences and Machine Learning）という機械学習の新たなコミュニティが発足します。IBISMLは、1998年より12年間にわたり開催されてきた「情報論的学習理論ワークショップ」の運営母体と、2006年に発足し、以来活発に研究会を主催してきた人工知能学会・データマイニングと統計数理研究会が統合してできる新たなコミュニティです。

これは、日本において機械学習を専門領域とする統一コミュニティが発足したことを意味し、これにより、日本の機械学習・データマイニング関連分野の研究がさらに活発になることが期待されます。

本IBISML研究会の記念すべき第1回研究会合が、2010年6月14日と15日の両日、東京大学にて開催されます。今回は初回を記念して、機械学習およびその関連分野で日本を代表する方々をご招待してご講演をお願いするほか、下記の通り一般講演も募集する予定です。機械学習研究の歴史に重要な一歩を記す会合となることと思います。どうかご参加くだされば幸いです。

招待講演

第1回IBISML研究会では、機械学習およびその関連分野で日本を代表する次の方々に招待講演をしていただきます。

鷲尾隆（大阪大学）
渡辺澄夫（東京工業大学）
福島孝治（東京大学）
津田宏治（産業総合研究所）
杉山将（東京工業大学）
岡野原大輔（Preferred Infrastructure）
柳井啓司（電気通信大学）
牧野貴樹（東京大学）
大羽成征（京都大学）

一般発表の募集

IBISML第1回研究会では、上記招待講演に加えて、一般講演も広く募集します。

申込締め切り

~~2010年5月10日（月）23:59~~
申し込みはこちら（締め切りました）

申し込みに関する注意点。

「発表の分類」は「一般発表」のどれかでお願いします（特に参照しませんので適当でもかまいません）。
申し込み後、担当幹事の方で簡単なチェックをさせていただきます。内容、時間的制約その他の都合で、発表をご遠慮いただく可能性もあります。その旨了解いただければ幸いです。
14日（月）夕方に懇親会を企画しています。受付システムに懇親会の出席可否のアンケートがありますが、参加される方は別途メールにて申し込みが必要ですのご注意ください。

カメラレディ原稿締め切り

~~2010年5月24日（月）23:59~~ 締め切りました

原稿のご用意についての注意点。

頂いた原稿は電子情報通信学会技術研究報告として出版されます。
研究成果の共有という趣旨のため、4ページ以上（12ページ以下）とさせていただきます。
提出の形式はpdfに限ります（Wordは受け付けません）。
原稿の用意の仕方などの詳細は、このページをご参照ください。参考までにサンプルを下記に載せておきます。

本研究会で対象とする主な分野は下記の通りです。

機械学習の情報論的基礎理論、統計数理、計算論的基礎理論、統計物理学的基礎理論
機械学習のデータマイニング応用
機械学習の信号処理への応用
機械学習のパターン認識・識別への応用
機械学習の自然言語、音声処理、画像処理への応用
機械学習のバイオインフォマティクスへの応用
機械学習の金融工学への応用
機械学習のロボット制御への応用
機械学習の生命科学・脳科学への応用
その他機械学習応用

懇親会

第1回IBISML研究会では初日14日（月）の夕方に懇親会兼 IBISML研究会発足祝賀会を企画します（参加申し込みは締め切りました）。会場の容量の都合で、当日申し込みを受け付ける予定はありません。悪しからずご了承ください。

懇親会申し込み締め切り

~~2010年6月8日~~ 締め切りました
場所：ルヴェソンヴェール本郷
料金： 4000円程度
すばらしいフランス料理といろいろ

プログラム

当日のプログラムは下記の通りでです。プログラムは電子情報通信学会のサイトでもご覧になれます（アブストラクトの一括ダウンロード等も可能です）。
最新の情報は本Webサイトにて随時更新するほか、IBISMLのメーリングリストおよびTwitterアカウント＠ibismlでもご提供します。

6月14日（月）

オープニング（司会: 井手剛）

09:30 IBISML研究会: 委員長山西健司

特別セッション1（座長: 井手剛）

09:35-10:25 招待講演：杉山将、「統計的機械学習の新展開：確率密度比に基づくアプローチ」 [slides]

統計的機械学習のほとんどの課題は，データの生成確率分布の推定を介して解決することができる．しかし，確率分布の推定は機械学習における最も困難な問題の一つとして知られているため，現実的には分布推定を回避しながら対象となる課題を解決することが望ましい．例えば，パターン認識法の一つであるサポートベクトルマシンでは，データの生成確率を推定することなくパターン認識に最低限必要な決定境界を直接学習することにより，高い汎化性能の獲得を可能にした．
これまで，分布推定を介さない学習アルゴリズムの開発は，個々の機械学習課題に対して個別に行われてきた．それに対し我々は，様々な機械学習課題に対して統一的に分布推定を避けることのできる汎用的な枠組みを提案してきた．この枠組みでは，確率分布でなく確率密度関数の比を考え，分子と分母の確率密度関数を推定することなくそれらの比を直接推定する．密度比推定によって，重点サンプリング（共変量シフト適応，ドメイン適応，マルチタスク学習），ダイバージェンス推定（二標本検定，外れ値検出，変化点検知），相互情報量推定（独立性検定，独立成分分析，特徴選択，十分次元削減，因果推定），条件付き確率推定（確率的パターン認識，条件付き密度推定）など様々な機械学習課題が解決できることを示してきた．従って，我々の開発してきた密度比直接推定手法を用いることにより，上記の機械学習課題群を一挙に，かつ，高精度に解決できるようになった．
本講演では，この枠組の全体像を紹介すると共に，最新の研究成果についても述べる．

参考文献
杉山将：密度比に基づく機械学習の新たなアプローチ，統計数理，印刷中．
Masashi Sugiyama, Taiji Suzuki, and Takafumi Kanamori:Density Ratio Estimation in Machine Learning—A Versatile Tool for Statistical Data Processing, Cambridge University Press, to appear.

10:25-11:15 招待講演：津田宏治、「複合ソート法による高速な全ペア類似度検索」 [slides]

近年、画像や信号などを、数十ビット程度のスケッチとよばれるビット列で表す手法が、多く提案されている。ここから、半教師つき学習などに必要な類似度ネットワークを作成するには、ハミング距離の意味で近いペアを網羅的に発見する必要がある。しかし、全てのペアに関して距離を計算する方法は遅すぎ、三角不等式を用いて枝刈りをする方法を用いても十分な速度が得られない。本発表では、アイテムセットマイニングに用いられるPatternGrowth法と、基数ソートを組合わせた複合ソート法という手法を紹介し、160万サンプルの画像データに適用して、cover tree, Lanczos bisectionなどの他手法よりも、大幅に高速であることを示す。特に、Locality sensitive hashingを用いてスケッチを作成した際の平均的な偽陰性確率（見逃しの確率）や、重複した発見を避けるための工夫についても述べる。

11:15-11:20 休憩

11:20-12:10 招待講演:：鷲尾隆、「変数間因果関係に関するリレーショナルデータマイニングへの取り組み」 [slides]

多数の変数を容易に測ることができる時代となり，どの変数がどの変数に影響してデータが生成されたか，即ちデータ生成過程を体系的に把握して対象を理解したい，というニーズが高まっている．この目的には，長い歴史を持つグラフィカルモデリング，時系列データモデリングなどの技術が使われてきたが，近年，新たな技術展開を見ている．これらを背景として，我々の研究室ではグラフマイニング研究を発展させ，変数間因果関係に関するリレーショナルデータマイニング研究に取り組んでいる．ここでは，この取り組みとこれら最新技術を用いた具体的解析例を紹介し，データ生成過程モデルを用いるデータマイニングの可能性を展望する．

12:10-13:30 昼休み

特別セッション2（座長: 山西健司）

13:30-14:20 招待講演：渡辺澄夫、「代数幾何と学習理論への入門と新展開」 [slides]: 情報論的学習理論に現れる確率モデルにおいてその学習の挙動は代数幾何学的な構造によって定まることが知られています。この講演では初めてこの問題に出会う人のために数学的な予備知識が要らない解説を行います。また最近の発展と研究の動向について報告します。
14:20-14:30 休憩
14:30-15:20 招待講演：岡野原大輔、「大規模文字列解析の理論と実践」[slides]: 文字列データは機械学習の処理対象として自然言語処理，ゲノム解析など多くの場面でみられ，そのデータの規模は近年、非常に大きくなっている．本講演では進展の著しい文字列処理の理論とそれに基づいた実践的な手法を入門から最新の結果まで紹介すると共に，これらが機械学習でどのように利用されているかについて解説する．
15:20-15:30 休憩

一般講演（学習の理論）座長神嶌敏弘

15:30-15:45 2次損失サポートベクトルマシンの非線形正則化パスに関する一考察 [slides]: ○烏山昌幸・竹内一郎（名工大）
15:45-16:00 階層Pitman-Yorトピックモデル [slides]: ○佐藤一誠・中川裕志（東大）
16:00-16:15 直交化と閾値化に基づくノンパラメトリック回帰の方法について: ○萩原克幸（三重大）
16:15-16:25 休憩

一般講演（モデルとデータの統合）座長: 鹿島久嗣

16:25-16:40 オンライン予測におけるプライバシ保護 [slides, slides (pptx)]: ○佐久間　淳・荒井ひろみ（筑波大）
16:40-16:55 階層ベイズモデルによる協調フィルタリング: ○麻生英樹（産総研）
16:55-17:10 カスタム価格設定推薦システム　〜簡単な実装と予備実験〜 [slides, slides (longer version)]: ○神嶌敏弘・赤穂昭太郎（産総研）・佐久間　淳（筑波大）
17:10-17:25 生存時間研究における調整型ランダムフォーレスト法: ○下川敏雄（山梨大）・辻　光宏（関西大）
(5) 17:25-17:40 影響伝播モデルIDMによる多面的データマイニング: ○松村真宏（阪大）

18:30〜懇親会: （申し込みはこちら）

6月15日（火）

特別セッション3（座長: 井手剛）

09:30-10:20 招待講演：牧野貴樹、「ノンパラメトリックベイズに基づく統計的機械学習」 [slides]: ノンパラメトリックベイズは、過学習の回避とモデル選択という、機械学習において繰り返し問題となるテーマに対する新しいアプローチである。ノンパラメトリックベイズ手法は、仮説空間上に適切な事前確率分布を導入することで無用に複雑な解を避けるベイズ推定の考え方をさらに推し進め、無限個のモデルの混合分布を考えることで、学習データに対応する複雑さのモデルが自動的に選択されるようにできることから、関数回帰、クラスタリング、文書のトピックモデルなど、多くの応用が研究されている。今回は、隠れマルコフモデルをノンパラメトリックベイズ化することで無限個の隠れ状態まで扱える infinite HMMを中心に、ノンパラメトリックベイズの枠組みを紹介する。また、infinite HMM の自然な拡張により隠れ状態の階層的なクラスタリングが実現できることを示す。
10:20-10:25 休憩
10:25-11:15 招待講演：大羽成征「超多重検定によって分かること」: 多重性の非常に高い検定（超多重検定）は、非常に多数の要因が関わる高次元システムを対象とするデータサイエンスにおいて、ますます重要な役割を果たしつつある重要な技術である。保守性や検出力といった統計的検定における重要概念が、多重性のもとでどのように変化してゆくかを解説したうえで、高い多重性を積極的に利用した新しい検定の世界を概観する。
11:15-11:20 休憩
11:20-12:10 招待講演：柳井啓司、「一般物体認識における機械学習の利用」: 近年，デジタルカメラやWeb上の写真共有サイトなどの普及により対象を限定しない一般的な実世界シーンの画像が爆発的な増大している．そうした制約のない実世界シーンの画像に対して，計算機がその中に含まれる物体を一般的な名称で認識することは「一般物体認識」と言われ，その研究は2000年以降，急速に発展を遂げている．急速な発展には，画像特徴表現の進歩，Webの普及による大量の学習データの入手容易化に加えて，機械学習の発展が大きな役割を果たしている．本講演では，「一般物体認識」の基礎的な技術について機械学習および画像特徴表現の両面から解説し，さらに最近の研究トピックや今後の研究課題について紹介を行う．
12:10-13:30 昼休み
アナウンス：大羽成征、持橋大地

特別セッション4 （座長: 山西健司）

13:30-14:20 招待講演：福島孝治、「マルコフ連鎖モンテカルロ法の新展開」 [slides]: マルコフ連鎖モンテカルロ法は，大自由度確率分布からのサンプリングやその期待値計算法の一つとして，様々な問題に応用されている．従来，サンプリングが難しいとされてきた多峰的な確率分布に対しても，ここ十数年の間に発展したモンテカルロ技法により，その困難点は大きく解消されてきた．ここ数年，あらたな展開として，規格化定数の評価から数え上げの問題への応用や確率分布の裾の稀な事象のサンプリングがある．このような最近のマルコフ連鎖モンテカルロ法の発展を例をあげながら外観する．

一般講演（物理現象と学習）座長: 持橋大地

14:30-14:45 交換モンテカルロ法による反射スペクトルにおける複合吸収帯の推定: ○永田賢二・杉田精司・岡田真人（東大）
14:45-15:00 データ変換による位相応答曲線の効率的推定 [slides]: ○中江　健（総研大）

一般講演（強化学習）座長: 大羽成征

15:10-15:25 一般化TD学習 [slides]: ○植野　剛・前田新一（京大）・川鍋一晃（フランフォーファ）・石井　信（京大）
15:25-15:40 New Feature Selection Method for Reinforcement Learning — Conditional Mutual Information Reveals Implicit State-Reward Dependency — [slides]: ○Hirotaka Hachiya・Masashi Sugiyama

一般講演 (構造学習・ベイジアンネット・確率推論) 座長: 鷲尾隆

15:50-16:05 Dependence Minimizing Regression with Model Selection for Non-Linear Causal Inference under Non-Gaussian Noise: ○Makoto Yamada・Masashi Sugiyama（Tokyo Tech）
16:05-16:20 命題論理に基づく確率モデルのための二部決定グラフと順序符号化を用いた効率的なEMアルゴリズム: ○石畠正和・亀谷由隆・佐藤泰介（東工大）・湊　真一（北大）
16:20-16:35 2重潜在クラスモデルとベイジアンネットを結合した小売サービスにおける顧客購買行動モデリング: ○石垣　司・竹中　毅・本村陽一（産総研）

一般講演（符号化・モデル選択）座長: 杉山将

16:45-17:00 逐次的動的モデル選択の線形時間アルゴリズム [slides]: ○櫻井瑛一・山西健司（東大）
17:00-17:15 符号化ダイバージェンスによる2つの集合の異なり具合の定量化 [slides]: ○杉山麿人・山本章博（京大）
17:15-17:30 正規化最尤符号化に基づくグラフクラスタリング [slides]: ○平井　聡・冨岡亮太・山西健司（東大）
17:30-17:45 モデル・アルゴリズム選択によって起こる誤分類率へのバイアスと真の誤分類率の推定: ○倉橋一成・大橋靖雄（東大）

クロージング

17:45 – 17:50 クロージング: 山西健司、杉山将