2009年10月19日(月) |
|
◇09:35-12:00 「金融リスクと統計的学習」 (オーガナイザー:中田貴之) | |
|
|
金融リスクは株価や為替などのマーケットの変動を表す市場リスクや企業倒産を対象とした信用リスクなどに細分される。本発表では、信用リスクの計量化モデルとその予測結果の評価方法を紹介し、限られた信用データのもとでの企業倒産判別の最適化に向けたアプローチを提案する。さらに判別モデルでは表現できない、実務的な課題について述べる。 | |
|
|
金融リスクの把握では、個別の株価や個別企業の信用力の変動などの各変量に関する分布(周辺分布)を把握するとともに、変量間の依存構造を把握することが大切である。コピュラは依存構造を表す一般的な関数であり、線形相関係数よりも柔軟に依存構造を表現する。本発表では、さまざまなコピュラを紹介し、変量間の裾での依存度合いに注目したうえで、コピュラの違いが市場リスクや信用リスクに及ぼす影響を具体例で考察する。 | |
極値統計学は,希ではあるがそれが発生すると深刻な影響を与える自然現象,豪雨,強風,大地震等,を伝統的に取り扱ってきた.防災のための建造物の設計のためには,将来起こりうるリスクを評価しなければならない.すなわち,我々の経験した事のないような事象についての予測が必要になる.そのためには利用可能なデータから統計的外挿を行なわなければならない.この様なリスクの評価は,現在では多くの分野(工学をはじめ経済等の分野)で必要になっている. 極値統計学では,利用可能なデータに応じた次の2つの方法が標準的である:一つはブロックごとの最大値データに一般極値分布を適合する方法,もう一つは十分大きな閾値以上のデータに一般パレート分布を適合する方法.これら方法を用いて最大値の分布や母集団分布の上側微小確率点(再現レベルやバリューアットリスクとよばれる)を推定しリスクの評価を行う. |
|
2009年10月20日(火) |
|
◇09:30-12:00 「音声・音響処理と機械学習」(オーガナイザー:渡部晋治、持橋大地) | |
|
|
例えば音声は音素によって構成され、音楽は音階単位の音で構成されているように、自然界の音響信号には、一見多様であっても実際は限られた種類の要素だけで構成されているという規則性をもつものが多い。本発表では、事前には未知な信号の構成要素を自律的に学習するスパース表現と呼ぶアプローチにより、このような規則性を積極的に利用して推定を行う、新しい音響信号処理の枠組を提案する。 | |
|
|
本発表では、音楽情報処理分野における機械学習手法の適用について、いくつか研究事例を挙げながら説明する。特に、どのような事象が機械学習可能であるのかという観点から議論してみたい。具体的には、(1) ハイブリッド型音楽推薦のための音響的特徴とユーザ評価の同時的生成過程、(2) 音楽に時間同期したコメントを自動付与するための音響的特徴と言語的特徴の対応付け、(3) 音楽をサムネイル化するための音響的特徴と視覚的特徴の対応付け、(4) 歌声の基本周波数抽出や音楽と歌詞との自動アラインメントのための歌声特徴量などが機械学習によりモデル化の対象とされてきた。この結果実現することができたアプリケーションについても紹介を行う。 | |
|
|
系列パターン認識問題の典型例である連続音声認識において広く用いられている代表的識別学習手法の概略を紹介し、その成り立ちを異にする各手法について、目的関数のレベルで共通の関数を基本とする統一的な解釈が可能であることを示す。さらに、この解釈に基づく、各手法の拡張や一般化についても言及する。 | |
|
|
日常生活での共有経験を反映するコミュニケーションは、対話者による環境の理解と、対話者間の相互理解を基盤として成立する。ロボットが、このようなコミュニケーション能力を、実世界における人間とのインタラクションを通して学習するための計算機構LCoreについて解説する。LCoreにより、ロボットは、音韻、単語、文法、 物体のカテゴリー、動作、タスクに関する知識、語用論的知識など、コミュニケーション能力を構成する要素(信念)をインクリメンタルに獲得し、それらを一つの信念システムとして統合してゆく。この信念システムはダイナミックグラフィカルモデルで表現される。さらに、ロボットは、この信念システムに基づいた発話の生成と理 解のプロセスを通して、対話者の信念システムの状態を推測し、自らの信念システムを修正する。ロボットと対話者は、互いにこのような調整を続けること―信念システム間のダイナミックな結合―により、状況に応じて適切に発話を生成・理解し、行動できるようになる。 |
|
◇13:30-14:30 「化学構造とその数理」 (オーガナイザー:大羽成征、瀬々潤) | |
木構造や化学構造に対して様々な特徴ベクトルやカーネル関数が提案され利用されてきた。本講演では、まず、順序木および無順序木に対する特徴ベクトルと、それを用いた木構造の編集距離の$L_1$空間への埋め込みとその検索への応用可能性について述べる。次に、与えられた特徴ベクトルからもとの木構造もしくは化学構造を推定する問題の計算量、アルゴリズム、応用について述べる。 |
|
2009年10月21日(水) |
|
◇09:30-12:00 「疎グラフ上のダイナミクス」(オーガナイザー:三村和史、鹿島久嗣) | |
|
|
情報科学,社会科学,生命科学などの分野で,例えば充足可能性問題,誤り訂正符号,ニューラルネット,マルチユーザ検出問題,輸送問題,代謝ネットワークなどのように,ネットワークで特徴づけられる問題が多数報告され,その動的な性質を調べるための理論的な解析が進められつつある.特に,頂点被覆問題や誤り訂正符号などの情報科学の諸問題に注目して,ダイナミクスの解析からどのようなことがわかってきたかについて簡単に紹介する. |
|
|
|
神経回路,人間関係,食物連鎖, インターネットなどに見られる多くのネットワーク構造には, スケールフリーなどといった共通の特徴がある. これらの「複雑ネットワーク」上のダイナミクスの研究は, 感染症やウイルスの拡散防止戦略, ネットワーク内での効率的情報探索手法の開発, 神経ネットワークの構造と脳の機能の相関の解明等, 自然科学,工学,社会科学などの広範囲にわたる応用が考えられる. 本講演では,こういったネットワーク上のダイナミクスの解析手法の一つとして, 経路積分を用いた解析を紹介する. 具体例として,ランダムネットワーク上の振動子の同期現象を考え, この問題に対して経路積分を用いてどのようなことが言えるかを紹介する. |
|
|
|
免疫系のイディオタイプネットワークにおいては, ある抗体を識別する免疫細胞の数は, システムサイズによらず1のオーダーであると考えられている. このような疎結合相互作用は,免疫系に限らず,ニューラルネットワーク, 一般の複雑ネットワークや符号理論(LDPCC)などでも現れる. 疎結合系の有効な解析方法の一つが空洞法(cavity法)である. 本講演では,特に位相振動子を素子とする疎結合ネットワークを取りあげ, 空洞法による解析方法を紹介する. また,ベーテ近似や信念伝搬法(belief propagation), レプリカ法などとの関連や, 応用可能な他の例などについても紹介する予定である。 |
|
◇13:30-14:30 「ランキング学習の最前線」(オーガナイザー:小山聡) | |
|
|
As an interdisciplinary field between machine learning and information retrieval, learning to rank is concerned with automatically constructing a ranking model using training data. Learning to rank technologies have been successfully applied to many tasks in information retrieval, and have been attracting more and more attention recently in the machine learning and information retrieval communities. In this talk I will introduce first explain the problem formulation of learning to rank, and relations between learning to rank and the other learning tasks. I will then describe in details about learning to rank methods developed in recent years, including pointwise, pairwise, and listwise approaches. |
|
◇14:40-15:20 「パターン認識の新潮流」(オーガナイザー:中島伸一) | |
情報科学では、抽象化された情報と現実の世界の関係、すなわち符号化は任意で あるとされる。逆に、一般対象に内包される情報の概念は、符号化できる対象の 全体を限定して、その範囲でのみ意味を持つ。しかし、例えば「有限の情報を持 つ図形」の全体を扱いたい場合、その全体を定義するためにまず情報の概念を使 う必要があるが、そのためには符号化を指定する必要がある。「図形」全体が符 号化できればよいが、対象となる集合が巨大すぎてそれは不可能である。このよ うに、対象の全体があまりに大きくなると、その全体に共通して適用可能な情報 概念の定義が難しくなる。このように、ビットで表わされる記号の世界を離れて 情報について考えると、他にも、符号化自体の隠し持つ情報量が無視できない場 合、符号化は任意とはいえなくなる、また、現実の世界における対象の持つ規則 性と符号化された対象の規則性が一致するようにしなければ、符号化を通して定 義された情報に意味がなくなる、等の問題が生ずる。本講演では、一般にパター ンとは何かを考えるときにも生ずるこれらの問題を考察し、一つの解答として、 任意の空間内で、その空間における規則性を規定する写像によって直接定義され た、計算と情報量の概念について紹介する。 | |
◇15:30-16:50 「広がる機械学習応用のフロンティア」(オーガナイザー:井手剛、中島伸一) | |
|
|
近年、顔画像認識技術が急速に実用化してきた。その代表的な応用として、広く普及されたのは顔検出機能を搭載したデジタルカメラやビデオカメラである。その他にセキュリティ分野における顔認識技術の応用や、自動マーケティングにおける性別年齢推定技術の応用なども実用化されている。これらの技術の実現には機械学習がなくてなならない重要な役割を果たしている。本講演では、顔検出、顔特徴点検出、顔認識、人体検出などの技術の開発の中で、どのように機械学習技術を応用し、そしてどのようにこれらの技術が実応用されているかの事例を紹介する。 | |
|
|
様々な産業界において,製品の品質や歩留りを改善し, 生産効率を高めるために,入手困難な品質データに関連 していると期待される膨大なプロセスデータを効果的に 解析する技術が求められている.本講演では,操業デー タに基づく製品品質の推定とプロセスの監視に焦点を当 て,様々なデータ解析手法の活用事例を交えながら,石 油化学,半導体,鉄鋼,製薬など様々な産業界における 現状と課題について述べる.特に,必ずしも連続的でな いプロセス特性の変化にモデルを適応させる方法の重要 性を指摘し,解決策の一つとして,Just-In-Timeモデリ ングにおける,相関関係に基づくパターン認識やスペク トラル・クラスタリングの応用について紹介する. |