一般発表一覧 (Poster Presentation Lists)

ポスターセッション 1a [11月12日(水)15:00-17:00]
Poster Session 1a [Wednesday, 11/12, 3:00~5:00 p.m.]
エントリー枠 (Entry Slot) / レギュラー枠 (Regular Slot)

ポスターセッション 1b [11月12日(水)17:10-19:10]
Poster Session 1b [Wednesday, 11/12, 5:10~7:10 p.m.]
エントリー枠 (Entry Slot) / レギュラー枠 (Regular Slot)

ポスターセッション 2a [11月13日(木)13:50-15:50]
Poster Session 2a [Thursday, 11/13, 1:50~3:50 p.m.]
エントリー枠 (Entry Slot) / レギュラー枠 (Regular Slot)

ポスターセッション 2b [11月13日(木)16:00-18:00]
Poster Session 2b [Thursday, 11/13, 4:00~6:00 p.m.]
エントリー枠 (Entry Slot) / レギュラー枠 (Regular Slot)

ポスターセッション 1a [11月12日(水)15:00-17:00]
Poster Session 1a [Wednesday, 11/12, 3:00~5:00 p.m.]

エントリー枠 (Entry Slot)

[1a-E-01] 双曲空間での言語モデル
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:海老沢達輝(国立情報学研究所)
概要:単語には意味の抽象度において階層構造が存在する。この様な階層構造は木構造で表現することができ、木構造は双曲空間上に埋め込むことでユークリッド空間の場合より低次元で精度良く表現することができる。本研究では単語の埋め込み表現を双曲空間で計算した場合、その埋め込み表現の構造に意味の階層構造をユークリッド空間よりも効率的に反映させることができるかについて調べた。

[1a-E-02] TDAを用いた深層学習の初期パラメータ分布の解析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:櫻井佑(慶應義塾大学大学院理工学研究科), 田中秀明(慶應義塾大学大学院理工学研究科), 森雄大(慶應義塾大学大学院理工学研究科), 小林景(慶應義塾大学理工学部数理科学科)
概要:本研究は、ニューラルネットワーク(NN)の初期パラメータの分布の違いと、学習過程における内部表現の構造の遷移の関係を、パーシステントホモロジー(PH)を用いて明らかにすることを目的とする。具体的には、Xavier初期化やHe初期化など複数の分布を用いてNNの学習を行い、中間層の活性化ベクトル群からPHを計算する。その位相的特徴量の時間変化の追跡・比較を通して、考察を行う。

[1a-E-03] Dynamic Neural Collapse のOpen Set Recognitionへの応用
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:川口駿(慶應義塾大学), Chang Yu Hsiang (慶應義塾大学), 小林景(慶應義塾大学)
概要:本発表では、Heら (2024) が提案したDynamic Neural Collapse (DNC) に基づくDYSONの枠組みをOpen Set Recognition (OSR) に応用し、既存の基本的なOSR手法と比較した。
実験の結果、DYSONを組み込むことで性能向上に繋がることが見出され、さらにNeural Collapse理論がOSRにおいてどのように機能するかを解析した。

[1a-E-04] 統計力学的アンサンブルの同値性から見た高次元エントロピー正則化最適輸送
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:加治佐貴大(電気通信大学)
概要:最適輸送問題はエントロピーによる正則化を加えることにより,ギブス分布のスケーリング問題に帰着されることが知られている.他方,統計力学における基礎定理であるアンサンブルの等価性は,ギブス分布とある種の経験分布が高次元の極限で同値になることを述べている.これらの観点から,エントロピー正則化最適輸送の解が,ある条件下においては射影行列のスケーリング問題になることを証明する.

レギュラー枠 (Regular Slot)

[1a-R-01] ソボレフ曲率とその応用
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:岩崎喬一(総研大), Le Tam(統数研/総研大), 日野英逸(統数研/総研大)
概要:本研究では、データ群の幾何的構造を捉える指標として広く用いられるOllivier Ricci CurvatureがWasserstein距離に基づくため計算コストが高いという問題に着目する。そこで、Sobolev Transportに基づき閉形式で計算できる新しい曲率指標としてソボレフ曲率を提案し、複数のデータセットに応用してその有効性を示す。

[1a-R-02] Realistic Evaluation of Deep Partial-Label Learning Algorithms
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:Wei Wang (The University of Tokyo and RIKEN), Dong-Dong Wu (Southeast University), Jindong Wang (William & Mary), Gang Niu (RIKEN), Min-Ling Zhang (Southeast University), Masashi Sugiyama (RIKEN and The University of Tokyo)
概要:Partial-label learning (PLL) is a weakly supervised learning problem in which each example is associated with multiple candidate labels and only one is the true label. In recent years, many deep PLL algorithms have been developed to improve model performance. However, we find that some early developed algorithms are often underestimated and can outperform many later algorithms with complicated designs. In this paper, we delve into the empirical perspective of PLL and identify several critical but previously overlooked issues. First, model selection for PLL is non-trivial, but has never been systematically studied. Second, the experimental settings are highly inconsistent, making it difficult to evaluate the effectiveness of the algorithms. Third, there is a lack of real-world image datasets that can be compatible with modern network architectures. Based on these findings, we propose PLENCH, the first Partial-Label learning bENCHmark to systematically compare state-of-the-art deep PLL algorithms. We investigate the model selection problem for PLL for the first time, and propose novel model selection criteria with theoretical guarantees. We also create Partial-Label CIFAR-10 (PLCIFAR10), an image dataset of human-annotated partial labels collected from Amazon Mechanical Turk, to provide a testbed for evaluating the performance of PLL algorithms in more realistic scenarios. Researchers can quickly and conveniently perform a comprehensive and fair evaluation and verify the effectiveness of newly developed algorithms based on PLENCH. We hope that PLENCH will facilitate standardized, fair, and practical evaluation of PLL algorithms in the future.

[1a-R-03] 統計多様体上の安定なテンソル・行列分解
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:ZHOU DERUN (国立情報学研究所), 杉山 麿人 (国立情報学研究所)
概要:非負テンソル分解における多体近似・ルジャンドル分解の一般化を目指し、自然パラメータの任意制約を導入可能な情報幾何的手法を構築した。今年度は、大規模テンソルに対し、最適な自然パラメータ制約を施した平坦部分多様体が、0制約付き多様体へと収束することを示し、その成果はUAI 2025に採択された。今後は、任意の平坦座標系を用いたテンソル分解の枠組み構築を進める。

[1a-R-04] FedDuA: Doubly Adaptive Federated Learning
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:高倉将吉(LINEヤフー), リュウセンペイ(LINEヤフー), 長谷川聡(LINEヤフー)
概要:本研究では、中央サーバーでの最適化手続きを鏡像降下法の観点から定式化し、クライアント間の不均一性とパラメータ間の不均一性の両方に基づいてグローバル学習率を適応的に選択する新しい枠組み FedDuAを提案する。提案手法はクライアント側に追加の通信や計算コストを要求しないにもかかわらず、広範な数値実験により、様々な状況で既存のベースライン手法を上回り、ハイパーパラメータの選択に対しても堅牢であることが示された。

[1a-R-05] 生存時間解析における累積分布関数予測のための勾配ベースメタ学習手法
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:佐野大河(NTT株式会社 社会情報研究所), 幸島 匡宏(NTT株式会社 人間情報研究所), 高橋 公海(NTT株式会社 社会情報研究所)
概要:生存確率の累積分布関数(CDF)推定では深層ニューラルネット(DNN)が高い性能を誇っている.しかし,希少な疾患等ではDNNの学習データが不足する上に,イベント発生機序の違いからイベント発生確率が従う分布が大きく異なるため転移学習の効果も限定的である.本研究では,サポートセットから得られる生存確率の傾向を用いることで,イベント発生機序が異なるドメイン間でも転移可能なCDF推定モデルのメタ学習手法を提案する.

[1a-R-06] Metapaths meet Transformer: A Transformer Architecture Enhanced by Metapath Semantics for Heterogeneous Graphs
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:Teng Wenhao (京都大学情報学研究科), 山本章博(京都大学情報学研究科)
概要:We present a metapath-guided graph Transformer architecture that places semantic structure at the heart of graph representation learning. Built upon this architecture, our model binds each attention head to a specific metapath, thereby disentangling heterogeneous relations, delivers stronger predictive performance, and, crucially, offers intrinsic interpretability. Unlike prior approaches that merely adapt graph data to generic Transformer designs, we explicitly model the unique semantics of heterogeneous graphs, turning structural priors into guiding signals rather than afterthoughts. Experiments on multiple benchmarks reveal consistent improvements over existing graph Transformers, confirming that our method not only excels in accuracy but also opens a clear window into the role of different metapaths. In this way, our study bridges performance with transparency, showing that interpretability and effectiveness need not be in opposition but can advance together.

[1a-R-07] Efficient MCMC Sampling for Bayesian Neural Networks via Low-Rank Weight Matrix Decomposition
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:金 永山(広島大学), Daniel Andrade(広島大学)
概要:Bayesian neural networks provide principled uncertainty quantification and improved robustness compared to deterministic models, but their adoption is severely constrained by computational requirements. To address this challenge, we propose a low-rank approximation to the full Bayesian posterior that is centered on the maximum a posterior (MAP) estimate. In detail, we propose to fix the primary components of the weight matrices to their MAP estimates and perform MCMC sampling only on the lightweight low-rank components. This reduces the sampling dimensionality for hidden layer weights from order of the product of the current and next layer sizes to order of their sum. Over a wide range of regression and classification tasks, our proposed method achieves computational speedups compared to traditional MCMC sampling methods, while maintaining competitive predictive performance and uncertainty estimates. Moreover, our analysis shows that our low-rank Bayesian neural network can even improve over ordinary Bayesian neural networks, reducing, for example, the negative log-likelihood by up to 31% while maintaining the same predictive quality.

[1a-R-08] エクストリームラーニングマシンを用いた強化学習における行動の取り扱い
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:小松尚登(滋賀大学)
概要:エクストリームラーニングマシン(ELM)は多層パーセプトロンにおいて出力結合重みのみを学習する機械学習手法であり、計算コストの軽さなどの特長から注目されている。
このELMを用いた強化学習を行う場合、先行研究では行動の候補aを入力情報に加えないアーキテクチャと加えるアーキテクチャの二種類が考えられる。本研究では、両者の性能を数値実験により比較する。

[1a-R-09] RFF-GP-HSMMを用いた作業行動の半教師あり分節化
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:饗塲壯(株式会社UnityStep AI,電気通信大学), 齋藤一誠(株式会社UnityStep AI,電気通信大学), 梶原賢(電気通信大学), 八田俊之(三菱電機株式会社,電気通信大学), 長野匡隼(京都大学, 電気通信大学), 中村友昭(電気通信大学)
概要:生産現場の作業行動分析は目視による分析が主流であり,多くの手間と時間を要している.そこで我々は,作業行動の教師なし分節化に基づく解析手法を提案してきた.しかし,教師なし分節化では必ずしも人が意図した分節が得られるとは限らない.そこで本発表では,RFF-GP-HSMM (Random Fourier Feature Gaussian Process Hidden Semi Markov Model)を用いた半教師あり分節化手法を提案する.実験では,一部のデータに教師ラベルを付与することで,作業行動の分節化精度が向上することを示す.

[1a-R-10] ミニマックスかつベイズ最適な最適腕識別:処置選択のための適応的実験計画
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:加藤真大 (みずほ第一フィナンシャルテクノロジー)
概要:固定予算下における最適腕識別(処置選択のための適応的実験計画)問題において,単純リグレットに対してミニマックスかつベイズ最適なアルゴリズムを提案する.私たちは二段階で処置腕を割り当てる.第一段階では各腕を等しい割合で割り当て,明らかに最適でない腕を排除し,アウトカムの分散を推定する.第二段階では,分散の推定値に比例して各処置腕を割り当てる.割り当て後,サンプル平均が最大の処置腕を最適腕とみなす.

[1a-R-11] 最適多分木による解釈可能なクラスタリング
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:鈴木颯斗(筑波大学), 池田春之介(筑波大学), 西村直樹(株式会社リクルート), 高野祐一(筑波大学)
概要:解釈性の高いクラスタリング手法として決定木を用いる方法があるが,二分木では木が深くなり,解釈性が低下するという課題がある.本研究では,多分木の最適化によるクラスタリング手法を提案する.多分木を用いることで木の深さを抑えつつ,高い分類性能と解釈性を両立するクラスタリングが可能である.公開データを用いた従来手法との比較実験によって提案手法の有効性を検証する.

[1a-R-12] 順序回帰において単峰性を促進する学習法の解析
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:山﨑遼也(一橋大学)
概要:賛成・中立・反対のような自然な順序関係をもつ離散目的変数Yを説明変数Xの観測に基づき予測する順序回帰の問題では,データの背後にある条件付き確率分布(P(Y=1|X=x),…,P(Y=K|X=x))がしばしば単峰もしくは単峰に近いと確認されている.先行研究では,条件付き確率分布の予測結果が単峰に近くになるように目指した正則化学習法が検討されている.本研究では,その学習法を解析し,予測結果を単峰に近くするだけでなく,less-confidentなものにすることを示す.

[1a-R-13] 敵対的攻撃に対する畳み込みスパース表現を用いた防御効果の検討
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:林奏太(久留米高専/九州大学), 黒木祥光(久留米高専), 森野佳生(九州大学)
概要:近年,ニューラルネットワークモデルの敵対的攻撃による精度低下が注目されている.本研究では敵対的画像に対する畳み込みスパース表現のノイズ除去能力の有効性を検証した.誤差項として外れ値に強いL1ノルムを導入し,従来のL2ノルムとの違いを比較した.実験の結果,畳み込みスパース表現は敵対的攻撃への防御法として有効であり,更にL1・L2ノルムを自動的に使い分ける方法を導入することが可能であることが判明した.

[1a-R-14] Almost Natural Gradient for Variational Student-t Process Models with Gaussian-Gamma Data Augmentation
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:尾上圭介(奈良先端大), 西村虎太郎(奈良先端大), 久保孝富(奈良先端大), 池田和士(奈良先端大)
概要:Student-t processes (TPs) are a robust extension of Gaussian processes, making them highly suitable for real-world data where the Gaussian assumption is often implausible. However, their practical application has been limited by computational intractability. In this work, we introduce a tractable and scalable structured mean-field variational inference (VI) framework for TP-based models to overcome this challenge. Our approach leverages a Gaussian-Gamma scale mixture representation of the Student-t distribution. This representation allows the Student-t distribution to be handled within the exponential family, which in turn enables the derivation of a closed-form, approximate natural gradient for updating the variational parameters. We validate our framework on both regression and classification models with heavy-tailed likelihoods, demonstrating its effectiveness on various real-world datasets.

[1a-R-15] 大規模言語モデルによる選好の推定とアイディア生成への応用
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:岩井皓暉(株式会社博報堂DYホールディングス), 熊谷雄介(株式会社博報堂DYホールディングス), 馬場雪乃(東京大学)
概要:本発表では,相対比較データから大規模言語モデルに選好規則を自然言語で推定させ,その推定結果をもとに選好条件付きのアイデア生成を行う枠組みを提案する.実験では,選好の推定とアイディア生成の双方における有効性を検証する.

[1a-R-16] 能動的モデル評価における正解・不正解データの分類不確実性に基づいた獲得関数
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:落合拓真(京都大学), 松井孝太(京都大学/滋賀大学/東京科学大学), 原聡(電気通信大学)
概要:本研究では分類モデルのテスト損失を、テストデータへの少量のラベル付けで推定する手法を提案する。従来の手法ではアンサンブルを必要とし学習コストが高いため逐次的な学習が難しい。本手法では正解・不正解データの分類不確実性に基づく、アンサンブルが不要な獲得関数を提案する。多クラス分類ではエントロピー正則化を導入することで、既存手法と同程度のラベル付けでテスト損失が推定可能なことを実験的に確認した。

[1a-R-17] 卸電力市場における時系列データの属性情報推定技術の一検討
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:藤島 美保(NTT), 納谷 麻衣子(NTT), 槇 俊孝(NTT), 倉沢 央(NTT), 三原 淳慎(NTTアノードエナジー), 中川 亮(NTTアノードエナジー)
概要:多様な時系列データが存在するが、値を説明する属性が欠落する場合が多い。例えば、電力の時間前市場では取引エリア情報がなく、同一商品でも価格変動が大きく見えることがある。実際にはエリア要因による価格差があり、属性欠落が解析を困難にしている。本研究では外部データから潜在指標を生成し、時系列クラスタリングにより属性を補完した。これにより複数属性を含む系列でも予測タスクに精緻に適用可能であることを確認した。

[1a-R-18] 卸電力市場における属性情報ごとの約定確率予測技術の一検討
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:納谷麻衣子(NTT), 藤島美保(NTT), 槇俊孝(NTT), 倉沢央(NTT), 三原淳慎(NTTアノードエナジー), 中川亮(NTTアノードエナジー)
概要:卸電力市場の一つである時間前市場では全国統一のオークション形式で取引が行われているが、潜在的にはエリアごとに約定価格・量が形成される。そのため、約定動向を参考にして入札を行っても、入札エリアによっては約定しない事象が生じうる。本研究ではエリアを推定・付与した約定実績を用いて、任意の価格・量に対する約定確率を予測するモデルを考案した。これにより、エリア特性を考慮した高度な入札戦略の立案が可能となる。

[1a-R-19] GNNを用いた多変量時系列データからの変数依存抽出
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:中田健太朗(総合研究大学院大学/国立情報学研究所) , 杉山麿人(総合研究大学院大学/国立情報学研究所)
概要:GNNの基本動作であるメッセージパッシングに着目し、多変量時系列データにおける空間的および時間的な依存関係を同時にモデリングする手法を提案する。メッセージの経路と強度を追跡することで、変数間および時刻間の依存関係を明示的に抽出する。実験により、提案手法が予測精度を損なうことなく、データに埋め込まれた依存関係を抽出できることを確認した。

[1a-R-20] Metropolis-Hastings法による世帯単位のスケジュールのサンプリング
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:荒木 雅弘(トヨタ自動車株式会社)
概要:本研究では,所与の確率分布に従って,世帯単位のスケジュールをサンプリングするMetropolis-Hastings法を提案する.具体的には,適切な状態空間と状態遷移を定義することで,世帯単位特有の時空間制約や資源制約の存在下でも,エルゴ―ド条件が満たされることを証明する.このサンプリングの出力は,同伴行動・家事育児の分担・送迎・自家用車等の資源の共有といった,個人単位では観察されない世帯単位特有の行動分析の入力として,使用される.

[1a-R-21] 微分方程式の時間発展学習に対する誤差補正モデルの提案
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:ライ アンネイ(大阪大学情報科学研究科) , 降籏大介(大阪大学D3センター) , 宮武勇登 (大阪大学D3センター)
概要:微分方程式の時間発展を深層学習モデル (FNO, HNNなど)で予測する際,長時間の自己回帰予測では誤差が累積する問題がある。本研究では,基盤モデル自体は変更せず,予測誤差そのものを再モデル化し,基盤モデルの出力に外部補正項を追加することで予測精度を改善する手法を試みる. 予測誤差をPODにより低次元の座標に変換し,小規模なMLPで学習することで誤差補正モデルを築く.本発表では,提案手法とbaselineモデルとの比較に加えて,保存構造を持つ微分方程式における挙動についても検討する.

[1a-R-22] Policy Gradients under Noisy Verifiers: Forward–Backward Corrections for RLVR
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:Xin-Qiang Cai (RIKEN-AIP), Wei Wang (The University of Tokyo), Feng Liu (University of Melbourne), Tongliang Liu (Universitty of Sydney), Gang Niu (RIKEN-AIP), Masashi Sugiyama (RIKEN-AIP, The University of Tokyo)
概要:Automated verifiers make Reinforcement Learning with Verifiable Rewards (RLVR) attractive for reasoning tasks, but real verifiers introduce unknown, systematic label noise. We analyze policy gradients under two regimes. (i) Symmetric, verifier-independent noise: duplicating queries yields a moment–inverse estimate of the flip rate and an unbiased reward correction, which bounds REINFORCE’s gradient bias and isolates verification from sampling noise. (ii) Asymmetric, verifier-dependent noise: modeling class-conditional errors $(\rho_0, \rho_1)$ that are deterministic per input, we derive two estimators adapted from backward/forward label-noise correction and improve stability. The backward view de-noises the binary reward via a scalar inverse transform to recover an unbiased gradient; the forward view scales score-function terms to preserve direction. Empirically, on Qwen2.5-Math 1.5B/7B trained with DeepScaler and evaluated on AIME-2024/2025 and MATH500, both corrections substantially outperform training on raw noisy rewards and approach a noiseless GRPO oracle; the forward variant converges fastest and remains robust under heavier noise. With modest calibration on an LLM verifier (GPT-5-nano), both corrections consistently recover near-oracle performance.

[1a-R-23] 条件付きバリュー・アット・リスクを用いたリスク考慮型モデル予測制御による車両軌道追従および障害物回避
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:曽根大雅(広島大学) , 小蔵正輝(広島大学) , 岸田昌子(国立情報学研究所)
概要:時相深層展開は動的システムの状態変化をディープニューラルネットワークの階層に展開することで適切な制御入力を学習する手法であり,複雑な動的システムの最適制御問題への適用が可能である.本研究では時相深層展開を用いたモデル予測制御にリスク指標である条件付きバリュー・アット・リスクを導入し,障害物回避を伴う車両軌道追従制御問題に適用する.不確実性下での安全性を担保しつつ,有効性を検証することを目的とする.

[1a-R-24] モンテカルロ勾配推定量分散を解明する理論
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:Paavo Parmas(The University of Tokyo)
概要:勾配推定量は強化学習や変分推論で不可欠である。しかし従来理論は関数の滑らかさを仮定、1次の最パラメータ化推定量が常に0次(尤度比)より優れると誤解を与える。だが実験は0次が低分散となる場合を示す。本研究はこの矛盾を解消する新理論を示し、0次は次元性で不利、1次は関数が高周波な場合に不利となる条件を直感的かつ定量的に説明し、滑らかさ仮定なしに収束率を導出する。

[1a-R-25] 非中央集権型連合学習における参加者貢献度の評価手法
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:穴田穂乃香(東京大学), 金子竜也(東京科学大学), 高前田伸也(東京大学/理化学研究所)
概要:連合学習では積極的参加の動機づけや透明性向上のために参加者貢献度の評価が不可欠であるが、既存手法は中央サーバが不在の非中央集権型連合学習 (DFL) には適用できない。本研究では、初めてのDFL向けの貢献度評価手法であるTRIP-Shapleyを提案する。TRIP-Shapleyは参加者が報告する局所的な貢献の伝播を追跡することで、分散環境における正確な貢献度評価を実現する。

[1a-R-26] LLMを用いた画像に対するアンサンブル異常検知出力の解釈
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:山科勇輔(株式会社 Insight Edge)
概要:本研究では、画像異常検モデルとLLMを組み合わせることで、画像に対する異常検知結果の解釈性を向上するアプローチを提案する.異常検知は、製造業や医療分野で不可欠であり、迅速かつ正確な判断が求められるが、その出力が抽象的で理解しづらいことがある.そこで異常検知によって検知された異常を、LLMを用いて自然言語で説明する言語駆動型説明可能 AI(Language-Driven Explainable AI)を提案し、異常検知結果の信頼性と透明性の向上を図るまた、その出力が実業務に有用 であるかも検証する.

[1a-R-27] データ多様性を考慮した多数決戦略による頑健な連合学習
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:中田雅貴(東京大学), 穴田穂乃香(東京大学), 金子竜也(東京科学大学), 中村宏(東京大学),前田伸也(東京大学), 高瀬英希(東京大学)
概要:連合学習は、学習参加者に悪意あるモデルを共有される攻撃に脆弱である。既存研究では、参加者をランダムにグループ化して多数決することで攻撃を無効化する。しかし、ランダムなグループ分けであるため、攻撃耐性の分散が大きいなどの問題がある。そこで本研究では、グループ内のデータ分布の多様性を考慮したグループ分け手法を提案する。これにより、分散を減少させるとともに攻撃耐性を向上できることを明らかにする。

[1a-R-28] 決定木アンサンブルに特化した公平性の定量的検証手法の検討
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:Zhao Zhenjiang (電気通信大学), 戸田貴久 (電気通信大学), 北村崇師 (産業技術総合研究所)
概要:一般的な検証手法は、公平性違反を示す一つの反例を見つけ出すことを目的とする。一方、定量的検証は、機械学習モデルの入力空間全体を対象に、反例が存在する領域といった情報を提供する。これまで定量的検証は主にニューラルネットワークを対象に研究されてきたが、決定木アンサンブルに対応する手法はまだ確立されていない。本発表では、既存手法を概観し、決定木アンサンブルに対する厳密な定量的検証手法を検討する。

[1a-R-29] Quantification and Control of LSTM Resilience Based on Stability Theory
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:山本涼介(アイシン・ソフトウェア株式会社), 吉原爽太(名古屋大学), 楠元宏幸(名古屋大学), 志村将也(名古屋大学)
概要:本研究は、長短期記憶(LSTM)ネットワークのレジリエンスを保証・評価するための新しい理論的枠組みを提案する。 我々は、LSTM が異常入力を受けた後に正常な状態へ戻るまでに要する時間を定量化するための新たなレジリエンス指標を導入し、制御分野での非線形システムに対する安定性理論を応用して、データに依存しない実用的な回復時間の上限を導出する。この上限値により、レジリエンスを考慮した学習が可能となる。

[1a-R-30] 大規模データに向けたAD/ADAS分野における効率的な継続学習手法
カテゴリ:実装・データ収集 (Implementation / Data Collection)
発表者:平田光(トヨタ自動車株式会社), 深沢祐太(トヨタ自動車株式会社)
概要:AD/ADAS分野のモデル改善には効率的な継続学習が求められる。従来研究である経験リプレイでは、バッファ多様性確保のため勾配を利用する手法(GSS, A-GEM等)が提案されている。しかし、膨大な過去データの勾配計算は過去データの1 epoch学習に匹敵し、差分的な学習の削減効果は限定的になる。本研究は勾配に依存せず、AD/ADAS特有のデータ特性を活用した軽量かつ高精度な手法を提案する。

[1a-R-31] The Hamiltonian of Poly-matrix Zero-sum Games
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:太田敏博(サイバーエージェント)
概要:Understanding a dynamical system fundamentally relies on establishing an appropriate Hamiltonian function and elucidating its symmetries. By formulating agents’ strategies and cumulative payoffs as canonically conjugate variables, we identify the Hamiltonian function that generates the dynamics of poly-matrix zero-sum games. We reveal the symmetries of our Hamiltonian and derive the associated conserved quantities, showing how the conservation of probability and the invariance of the Fenchel coupling are intrinsically encoded within the system. Furthermore, we propose the dissipation FTRL (DFTRL) dynamics by introducing a perturbation that dissipates the Fenchel coupling, proving convergence to the Nash equilibrium and linking DFTRL to last-iterate convergent algorithms. Our results highlight the potential of Hamiltonian dynamics in uncovering the structural properties of learning dynamics in games, and pave the way for broader applications of Hamiltonian dynamics in game theory and machine learning.
This talk is based on arXiv: 2505.12609.

[1a-R-32] Sample Complexity of Identifying the Nonredundancy of Nontransitive Games in Dueling Bandits
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:Shang Lu(Graduate School of ISEE Kyushu University), Shuji Kijima(Department of Data Science Shiga University)
概要:We analyze dueling bandits under non-transitive preferences. Unlike prior work focusing on transitive cases or Condorcet winners, we study settings such as rock-paper-scissors, where uniform mixed forms the Nash equilibrium. Extending to n items, we ask whether each option is indispensable in the win–lose relation. We then derive upper and lower bounds on the sample complexity, expressed via the determinant of the skew-symmetric payoff matrix A and the linear condition x^TA=0^T.

[1a-R-33] Multi-thresholding Good Arm Identification with Bandit Feedback
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:Xuanke Jiang(Kyushu University/RIKEN AIP), Sherief Hashima(RIKEN AIP), Kohei Hatano(Kyushu University/RIKEN AIP), Eiji Takimoto(Kyushu University)
概要:We consider a good arm identification problem in a stochastic bandit setting with multi-objectives, where each arm $i \in [K]$ is associated with a distribution $D_i$ defined over $R^M$. For each round $t$, the player pulls an arm $i_t$ and receives an $M$-dimensional reward vector sampled according to $D_{i_t}$. The goal is to find, with high probability, an $\epsilon$-good arm whose expected reward vector is larger than $\bm{\xi} – \epsilon \mathbf{1}$, where $\bm{\xi}$ is a predefined threshold vector, and the vector comparison is component-wise. We propose the Multi-Thresholding UCB~(MultiTUCB) algorithm with a sample complexity bound. Our bound matches the existing one in the special case where $M=1$ and $\epsilon=0$. The proposed algorithm demonstrates superior performance compared to baseline approaches across synthetic and real datasets.

[1a-R-34] スコア関数を通して探る拡散モデルの幾何と応用
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:齋藤慎之介(北海道大学), 松原崇(北海道大学)
概要:拡散モデルは,スコア関数を介してデータ多様体を学習していると考えられている.しかし,その多様体上の計量を定義する方法は自明ではない.本研究では,スコア関数のヤコビアンが,データ多様体上の距離を定めるリーマン計量として機能するという新たな視点を提示する.画像間の測地線を利用した補間実験では,従来手法よりも意味的に自然な遷移を達成し,提案手法がデータ多様体の意味的な幾何構造を捉えることを確認した.

[1a-R-35] Training-Free NAS Based on Uncertainty Modeling for Domain Generalization
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:Keigo Wakayama (Institute of Science Tokyo), Takafumi Kanamori (Institute of Science Tokyo/RIKEN)
概要:Designing neural network architectures manually is time-consuming and labor-intensive when applying deep learning to various tasks and datasets. Neural architecture search (NAS) has been proposed to automate this process, but existing methods mainly aim at improving generalization on in-distribution data. NAS methods for out-of-distribution data have been developed to address performance degradation on unseen domains, but they require training large super-networks during the search, which results in long search times and high computational costs. There is a need for an efficient NAS method that can reduce search time while maintaining high performance. In this work, we propose a training-free NAS method for domain generalization. Our method extends zero-cost proxy-based NAS by incorporating uncertainty modeling. We compute architecture scores using autoencoders with uncertainty-based data augmentation and apply feature augmentation during training. In addition, we provide a theoretical connection between our method and domain generalization error bounds. Experiments on standard benchmarks, including PACS, Office-Home, and NICO, show that our method achieves comparable or superior accuracy to existing domain generalization methods while reducing search time from over one hour to under ten minutes and using fewer parameters. ※This content has been accepted for publication in IEEE Access.

[1a-R-36] Neural Architecture Searchにおける潜在特徴量空間の平滑化
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:逸見一喜(筑波大, 産総研), 谷垣勇輝(大阪工業大), 大西正輝(産総研)
概要:Neural Architecture Searchの探索コスト削減に向けて,NAVIGATORによるモデル構造表現の潜在特徴量抽出が注目されている.しかし,潜在空間の非平滑性により探索中の局所的な変動が大きく,最適化効率を損なうことが課題である.そこで本研究では,NASBench301における潜在空間を分析し,潜在空間平滑化のために新たな変換器を導入することで,モデル構造探索における有効性を示す.

[1a-R-37] 数理論理学に基づく人工コーパスの構築、および強化学習によるLLMの推論能力の向上
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:森下皓文(日立製作所), 森尾学(日立製作所), 十河泰弘(日立製作所)
概要:LLMの推論能力を高めるための大規模コーパスを構築した。良質なコーパスを生成するため、理論(=数理論理学)と経験(=先行研究の実験結果)に基づく設計原則を提案し、それに基づいて自動生成した。本コーパスは、一階述語論理の公理系を組合わせた多段の論理推論問題を含む。LLMを強化学習することにより、数学・科学・論理・コーディング等の様々な推論タスクにおいて大幅な性能向上を達成した。

[1a-R-38] 条件付き拡散モデルと正規化フローの分業による反事実的画像編集
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:橋上剛史(京都大学大学院情報学研究科データ科学コース)
概要:本研究では画像とそのメタ的な情報の間に存在する因果的関係を探索及び学習し、画像に対する種々の因果推論を実現するための学習理論を提案する。画像生成モデルには高精細かつ分類器の学習を要しない分類器フリーガイダンス付き拡散モデルを、メタ情報生成モデルには比較的計算コストの小さい正規化フローを用いる分業形態を採用する。またメタ情報間の因果関係が不明の状況を考慮し連続最適化による因果探索を導入する。

[1a-R-39] MNISTの分類器学習によって得られる特徴量空間と文字の対応の可視化
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:望月義彦(埼玉工大), 藤木淳 (福岡大), 江口脩 (元 青森大, 現 Wing-AI Lab), 大山航 (東京電機大)
概要:深層学習を用いた文字分類は,特徴量のソフトマックスを用いて行われる.分類問題においての理想的な結果はワンホットベクトルとなるはずだが,実際にはそのようにはならず,ほかの成分を含めて分類に適した特徴量を学習していると考えられる.そこで分類器の学習によって得られた特徴量空間において,それぞれの文字クラスが作る分布をよく観察するための可視化ツールを作成し,各クラスがどのようにロジット空間で分布しているかを調査した.

[1a-R-40] In-Context Learning is provably Bayesian Inference
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:若山智哉(理研AIP), 鈴木大慈(東大,理研AIP)
概要:大規模言語モデルの文脈内学習(ICL)を、複数タスク混合を許すメタ学習の枠組みで分析し、ICLがベイズ推論と等価であることを示す。さらに、ICLのリスクを、モデル性能による「事前学習リスク」とテスト時の文脈長で減少する「テスト時リスク」(事後分散)に正確に分解する。それらのタイトな減衰レートを導出することでICLが少数の例示に基づいて良好に機能することを理論的に裏付ける。





[1a-R-41] Chain of Thought in Order: Discovering Learning-Friendly Orders for Arithmetic
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:佐藤裕太(千葉大学), 川本一彦(千葉大学), 計良宥志(千葉大学)
概要:The chain of thought is fundamental in Transformers, which is to perform step-by-step reasoning. Besides what intermediate steps work, the order of these steps critically affects the difficulty of the reasoning. This study addresses a novel task of unraveling chain of thought—reordering decoder input tokens to a learning-friendly sequence for Transformers to learn arithmetic tasks. The proposed pipeline first trains a Transformer on a mixture of target sequences arranged in different orders and then identifies benign orders as those with fast loss drops in the early stage. As the search space grows factorially with sequence length, we propose a two-stage hierarchical approach for inter- and intra-block reordering. Experiments on four order-sensitive arithmetic tasks show that our method identifies a learning-friendly order out of a few billion candidates. Notably, on the multiplication task, it recovered the reverse-digit order reported in prior studies.

[1a-R-42] 拡散モデルの情報幾何的な解析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:相島祐太(NAIST), 池田和司(NAIST)
概要:近年、拡散モデルは生成モデルとして成功を示している。しかし、そのデータ生成能力に対する理論的な理解はまだ不十分と考えられる。本研究では、拡散モデルの仕組みを情報幾何的な立場から調査する。拡散モデルをOU過程でモデル化すると、その解がガウス分布となることに注目し、拡散モデルの前向き過程の解の列を双対平坦な多様体の点列とみなす。その後、Tweedie式の知見を用いて、生成過程と統計的パラメータ推定の対応、拡散モデルの学習であるデノイジングスコアマッチングの特徴付けを行う。

[1a-R-43] グラフ上での不確実性の相互作用に基づくバッチ型能動学習手法の検討
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:小野悠太(東京大学), 中村宏(東京大学), 高瀬英希(東京大学)
概要:能動学習はより少ないアノテーション量で一定の深層学習モデル性能に到達することを目指す枠組みである.特にバッチ型能動学習は一度に複数のデータを選択し,計算コストの削減や時間効率の向上を試みる手法である.本研究ではGNNに対するバッチ型能動学習において,その性能を最大化するためにはどのようなノードを優先的にアノテーションするべきか,グラフノードに対する推論の不確実性という観点から検討する.

[1a-R-44] 次トークン予測における隠れ状態の角度と大きさの役割の分析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:松下 京群(富士通株式会社)
概要:Transformer を用いた生成 AI モデルは様々なタスクで高い性能を示しているが,モデルの学習や推論のコストが高い.多くのコスト削減手法が提案されているが,依然として学習や推論に必要なコストは無視できない.本研究ではよりよいコスト削減手法の開発において重要だと考えられる Transformer モデルの動作原理の理解にむけて,次トークン予測における隠れ状態の角度と大きさの役割を分析した.

[1a-R-45] Dimension-free FDR control via deep neural networks
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:澤谷一磨(東京大学)
概要:変数選択は、アルツハイマー病に関連する遺伝子の発見など、応答変数に関連する特徴量を発見するタスクである。本研究は、深層ニューラルネットワークを用いた変数選択法を構築し、それが偽発見率(誤って選択した変数の割合)を既定水準以下に制御できることを提示する。その際の仮定として、任意の幅と層数、畳み込みや注意機構を許容するが、特徴量行列の右回転不変性を要求する。

[1a-R-46] RAD: Redundancy-Aware Distillation for Hybrid Models via Self-Speculative Decoding
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:星野悠一郎(PKSHA Technology), 橘秀幸(PKSHA Technology), 稲原宗能(PKSHA Technology), 竹川洋都(PKSHA Technology)
概要:We propose RAD (Redundancy-Aware Distillation), a novel framework that leverages self-speculative decoding as a diagnostic tool to identify redundant attention layers in language models. These identified layers are then selectively replaced with State Space Models, followed by targeted (self-)distillation. Specifically, RAD focuses knowledge transfer on the components identified as redundant, considering architectural changes and specific weight initialization strategies. We experimentally demonstrate that self-distillation using RAD significantly surpasses the performance of the original base model on mathematical and coding tasks. Furthermore, RAD is also effective in standard knowledge distillation settings, achieving up to approximately 2x faster convergence compared to baseline methods.

[1a-R-47] 少ない学習データに基づくセグメンテーションのための予測確率駆動損失
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:横井悠人(名城大学), 堀田一弘(名城大学)
概要:医用画像はプライバシーや倫理的制約、教師作成コストの高さから学習データ不足に陥りやすく、頑健かつ効率的な学習が求められる。少ない学習データに基づくセグメンテーションのために、予測確率駆動で識別が難しいサンプルを強調する損失関数を提案する。予測確率が低い所で損失を大きくできるため、学習データが少ない場合でも学習を促進できる。細胞および医用画像を用いた実験により、提案手法の頑健性を確認した。

[1a-R-48] A Formal Comparison Between Chain-of-Thought and Latent Thought
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:許ケビン(東京大学)
概要:本論文はTransformerを用いた推論手法であるChain-of-Thought (CoT) とLooped Transformer (Latent Thought) の表現能力を理論的に比較する。Looped Transformerは並列計算により効率的であるが、CoT は確率的推論に基づく近似計算を実現できることを示す。

[1a-R-49] 大規模言語モデルを用いた購買行動支援のための基礎検証
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:熊谷雄介(株式会社博報堂DYホールディングス), 安永遼真(株式会社博報堂DYホールディングス)
概要:本研究では大規模言語モデル(LLM)にもとづくエージェントによる購買行動実現のため,LLM自身がどの程度商品知識や経済的合理性を持つかを検証する.

[1a-R-50] Toward Rationale-Enhanced Decoding for Multi-modal Chain-of-Thought Reasoning
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:Shin’ya Yamaguchi (NTT), Kosuke Nishida (NTT), Daiki Chijiwa (NTT)
概要:Large vision-language models (LVLMs) have demonstrated remarkable capabilities by integrating pre-trained vision encoders with large language models (LLMs). Similar to single-modal LLMs, chain-of-thought (CoT) prompting has been adapted for LVLMs to enhance multi-modal reasoning by generating intermediate rationales based on visual and textual inputs. While CoT is assumed to improve grounding and accuracy in LVLMs, our experiments reveal a key challenge: existing LVLMs often ignore the contents of generated rationales in CoT reasoning. To address this, we re-formulate multi-modal CoT reasoning as a KL-constrained reward maximization focused on rationale-conditional log-likelihood. As the optimal solution, we propose rationale-enhanced decoding (RED), a novel plug-and-play inference-time decoding strategy. RED harmonizes visual and rationale information by multiplying distinct image-conditional and rationale-conditional next token distributions. Extensive experiments show that RED consistently and significantly improves reasoning over standard CoT and other decoding methods across multiple benchmarks and LVLMs. Our work offers a practical and effective approach to improve both the faithfulness and accuracy of CoT reasoning in LVLMs, paving the way for more reliable rationale-grounded multi-modal systems.

[1a-R-51] HapticMatch: A Dataset and Exploration for Generative Material Haptic Simulation and Interaction
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:Zhang MingXin(東京大学), Yao Yu(東京大学), 牧野泰才(東京大学), 篠田裕之(東京大学),杉山将(RIKEN AIP/東京大学)
概要:We introduce HapticMatch, a novel multimodal dataset capturing the properties of common real-world material surfaces. The dataset first uniquely provides precisely aligned pairs of microscale local optical photographs and corresponding height-maps of the surface topography, accurately matched in spatial location, scale, and orientation. This curated dataset can be leveraged by specialized hardware for reconstructing tactile sensations, such as the Precise Ultrasonic Generator and Electrostatic Tactile Display, offering significant potential for enhancing haptic feedback simulation. To demonstrate the dataset’s utility, we showcase its use in training and fine-tuning conditional generative models, including Diffusion, Generative Adversarial Networks (GANs), and Flow-Matching approaches. We successfully demonstrate the generation of realistic microscale height-maps conditioned on optical images and material labels, highlighting the promise of these models for broader tactile signal synthesis tasks. The dataset and demonstration are presented to foster future research in multimodal material understanding and generative haptics.

[1a-R-52] 二重降下現象を通した相互学習手法の汎化過程の解析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:小森郁花(九州工業大学), 中⻄慶⼀(九州工業大学), 徳永旭将(九州工業大学)
概要:近年、単体モデルと同等の推論コストで高い汎化性能を発揮することが可能な相互学習手法が注目されている。しかし、その汎化性能向上の要因は未解明である。そこで、本研究では従来のバイアス・バリアンストレードオフとは異なる挙動を示し、汎化性能の変動が顕著に表れやすい「二重降下現象」に着目した。単体学習モデルと相互学習モデルの二重降下現象の挙動を比較し、相互学習手法の汎化過程及び汎化性能向上の要因を解析する。

[1a-R-53] 連成系の学習のためのLagrange-Dirac Neural Network
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:李怜歩(北海道大学), コスロービアン ラズミックアルマン(大阪大学), 谷口隆晴(神戸大学), 吉村浩明(早稲田大学), 松原崇(北海道大学)
概要:深層学習モデルは,支配方程式が未知でも複雑な物理現象を予測できる.しかし既存手法は,微分代数方程式で記述されるシステムや,サブシステム間の連成を十分に扱えていない.そこで本研究では,ラグランジュ=ディラック形式に基づく,Lagrange-Dirac Neural Networkを提案する.この枠組みにより,微分代数方程式で記述されるシステムや,サブシステム間の連成を,再学習を行うことなく学習済みモデル同士を結合することで扱うことが可能となる.

[1a-R-54] テンソルプログラムを用いた単一アテンション層の無限幅極限の解析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:酒井真菜(東京大学, 理化学研究所), 唐木田亮(産業技術総合研究所, 理化学研究所), 今泉允聡(東京大学, 理化学研究所)
概要:ニューラルネットワークの理論研究において、ガウス近似に基づく従来の理論では、特殊な設定を採用しない限りアテンション機構内部の分布を捉えられなかった。本研究では、標準的なスケーリングと現実的な有限ヘッドの設定のもとで、単一のマルチヘッドアテンション層の出力が従う非ガウス極限分布を明示的に導出する。本研究は、深層トランスフォーマーの内部の分布を解析する統一理論を築く第一歩となる。

[1a-R-55] 言語モデルに対する劣化なしトークン語彙削減
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:千々和大輝 (NTT), 長谷川拓 (NTT), 西田京介 (NTT), 山口真弥 (NTT), 坂尾珠和 (NTT), 大庭知也 (NTT), 竹内亨 (NTT)
概要:自己再帰型の言語モデルは、次トークン分布に従って再帰的にトークン列を出力する。本研究では、与えられた次トークン分布を適切に変換することで、最終的な出力文章の分布を変化させることなく、次トークン分布の台集合(トークン語彙)を任意に縮小できる効率的なアルゴリズムを導出した。その応用として、トークン語彙の異なる言語モデル間での共通語彙を介したアンサンブルを実験的に検証した。

[1a-R-56] モデル間予測整合性に基づく学習手法の提案とその汎化メカニズムの解析:予測分布間のエントロピーギャップは相乗効果を生み出すか?
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:中西慶一(九工大), 徳永旭将(九工大)
概要:単体学習以上の汎化性能を実現するSynergistic Learning (SL) を提案し, その汎化メカニズムを解析する。SLは各モデルの予測損失とモデル間の整合性不一致度の最小化により各モデルの機能分化を促す学習手法である。画像分類ベンチマーク: STL-10の実験を通して, KLDに基づく整合性不一致度が予測分布間のエントロピーギャップを生み出すことで, 単体学習と比較し8.6%の正解率向上を実証した。

[1a-R-57] 深層汎化誤差の幾何学的解析と代数的分類に基づく最適深さの計算
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:園田翔(理研・サイバーエージェント), 橋本悠香(NTT・理研), 石川勲(京都大・理研), 池田正弘(大阪大・理研)
概要:深層学習に対する汎化誤差評価の深さ依存性を調べる.ニューラルネットを幾何学的に再定式化することで,中間層の代数的性質(自由・可換など)が汎化誤差の増大度を決定することを指摘する.近似誤差と推定誤差のトレードオフを解析し,最適深さを計算する.

[1a-R-58] Deep priorによるノイズ・アーティファクト除去~軟X線角度分解光電子分光法への適用~
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:横山優一(JASRI), 山神光平(JASRI), 住谷祐太(電気通信大), 庄野逸(電気通信大), 水牧仁一朗(熊本大)
概要:放射光施設等の先端計測現場では、大量の正解データを必要としない実用的な深層学習が求められている。我々は、Deep Image Priorに注目し、SPring-8の軟X線角度分解光電子分光法で課題となっているアーティファクトに適用した。CNN構造等の調整により、シグナルとアーティファクトの学習を系統的に分離させ、これまで実験的に平均化していたアーティファクトをデータから直接的に除去することに成功した。

[1a-R-59] 任意学習率を用いたときの勾配降下法の収束
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:包含(統計数理研究所), 坂上晋作(サイバーエージェント, 理研AIP), 竹澤祐貴(京都大学, OIST)
概要:勾配降下法は連続最適化で幅広く用いられる手法である。古典的には、凸かつ平滑な関数の場合に対して、学習率が平滑定数の逆数に対して十分小さいときに収束保証が与えられている。しかし、深層学習時代では計算効率性のため、収束保証されないほど大きな学習率がよく用いられる。本発表では、線形分離可能な二値分類データに対し、パラメータ軌跡が振動しつつも勾配降下法が収束することを示す。

[1a-R-60] WEEP: 弱凸包絡に基づく微分可能-非凸スパース正則化
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:古橋 敬信(名古屋工業大学),本谷 秀堅(名古屋工業大学),横田 達也(名古屋工業大学,理研AIP)
概要:従来のスパース正則化は,微分不可能で勾配情報を用いた最適化が難しく,かつスパース化の程度を柔軟に調整できないという欠点を抱える.本研究では,この課題を解決する微分可能な非凸スパース正則化WEEPを提案する.WEEPは弱凸包絡という数学的操作に基づき,調整可能なスパース化と安定した高速な最適化(弱凸性,L-平滑性)を両立する.信号・画像復元(TV正則化)やロバスト回帰で,提案手法の有効性を示す.

[1a-R-61] Potential Maximizersの期待削減量に基づくリプシッツ最適化
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:増井秀之(三菱電機株式会社), 中根滉稀(三菱電機株式会社), 長澤廉師(三菱電機株式会社)
概要:本研究では、目的関数がリプシッツ連続であることを仮定したブラックボックス最適化手法を扱う。従来のリプシッツ最適化は、大域的最適解が存在する可能性があるpotential maximizers を推定し、その中からランダムに探索をする。そこで本研究では、各候補点を探索したときの potential maximizers の期待削減量を推定し、その値に応じた重み付き分布に基づき探索することを検討する。これにより、理論的な収束保証を確保しつつ、より効率的な探索を実現する。

[1a-R-62] SAV法に基づく連続最適化手法の改善とPINNsにおける最適化への適用
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:佐川遼(大阪大学大学院情報科学研究科), 宮武勇登(大阪大学D3センター), 降簱大介(大阪大学D3センター)
概要:近年,PDEの構造保存解法であるSAV法に基づく連続最適化手法が提案されている.本研究では,SAVスキームにおける線形作用素を目的関数の近似ヘッセ行列に基づき適応的に調整する手法を提案し,収束速度およびに線形作用素選択のロバスト性の改善を期待する.さらに,提案手法をPINNs(Physics-Informed Neural Networks)の損失最適化に適用し,提案手法の実用性を検討する.

[1a-R-63] Inverse Mixed-Integer Programming: Learning of Constraints then Objective Functions
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:北岡 旦(NEC)
概要:混合整数線形計画の逆最適化問題は,観測された解が最適となる制約条件や目的関数の重みを推定する問題であり,意思決定や実応用で重要性が高まっている.しかし,従来手法は高次元では非効率である.本研究では,まず制約条件を復元し,次に目的関数を推定する二段階法を提案する.また,汎化誤差バウンドの定理を示し,理論・実験の両面から高次元推定性能を検証した.

[1a-R-64] 最適決定木を用いてアンサンブル学習を近似する単一木構築手法
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:中川海智(兵庫県立大学), 東川雄哉(兵庫県立大学), 照山順一(兵庫県立大学), 梅谷 俊治(株式会社リクルートホールディングス)
概要:本研究は、予測精度と説明性を両立する単一決定木の構築を目的とする。まず学習データの一部を用いて、アンサンブル学習や深層学習に基づく高性能学習器を生成し、それを用いて残りのデータに擬似ラベルを付与する。このように生成した擬似データを元の一部データと併せて用い、構造制約付き最適決定木を構築する。これにより、高性能学習器の予測性能を保持しつつ、制御された構造により解釈が容易な決定木を得ることを目指す。

[1a-R-65] Adversarial bandit optimization for approximately linear functions
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:Zhuoyu Cheng(Department of Informatics, Kyushu University, Japan), Kohei Hatano(Department of Informatics, Kyushu University, Japan,RIKEN AIP, Japan), Eiji Takimoto(epartment of Informatics, Kyushu University, Japan)
概要:We consider a bandit optimization problem for non-convex and non-smooth functions, where in each trial the loss function is the sum of a linear function and a small but arbitrary perturbation chosen after observing the player’s choice. We give both expected and high probability regret bounds for the problem. Our result also implies an improved high- probability regret bound for the bandit linear optimization, a special case with no perturbation. We also give a lower bound on the expected regret.

ポスターセッション 1b [11月12日(水)17:10-19:10]
Poster Session 1b [Wednesday, 11/12, 5:10~7:10 p.m.]

エントリー枠 (Entry Slot)

[1b-E-01] Kannanの不動点定理の一般化および一意不動点をもつための最弱条件
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:橋本隼也 (京都大)
概要:Kannanの不動点定理とは, 出力間の距離が入力とその出力の距離の合計で制御できるという縮小条件をもつ不動点定理である. 入力間の距離で制御できるBanachの不動点定理とは独立であり, 不連続な関数も扱えることから機械学習への応用が期待されている.  本研究はKannanの不動点定理の条件を一般化して, 完備距離空間上において一意な不動点をもつことと同値となる条件を導いたものとなる.

[1b-E-02] 学習アルゴリズムが持つ数学的構造の分析
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:中村卓武(東北大学大学院情報科学研究科), 浅田和之(電気通信研究所), 中野圭介(電気通信研究所)
概要:近年プログラミングに関する分野では、習アルゴリズムの数学的構造を分析する試みが盛んである。この分析では主に学習計算やその性質、組合せ方の抽象化・統一を目指す。これにより機械学習手法に統一的なフレームワークを提供でき、学習手法の構成や性質分析が容易になる。2019年にFongらによってLearnerと呼ばれる学習計算の構造化を提案したが、本発表ではこれの更なる一般化と応用を行う。

[1b-E-03] スライス最適輸送を用いた球面上のフローマッチング
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:加悦憲人(東京大学), 磯部伸(理研AIP), 今泉允聡 (東京大学, 理研AIP)
概要:画像変換など様々に応用可能である「最適輸送計画を用いた条件付きフローマッチング(OT-CFM)」は、主にユークリッド空間上のデータ生成について検討されてきた。また、この手法は計算量がバッチサイズの2乗のオーダーで増加する。本研究では、この手法を球面上に適用し、球面上の分布を1次元円周へ射影することで計算量を抑えたまま球面上の大規模フローマッチングを可能にする手法を提案する。

[1b-E-04] 線形分離不可能な分類問題におけるグラフ畳み込みネットワークの学習ダイナミクス解析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:稲垣然(東京大学), Braun Guillaume(理研AIP), 今泉允聡(東京大学,理研AIP)
概要:データ点間にグラフ構造を持つデータを扱えるグラフ畳み込みネットワーク(GCN)は、通常のニューラルネットワークに比べて学習ダイナミクスの理論研究は発展途上である。本研究では線形分離不可能な分類問題における2層非線形GCNの勾配・特徴量の理論解析を行い、ハードラベル下ではグラフ構造がGCNの学習に悪影響を与える場合があるが、推論においてはグラフ構造により分類精度が向上することを検証した。

レギュラー枠 (Regular Slot)

[1b-R-01] Objective perturbation下のスパース推定における推定値分布とプライバシー評価
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:坂田綾香(お茶大情報,理研AIP), 丹澤春香(お茶大情報)
概要:本研究では、プライバシーノイズとしてobjective perturbationを用いたスパース推定について、その推定値分布を解析する。特に、プライバシー評価で中心となる”one point mutant”データ下での推定値を、グラフィカルモデルおよび近似確率伝搬法を用いて導出する。On-Average KLをはじめとするプライバシー指標のもと、推定精度とプライバシー保証のトレードオフや、汎化とプライバシー保障の関係性を議論する。

[1b-R-02] メトロポリスを超えた枠組みで我々はどこまで行けるか?
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:司馬博文(総合研究大学院大学)
概要:区分確定的マルコフ過程に基づくモンテカルロ法は, メトロポリスの枠組みから逸脱する新種の MCMC 手法である.より速い収束に加え,ミニバッチでの実行でも漸近的な正確性が保たれるため,大規模データへのスケーラビリティが期待されている. 本発表ではモメンタム法に類する発想で加速を達成する最新の PDMP 法を取り上げ,スケーリング解析を通じてその優位性を示す.

[1b-R-03] MetaCaDI: A Meta-Learning Framework for Scalable Causal Discovery with Unknown Interventions
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:Hans Jarett Ong (Nara Institute of Science and Technology); Yoichi Chikahara (NTT Communication Science Laboratories); Tomoharu Iwata (NTT Communication Science Laboratories)
概要:Uncovering the underlying causal mechanisms of complex real-world systems remains a significant challenge, as these systems often entail high data collection costs and involve unknown interventions. We introduce MetaCaDI, the first framework to cast the joint discovery of a causal graph and unknown interventions as a meta-learning problem. MetaCaDI is a Bayesian framework that learns a shared causal graph structure across multiple experiments and is optimized to rapidly adapt to new, few-shot intervention target prediction tasks. A key innovation is our model’s analytical adaptation, which uses a closed-form solution to bypass expensive and potentially unstable gradient-based bilevel optimization. Extensive experiments on synthetic and complex gene expression data demonstrate that MetaCaDI significantly outperforms state-of-the-art methods. It excels at both causal graph recovery and identifying intervention targets from as few as 10 data instances, proving its robustness in data-scarce scenarios.

[1b-R-04] 和積ネットワークのトップダウン型ベイズ推論
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:横井創磨(東京大学), 佐藤一誠(東京大学)
概要:和積ネットワークは確率分布とその和積操作で構成される高い表現力と柔軟性をもつ深層確率モデルである。高速な推論が可能な一方で、ベイズ的なパラメータ学習にはネットワーク全体のボトムアップ走査が要求される。本研究では、事後サンプリングを部分グラフのトップダウンパスに帰着させることで、時間計算量を指数的に改善し、数値実験の計算時間を従来比で1/100以下に短縮する。

[1b-R-05] 二相サンプリングの下での平均処置効果の効率的推定について
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:原田和治(東京医科大学), 田栗正隆(東京医科大学)
概要:二相サンプリングとは,第一相で低コスト変数を収集し,第二相で一部の個体について高コスト変数を収集するサンプリング戦略である.第二段階では層化抽出を行うため,母集団パラメータの推定には抽出確率に基づく調整が必要である.標的パラメータが潜在アウトカムについて定義される場合も同様である.本発表では,二相サンプリングの下で平均処置効果の有効推定量を導出し,推定量の性質に基づく実務的ガイダンスを提供する.

[1b-R-06] 観察データと実験データを統合した非観測交絡存在下での因果効果推定のベイズ的枠組み
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:堀井俊佑(早稲田大学), 近原鷹一(NTT)
概要:本研究では、観察データと複数の実験データを統合し、因果効果を推定するベイズ的枠組みを提案する。本提案手法では、構造的因果モデル(SCM)に基づきデータ生成過程を統一的に表現することで、観察データの豊富さと実験データの信頼性を補完的に活用する。各変数の構造方程式に誤差項に相関のあるガウス過程を仮定することで、データが少数かつ非観測交絡が存在する環境でも頑健かつ高精度な因果効果推定を実現する。

[1b-R-07] 特権情報を使用したオフポリシー周辺化密度比推定量の開発
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:楊之介 (早稲田大学先進理工学研究科電気・情報生命専攻), 浜田道昭 (早稲田大学理工学術院, 産業技術総合研究所 細胞分子工学研究部門, 日本医科大学)
概要:ログデータのみから方策の評価が出来るオフポリシー推定手法である重要度重み付き法は高い分散を持つ。周辺化密度比推定量が持つ分散は低いが、方策密度比にノイズが多く含まれているときでは予測が困難となる。本研究ではデータ収集施策には評価施策には存在しない特権情報が収集されていると仮定し、特権情報機械学習の観点から方策密度比のノイズ問題を解決し、周辺化推定量をより良く予測する手法を開発する。

[1b-R-08] GNNによる特徴グラフのためのノンパラメトリックコミュニティ埋め込み
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:福澤康太(NTT), 佐藤千尋(NTT), 丹治直幸(NTT)
概要:グラフのコミュニティ埋め込みはコミュニティレベルのアプリケーションに役立つだけでなく、コミュニティ検出とノード分類の両方に有益である。しかし、これらの手法の多くはノードの特徴量を活用できない。また、コミュニティ数を事前に推定することは難しく、実応用化するうえで課題となる。本研究では特徴グラフに対する、コミュニティ数を適応的に決定するコミュニティ埋め込み手法を提案する。

[1b-R-09] Physics-Informed Linear Model (PILM)
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:岡﨑智久 (理化学研究所AIP)
概要:偏微分方程式(PDE)をニューラル・ネットワークを用いて解くために、PDE・境界条件・データからの残差二乗和を最小化するPhysics-Informed Neural Network (PINN)が注目されている。本研究では、基底関数の線形結合を用いて解を表現することで、最適解を解析的に表現できるPhysics-Informed Linear Model (PILM)を検討する。PILMを典型的な順問題および逆問題に対して定式化・検証し、測地データを用いた地殻内の歪み速度場推定に応用する。

[1b-R-10] タンパク質間相互作用を利用した人⼯知能による新しい薬剤遺伝子ー疾患相互作⽤の同定
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:田口善弘(中央大学)
概要:本研究は、タンパク質間相互作用 (PPI) の情報のみを用いて、薬剤、遺伝子、疾患の三者の関係性を解明し、創薬に繋げる新しい人工知能 (AI) 手法を提案するものです。従来、疾患に重要な遺伝子を特定してから薬剤を探す方法や、薬剤が作用する遺伝子から関連疾患を探す方法は複雑でした。本研究では、疾患や薬剤をあらかじめ特定せず、遺伝子に着目するアプローチを採用しました。具体的には、ヒトとマウスのPPIデータを統合し、「テンソル分解(TD)に基づく教師なし特徴抽出」というAI技術を適用して、重要なタンパク質(遺伝子)群を抽出しました。その結果、PPI情報のみから、がん関連遺伝子群とその治療薬候補を特定することに成功しました。この手法は、単に相互作用の数が多い「ハブタンパク質」を解析する従来法と異なり、がん以外の疾患に対する薬剤候補も同定できる利点があります。さらに、本手法で選ばれたタンパク質は相互作用の相手を共有する傾向が強く、これにより生体内 (in vivo) 実験で有効な薬剤の同定も可能となりました。結論として、本研究で提案されたTDを用いたアプローチは、PPI情報だけを使い、既存薬の新たな薬効を発見する「ドラッグリポジショニング」において非常に有用なツールであると示されました。

[1b-R-11] Diffusion Models with Double Guidance
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:Yanfeng Yang(The Institute of Statistical Mathematics), Kenji Fukumizu(The Institute of Statistical Mathematics)
概要:Creating large-scale datasets for training high-performance generative models is often prohibitively expensive, especially when associated attributes or annotations must be provided. As a result, merging existing datasets has become a common strategy. However, the sets of attributes across datasets are often inconsistent, and their naive concatenation typically leads to block-wise missing conditions. This presents a significant challenge for conditional generative modeling when the multiple attributes are used jointly as conditions, thereby limiting the model’s controllability and applicability. To address this issue, we propose a novel generative approach, Diffusion Model with Double Guidance, which enables precise conditional generation even when no training samples contain all conditions simultaneously. Our method maintains rigorous control over multiple conditions without requiring joint annotations. We demonstrate its effectiveness in molecular and image generation tasks, where it outperforms existing baselines both in alignment with target conditional distributions and in controllability under missing condition settings. (https://arxiv.org/abs/2505.13213)

[1b-R-12] 学習問題から学習問題への帰着の学習の枠組み
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:末廣大貴(九州大学)
概要:学習問題を別の学習問題へ帰着(変換)を行うことで,既知の解法や理論が適用でき,解析を効率化できる.一方で,帰着のプロセスは問題に応じて個別に,かつ試行錯誤的に行う必要がある.本研究では帰着のプロセスを学習により自動化する枠組みを提案する.また,マルチインスタンス学習に帰着可能な問題へ適用した実験結果を示す.

[1b-R-13] 多段学習における回帰精度の漸近解析
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:山崎啓介(産総研)
概要:近年、エンコーダ・デコーダ型モデルのように、データを別の表現に変換した後に回帰による予測を行う構造が広く利用されている。事前学習されたエンコーダに対してデコーダを多段学習する場合、エンコーダの学習リソースが有限であるため、デコーダが受け取るデータの不確実性が増加する。本研究では、このように入力に新たな不確実性が加わる構造における予測精度について漸近解析を行い、エンコーダ学習の影響を明らかにした。

[1b-R-14] スケールの盲点:LLMの心理的脆弱性
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:山田真徳(NTT)
概要:LLMスケーリングに伴う心理的脆弱性の深刻化を発見した。心理的jailbreak攻撃により4B〜70Bパラメータで評価し、大規模モデルほど人間的心理的弱点への脆弱性が高まることを実証した。対策として内部状態介入法を提案し、心理的攻撃成功率を有意に低減した。本研究はスケーリングと心理的堅牢性のトレードオフを明らかにし、大規模AIシステム実用化への重要な示唆を提供する。

[1b-R-15] 多次元不確実性に対するアンサンブル系投影法の解析
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:金澤拓也 (神戸学院大学)
概要:機械学習モデルの予測値が多変量である場合,その不確実性は一般には多峰性のある確率分布の形をとる。そのノンパラメトリックな定量化を行う従来手法はニューラルネットワーク(NN)を用い,非凸な最適化を行うため計算コストが高い。本研究ではNNを用いない決定木アンサンブル系の簡易手法を提案し,その性能を評価する。

[1b-R-16] 木構造によるCategorical Wasserstein Weisfeiler-Lehman Graph Kernelの高速化
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:三戸圭史(総研大), Le Tam(統数研/総研大), 日野英逸(統数研/総研大)
概要:グラフの頂点ラベルを用いるWeisfeiler-Lehman(WL)カーネルに最適輸送を導入したWasserstein WL(WWL)カーネルは優れた性能を示す一方で計算コストが高く大規模グラフデータセットへの適用が困難である.本研究はWLアルゴリズムで生成されるラベル構造に着目した高速化を提案し,離散ラベルWWLカーネルの厳密なWasserstein距離が頂点数の定数倍で得られることを示した.

[1b-R-17] Vison-language基盤モデルの画像破損に対するテスト時適応
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:足立一樹 (NTT, 横浜国立大学), 山口真弥 (NTT), 濱上知樹 (横浜国立大学)
概要:CLIPを始めとするVision-language基盤モデルは高い汎化性能を示す一方で、学習時と入力データ分布が大きく異なると性能が低下する分布シフトの問題が存在する。本研究では、ゼロショット画像分類において、ラベルなしのテストデータのみでモデルを適応するテスト時適応に取り組む。埋め込みベクトルの一様分布性に着目することで、入力画像にノイズが乗る等の既存手法が効きにくいタイプの分布シフトに対して効果のあるテスト時適応手法を提案する。

[1b-R-18] 関数データ解析のためのSpectral Truncationカーネル
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:橋本悠香(NTT / RIKEN AIP), Ayoub Hafid(東大), 池田正弘(阪大 / 理研AIP), Hachem Kadri(Aix-Marseille University)
概要:カーネル法は,非線形な関係性を効率的に抽出できるという利点から,盛んに研究されてきた.本発表では,入力と出力がベクトルまたは関数である場合に焦点を当て,積の非可換性を導入することで新たなカーネルを提案する.提案するカーネルが既存の典型的なカーネル間のギャップを埋めることを示す.さらに,ベクトルや関数を出力とするカーネル法における重要な課題である,カーネル選択と計算コストの問題における利点を示す.

[1b-R-19] 正・ラベルなし学習のための期待較正誤差の推定
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:木了龍一(東京大学), 二見太(大阪大学,RIKEN AIP), 杉山将(RIKEN AIP,東京大学)
概要:期待較正誤差(ECE)は分類器の信頼度が真の確率を反映する程度を測る指標だが、負例の得られない正・ラベルなし(PU)学習では従来法は使えない。本研究はPUデータのみから推定可能なPU-ECEを提案する。非漸近的バイアス上界と情報理論的解析による汎化誤差を解析し、教師付きECEと同等の収束率を証明する。実験により、理論解析を検証し、PU-ECEが教師付きECEと同等の性能を達成することを確認する。

[1b-R-20] オンライン予測に基づくCurriculum Learning
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:森岡達彦 (九州大学), 末廣大貴 (九州大学/理研AIP)
概要:学習データの難易度に応じて学習の順番をスケジューリングするCurriculum Learning(CL)に着目する.本研究では,ニューラルネットワークのパラメータ更新に応じて,オンライン予測理論に基づき学習データを適応的に重み付けするCL手法を提案する.これにより,リグレット解析に基づくCLの理論保証を導出できる.実験では,分類学習を題材として,提案法の有効性について検証する.

[1b-R-21] Importance Weighting for Aligning Language Models under Deployment Distribution Shift
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:Thanawat Lodkaew (The University of Tokyo), Tongtong Fang (The Institute of Statistical Mathematics), Takashi Ishida (RIKEN and The University of Tokyo), Masashi Sugiyama (RIKEN and The University of Tokyo)
概要:Aligning language models (LMs) with human preferences remains challenging partly because popular approaches, such as reinforcement learning from human feedback and direct preference optimization (DPO), often assume that the training data is sufficiently representative of the environment in which the model will be deployed. However, real-world applications frequently involve distribution shifts, e.g., changes in end-user behavior or preferences during usage or deployment, which pose a significant challenge to LM alignment approaches. In this paper, we propose an importance weighting method tailored for DPO, namely IW-DPO, to address distribution shifts in LM alignment. IW-DPO can be applied to joint distribution shifts in the prompts, responses, and preference labels without explicitly assuming the type of distribution shift. Our experimental results on various distribution shift scenarios demonstrate the usefulness of IW-DPO.

[1b-R-22] 確率的勾配降下法に関する特異学習理論を用いた考察
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:牟田篤兄(東京大学)
概要:深層ニューラルネットワークの大きな発展に伴い、学習アルゴリズムである確率的勾配降下法(Stochastic Gradient Descent ; SGD)についても強い関心が寄せられた。一方、SGDが高い汎化能力を達成する数理的な原理については不明なことが多い。そこで、本研究では学習誤差が0に近い状況においてSGDを確率微分方程式によって近似し、予測精度があがる原理を特異学習理論を用いて説明する。

[1b-R-23] Dynamic Generation of Quantum Circuit via Residual Error Pattern-based Direct Preference Optimization
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:芳川昇之(三菱電機株式会社)
概要:動的最適回路生成(DOCG)は、推論誤差パターンを波レットで符号化し、ニューラル回路生成器がDPO/CPOで学習した問題特化回路を付加する枠組みである。回帰課題でランダム探索と同精度を維持しつつ、収束は最大3倍高速、ゲート数も30%以上削減し、NISQ向け効率的適応回路設計を示す。

[1b-R-24] CoSyNN: Conformal symplectic neural networks for learning dissipative Hamiltonian systems
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:徐百歌(神戸大学), 谷口隆晴(神戸大学,理化学研究所)
概要:減衰項をもつハミルトン系の多くはconformal symplectic 構造というハミルトン系のsymplectic構造を拡張した構造をもつ.本発表では,symplectic構造を保つニューラルネットワークであるSympNetsを拡張し,conformal symplectic構造を保つニューラルネットワークを提案する.

[1b-R-25] 最適輸送を用いた高次元物理現象データの補間
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:堀江正信(株式会社RICOS), 中嶋怜央(株式会社RICOS), 佐藤慎太郎(東北大学)
概要:物理現象の高速な予測方法の実現のために、データ科学の手法が注目されている。多くの既存手法では既知のデータから何らかの意味で補間をしていると考えられるため、よい補間を構成することによって予測精度を見積もる一般的な方法が得られると期待される。しかし、多くの物理現象は高次元データであり、単純な補間では予測精度に限界がある。そこで本研究では、最適輸送の理論を援用することにより補間操作の高精度化を目指す。

[1b-R-26] ニューラルネットワークによる優解・劣解生成と解の厳密包含
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:田中一成(早稲田大学), 矢田部浩平(東京農工大学)
概要:微分方程式の解の存在性と精度を厳密に保証することは重要な課題である。本研究では、深層学習を用いて偏微分方程式の優解・劣解を生成することで、対象方程式の厳密な解包含を実現する。数値計算過程には精度保証付き数値計算技術を適切に用いることで、丸め誤差・離散化誤差を含めた数学的に正しい結果を保証する。

[1b-R-27] 汎用的ユーザ埋め込みのための時系列・イベント行動表現の対照学習
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:太刀岡 勇気(デンソーアイティーラボラトリ)
概要:現代の推薦システムはタスクごとにモデルを構築するが,開発コストやコールドスタート,ロングテール問題に課題がある.本研究では複数種類のイベント行動ログから自己教師ありで汎用的ユーザ埋め込みを学習する枠組みを提案する.時系列・イベント変換による行動ビューを対照学習で統合し,補助タスクにより埋め込みに予測に有用な意味を付与することで,多様な下流タスクに高い汎化性能を示した.

[1b-R-28] Bounding ODE Solutions with Neural Operator–Based Sub- and Super-Solutions
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:XU, Chenjian(早稲田大学), 田中一成(早稲田大学)
概要:本研究では、ODEの真の解を包含するために、その劣解および優解を学習する、ニューラルオペレーターに基づく手法を提案する。本手法は、Fourier Neural Operator アーキテクチャに基づく2段階のプロセスで構成されている。事前学習およびファインチューニングの両段階において、劣解と優解を与えるニューラルオペレーターを学習する。

[1b-R-29] 乱択化フーリエ特徴を用いた教師なし分節化に基づく動作の定量的解析
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:梶原賢(電気通信大学), 齋藤一誠(電気通信大学), 中村友昭(電気通信大学), 持橋大地(統計数理研究所), 三村喬生(国立研究開発法人国立精神・神経医療研究センター)
概要:教師なし分節化により連続動作から単位動作を抽出した後で,被験者間の単位動作を定量的に比較する手法を提案する.提案手法では,乱択化フーリエ特徴を教師なし分節化手法であるGP-HSMMに導入することで,被験者間の単位動作を低次元のパラメータで表現する.本発表ではダンス動作を対象として,この単位動作のパラメータを比較することで,熟練度の異なる被験者の動作の違いを定量的に解析できることを示す.

[1b-R-30] 高分子マルチ物性予測向けのMulti-gate Mixture of Experts(MMoE)モデル
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:小渕喜一(NEC/産総研), 矢作裕太(NEC/産総研), 松井孝太(京大/滋賀大/東京科学大)
概要:本研究では、ポリマー物性予測のためにMMoEに基づくマルチタスク学習(MTL)モデルを提案する。約1,000件のシミュレーションデータによる16タスクでの検証により、MMoEやHPSはシングルタスク学習を上回る性能を示した。さらに、Nash-MTLが一貫して最良の結果を達成し、タスク間競合の緩和に有効であることが示された。

[1b-R-31] 高次ネットワークの多重構造
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:中嶋一貴(東京都立大学), 佐々木勇和(大阪大学), 宇野毅明(国立情報学研究所), 会田雅樹(東京都立大学)
概要:複雑系は2つ以上のノード間の相互作用を伴うことが多く,それらはハイパーグラフとして表現される.確率的ブロックモデルは,複雑系内のコミュニティ構造を抽出するために用いられ,潜在的なコミュニティ構造を仮定する生成モデルを実世界のデータに当てはめる.本研究では,異なるハイパーエッジのサイズにわたるコミュニティ固有の高次相互作用の異質性を考慮したハイパーグラフの多重確率ブロックモデルを提案する.

[1b-R-32] Gray-Scottモデルに対するパーシステントホモロジーの安定性
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:岡本優太(京都大学大学院情報学研究科情報学専攻)
概要:Gray-Scottモデルから得られるパターンをパーシステントホモロジーを利用して解析する研究はすでに存在するが、その多くは数値実験的な研究である。本研究では、Gray-Scottモデルから得られるパーシステンス図がパラメータの微小な変動に対して安定的であることを示すことで、パーシステントホモロジーを利用したGray-Scottモデル解析の妥当性を示す。

[1b-R-33] Dynamic Generalized Linear Modelを用いた大規模物流倉庫向け出荷量予測手法の開発
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:松本拓哉(株式会社IHI), 藤澤洋徳(統計数理研究所)
概要:物流倉庫では人員計画や在庫管理のために将来の出荷量を予測することが重要となる。しかし、数万SKU(Stock Keeping Unit)を扱う大規模倉庫ではSKUごとに個別モデルを構築することは困難である。そこで本研究では、各SKUの出荷特性(トレンド・周期性など)に適応できる汎用性を持ち、かつ高速に予測可能なPoisson型Dynamic Generalized Linear Modelを開発した。実際の物流倉庫データによる数値実験を通じて、提案手法の有効性を確認した。

[1b-R-34] 時系列データストリームにおける時間変化する因果関係の抽出
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:千原直己(大阪大学・産業科学研究所), 松原靖子(大阪大学・産業科学研究所), 藤原廉(大阪大学・産業科学研究所), 櫻井保志(大阪大学・産業科学研究所)
概要:一般的に因果構造は時間変化するものであるが、大半の既存手法は因果定常性を仮定している。具体的には、感染症の伝播のケースを考えると、新たな変異株の発見などといった外的影響に対応して感染者数の増加の原因となる国は遷移する。このような現象に対して、大規模時系列データストリーム中の時間変化する因果関係の抽出および将来予測を同時に行う方法について議論する。

[1b-R-35] 個別最適化された医療検査項目選択
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:筬島未輝夫(九州大学), 松尾信之介(九州大学), 志久開人(九州大学), 備瀬竜馬(九州大学)
概要:医療現場では,患者に複数の検査を行った上で最終診断が下されるが,各項目の寄与度が十分に解明されていない疾患も多い.本研究では,初期検査で得られる基礎項目を入力とし,Transformerに基づく予測分布を用いて未取得項目を仮想的に追加した際のエントロピー低減量を情報価値と定義する.この情報価値に基づいて最も有効な項目を逐次的に推薦し,診断精度を維持しつつ検査コスト削減を実現する.

[1b-R-36] HEA探索に向けた組成データ解析の取り組み
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:遠藤瑛泰(NIMS), 三浦誠司(北海道大学), 村上諒(元NIMS, 現:トヨタ自動車), 源聡(NIMS)
概要:高エントロピー合金(HEA)は「CrMnFeCoNi」「HfNbTaTiZr」を代表とするような5つ以上の元素で構成される組成の合金であり,高い設計自由度と優れた特性から注目されている.しかし,探索する組成空間は膨大であり,HEAの高い設計自由度に対して元素選択などの設計指針を得ることが求められている.本研究では,組成データ解析を実施し,HEAの設計指針となる有効な潜在構造の抽出を試みる.

[1b-R-37] Policy Testing in Markov Decision Processes
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:Po-An Wang (NTHU), Kaito Ariu (CyberAgent), Alexandre Proutiere (KTH,digital future), Kenshi Abe (CyberAgent))
概要:We consider the problem of determining whether a policy’s value in a discounted Markov decision process (MDP) exceeds a threshold while minimizing sample complexity. First, we establish an instance-specific lower bound on any algorithm’s performance, derived from a non-convex optimization problem. We then propose a policy testing algorithm inspired by this characterization. However, the non-convex constraints in the lower-bound problem pose significant challenges, creating doubts about achieving both statistical optimality and computational tractability. To overcome this issue, we reformulate the lower-bound problem by interchanging the roles of the objective and constraints, obtaining a non-convex objective with convex constraints. Remarkably, the reformulated problem can be viewed as a policy optimization task in a reversed MDP. Leveraging recent policy gradient advances, we solve this problem efficiently and integrate its solution into a policy testing algorithm. Our method matches the instance-specific lower bound on sample complexity and remains computationally practical. Numerical experiments confirm its effectiveness.

[1b-R-38] 睡眠型競合バンディットのリグレット解析
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:姥真ノ介(大阪大学), 山口勇太郎(大阪大学)
概要:本研究では、フードデリバリーにおける配達員への依頼割り当てを、オンライン学習を用いたマッチング問題として定式化する。既存の競合バンディット問題を、各ラウンドでのプレイヤーとアームの集合が動的に変化する設定へと拡張する。この設定に合わせ、競合バンディットで用いられる性能指標である「最適安定リグレット」を再定義し、劣線形のリグレットを達成する手法の提案を目指す。

[1b-R-39] Off-Policy Corrected Reward Modeling for Reinforcement Learning from Human Feedback
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:Johannes Ackermann (The University of Tokyo and RIKEN AIP), Takashi Ishida (RIKEN AIP and The University of Tokyo), Masashi Sugiyama (RIKEN AIP and The University of Tokyo)
概要:Reinforcement Learning from Human Feedback (RLHF) allows us to train models, such as language models (LMs), to follow human preferences. In RLHF for LMs, we first train an LM using supervised fine-tuning, sample pairs of responses, obtain human feedback, and use the resulting data to train a reward model (RM). RL is then used to train the LM to maximize the reward given by the RM. As training progresses, the responses generated by the LM no longer resemble the responses seen by the RM during training, leading to the RM becoming inaccurate. The score given by the RM keeps increasing, but the learned behavior no longer matches the human preferences. This issue is known as overoptimization. We investigate overoptimization as distribution shift and show that the shift results in an inconsistent estimate of the RM parameters, leading to an inconsistent estimate of the policy gradient. We propose Off-Policy Corrected Reward Modeling, which iteratively off-policy corrects the RM using importance weighting. This results in a more accurate RM, which empirically leads to an improved final policy. We validate our approach in experiments with summarization and chatbot datasets and show that it performs significantly better than standard RLHF methods and baselines.

[1b-R-40] Multi-player approaches for dueling bandits
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:Or Raveh (University of Tokyo/RIKEN AIP)
概要:Fine-tuning deep networks with human preferences shows promise, but scaling to many users and recent complex data like videos requires distributed feedback collection. To address this, we introduce a multiplayer dueling bandit problem, highlighting that exploring non-informative candidate pairs becomes especially challenging in a collaborative environment. We demonstrate that the use of a Follow Your Leader black-box approach matches the asymptotic regret lower-bound when utilizing known dueling bandit algorithms as a foundation. Additionally, we propose and analyze a message-passing fully distributed approach with a novel Condorcet-Winner recommendation protocol, resulting in expedited exploration in the non-asymptotic regime, which reduces regret. Our experimental comparisons underscore the multiplayer algorithms’ efficacy in addressing the nuanced challenges of this setting.

[1b-R-41] On the Optimality of Follow-the-Perturbed-Leader in Adversarial Combinatorial Semi-Bandit Problems
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:Botao Chen (Kyoto University), Jongyeong Lee (Seoul National University), Junya Honda (Kyoto University / RIKEN AIP)
概要:This work studies the optimality and complexity of Follow-the-Perturbed-Leader (FTPL) policy in adversarial size-invariant combinatorial semi-bandit problems. FTPL is known to achieve Best-of-Both-Worlds (BOBW) optimality in standard multi-armed bandits with Fréchet-type perturbations, but its optimality in combinatorial semi-bandits has been unclear despite its original motivation. We show that FTPL with geometric resampling respectively achieves nearly optimal regret with Fréchet distributions, and the optimal regret with Pareto distributions in this setting. Furthermore, we extend a technique called conditional geometric resampling to this setting, which significantly reduces the computational complexity from the original geometric resampling without sacrificing the regret performance of FTPL.

[1b-R-42] 大規模言語モデルと制御バリア関数に基づく移動ロボットの自然言語制御
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:竹内天寧(早稲田大学), 和佐泰明(早稲田大学)
概要:本研究は、自然言語指示によるロボット群制御を目指す。大規模言語モデル(LLM)を用い、人間による自然言語の指示を線形時相論理(LTL)仕様へ自動翻訳する。このLTL仕様を、制御バリア関数(CBF)に基づく二次計画問題(QP)コントローラの自動合成フレームワークに入力する。これにより、安全性や到達性を数学的に保証しつつ、直感的な指示で複雑なタスクを実行するシステムを構築する。

[1b-R-43] 介入依存モデルの逐次学習に基づくベイズ適応半マルコフ型運用最適化
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:根本龍昌(日本電気株式会社)
概要:意思決定が将来の事象発生率を変調し得る状況を想定し、連続時間の半マルコフ決定過程として系を記述した上で、打ち切りを含む観測に対するベイズ的更新と予測に基づく意思決定手法を構成した。模擬実験では、小標本・高検閲下で点推定モデル手法、モデルフリー手法より過剰確信の抑制と方策安定性の向上が示唆された。本稿では因果識別は扱わない。

[1b-R-44] 分布変換・後処理統合による再学習不要な公平性-精度トレードオフ制御と効率向上
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:坂田麻絢(筑波大学/理研AIP), 福地一斗(筑波大学/理研AIP)
概要:機械学習システムにおける公平性-精度トレードオフ比を選好に応じて柔軟に調整したい場合がある.前処理・学習時処理手法は選好変更時の再学習が必要であり,後処理手法は公平にすることによる精度低下が大きいという問題がある.本研究では,分布変換ベースの学習時処理とベイズ最適分類器理論に基づく後処理手法を組み合わせ,再学習なしで様々な選好に対応し効率的な公平性-精度トレードオフを実現する分類手法を提案する.

[1b-R-45] Popularity-Bias Vulnerability: Semi-Supervised Label Inference Attack in Federated Recommender Systems
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:篠田謙司(トヨタ自動車株式会社), 笹井健行(トヨタ自動車株式会社), 福島真太朗(トヨタ自動車株式会社)
概要:Organizations are increasingly applying Vertical Federated Learning (VFL) to enhance recommender systems without sharing raw data among themselves. However, partial outputs in VFL remain to introduce significant privacy risks. In this study, we propose a novel label inference attack specifically tailored for VFL-based recommender systems, leveraging two common characteristics: (1) item popularity often follows a power-law distribution, and (2) random negative sampling is commonly used for implicit feedback, a substitute for non-existing true labels. By combining partial local information from VFL with this prior knowledge, a malicious party can construct a semi-supervised learning pipeline. The experimental results of three real-world datasets demonstrate that our approach achieves a higher label inference performance than the existing attacks. These findings demonstrate the need for more robust privacy preserving mechanisms in federated recommender systems.

[1b-R-46] 弱特徴量を含む学習の一般理論と汎化誤差解析
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:杉山孔亮(早稲田大学), 内田真人(早稲田大学)
概要:本発表では,欠測や誤観測,曖昧な観測といった任意の低品質な特徴量(弱特徴量)を含むデータセットからの学習問題について,その理論的性質を明らかにする.我々は,この学習問題を,弱特徴量の真の値の推定と,推定結果を用いた下流タスクのラベル予測という2段階の学習問題として定式化する.そして,弱特徴量に対する推定モデルと下流タスクに対する予測モデルが,互いの学習効率に与える影響を理論的に明らかにする.

[1b-R-47] 類似確信度と確信度差を用いた弱教師あり学習
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:舘知哉(早稲田大学), 杉山孔亮(早稲田大学), 内田真人(早稲田大学)
概要:弱教師あり学習は正確な教師ラベルを前提とせず, 不完全なラベルから学習を行う手法であり, 従来は単一の弱ラベルに基づく手法が検討されてきた.  本発表では, 「類似確信度」と「確信度差」という二種類の弱ラベル情報を活用し, それらを統合して学習する手法について議論する. 具体的には, 両者のラベルを同時に活用する不偏リスク推定量を導出し, その有効性を理論解析により保証できることを示す.

[1b-R-48] スパースモデリングにおける経験ベイズ推定量がもたらす一致性
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:吉田司 (NTT), 渡辺一帆 (豊橋技術科学大学)
概要:自動的にハイパーパラメータを決定する方法として代表的なものの一つに経験ベイズ推定がある。経験ベイズ推定は考え方は古くからあるものの、その性質は未だ完全に明らかにされていない。本研究ではスパースモデリングで利用される機械学習手法に関して経験ベイズ推定量の性質を調査する。結果として経験ベイズ推定量が有用な特性である一致性をMAP推定量にもたらすことを示す。

[1b-R-49] Adversarially Pretrained Shallow Transformers are Universally Robust In-Context Learners
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:熊野創一郎(東京大学), 計良宥志(千葉大学), 山崎俊彦(東京大学)
概要:Adversarial training is one of the most effective adversarial defenses, but it incurs a high computational cost. In this study, we show that transformers adversarially pretrained on diverse tasks can serve as robust foundation models and eliminate the need for adversarial training in downstream tasks. Specifically, we theoretically demonstrate that through in-context learning, a single adversarially pretrained transformer can robustly generalize to multiple unseen tasks without any additional training, i.e., without any parameter updates. This robustness stems from the model’s focus on robust features and its resistance to attacks that exploit non-predictive features. Besides these positive findings, we also identify several limitations. Under certain conditions (though unrealistic), no universally robust single-layer transformers exist. Moreover, robust transformers exhibit an accuracy-robustness trade-off and require a large number of in-context demonstrations.

[1b-R-50] Asymmetric Perturbation in Solving Bilinear Saddle-Point Optimization
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:阿部拳之(サイバーエージェント,電気通信大学), 坂本充生(サイバーエージェント); 蟻生開人(サイバーエージェント), 岩崎敦(電気通信大学)
概要:近年,ミニマックス最適化問題を効率的に解くために,各プレイヤーの学習アルゴリズムに与える利得を摂動させる方法が用いられている.本研究では,両プレイヤーの利得を同時に摂動する従来の方法では真の均衡解に到達できないことを理論的に示す.次に,一方のプレイヤーの利得のみを摂動させる非対称的な手法を提案し,この手法のもとでは均衡解が本来のゲームから変化せず,学習アルゴリズムが真の均衡へと収束することを示す.

[1b-R-51] 文脈依存言語における相転移現象
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:都地悠馬(北海道大学大学院情報科学院), 高橋惇(東京大学物性研究所), Vwani Roychowdhury(UCLA), 宮原英之(北海道大学大学院情報科学研究院)
概要:我々は、言語における様々な多体現象(Zipf則やLLMのスケーリング現象)を統計力学的に理解するための第一歩として、明確な相転移を起こす確率的な文法モデルを定式化した。そして、そのモデル上でBKT転移という特殊な転移現象が起こることを数値的に示した。BKT転移はスケーリング則が特定のパラメータ点ではなく領域で現れる転移であり、これは多様な言語体系でスケーリング則が観測されることと整合している。

[1b-R-52] ゲームにおける時間遅れフィードバックからの学習
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:藤本悠雅(サイバーエージェント), 阿部拳之(サイバーエージェント), 蟻生開人(サイバーエージェント)
概要:This study raises and addresses the problem of time-delayed feedback in learning in games. Because learning in games assumes that multiple agents independently learn their strategies, a discrepancy in optimization often emerges among the agents. To overcome this discrepancy, the prediction of the future reward is incorporated into algorithms, typically known as Optimistic Follow-the-Regularized-Leader (OFTRL). However, the time delay in observing the past rewards hinders the prediction. Indeed, this study firstly proves that even a single-step delay worsens the performance of OFTRL from the aspects of the regret and convergence. This study proposes the weighted OFTRL (WOFTRL), where the prediction vector of the next reward in OFTRL is weighted n times. We further capture an intuition that the optimistic weight cancels out this time delay. We prove that when the optimistic weight exceeds the time delay, our WOFTRL recovers the good performances that the regret is constant (O(1)-regret) in general-sum normal-form games, and the strategies last-iterate converge to the Nash equilibrium in poly-matrix zero-sum games. The theoretical results are supported and strengthened by our experiments.

[1b-R-53] 繰り返し不完全情報ゲームに対するCFR系分割法の高速化と収束性検証
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:水谷友哉(北海道大学 情報科学院 情報理工学コース), 中村篤祥 (北海道大学 情報科学院 アルゴリズム研究室 教授)
概要:繰り返し不完全情報ゲームに対し,サブゲーム分割とトランク/サブ問題分離を併用するCFR系手法を検討する。状態再利用と局所再計算で計算量とメモリを削減し,RPSやKuhn Pokerで収束性と効率を検証する。

[1b-R-54] GNNを用いた歩車共存空間における歩行者の移動モデルの構築
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:位曼曼(筑波大学), 大西正輝(産業技術総合研究所), 尹英杰(トヨタテクニカルディベロップメント株式会社)
概要:歩車共存空間における歩行者の移動予測は、自動運転や高度交通システムにおいて重要な課題である。歩行者の移動は複雑な相互作用や環境制約、多様な行動モードの変化を伴うため、予測は困難である。本研究では、相互作用を捉えるGNN、環境情報を処理するCNN、多様な行動モードを表現する粒子ベース手法を組み合わせた新たな予測モデルを提案する。提案手法を公開データセットで検証した結果、従来手法より合理性かつ信頼性の高い予測を生成できることを確認した。

[1b-R-55] 対数尤度ベクトルを用いた大規模言語モデルの学習ダイナミクスの予測
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:幡谷龍一郎(SB Intuitions, 京都大学)
概要:確率モデルを対数尤度ベクトルに変換することで、モデル間のKLダイバージェンスをユークリッド距離によって近似することができる。本研究では、大規模言語モデル(LLM)を対数尤度ベクトルを用いて表現し、動的モード分解を用いて事前学習によるモデルの時間発展の予測を行う。計算コストの大きいLLMのハイパーパラメータ選択などへの応用が期待される。

[1b-R-56] 自己進化LLMの幾何
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:坂本航太郎(東京大学), 坂本龍亮(北海道大学)
概要:鏡像降下法の正則化の大きさによるダイナミクスと収束先の違いについて分析し,正則化を制御することによって,収束を早める手法を開発した.

[1b-R-57] Probabilistic verification with LLMs-as-judges
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:Anita Yang (Lattice Lab, Toyota Motor Corporation / The University of Tokyo), Masaki Adachi (Lattice Lab, Toyota Motor Corporation), Siu Lun Chau (Nanyang Technological University), Krikamol Muandet (CISPA Helmholtz Center for Information Security)
概要:Hypothesis verification is central to discovery. With advances in automatic hypothesis generation, Large Language Models (LLMs) are increasingly employed as evaluators (LLM-as-a-judge) to screen large volumes of hypotheses. However, novel hypotheses inherently fall outside the distribution of known data, where LLMs (and humans) lack knowledge, giving rise to epistemic uncertainty. Faithfully capturing the LLM judge’s epistemic uncertainty is necessary to avoid rejecting promising hypotheses due to ignorance. Existing approaches to uncertainty quantification rely on precise probabilities, which insufficiently model epistemic uncertainty and cannot faithfully represent partial knowledge. In this work, we propose using an ensemble of LLM judges to expand the knowledge pool and characterize their combined uncertainty through imprecise probability.

[1b-R-58] 訓練損失が0になるパラメータにおける汎化誤差の代数幾何的解析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:吉田直生 (東京大学), 石川勲 (京都大学), 今泉允聡 (東京大学/理研AIP)
概要:本研究では,機械学習モデルにおいて訓練損失が完全に0になるパラメータにおける汎化誤差を理論的に解析した.従来の統計理論を用いて導出された汎化誤差の上界値は,一般にモデルのパラメータ数が増えるほど大きくなるが,この結果は深層学習などのパラメータ数の多いモデルがよく汎化するという経験的事実を説明できない.本研究では,実際の深層学習はほぼゼロ訓練損失を達成するという事実に注目し,訓練損失が完全に0になるパラメータに限定して汎化誤差解析を行った.その結果,汎化に必要なデータ数は,モデルが完全にデータを表現するパラメータ集合の次元によって決まることが示された.証明のテクニックとして,代数幾何による集合の次元解析を用いた.

[1b-R-59] 深層ニューラルネットワーク学習効率化に向けた重点サンプリングによる分散低減の解析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:沓名拓郎(株式会社豊田中央研究所)
概要:重点サンプリングを用いることで勾配推定の分散を低減し、DNNの学習効率を高めることが期待される。しかし、一様サンプリングと比較した分散低減効果の評価は計算コストの高さから困難である。本研究では、重点サンプリングで抽出したミニバッチのみを用いて勾配分散低減を推定する手法を提案する。その推定量に基づいた有効ミニバッチサイズの導出と学習率の自動調整、および、重要度推定アルゴリズムの設計を行う。

[1b-R-60] 幅拡大のみによる Linear Mode Connectivity の達成可能性
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:伊東燦(NTT社会情報研究所), 山田真徳(NTT社会情報研究所), 千々和大輝 (NTTコンピュータ&データサイエンス研究所), 熊谷充敏(NTTコンピュータ&データサイエンス研究所)
概要:従来、十分に幅を広げたニューラルネットワークでは、パラメータの順列対称性により、異なるランダムシードで学習した2つのモデル間でもlinear mode connectivityが成立することが報告されている。本発表では、幅を広げるだけで、マージ後のモデルの性能が向上し、元のモデルに匹敵する性能を達成可能な場合があることを実験的に明らかにする。

[1b-R-61] Caulkingによる事前学習モデルの有用性の理論的特徴づけ
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:福地一斗(筑波大学/理研AIP), 幡谷龍一郎(SB Intuitions/京都大学), 松井孝太(京都大学/滋賀大学/東京科学大学)
概要:大規模言語モデル(LLM)など,様々なドメインのサンプルから学習された事前学習モデルの活用により,ターゲットドメインにおける高精度モデルがサンプルが小さい場合でも構築可能となる.本発表では,Caulkingと呼ばれる新しい学習枠組みを提案し,それにより事前学習モデル活用の有用性を理論的に示す.特に,大規模サンプルによる事前学習でより複雑な事象をあらかじめ学習しておくことで,ターゲットドメインのサンプルの複雑度が低減することを示す.

[1b-R-62] Bottleneck Communication Delay Minimization for Communication-Efficient Decentralized Learning
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:秦希望(NTT), 丹羽健太(NTT)
概要:To enable communication-efficient decentralized learning, various advanced network (NW) topologies have been studied. Notably, exponential and 1-peer exponential graphs–which are special cases of circulant digraphs–exhibit a strong convergence rate under idealized NW settings with homogeneous communication delays across nodes. However, real-world physical NWs often involve heterogeneous communication delays due to geographically distributed computing nodes, making node assignment optimization crucial for minimizing the Bottleneck Communication Delay (BCD). To address this, we propose BTSP-MSR, an approximation solver for BCD tailored to circulant digraphs. Leveraging the insight that circulant digraphs can be represented as a union of (directed) ring graphs, we derive an upper bound on the BCD objective using the Bottleneck Traveling Salesman Problem (BTSP), which is equivalent to BCD on ring graphs. BTSP-MSR is constructed to explore around the BTSP solution to further improve the approximation quality. Through numerical experiments, we demonstrated that BTSP-MSR effectively reduces BCD across several circulant digraphs, thereby enabling communication-efficient decentralized learning. Notably, exponential and 1-peer exponential graphs remain effective under heterogeneous delay settings.

[1b-R-63] 営業架電スケジュールの最適化:効率的解法とシミュレーション評価
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:笠原勇布(株式会社リクルート), 松岡佑知(株式会社リクルート), 西村直樹(株式会社リクルート), 金光俊輔(株式会社リクルート), 池田春之介(筑波大学), 鮏川矩義(法政大学), 高野祐一(筑波大学)
概要:To enable communication-efficient decentralized learning, various advanced network (NW) topologies have been studied. Notably, exponential and 1-peer exponential graphs–which are special cases of circulant digraphs–exhibit a strong convergence rate under idealized NW settings with homogeneous communication delays across nodes. However, real-world physical NWs often involve heterogeneous communication delays due to geographically distributed computing nodes, making node assignment optimization crucial for minimizing the Bottleneck Communication Delay (BCD). To address this, we propose BTSP-MSR, an approximation solver for BCD tailored to circulant digraphs. Leveraging the insight that circulant digraphs can be represented as a union of (directed) ring graphs, we derive an upper bound on the BCD objective using the Bottleneck Traveling Salesman Problem (BTSP), which is equivalent to BCD on ring graphs. BTSP-MSR is constructed to explore around the BTSP solution to further improve the approximation quality. Through numerical experiments, we demonstrated that BTSP-MSR effectively reduces BCD across several circulant digraphs, thereby enabling communication-efficient decentralized learning. Notably, exponential and 1-peer exponential graphs remain effective under heterogeneous delay settings.

[1b-R-64] Anistropic Smoothness and PL Condition to Derive Adam Optimization
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:前田煌(東京大学), 駒木文保(東京大学)
概要:Recent advances in optimization theory for machine learning have introduced the notion of ($L_0, L_1$)-smoothness, which provides a more precise characterization of the descent behavior of gradient-based methods. Furthermore, layer-wise smoothness conditions have been proposed to adaptively scale the step size across different coordinates. Building on these developments, we propose a general anisotropic smoothness condition that unifies and extends these existing notions. This condition naturally gives rise to optimization methods reminiscent of Adam, where step sizes are adjusted in an adaptive and coordinate-wise manner. In addition, we introduce an anisotropic variant of the Polyak–Łojasiewicz (PL) condition, which guarantees linear convergence under our framework and provides a refined description of convergence behavior in relation to smoothness. Together, these results offer a unified theoretical foundation that bridges existing smoothness conditions with practical adaptive gradient methods, shedding light on their convergence properties and effectiveness in large-scale machine learning.

[1b-R-65] Scalable Decentralized Learning with Teleportation
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:竹澤祐貴 (京都大学/OIST), Sebastian Stich (CISPA)
概要:Decentralized SGDは小さい通信コストで動作するが、そのスパースな通信特性により収束速度は低下してしまう。特にノード数が多い場合に顕著に悪化することが知られている。従来の研究では、スペクトルギャップの大きいグラフを設計することで、こうした状況における収束率の低下を緩和しようとしてきた。しかし、ノード数が膨大な場合には、依然として顕著に低下してしまう。本研究では、この収束率の低下を完全に解消できるTELEPORTATIONを提案する。

ポスターセッション 2a [11月13日(木)13:50-15:50]
Poster Session 2a [Thursday, 11/13, 1:50~3:50 p.m.]

エントリー枠 (Entry Slot)

[2a-E-01] 読後感スコアとLLMを活用した主観的文学作品検索
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:伊藤達也(法政大学 理工学部 応用情報工学科), 竹下理斗(法政大学 理工学部 応用情報工学科), 大橋巧(法政大学大学院 理工学研究科 応用情報工学専攻), 福田由紀(法政大学 文学部 心理学科), 彌冨仁(法政大学 理工学部 応用情報工学科)
概要:本研究では、108件の文学作品に対し、それぞれ約70名の評価者から得られた6項目の読後感スコアを用い、ModernBERT を基盤とする読後感予測モデルおよび、読後感スコアに基づく推薦システムを構築した。評価実験により一定の成果を確認するとともに、大規模言語モデル(LLM)で生成した感想文を新たな感性表現として用いることで、読者の潜在的嗜好に基づく作品推薦の実現可能性を示した。

[2a-E-02] ベイズ最適化を用いたサンプルサイズ設計:中断時系列デザインへの応用
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:川端孝典(千葉大学/国立循環器病研究センター), 松井孝太(京都大学/滋賀大学/東京科学大学), 川上英良(千葉大学/理研)
概要:臨床・疫学研究では計画段階でサンプルサイズを設定することが重要である。しかし、複雑な研究デザインではサンプルサイズを解析的に求めることは困難で、検討するシナリオ毎に検出力をシミュレーション評価することが基本的なアプローチである。ただこのアプローチは多くの計算時間を要する。例として中断時系列デザインを挙げ、ベイズ最適化を用いて従来より効率的にサンプルサイズを決定するフレームワークを示す。

[2a-E-03] 因果探索と大規模言語モデルによるビジネス指標の変動要因解釈支援
カテゴリ:実装・データ収集 (Implementation / Data Collection)
発表者:松田亜登夢(株式会社グロースデータ), 今井優作(株式会社グロースデータ)
概要:ビジネス指標の変動要因を正確かつ迅速に解釈することは、効果的な意思決定に不可欠である。近年、因果探索技術の発展により、多数の要因から因果構造を推定することが可能となったが、その出力は複雑で、人間による解釈が困難であるという課題がある。そこで本研究では、因果探索により得られた因果グラフを大規模言語モデルに学習させることで、ビジネス指標に影響を与える要因を提示し、解釈支援するための分析手法を提案する。

[2a-E-04] 相関スピングラスにおける西森線とベイズ最適性の考察
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:藤森寧々(お茶大情報)(北里大物理), 西川宜彦(北里大物理), 髙橋昂(東大知の物理)(理研AIP),坂田綾香(お茶大情報)(理研AIP)
概要:ベイズ最適推定は、統計物理におけるスピングラス模型の西森線と関係する。近年、スピン間相互作用に相関を導入したスピングラス模型(西森模型)が提案された。西森模型では、西森線は特殊な相互作用分布に対応し、また西森模型は西森線においても従来のスピングラス理論とは異なる振る舞いを示す。本研究では、この西森模型が示す振る舞いを平均場理論の枠組みで記述し、その解析を通じてベイズ最適性との関係を考察する。

レギュラー枠 (Regular Slot)

[2a-R-01] Moment Matters: Mean and Variance Causal Graph Discovery from Heteroscedastic Observational Data
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:近原鷹一(NTT)
概要:複雑な実現象に潜在するメカニズムを解明するための新たなフレームワークとして、確率変数のモーメントに基づく因果グラフ推定を提案する。複雑な実現象では、各変数の分散が他の変数の値に影響されるような分散不均一ノイズを伴う観察データが得られることがしばしばあるが、この場合旧来の因果グラフ推定では、各変数の平均に影響する原因変数と、分散に影響する原因変数とを区別することができないという問題がある。本研究では、平均因果グラフ・分散因果グラフと呼ぶ2つのグラフ構造の識別可能条件を導出し、これに基づいて各グラフの事後分布を推定するBayesian causal discoveryのアプローチを提案する。

[2a-R-02] 順方向KLダイバージェンスを用いたベイズ推定と高次元への課題
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:Daniel Andrade (広島大学)
概要:逆方向のKullback–Leibler (KL) ダイバージェンスを用いた変分ベイズは、高次元のベイズモデルにも簡単に適用可能のため、広く用いられている。しかし、正規化フローを用いた場合であっても、逆方向KLはしばしばモード崩壊を引き起こし、多峰性事後分布を高精度に近似できないという問題がある。この問題に対処するため、近年では順方向KLを用いて正規化フローを学習する手法が提案されている。本研究では、既存の手法を分析し、確率的勾配の分散が大きいことに起因して高次元のベイズ推定が困難だと分かった。高次元へのスケーラビリティを改善するために、いくつかの改善案を示し、人工的に設計した目標分布およびベイズ潜在変数モデルにおける予備実験の結果を報告する。

[2a-R-03] gPIE : 計算イメージングのための近似推論フレームワーク
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:上田朔(東京大学新領域創成科学研究科), 片上舜(東京大学新領域創成科学研究科), 岡田真人(東京大学新領域創成科学研究科)
概要:gPIEは、イメージングにおける物理モデルを記述し、近似ベイズに基づく逆解析を自動的に実行するPythonフレームワークである。因子グラフとして記述された物理モデルに対し、期待伝播により推論を自動化し、CPU/GPU実行に対応している。タイコグラフィ・多層光学系・ホログラフィなどへの応用例を示す。

[2a-R-04] リグレット vs 平均二乗誤差:オフ方策学習と条件付き平均処置効果推定の橋渡し
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:加藤真大(みずほ第一フィナンシャルテクノロジー)
概要:因果推論における処置選択には,経験的な方策価値を最大化することで方策を学習するオフ方策学習と,条件付き平均処置効果を推定した後にその推定値が大きい処置を選ぶ方法の二つのアプローチが存在する.本研究では,処置効果推定に用いるモデルに制約を加えることで,この二つのアプローチが同値になることを示す.近年の文献では意思決定の点からオフ方策学習の優位性が主張される傾向にあるが,本研究はその妥当性も再考する.

[2a-R-05] 常微分方程式の離散化誤差の不確実性定量化:状態空間モデルへの帰着に基づく方法
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:豊田祥史(九州大学), 宮武勇登(大阪大学)
概要:本研究では、数値解法に伴う常微分方程式の離散化誤差を、観測データに基づいて、統計的、特にベイズ推論の立場から定量化する。ベイズ推論における事前分布にマルコフ性の制約を課すことで、問題を状態空間モデルに帰着させ、逐次推論に基づき推論するアプローチをとる。数値実験を通じ、提案手法の有効性を示す。

[2a-R-06] 時系列基盤モデルの頑健な学習法
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:勝木孝行(IBM東京基礎研究所), Haoxiang Qiu(IBM東京基礎研究所), 坂井 智哉(IBM東京基礎研究所), Vijay Ekambaram(IBM Research), Kyongmin Yeo(IBM Research), Arindam Jati(IBM Research), Sumanta Mukherjee(IBM Research), Subodh Kumar(IBM Research), Pankaj Dayama(IBM Research), Wesley M. Gifford(IBM Research), Chandra Reddy(IBM Research), Jayant Kalagnanam(IBM Research)
概要:時系列基盤モデルの構築は、データの可用性が限られていることや様々な時系列データセット間で時間的なダイナミクスが不均一であることから、学習の安定性という観点で課題を抱えています。本研究では、時系列基盤モデルの堅牢で安定なモデル非依存の事前学習フレームワークを提案します。公開されている様々なベンチマークデータセットを用いたダウンストリームタスクでの評価で、提案法で学習したモデルは一貫して競争力のあるゼロショット性能を達成することを示します。

[2a-R-07] p進数を用いた単語埋め込みについて
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:三原朋樹(筑波大学), 石川勲(京都大学), 横井祥(人間文化研究機構)
概要:素数pを1つ固定すると、有理数上に「pでの割り切れやすさ」という尺度によってp進絶対値が定義される。ここから、p進数と呼ばれる木構造を内在し非アルキメデス性(整数倍で大きさ増加しない)を有する数の体系が構成できる。その性質は実数と大きく異なるが、整数論など研究分野では広く用いられている。本発表では、p進数上のベクトル空間におけるp進特異値分解や低ランク近似用いた単語埋め込み(p進SkipGram)を提案し、その特徴や性能について紹介したい。

[2a-R-08] TAP方程式によるFastICAの理論的性能解析
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:遠藤優介(茨城大), 竹田晃人(茨城大)
概要:FastICAはICA(独立成分分析)の標準アルゴリズムであり、音源分離や神経活動データの解析などの場で幅広く活用されている。一方で、データ数やノイズが解に与える影響といった理論的性能は十分に解明されていない。そこで本研究では統計物理学の観点から、FastICAの解が従うTAP(Thouless-Anderson-Palmer)方程式を導出し、その性能の理論的な解析を試みる。

[2a-R-09] FDR制御した回帰レベルセットの発見
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:豊田雅樹(一橋大学), 植松良公(一橋大学), 石原卓弥(東北大学)
概要:ノンパラメトリック回帰レベル集合{x:m(x)>c}の推定において、偽発見率(FDR)を漸近的に制御する問題を考える。Xの連続性に対応するため、測度μで偽発見領域の割合を評価する連続版FDRを考える。μが既知の場合と未知の確率測度の場合の2設定で多重検定による手続きを提案し、FDR制御を理論的に保証する。シミュレーションと実データ応用で有効性を示す。

[2a-R-10] Harnessing Asymmetry for Test-Time Scaling
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:神谷俊輔 (東京大学), 久保健治 (東京大学), 小山雅典 (東京大学), 林浩平 (東京大学), 鈴木雅大 (東京大学), 松尾豊 (東京大学)
概要:Humans can answer problems requiring advanced reasoning by taking a longer thinking time. In AI models, an analogous phenomenon called “test-time scaling (TTS)” has been reported, where task accuracy improves only by increasing the number of identical iterations in the model’s latent space. While TTS is considered to be realized by the dynamics of the model descending some “potential,” not all models exhibiting TTS are gradient systems. Although it is pointed out that an antisymmetric component, which cannot be represented by gradients, plays an important role, the role and significance of such an antisymmetric component remain unsolved. This study addresses this question by constructing the Helmholtz-Hodge Network (HHNet), which explicitly incorporates a decomposition of gradient and rotation terms. We discuss the behavior of symmetric and asymmetric terms when this model solves the Sudoku task, commonly used as an inference task.

[2a-R-11] Unified Nonparametric Variable Selection
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:宮崎隆之介(一橋大学ソーシャル・データサイエンス研究科), 植松良公(一橋大学ソーシャル・データサイエンス研究科)
概要:本研究は、従来の線形モデルに基づく変数選択をノンパラメトリックに拡張し、多様体・多様体上の関数データといった非ユークリッドデータにまで適用可能な新手法を提案する。このノンパラメトリック変数選択法は解釈可能AIとも関連する分野である。我々は条件付きフレシェ平均に基づき、カーネルを用いた新たな作用素を導入して統計量を構成し、double robustness等の理論保証を与える。

[2a-R-12] 方向性サンプリングによる勾配推定法および進化戦略
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:清水瑛貴(統計数理研究所), Paavo Parmas(東京大学), 谷口 泰地(京都大学)
概要:REINFORCE勾配推定法は、進化戦略などの手法の基礎であり、パラメータ分布からのサンプルと関数評価をもとに勾配を推定する。通常は正規分布が用いられ、またsmoothingされた関数に対する勾配を推定するという特徴もある。本研究では、サンプリングの方法を工夫することで手法が一般化され、正規分布の場合と比べて、高次元でのsmoothingがよくなるケースや勾配分散の分析ができることなどを示す。

[2a-R-13] クロスドメイン状況下における長期的指標最適化のためのオフポリシー評価
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:室井隆徳(ソニーグループ株式会社), 宇田川拓麻(ソニーグループ株式会社), 舘野啓(ソニーグループ株式会社)
概要:オフポリシー評価を用いた長期効果の推定には、評価対象のデータに加え長期指標も観測したデータが必要であるが、運用開始直後のDTCサービスではデータが観測されておらず評価が困難である。本研究では、複数の類似サービスから観測した長期指標データのドメイン間の差異を補正し、評価対象サービスの長期効果を推定する手法を提案する。数値実験の結果、本手法が既存手法よりも長期効果を正確に評価可能であると確認した。

[2a-R-14] 外れ値が多くあるときの非有界な密度比の頑健かつスパースな推定
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:南雲亮佑(パナソニックホールディングス株式会社), 藤澤洋徳(統計数理研究所)
概要:頑健な密度比推定手法である Weighted DRE の二重強頑健性を非漸近論的な枠組みで解析する。本研究は密度比推定とロバスト推定の両側面の困難を克服する。密度比推定の側面では、本研究は重みつき密度比が有界であればよいという仮定をおくことで非有界な密度比の解析を可能とした。ロバスト推定の側面では、外れ値が少ないもしくは遠くにあるという仮定を置くことで、外れ値が多い時の解析を可能とした。

[2a-R-15] 矩形制約付きソフトマックス関数と信頼できる予測への応用
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:新恭兵(京都大学), 小山聡(名古屋市立大学), 荒井ひろみ(RIKEN AIP), 鹿島久嗣(京都大学)
概要:本研究では、出力に明示的に下限と上限を導入できるようにソフトマックス関数を一般化した、矩形制約付きソフトマックス関数(BCSoftmax)を提案する。BCSoftmax関数は、矩形制約付き最適化問題の解として定式化されるが、厳密かつ効率的に計算できることを示す。また、BCSoftmax関数の応用として、予測モデルの事後確率較正手法と、ラベルノイズに頑健な学習手法を提案する。

[2a-R-16] 深層ニューラルネットワークとグラフマイニングの融合による判別性と解釈性に優れたグラフ予測モデルの構築
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:小島大河(名古屋工業大学), 烏山昌幸(名古屋工業大学)
概要:グラフ分類問題に対し部分グラフの有無を入力とするニューラルネットワークを提案する.提案法はスパースペナルティにより,分類に寄与する少数の重要部分グラフパターンを特定できる.誤差逆伝播と近接勾配法,およびグラフマイニングに基づくPruning戦略を組み合わせることで,膨大な探索空間を効率的に処理し,解の品質を保証できることを示す.また,決定木を用いて学習したネットワークを解釈する方法も検討する.

[2a-R-17] 転移学習における適応的実験計画法
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:三浦大志(科学大), 松井孝太(京都大/滋賀大/科学大), 金森敬文(科学大/理研)
概要:ドメイン適応の理論研究で確立されたWasserstein距離を用いた汎化誤差上界に着目する。この上界を最小化することを目的とし、どのドメインから追加データを取得すれば上界が効果的に減少するかを推定する実験計画法を導入する。能動学習の枠組みに基づき、各ドメインの潜在的な貢献度を評価し、クエリ対象を選択するアルゴリズムを設計した。数値実験により、効率的にターゲットリスクを低減できることを示す。

[2a-R-18] 欠損のある時系列の分類と補完のための拡散モデルとコンフォーマル予測
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:白上龍(有限責任監査法人トーマツ,京都大学), 広瀬俊亮(株式会社JMDC), 竹内孝(京都大学)
概要:実世界で収集される時系列データは欠損が避けられず、不完全な時系列の分類と補完はともに重要なタスクである。本研究は、欠損のある時系列データの補完と分類を同時に行う手法を提案する。本手法は、確率的補完と分類を両立する拡散モデルと、その出力のばらつきを考慮したコンフォーマル予測手法からなる。これにより、本手法は従来手法を上回る性能だけでなく、予測の不確実性の定量化による高い解釈性を実現する。

[2a-R-19] Bregmanダイバージェンスを用いた頑健なノイズ対照推定
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:藤井優斗(東京科学大学), 佐々木博昭(明治学院大学), 金森敬文(東京科学大学/理研)
概要:最尤推定には、外れ値への脆弱性と正規化定数の計算困難性という2つの課題がある。本研究では、これらを同時に解決するため、正規化定数の計算が不要なノイズ対照推定(NCE)の識別基準を、凸関数に基づき定義されるBregmanダイバージェンスを用いた推定量へ拡張する手法を提案する。提案手法は計算効率を維持しつつ、凸関数の選択により外れ値に対して頑健であることを理論的に示す。

[2a-R-20] 情報検索における知識蒸留のための行列分解的アプローチ
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:岡島光希(NTT), 中村泰明(NTT), 竹内亨(NTT)
概要:大量の文書から与えられたクエリと関連度の高い文書を検索する情報検索技術において、検索精度が高いモデルの知識を検索速度が速いモデルへ転移する知識蒸留が注目されている。一方、知識蒸留は高い学習コストと検索精度劣化が課題である。本研究では検索精度を維持しつつ知識蒸留を高速化するため、両モデルから得られるクエリ-文書対に対するスコア差分を行列分解モデルにより補完する手法を提案し、実験的に有効性を検証した。

[2a-R-21] Learning infinite dimensional Hamiltonian systems via shear-type neural operators
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:YEANG MAKARA (神戸大学), 田中佑典(NTTコミュニケーション科学基礎研究所), 松原崇(北海道大学), 谷口隆晴(神戸大学, 理化学研究所)
概要:Preserving the symplectic structure is essential for simulating Hamiltonian systems. However, general neural operators such as FNO, GNO, CNO, and DeepONet do not account for this geometric property. We propose a shear-type neural operator designed to approximately preserve this structure. Numerical experiments on the wave, EM wave, Schrödinger, and Klein–Gordon equations show that our model achieves higher accuracy, greater long-term stability, and improved conservation of energy and symplectic form, offering a promising framework for structure-preserving learning in infinite-dimensional systems.

[2a-R-22] 実交渉シーンにおける自然言語データに基づくネゴシエーション・ダンスの推定
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:森雄人(株式会社Seeeng)
概要:大規模言語モデル(LLM)とAIエージェントの発展にしたがい, 現実の意思決定場面に近い合意形成支援・自動交渉の研究が進んでいる. 本研究はその潮流の中で, 自然言語の交渉ログから交渉過程を抽象化した「ネゴシエーション・ダンス」を推定する枠組みを提案し, よりよい合意形成に至る手法について検討する.

[2a-R-23] 輪郭保持を考慮した変換による2D撮像FLAIR MRIとfat-saturation 3D撮像FLAIR MRIの調和
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:秋葉裕貴(法政大学大学院理工学研究科), 西牧慧(法政大学大学院理工学研究科), 大橋巧(法政大学大学院理工学研究科), 友重秀平(法政大学大学院理工学研究科), 大石健一(ジョンズホプキンス大学医学部), 彌冨仁(法政大学大学院理工学研究科)
概要:FLAIR MRIは主に臨床の2D撮像と研究用3D撮像で分解能やfat-saturationの有無に差があり統合解析に課題となる。本研究はこれを解消するGANベースの調和手法SynFLAIRを提案する。SynFLAIRは頭蓋骨除去・解像度補正・スタイル変換からなり、特に重要な脳構造保持のための新たな損失を導入した。ADNIデータによる評価実験により有効性と脳構造の保持性を確認した。

[2a-R-24] データ駆動型離散力学系による時系列シングルセルデータ解析
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:人見花帆(大阪大学医学部), 加藤有己(大阪大学医学系研究科)
概要:多種多様な細胞動態を、微分方程式などで包括的に記述することは難しい。本研究では、最適輸送と動的モード分解を組み合わせ、現象を支配する方程式を仮定せずデータのみから推定する、離散力学系による細胞状態解析法を提案する。マウス皮質細胞の時系列シングルセルデータを用いて提案手法を評価したところ、細胞型に対応する力学系の不動点が漸近安定であることを示し、未来の発現量の予測において、高い決定係数を達成した。

[2a-R-25] LLM製知識グラフに対するEntity Alignmentの有効性評価
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:大磯秀幸(NEC), 柿崎和也(NEC), 宮川大輝(NEC), 古川諒(NEC)
概要:LLMの発展に伴い、テキストからLLMによって知識グラフを構築する技術が台頭している。LLM製知識グラフを他のグラフと統合して知識拡大するためには、Entity Alignment (EA)が必要である。しかしながら、LLM製知識グラフはしばしば不正確であるため、LLM製知識グラフに対して既存EAが機能するかは自明でない。本研究では、LLM製知識グラフを含む新たなデータセットを半自動構築し、既存EAのLLM製知識グラフに対する頑健性の評価結果を提示する。

[2a-R-26] メッシュ・ガウシアン表現の同時最適化に基づく3D人体復元
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:坪田和也(京都大学), 吉井和佳(京都大学), 伊藤陽介(京都大学), 上田博之(京都大学)
概要:3D Gaussian Splatting (3DGS) は多視点画像から高品質なレンダリングを実現するが、少数視点では形状崩壊や不自然なポーズが生じやすい。本研究では、パラメトリック人体モデルと3DGSの同時最適化を提案する。人体モデルに基づく形状・ポーズ制約を利用することで、少数視点下においても一貫した形状と自然なポーズを保持し、従来手法を上回る復元精度を実現した。

[2a-R-27] ドメイン変換付きスケーラー転移による少数ショット学習の効率化と材料特性予測における実証
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:矢作裕太(NEC, AIST), 小渕喜一(NEC, AIST), 高坂文彦(AIST), 松井孝太(京大, 滋賀大, 科学大)
概要:材料データ材料分野においてはデータ取得コストが高く、またデータドメインも多様であるため学習に使えるデータが少ないという課題がある。本研究ではデータ不足を克服するため、ドメイン変換とスケーラーの転移からなるデータ効率の良い異種ドメイン間転移学習手法を提案する。本手法を電極触媒活性予測に適用し予測器の性能評価を行ったところ、全体的に正の転移が確認でき、特に少数ショット学習で顕著な予測精度の向上が見られた。

[2a-R-28] Physics-Informed Neural Networks による定量MRI
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:江山晋世 (一橋大学大学院ソーシャル・データサイエンス研究科), 越智久晃 (一橋大学大学院ソーシャル・データサイエンス研究科), 本武陽一 (一橋大学大学院ソーシャル・データサイエンス研究科)
概要:MRIの特性を表す定量値(T1/T2緩和時間)推定のため、磁化信号モデルの基礎理論であるBloch方程式を直接組み込んだPhysics-Informed Neural Networks (PINNs)の開発を試みた。従来のMRI分野におけるPINNsが、単にシミュレータと一般的なNNsの組み合わせに留まる中、本研究ではBloch方程式を物理的制約としてモデルに導入する。これにより、スパースな磁化信号データからでも高精度かつ物理法則に忠実な定量値推定を実現してロバストな定量値マッピングへ貢献することが期待される。

[2a-R-29] マルチモーダルな項目反応理論によるVLMとベンチマークのクロスモーダルな評価
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:上林駿希(京都大学大学院), 増井建斗(株式会社サイバーエージェント), 新恭兵(京都大学大学院), 井上直人(株式会社サイバーエージェント), 包含(京都大学大学院), 鹿島久嗣(京都大学大学院), 大谷まゆ(株式会社サイバーエージェント), 竹内孝(京都大学大学院)
概要:視覚言語モデル(VLM)の発達とともに、モデルが画像とテキストを同時に扱う能力を正確に評価するベンチマークの重要性が高まりつつある。しかし現状のVLMベンチマークには画像とテキストの対応が取れていない問題や、画像もしくはテキストのみで解ける「ショートカット問題」が含まれる。そこで、VLMとベンチマークの問題をモダリティごとに評価するMMIRTを提案し、VLMの能力と問題の品質を評価する。

[2a-R-30] ガウス過程に基づく事後分布サンプリングを用いた能動的CTスキャン方式
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:孫宏謀(京都大学), 本多淳也(京都大学/理研AIP), 工藤博幸(筑波大学/東北大学SRIS), 小松崎民樹(北海道大学)
概要:本研究では、動的スキャン方策に基づくCT画像再構成の問題を考える。従来のCTスキャンはX線投影の位置と角度を事前に固定しているため、多数の投影が必要で被曝線量も増大する。本研究では、ガウス過程に基づいて画像をモデリングし、事後分布サンプリングを用いてX線投影の位置と角度を逐次的に適応選択する手法を提案する。実験的検証により、従来法より少ない投影数で高品質な再構成が可能であることを示す。

[2a-R-31] Heatmap regressionのタンパク質構造推定への応用
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:前島遼太(明治大学), 唐澤直之(埼玉大学), 本間さくら(埼玉大学), 石曽根毅(明治大学), 松永康佑(埼玉大学), 中村和幸(明治大学)
概要:本研究では、タンパク質の顕微鏡観測からアミノ酸の位置を特定するために、姿勢推定タスクで用いられるheatmap regressionを応用した。顕微鏡で撮影した単分子タンパク質からアミノ酸の位置を特定し、バイアス付き物理演算で不安定な構造を緩和させた。擬似的に生成したデータセットに提案手法を適用したところ、正解に近い構造を得ることができた。

[2a-R-32] Physics-Informed Machine Learningによるフェルミ加速模擬システムの縮約モデリング
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:久保田燿丞(一橋大学), 田中賢(一橋大学), 山戸瞭雅(京都大学), 奥野彰文(統計数理研究所), 小林進二(京都大学), 本武陽一(一橋大学)
概要:核融合炉内相対論的電子のエネルギー分布関数の時間発展を記述する偏微分方程式に対し、拡散係数を重要パラメータとして推定することを目的に、物理法則を損失関数へ組み込むニューラルネットワーク手法を適用し、その妥当性を検証するとともに、手法の有効性について議論する。

[2a-R-33] AI生成画像の分析および検知手法の提案
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:水谷英生(東京科学大学), 長田元気(LINEヤフー);
概要:昨今のAI生成画像は本物の写真と判別困難である。悪用されれば深刻な社会的脅威となり得、検知技術の確立は喫緊の課題である。本研究では学習済み検出器にAdversarial攻撃を適用し、リアル画像とフェイク画像の差異を実験的に調査した。loss関数の安定性において両者間に顕著な乖離が確認された。これら分析の結果と、得た知見に基づいて考案した検知手法の有用性について報告する。

[2a-R-34] Recursive Reward Aggregation
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:Yuting Tang (The University of Tokyo, RIKEN AIP), Yivan Zhang (The University of Tokyo, RIKEN AIP), Johannes Ackermann (The University of Tokyo, RIKEN AIP), Yu-Jie Zhang (RIKEN AIP), Soichiro Nishimori (The University of Tokyo, RIKEN AIP), Masashi Sugiyama (RIKEN AIP, The University of Tokyo)
概要:In reinforcement learning (RL), aligning agent behavior with specific objectives typically requires careful design of the reward function, which can be challenging when the desired objectives are complex. In this work, we propose an alternative approach for flexible behavior alignment that eliminates the need to modify the reward function by selecting appropriate reward aggregation functions. By introducing an algebraic perspective on Markov decision processes (MDPs), we show that the Bellman equations naturally emerge from the recursive generation and aggregation of rewards, allowing for the generalization of the standard discounted sum to other recursive aggregations, such as discounted max and Sharpe ratio. Our approach applies to both deterministic and stochastic settings and integrates seamlessly with value-based and actor-critic algorithms. Experimental results demonstrate that our approach effectively optimizes diverse objectives, highlighting its versatility and potential for real-world applications.

[2a-R-35] 無線給電ドローンのための信号時相論理仕様に基づく自律誘導制御
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:芹澤和伸 (大阪大学), 橋本和宗 (大阪大学), 岸田昌子 (国立情報学研究所), 髙井重昌 (大阪大学)
概要:無線給電ドローンが離着陸せずに長時間のミッション(搬送・巡回など)を自律的に実行するには、「バッテリー残量が無くなる前に充電地点へ移動して、必要な時間だけ充電した後にミッションを再開する」といった時間的・空間的な要素が絡む複雑な制御仕様を明確に満たす必要がある。本研究では、無線給電ドローンの制御仕様を信号時相論理に基づいて表現し、形式的に検証可能な自律誘導制御手法を提案する。

[2a-R-36] Implicit Imitation Learningの応用による強化学習の効率化
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:今川孝久(九工大), 榎田修一(九工大)
概要:強化学習のサンプル効率性の低さはしばしば問題となる.本研究では,通常のオンライン強化学習の前提に加えて,少量の人間のデータ,特に単に模倣するだけでは不十分な質のデータが与えられるとする.その前提の下,通常のオンライン強化学習よりもサンプル効率的に,模倣より高品質なポリシーを学習することを目指す.本研究では既存手法implicit imitation learningに着目しそれを応用する.

[2a-R-37] 共通トレンドを考慮した加法報酬モデルに基づく非定常バンディットアルゴリズム
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:暮石航大(CyberAgent), 蟻生開人(CyberAgent), 阿部拳之(CyberAgent)
概要:非定常多腕バンディットに対し、報酬を時間とともに変動する全アーム共通成分と、時間に依存しないアーム固有の定常成分に分解するアプローチを提案する。この報酬モデルの構造を利用した Thompson Sampling に基づく手法は、実験で主要な既存手法を上回る性能を示した。

[2a-R-38] 敵対的およびヘビーテイルなノイズに頑健な計算効率の高い線形コンテキストバンディットアルゴリズム
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:谷直斗(大阪大学,理研), 二見太(大阪大学,理研)
概要:現実の応用では、バンディット問題がヘビーテイルノイズや報酬改ざんといった不確実性に直面し、頑健なアルゴリズムが求められる。従来はノイズ頑健性、改ざん頑健性、計算効率のうち2条件までを満たす手法は提案されてきたが、3条件を同時に満たすものは存在しない。本研究では3条件を同時に達成するOnline Mirror Descentを用いたアルゴリズムを提案し、理論解析および数値実験により有効性を確認した。

[2a-R-39] 強化学習における固定方策の価値オラクルを利用した価値推定法
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:池田琢真(NEC データサイエンスラボラトリー), 窪澤駿平(NEC データサイエンスラボラトリー)
概要:強化学習において、方策を改善するためには方策の価値関数を推定する必要があるが、複雑な環境ではこの推定に多量のデータが必要になる。本発表では、一部の応用ドメインで、ある固定方策の価値関数(価値オラクル)が利用できることに着目し、価値オラクルを活用した新たな価値推定法を提案する。また、どのような固定方策のもとで提案する価値推定法のサンプル効率が向上するのかを理論的および実験的に調べる。

[2a-R-40] 自己説明型モデルが獲得した説明能力は転移可能か?
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:吉川友也(千葉工業大学), 清水良太郎(ZOZO Research), 川島貴大(ZOZO Research), 斎藤侑輝(ZOZO Research)
概要:自己説明型モデルは、予測とその根拠の説明を一度の推論で同時に行える。しかし、人が望む説明を出力するにはそれ専用の訓練が必要となり、学習コストが増加する。本発表では、モデル編集技術の一つであるTask arithmeticに基づき、タスクAで獲得した説明能力を、タスクBで訓練された同じアーキテクチャの予測のみ可能なモデルに転移させ、追加学習無しでタスクBの自己説明型モデルを構築する方法を提案する。

[2a-R-41] ITBenchによるAIエージェントの実運用IT自動化タスク評価 − SRE/CISO/FinOpsへの展開と課題−
カテゴリ:実装・データ収集 (Implementation / Data Collection)
発表者:渡邊裕治(日本IBM), 柳川琢省(日本IBM), 北原啓州(日本IBM), 高野紗輝(日本IBM)
概要:本研究では、AIエージェントのIT自動化能力を体系的に評価する基盤「ITBench」を提案します。SRE、CISO、FinOpsといった実務に即したタスクを形式化し、モデルの比較や課題の整理を可能にしました。本枠組みは、AI研究における評価の透明性を高めるとともに、IT運用分野での応用可能性を検討する基盤として位置づけられます。

[2a-R-42] ヘルダーの不等式に関連するダイバージェンスの再考
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:小林真佐大(豊橋技術科学大学)
概要:関数解析における基本的な不等式である(逆)ヘルダーの不等式は、ガンマダイバージェンスの非負性を保証することが知られている。本発表では、(逆)ヘルダーの不等式を出発点とし、不等式を重ねることで種々のダイバージェンスが導出されることを紹介する。また、それらの関係や性質について述べる。

[2a-R-43] 低ランク行列バンディットを用いた未知の内在意見下での意見形成ダイナミクスの最適化
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:Federico Cinus (CENTAI Institute), Yuko Kuroki (CENTAI Institute), Atsushi Miyauchi (CENTAI Institute), Francesco Bonchi(CENTAI Institute)
概要:本研究は人々の意見形成をモデル化するFriedkin-Johnsen Modelを用い, 社会の分極化と意見対立を最小化することを目指す.従来研究では個人の内在意見は既知とする仮定が必要であった.本研究では内在意見が未知であり逐次的に観測を行うリグレット最小化問題を扱う.この問題を低ランク行列近似と関連付け,部分空間推定と線形バンディットを組み合わせた手法を開発し,そのリグレットを解析する.

[2a-R-44] 反学習の効果を取り入れた Hopfield モデルの理論解析
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:竹内朱太(東大理物), 髙橋昂(東大知の物理), 樺島祥介(東大知の物理)
概要:Hopfieldモデルにおける偽記憶の抑制手法である、ニューロン間の相関に基づいて結合を修正する反学習モデル(Nokura, J. Phys. A 29, 3871, 1996)の振る舞いをレプリカ法により解析した。レプリカ法による理論解とシミュレーション結果は良好に一致し、反学習強度εおよび相関を評価する際の温度γの変化に対して、想起パターンとの重なりが相転移的な挙動を示すことを明らかにした。

[2a-R-45] No-regret incentive-compatible online learning under exact truthfulness with non-myopic experts
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:Junpei Komiyama (New York University), Nishant A. Mehta (University of Victoria), Ali Mortazavi (University of Victoria)
概要:We study an online forecasting setting in which, over T rounds, N strategic experts each report a forecast to a mechanism, the mechanism selects one forecast, and then the outcome is revealed. In any given round, each expert has a belief about the outcome, but the expert wishes to select its report so as to maximize the total number of times it is selected. The goal of the mechanism is to obtain low belief regret: the difference between its cumulative loss (based on its selected forecasts) and the cumulative loss of the best expert in hindsight (as measured by the experts’ beliefs). We consider exactly truthful mechanisms for non-myopic experts, meaning that truthfully reporting its belief strictly maximizes the expert’s subjective probability of being selected in any future round. Even in the full-information setting, it is an open problem to obtain the first no-regret exactly truthful mechanism in this setting. We develop the first no-regret mechanism for this setting via an online extension of the Independent-Event Lotteries Forecasting Competition Mechanism (I-ELF). By viewing this online I-ELF as a novel instance of Follow the Perturbed Leader (FPL) with noise based on random walks with loss-dependent perturbations, we obtain \tilde{O}(\sqrt{TN}) regret.

[2a-R-46] WAICとWBICを結ぶ漸近的な方程式
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:林直輝(株式会社豊田中央研究所), 沓名拓郎(株式会社豊田中央研究所), 高椋佐和(株式会社アイシン)
概要:パラメータと確率分布が一対一でない統計モデルは特異モデルと呼ばれ,この場合従来のAICやBICは適用できない.特異モデルに適用可能な情報量規準としてWAICとWBICが提案され,モデル選択に広く使われているが,これらの直接的関係は明らかでなかった.本研究では両者を結ぶ漸近的な方程式を理論的に導出した.この結果から,両者を同じ事後分布から近似計算可能であることも示し,その計算効率化の基礎を与えた.

[2a-R-47] Improved Regret Bounds for Gaussian Process Upper Confidence Bound in Bayesian Optimization
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:岩崎省吾(LINEヤフー株式会社)
概要:本研究ではベイズ最適化におけるGaussian process upper confidence bound (GP-UCB)アルゴリズムの既存のリグレット解析を改善する. 本研究の解析ではGP-UCBが, (i)ノイズなし設定において準最適なリグレットを達成すること, および(ii)ノイズありのベイズ的設定において$O\sqrt{T}$のリグレットを達成することをそれぞれ示す.

[2a-R-48] Multi-Class Classification with Abstention with Convex Surrogate Losses
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:Hongyu Zhang (Kyoto University), Han Bao (The Institute of Statistical Mathematics), Junya Honda (Kyoto University / RIKEN AIP)
概要:We study the problem of multi-class classification with abstention, where the learner can choose to abstain from making a prediction to avoid serious misclassification. Specifically, we focus on the predictor-rejector framework, in which a predictor and a rejector are jointly learned and the abstention cost is explicitly taken into account. However, only non-convex surrogate losses have been known previously. We propose a novel family of convex surrogate losses for multi-class classification with abstention in the predictor-rejector framework. Our convex surrogate losses are based on Crammer-Singer (CS) surrogate, which enjoys better optimization properties than those in previous work. We derive calibration results and prove non-asymptotic excess error bounds for our surrogate losses, demonstrating a linear growth rate for a certain choice of the loss, which is the first result under the predictor-rejector framework to the best of our knowledge.

[2a-R-49] 拡散モデルの報酬ベース転移学習における次元非依存誤差上界
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:仲北祥悟(東京大学), 今泉允聡(東京大学/理研AIP)
概要:拡散モデルの報酬ベース転移学習は、近年理論解析や方法提案が活発に行われている重要な学習問題である。しかしその多くが転移学習後の生成分布とプロンプト分布に対する報酬の期待値を既知とする設定に依拠している。特にプロンプトに対する期待値は通常未知であり、実践では経験報酬で近似される。この近似誤差を統計的観点から理解することは理論・応用双方において重要である。本研究はその解明に貢献する次元非依存集中不等式を導出する。

[2a-R-50] Trajectoryの外観情報とモーション情報を活用したエンドツーエンドマルチビュー歩行者追跡
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:山根大河(NTT株式会社), 増村亮(NTT株式会社), 鈴木聡志(NTT株式会社), 折橋翔太(NTT株式会社)
概要:マルチビュー歩行者追跡はマルチビュー映像から歩行者を鳥観図形式で追跡するタスクである.本タスクでは,歩行者の検出と識別IDの付与を一つのモデルで行うエンドツーエンドな手法が主流である.歩行者の外観情報とモーション情報は識別IDの付与に重要であるが,既存手法は2フレーム間の情報のみに依存している.本研究では,Trajectory内の複数フレームの情報を用いて頑健な識別IDの付与を行う手法を提案する.

[2a-R-51] 潜在拡散モデルでのレイアウト指定生成に向けたアテンションに基づく初期ノイズ最適化
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:永井大地(法政大学大学院理工学研究科), 守田竜梧(法政大学大学院理工学研究科), 北田俊輔(法政大学大学院理工学研究科), 彌冨仁(法政大学大学院理工学研究科)
概要:テキストから画像を生成する拡散モデルは目覚ましい成功を収めているが、デザインや広告などの実応用においてはレイアウト制御が不可欠である。本研究では、アテンションに基づく初期ノイズの最適化を行い、目的とするレイアウトに従った画像生成の実現を目指す。実験ではテキストとレイアウトから構成されるデータセットを用いて生成を行い、有効性を評価した。本手法は拡散モデルに対して新たなレイアウト指定方法を提供する。

[2a-R-52] 二段階最適化とペナルティ法を用いたニューラルネットワークの正則化パラメータの自動調整
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:蒲原直人(慶應義塾大学), 成島康史(慶應義塾大学)
概要:ニューラルネットワークにおいて、正則化パラメータを決定変数とする二段階最適化を定式化し, ペナルティ法よる新しい求解アルゴリズムを提案する. 正則化パラメータの繰り返し探索を要さず, 一回の学習で適切なパラメータを自動で決定することを可能にした. L1正則化付きCNNによる数値実験では,既存手法と同等の分類精度およびスパース性を保ちながら,パラメータが自動で適切な値へ収束することを確認した.

[2a-R-53] 大偏差原理を用いた特異学習モデルの複雑性指標の特徴づけ (Characterization of complexity measure for singular learning models via large deviation principle)
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:福島真太朗(トヨタ自動車株式会社), 二反田篤史(Agency for Science, Technology and Research (A*STAR) / Nanyang Technological University)
概要:深層学習は高い汎化性能や表現能力を示す一方で,複雑な損失関数や学習中の挙動など未解明な点が多い.これらの特異学習モデルの解析には特異学習理論の学習係数が重要な役割を果たすが,大規模なモデルでの数値計算法は確立したとは言い難い状況である.本研究では,大偏差原理のLaplace原理に基づき,確率的近似のパラメータの経路を最適化し学習係数を推定するための理論と数値計算法を提案し,実験で有効性を確認する.

[2a-R-54] 重み共有に対する段階別低ランク更新の深さの表現によるTransformerの効率化
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:坂田逸志(理研AIP), 河原吉伸(大阪大学/理研AIP)
概要:Transformerにおいて重み共有はモデル容量を抑える一方、同一重みの再利用だけでは層ごとの機能変化に追随しにくい。一方、多粒子力学系の視点では、重み共有はトークン間にクラスタリングを生じさせ、学習済みモデルの後半層の情報統合と類似する。本研究は、後半層を共有ブロックの反復として、その層に段階別の低ランク更新で相互作用のみを調整する枠組みを提案し、画像・言語データにおいて有効性を確認した。

[2a-R-55] ゲート付き線形RNNの理解に向けて
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:岩森俊哉(総合研究大学院大学、国立情報学研究所), 杉山麿人(総合研究大学院大学、国立情報学研究所)
概要:線形RNNはメモリ及び計算効率の高さから高い注目を集めている。特にゲート付き線形RNNは、ゲートから隠れ状態を取り除くことで、非線形変換を取り入れつつも並列計算を可能にしている。しかし、ゲートの影響およびそれらから隠れ状態を取り除いた時の影響は明らかにされていない。本研究では実験的にゲートの影響を調査し、ゲートの0と1付近の値が隠れ状態に強く依存しており、ゲートから隠れ状態を取り除いた時、意図しない分布シフトが発生することを発見した。これらの発見をもとに、我々は分布シフトを軽減し、長期系列を扱うタスクにおいて実験的に性能向上させる方法を提案する。

[2a-R-56] 病院間差異を考慮したドメイン適応による医用画像分類
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:伊藤萌乃(電気通信大学), 木村大毅(電気通信大学, IBM), 庄野逸(電気通信大学)
概要:医用画像分類において施設間の画像特性差異は判別性能の低下を招く。本研究では、びまん性肺疾患の診断支援を目的に、半教師ありCycleGANを用いたドメイン適応により施設間差を補正し、少量ラベル下での分類性能向上を図った。先行研究とは異なる病院のデータを用いて再現性を検証しており、提案手法の汎化性能と有効性を評価中である。今後は前処理と適応手法の改良を通じて分類性能を高め、既存研究との差別化を目指す。

[2a-R-57] 再帰トランスフォーマーによる自己組織化におけるトークン間幾何情報の保存則
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:今泉允聡(東大/理研AIP/京大), 小山雅典(東大), 磯部伸(理研AIP), 林浩平(東大)
概要:再帰的な深層トランスフォーマーによって生成されるトークン分布に現れる構造を数学的に特徴づける。従来の数学解析では、再帰的なトランスフォーマーはトークン分布の破壊的縮退を促すことが示されているが、実用上はこの縮退は起きない。本研究では、位置埋め込みの選択によって縮退を防ぐ再帰的トランスフォーマーを構築できることを示す。特に、トークン間の幾何的な構造を保存する自己組織化が実現することを議論する。

[2a-R-58] 有限幅多層ニューラルネットワークの精密な勾配降下学習ダイナミクス
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:Qiyang Han(Rutgers University), 今泉允聡(東大/理研AIP/京大)
概要:有限幅の多層ニューラルネットワークの勾配降下法ダイナミクスを精密に記述する。層の多いニューラルネットの学習のダイナミクスの記述は、深層学習の挙動を理解する上で重要な挑戦である。本研究では、有限幅多層ニューラルネットの訓練誤差と汎化誤差の両方を評価する。導出には高次元統計における状態発展の理論を活用する。応用として、汎化誤差の一致推定および早期終了やハイパラ選択に利用可能であることを示す。

[2a-R-59] 等式制約付き凸最適化問題に対するODEアプローチによる収束解析
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:石井千星(慶應義塾大学・三菱UFJフィナンシャル・グループ), 成島康史(慶應義塾大学)
概要:本研究では、等式制約付き凸最適化問題に対するADMM(Alternating Direction Method of Multipliers)型アルゴリズムの連続極限として導かれる力学系に着目し、Lyapunov関数を用いた定量的な収束解析を行う。近年、スパース性や低ランク性を備えたモデルの普及に伴い、微分不可能な関数を含む実問題が増加している。提案手法は非平滑かつ強凸ではない目的関数を対象としており、特に大規模かつ非平滑な問題において有効である。本手法では、Nesterovの加速法に対する連続極限の研究を契機としたODEアプローチに基づき、拘束条件付き常微分方程式(ODE)に拡張して収束解析を行う。加えて、目的関数にKurdyka–Łojasiewicz(KL)性に類似した幾何学的性質を仮定することで、KL指数に依存する収束率を導出し、従来知られている局所的な収束率 O(1/t^2)を保証する。

[2a-R-60] Delayed Momentum Aggregation: Communication-efficient Byzantine-robust Federated Learning with Partial Participation
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:大塚馨 (OIST), 竹澤祐貴 (京都大学, OIST), 山田誠 (OIST)
概要:Federated Learning (FL) allows distributed model training across multiple clients while preserving data privacy, but it remains vulnerable to Byzantine clients that exhibit malicious behavior. While existing Byzantine-robust FL methods provide strong convergence guarantees (e.g., to a stationary point in expectation) under Byzantine attacks, they typically assume full client participation, which is unrealistic due to communication constraints and client availability. Under partial participation, existing methods fail immediately after the sampled clients contain a Byzantine majority, creating a fundamental challenge for sparse communication. First, we introduce delayed momentum aggregation, a novel principle where the server aggregates the most recently received gradients from non-participating clients alongside fresh momentum from active clients. Our optimizer D-Byz-SGDM (Delayed Byzantine-robust SGD with Momentum) implements this delayed momentum aggregation principle for Byzantine-robust FL with partial participation. Then, we establish convergence guarantees that recover previous full participation results and match the fundamental lower bounds we prove for the partial participation setting. Experiments on deep learning tasks validated our theoretical findings, showing stable and robust training under various Byzantine attacks.

[2a-R-61] 微分不可能な正則化項を含む無制約最適化問題に対するArmijo型直線探索を用いた近接非線形共役勾配法
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:浜名翔大(慶應義塾大学), 成島康史(慶應義塾大学)
概要:微分不可能な正則化項を含む無制約最適化問題に対する近接型非線形共役勾配法を提案する。本研究では、目的関数に対する勾配の代わりに近接写像を用いて項を導入することで、非線形共役勾配法を構築する。さらに、Armijo型の直線探索を組み込んで、微分不可能な正則化項を含む無制約最適化問題に対する新たな枠組みとして実用的な解法を与える。数値実験では、特に大規模問題において計算時間と反復回数の削減を確認した。

[2a-R-62] 非凸最適化に対する微分可能な加速法
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:牛山寛生(東京大学), 佐藤峻(東京都立大学)
概要:近年,勾配とへシアンがLipschitz連続な非凸関数に対し,少ない計算量で停留点を求める加速法が研究されている.これらの手法は主にリスタートにより高速な収束を実現しており,アルゴリズムが複雑であった.本研究では,リスタートを用いない単純な加速法を提案する.この手法は出力を入力で微分可能な,differentiable algorithmである.提案手法はある微分方程式(連続時間アルゴリズム)を離散化することで得られ,収束解析も連続と離散で対応している.

[2a-R-63] 探索進捗率を用いたベイズ最適化の改良とその実証
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:長澤廉師(三菱電機株式会社), 増井秀之(三菱電機株式会社), 中根滉稀(三菱電機株式会社), 稲津佑(名古屋工業大学), 烏山昌幸(名古屋工業大学)
概要:ベイズ最適化において、探索を終了する判断の難しさは実応用上の課題である。これまで我々は、potential optimizersに基づいた指標「探索進捗率」を定義し、この指標を最大化する新たな獲得関数を検討してきた。本研究では、リグレット最小化を考慮した獲得関数の改良を提案する。ベンチマーク関数や実データセットに対する数値実験において、従来手法より高効率な探索が実現できることを示す。

[2a-R-64] 異なる入力ノイズを考慮したベイズ最適化による複数解探索の検討
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:安田雄佑(三菱電機株式会社), 伊藤凜(三菱電機株式会社), 増井秀之(三菱電機株式会社)
概要:環境変化などの揺らぎは最適化問題に対してノイズとして影響を与えるが,許容するノイズ量は運用時に変化する場合がある.本発表では,決定変数にノイズを含む最適化問題に対して,効率的にロバストな複数解を探索するベイズ最適化手法を検討する.

ポスターセッション 2b [11月13日(木)16:00-18:00]
Poster Session 2b [Thursday, 11/13, 4:00~6:00 p.m.]

エントリー枠 (Entry Slot)

[2b-E-01] がん第Ⅰ/Ⅱ相臨床試験における安全ベイズ最適化を用いた試験デザインの提案
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:若林建汰 (京都大学), 松井孝太 (京都大学, 滋賀大学, 東京科学大学), 松井茂之 (京都大学, 統計数理研究所)
概要:臨床試験の実施にあたっては、研究参加者の安全を最優先し、過剰な負担や侵襲が生じないよう十分に配慮する必要がある。本研究では、がん第Ⅰ/Ⅱ相臨床試験において、安全性と有効性を同時に考慮した新たな試験デザインを提案する。具体的には、安全ベイズ最適化(Safe Bayesian Optimization)を用いて試験データに基づくモデルを逐次更新し、安全性が高い確率で保証される用量に限定して探索と活用を行うことで、最適な用量を決定する。

[2b-E-02] リアルタイム広告オークションにおける勝率予測モデルの選択バイアスに関する実証研究
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:伊崎義理(株式会社CARTA ZERO), 神谷クリスチャン(株式会社CARTA ZERO), ソヴィンスキ ルカス(株式会社CARTA ZERO), 鰐川友太(株式会社CARTA ZERO)
概要:オンライン広告のリアルタイム入札では、コスト効率と利潤を両立するため勝率予測が鍵となる。例えば、低勝率と予測される入札を見送る戦略があるが、これは学習データを予測的に選抜するため、多くの実応用で課題となる選択バイアスを生む。我々はこのバイアスがモデルに予測勝率を系統的に過大評価させるという仮説を立て、オンライン実験によりこれを検証した。

[2b-E-03] 根拠参照型QAタスクにおけるトポロジー解析に基づく難易度評価の検討
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:眞方篤史(損害保険ジャパン), 下村誠(無所属)
概要:LLMの推論能力評価において、従来の研究では主にmulti-hop推論のホップ数や推論ステップ数に基づく難易度指標が用いられてきたが、実際の推論タスクではより複雑な構造的要因が難易度に影響することが指摘されている。本研究では、根拠参照型QAタスクを対象とし、従来の推論ステップ数に加えて根拠文書間の関係性をグラフ構造として捉え、そのトポロジカル特性に基づく新たな難易度評価指標を提案する。

[2b-E-04] 活性化関数の選択とサロゲートモデルの高精度化
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:林田健二(株式会社レゾナック), 須藤薫淑(株式会社レゾナック)
概要:本発表はマクロ物理シミュレーションの機械学習モデルであるサロゲートモデルの高精度化を活性化関数の選択という観点から議論する。対象とするタスクは熱伝導方程式で記述される温度分布を対象とした回帰タスクである。本研究では複数の活性化関数での精度比較を行い、シミュレーションの再現精度向上に向けた指針を検討する。

レギュラー枠 (Regular Slot)

[2b-R-01] 行動と手順書の対応付けに基づく作業行動の教師なし分節化
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:近藤空哉(電気通信大学), 齋藤一誠(電気通信大学), 長野匡隼(電気通信大学), 神谷聡(三菱電機株式会社先端技術総合研究所), 藤田渉(三菱電機株式会社先端技術総合研究所), 八田俊之(電気通信大学,三菱電機株式会社先端技術総合研究所), 中村友昭(電気通信大学)
概要:生産現場の作業行動分析は目視が主流で,膨大な手間と時間を要する.そこで我々は作業行動の教師なし分節化に基づく分析手法を提案したが,作業行動のみだけでは分節化の精度に限界があった.そこで本発表では,作業行動だけではなく,テキストで記述された手順書を利用した分節化手法を提案する.各手順のテキストと作業行動の対応を推定し,テキスト内の単語と行動の共起性を利用することで,高精度な分節化が可能となる.

[2b-R-02] MDL原理に基づく構造的因果モデル(SCM)のモデル選択による直接原因変数の学習
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:久保木優太(東京大学), 松島慎(東京大学)
概要:離散データを対象に、ターゲット変数の直接原因変数のみを学習する局所的因果探索に取り組む。直接原因変数を知ることはターゲット変数への介入施策に有益である。提案手法はSCMを仮定し、データの符号長を計算のうえ、MDL原理に基づくモデル選択を用いる。既存手法の多くが前提とする causal sufficiency の仮定を緩和でき、また一致性を持たない統計的仮説検定に依存しない。人工データ実験により、一致性を確認した。

[2b-R-03] Odd Sketchを用いたゲノム間類似度推定
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:菊田恭平(早稲田大学 先進理工学研究科), 浜田道昭(早稲田大学 理工学術院, 産業技術総合研究所 細胞分子工学研究部門, 日本医科大学 医学研究科)
概要:Odd SketchにOne-Permutation Hashingを統合し、推定精度を向上。合成ゲノム500組での比較では、全体RMSEは0.0112(BinDash 0.0096)と同水準、とくに高類似域(J\_true>0.75)で0.0045対0.0078と優位。スケッチ長の増大なく計算軽量で、大規模解析への適用性を示した。

[2b-R-04] Interactive Recommendation Framework Using QUBO Models
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:戸枝泰雅(Graduate School of Information Sciences, Tohoku University), 山田優斗(Graduate School of Information Sciences, Tohoku University)
概要:Recommender systems widely deployed on e-commerce platforms tend to favor items similar to a user’s past behavior, yielding homogenized results that hinder new discoveries that broaden a user’s perspective. To address this issue, we propose a new interactive framework consisting of (i) user-preference estimation and (ii) set recommendation via Quadratic Unconstrained Binary Optimization (QUBO). In step (i), we estimate continuous-valued preferences over item features by minimizing a cross-entropy loss with an L1 regularization term, using the user’s selection feedback on recommended item sets. The L1 penalty promotes sparsity in the preference values so that features are clearly expressed not only as “liked” (positive values) or “disliked” (negative values), but also as “neutral” (exactly zero), which forms a basis for increasing recommendation diversity. In step (ii), given the estimated preferences, we solve a QUBO that incorporates both fidelity to user taste and diversity-promoting constraints within the recommended set, thereby selecting an item subset that balances relevance and novelty. Repeating this cycle of estimation and recommendation allows the system to adapt dynamically to user responses and to learn preferences in an exploratory manner, enabling interactive recommendations that are both personalized and diverse.

[2b-R-05] 複数構造を標的とするRNA設計のための償却推論:折り畳みエネルギーランドスケープを制御するためのMRFポテンシャル学習
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:西村友宏(早稲田大学);福永津嵩(慶應義塾大学), 浜田道昭(早稲田大学,産業技術総合研究所 細胞分子工学研究部門,日本医科大学)
概要:複数の安定二次構造を持つRNA配列設計は、従来、ターゲット構造毎の探索最適化が主流であった。本研究では、償却推論の枠組みで最適な配列生成器を直接学習する手法を提案する。具体的には、ニューラルネットワークが標的構造からマルコフ確率場(MRF)のポテンシャル関数を生成し、その構造に特化した配列生成モデルを構築する。モデルの学習はREINFORCEアルゴリズムに基づき、物理化学的なブラックボックス評価指標を報酬として最大化する。本手法は、MRFによって課される厳密な配列設計制約を満たしつつ、安定性や遷移のしやすさ等の大局的な物理特性の最適化を両立させ、柔軟な配列設計を可能にする。

[2b-R-06] 複雑な幾何構造の変化を伴う化学反応ダイナミクスのベイズモデリング
カテゴリ:確率的手法・グラフィカルモデル・因果推論 (Probabilistic Methods / Graphical Models / Causal Inference)
発表者:森田秀利(一橋大学), 大久保駿人(一橋大学), 天本義史(東京大学), 有竹俊光(一橋大学), 熊添博之(一橋大学), 久新荘一郎(特殊無機材料研究所), 佐藤光彦(東京工科大学), 本武陽一(一橋大学)
概要:無機高分子を用いた材料開発においては、分岐、架橋、焼結を経て材料が生成されるが、その反応経路が複雑であり、数理的に現象を再現することは困難とされている。そこで我々は、考えられる化学反応や幾何構造の変化をグラフとしてモデル化し、そこでの反応過程をベイズモデリングする枠組み開発に取り組んでいる。これらの成果について報告する。

[2b-R-07] 構造化RAGのためJSONLの高速部分構造検索
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:田部井靖生(理研-AIP)
概要:JSONLデータセットにおける部分構造検索は、基盤モデル応用における構造化RAGを実現するために不可欠である。しかし既存手法は計算コストが高い。本研究では高速手法jXBWを提案し、統合木表現、拡張Burrows–Wheeler変換に基づく簡潔データ構造、三段階検索法を導入することで、従来法比で最大4,700倍、XML処理比で600万倍以上の高速化を達成した。

[2b-R-08] 経験リスク最小化は良いキャリブレーションをもたらすか?
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:藤澤将広(大阪大学/理研AIP/トヨタ自動車), 二見太(大阪大学/理研AIP)
概要:信頼性の高い機械学習モデル運用では,予測確率と真のラベル頻度の整合性,すなわちキャリブレーションが担保されることが重要である.本研究では,仮説空間に関する適切な正則化の下で,標準的な学習戦略である経験リスク最小化(ERM)が,キャリブレーション性能をも高め得ることを理論的に示す.具体的には,ラプラスカーネルやガウスカーネルを用いたカーネル(ロジスティック)回帰において,L2正則化付きERMが平滑化キャリブレーション誤差およびその汎化誤差を制御できることを示し,実験的にその妥当性を確認する.

[2b-R-09] Lag Operator Projections: A Novel Framework for State Space Modeling with HiPPO as a Special Case
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:Sutashu Tomonaga (OIST), Kenji Doya (OIST), Noboru Murata (Waseda Univ.)
概要:State Space Models (SSMs), which are at the heart of the recently popular Mamba architecture, are powerful tools for sequence modeling, but deriving their discrete-time recurrences often involves a complex multi-stage process of continuous-time modeling and subsequent discretization, making it challenging to grasp. We introduce a novel, direct framework for constructing discrete-time SSMs from first principles. Our approach is based on projecting the signal history onto a basis of functions on a dynamically warped time axis. The core of our method is a lag operator that provides a geometric, inner-product-based derivation of the state transition matrix, bypassing the need for intermediate ODEs. This framework offers a modular design space for creating novel SSMs by flexibly combining different basis functions and time-warping schemes. To validate our approach, we demonstrate that a specific instance using Legendre polynomials and an exponential warp exactly recovers the recurrence of the influential HiPPO model, thus also providing a more fundamental foundation for it. Numerical simulations confirm our derivation and illuminate a critical aspect of SSM design: the need for consistent scaling between the integral-based state update and the discrete input injection. Our work provides new theoretical tools for designing flexible and robust sequence models.

[2b-R-10] 力学系に内在する非線形な対称性の推定について
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:後藤有輝 (慶應義塾大学, 理研AIP), 神谷俊輔 (東京大学), 本永翔也 (立命館大学), 坂本航太郎 (東京大学), 柴山允瑠 (京都大学), 本武陽一 (一橋大学)
概要:古典力学におけるNoetherの定理によると、力学系が持つ保存量はある種の連続的な対称性に対応する。特に観測空間で非線形な「隠れた対称性」をデータ駆動的に推定する手法を開発することで、未知の物理系に対してモデルが何を学習しているかを分かるようにする、といった応用が考えられる。本発表では、対称性が十分多い力学系である可積分系に対する対称性の発見やそれを用いたダイナミクスの推定について紹介する。

[2b-R-11] Dual-Process Theory Inspired Integration of Tree ensembles and Graph Neural Networks
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:RUNCHEN FU(Graduate School of Informatics, Kyoto University), Akihiro Yamamoto(Graduate School of Informatics, Kyoto University)
概要:The performance of GNNs often degrades when node features are heterogeneous and class labels are highly imbalanced. We present a hybrid method that integrates tree ensembles and GNNs through an EM-style alternating loop. First, Gradient Boosted Decision Trees (GBDT) are trained in a preprocessing step to produce augmented node features and candidate feature transforms. Then the core alternating procedure repeatedly executes two steps: (i) Random Forest (RF) computes feature-importance scores that are applied in an attention-like mechanism to modify node features, and (ii) a GNN consumes the modified features and is trained for multiple epochs to obtain updated structure-aware node embeddings. The updated embeddings are fed back to RF to produce revised importance scores, forming a bidirectional refinement loop in which only RF and the GNN are updated. We analyze the effect of the number of alternating iterations, provide a theoretical generalization bound under mild assumptions. Empirical results on benchmarks and synthetic datasets, together with ablation and sensitivity studies, show performance gains under feature heterogeneity and class imbalance.

[2b-R-12] 説明の互換性を考慮した決定木の再構築アルゴリズム
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:鈴木浩史 (富士通株式会社)
概要:機械学習モデルの運用において、新規に蓄積したデータを用いたモデルの再学習が行われる場合がある。これに関して、再学習後のモデルの振舞いが極端に変化することを避けるために、「互換性」を考慮する研究が行われている。本研究では、説明可能なモデルである決定木に着目し、決定木における説明の互換性を定式化する。そして、説明の互換性を考慮した決定木の再構築を行う高速なアルゴリズムを設計し、実験評価する。

[2b-R-13] Hölder-DPO:人間の嗜好ラベル反転を同定するロバストLLMアラインメント
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:藤澤将広(大阪大学/トヨタ自動車/理研AIP), 足立真輝(トヨタ自動車/オックスフォード大学), Michael A. Osborne(オックスフォード大学)
概要:人間の嗜好データに基づくLLMアラインメントは嗜好ラベルの反転に脆弱である.本研究では,この脆弱性を理論的に無効化可能にするHölder-DPOを提案する.本手法は頑健なアラインメントに加え,検証データなしで誤ラベルの割合推定と特定が可能である.この性能はデータクリーニング方法としても有益であり,実際,Anthropic HHのような標準データセットが含む多くのノイズデータを特定した.

[2b-R-14] 連続確率分布に対する適応的劣モジュラ性とその応用
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:楢原晃都(科学大), 松井孝太(京都大/滋賀大/科学大), 金森敬文(科学大/理研)
概要:離散確率分布に対して構築されてきた適応的劣モジュラ性の理論を,一般の確率分布での設定へ拡張する.各種概念を測度論の枠組みで定式化し,代表的な適応的最適化問題である適応的最大化問題と適応的最小コストカバー問題に対する貪欲アルゴリズムの近似精度の理論保証を与える.これらの理論を機械学習の問題に適用し,それぞれ貪欲アルゴリズムの性能保証を与える.

[2b-R-15] 次元削減における中央値コンセンサス埋め込み
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:塘由惟(国立健康危機管理研究機構), 米岡大輔(国立健康危機管理研究機構)
概要:t-SNEやUMAPなどの非線形次元削減法は高次元データ可視化のために頻用される.しかし,得られる低次元埋め込みは最適化プロセスの初期値やハイパーパラメータの値に大きく依存する.この問題に対し,異なる設定下における複数の埋め込みを統合することで安定的な結果を得られると期待される.そこで本研究では,幾何中央値による統合法である中央値コンセンサス埋め込み(Median Consensus Embedding; MCE)を提案する.

[2b-R-16] バイレベル最適化問題のための情報論的ベイズ最適化
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:金山卓矢(名古屋工業大学), 伊藤由騎(名古屋工業大学), 田村友幸(名古屋工業大学), 烏山昌幸(名古屋工業大学)
概要:バイレベル最適化問題は,2つの最適化問題が上位問題・下位問題として入れ子状に構成され,下位問題の最適性が上位問題の制約条件となる.この設定は階層的な意思決定問題などでよく現れる.本研究では特に上位・下位ともに観測が高コストなブラックボックス関数である設定に着目し,最適値や最適解に対する情報利得に基づく獲得関数を設計することで効率的なベイズ最適化法が構築できることを示す.

[2b-R-17] データの3次パーシステントホモロジーまで考慮したオートエンコーダー
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:不死原大知(NTT), 軽部尚香(大阪大学), 橋本悠香(NTT), 松尾洋一(NTT)
概要:オートエンコーダ(AE)はデータの圧縮と再構成を通じて,データの低次元表現を求める手法であり,異常検知などで広く用いられている.しかし,AEの学習はパーシステントホモロジー(PH)などのデータの位相幾何学的な特徴に依存することが指摘されている.本発表ではデータの3次PHまで考慮したAEを提案し,人工データに対して実験・評価した結果を報告する.

[2b-R-18] 多様な偏微分方程式に基づくPINNsのメタ学習
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:大野花純 (NTT), 田中佑典 (NTT), 岩田具治 (NTT)
概要:PINNsは,物理法則をニューラルネットワークの学習に組み込むことで偏微分方程式を解く手法として注目されているが,初期・境界条件や方程式が異なる場合には再学習が必要である.本発表では,確率的に生成した多様な方程式に対する表現を獲得することで,新たに与えられた方程式への効率的な適応法を提案する.対象とする単一の方程式を学習させたPINNsと,提案法の予測性能や計算速度について比較する.

[2b-R-19] 科学者によるスペクトル分解過程のベイズモデリング
カテゴリ:機械学習手法一般 (General Machine Learning:Methods)
発表者:大久保駿人(一橋大), 天本義史(一橋大), 熊添博之(一橋大), 有竹俊光(一橋大), 本武陽一(一橋大)
概要:本発表では、物理的事前知識を考慮しながら解析する科学者の営みをベイズモデリングするスペクトル分解手法を提案する。 従来のフィッティングでは困難だった高ノイズ強度やバックグラウンドの存在下等でのピーク数や強度などのパラメータの推定を、ベイズ的スペクトル分解とガウス過程回帰の組み合わせにより実現することを目的とする。 本手法をスペクトルデータに適用した結果を紹介し、今後の応用展望についても議論する。

[2b-R-20] クープマン解析に基づくティッピングの早期警告信号の拡張
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:宮内優太(大阪大学大学院情報科学研究科), 池田正弘(大阪大学大学院情報科学研究科、理化学研究所革新知能統合研究センター), 河原吉伸(大阪大学大学院情報科学研究科、理化学研究所革新知能統合研究センター)
概要:ティッピングの早期警告信号の開発は生態学, 医学, 経済学などの分野で重要な研究課題である. 従来では、ティッピングを起こす前に摂動に対するレジリエンスが低下することに注目し、データの分散を用いる方法が提案されてきたが、背景にある非線形力学系の性質を十分に考慮していなかった。本研究では, 力学系の時間発展を無限次元関数空間上で扱うクープマン作用素を応用して,確率的レジリエンスの一般化を行った.

[2b-R-21] Line-Art Graph Correspondence with Diffusion Features and Optimal Transport
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:Sho Kuno (EQUES Inc., The University of Tokyo), Ryugo Morita (EQUES Inc., Hosei University), Issey Sukeda (EQUES Inc.), Rongzhi Li (EQUES Inc., The University of Tokyo), Hoang Dai Dinh (EQUES Inc.), Ryunosuke Tanaka (EQUES Inc.)
概要:Finding correspondences in line-art is a core building block for anime automation tasks such as inbetweening and colorization. Prior work AnimeInbet (ICCV 2023) geometrizes frames into stroke graphs and formulates correspondence as a graph-alignment problem, often solved within an optimal transport framework. We adopt this formulation and enrich node descriptors with diffusion features. Specifically, using DIFT (NeurIPS 2023), we extract per-frame feature maps and assign each graph node the mean feature within a local neighborhood of pixels. We evaluate correspondence accuracy on the AnimeInbet dataset, comparing against the AnimeInbet baseline, and discuss implications for topology-preserving inbetweening of line-art frames.

[2b-R-22] 時系列基盤モデルを活用した時系列データの早期分類手法
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:東口慎吾(大阪大学), 勝木孝行(IBM東京基礎研究所), 坂井智哉(IBM東京基礎研究所), Haoxiang Qiu(IBM東京基礎研究所), 櫻井保志(大阪大学);松原靖子(大阪大学), 井手剛(IBM T.J. Watson Research Center)
概要:時系列データの早期分類は、現在まで観測されたデータのみを用いて分類クラスを予測する問題であり、医療や工場設備のモニタリングなど早期の意思決定が必要な場面において特に重要である。不完全な系列から適切に特徴抽出を行い早期分類を行うために、大規模データで事前学習された時系列基盤モデルを用いる手法を提案する。実験の結果、時系列基盤モデルを組み込んだ提案手法は、既存の手法を上回る早期分類精度を達成することが示された。

[2b-R-23] マスク付き距離空間を用いた欠損値を含むデータの統合に基づく因果効果推定
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:玉野史結(国立健康危機管理研究機構 国立感染症研究所), 石川裕也(国立がん研究センター),塘由惟(国立健康危機管理研究機構 国立感染症研究所)
概要:医学研究では,外部対照群の活用や異時点データの統合により検出力向上や長期アウトカム評価が行われる.本研究は,統合に伴う共変量分布差による推定バイアスに対し,最適輸送に基づく因果効果推定法を提案する.特にほとんどの医学研究で発生する結束を含む状況を想定し,マスク付き距離空間を導入して欠測の補完を行わずに最適輸送由来のバランシング重みを構築する.

[2b-R-24] Discovering New Theorems via LLMs with In-Context Proof Learning in Lean
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:笠浦一海 (オムロンサイニックエックス株式会社), 恩田直登 (オムロンサイニックエックス株式会社), 折池雄太 (株式会社サイバーエージェント), 谷口雅弥 (理化学研究所), 三内顕義 (京都大学), 園田翔 (理化学研究所 / 株式会社サイバーエージェント)
概要:本論文では、LLMが新規定理を発見する能力に着目する。数学的予想を自動生成し、Lean 4形式で証明する「予想-証明ループ」パイプラインを提案する。本手法の特徴は、過去に生成した定理とその証明を含む文脈を用いてさらなる予想を生成・証明することである。これにより、LLMのパラメータを変更せずに、証明戦略のインコンテクスト学習を通じてより困難な証明の生成が可能となる。

[2b-R-25] Mechanism-Informed Learning for Fair Division
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:五十嵐歩美(東京大学), 丸尾亮太(京都大学), 竹内孝(京都大学), 横山智彦(東京大学)
概要:Fair division provides a simple yet powerful framework for modeling fairness in resource allocation. While existing literature typically assumes complete information about preferences, many practical scenarios involve incomplete preference data, posing challenges in estimating fair allocations. In this paper, we propose mechanism-informed preference learning, a framework that integrates neural networks with differentiable approximations of classical fair division mechanisms—adjusted winner, round-robin, and moving-knife—to estimate fair allocations from incomplete preference. Experiments on real-world household chore preference data show that our approach using differentiable mechanism achieves fairer allocations, compared to methods that do not incorporate mechanism information.

[2b-R-26] 逐次KDE誘導ゼロショット回帰:二軸のドメイン下で未観測条件を予測
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:佐藤堪太(第一三共), 加納学(京都大学)
概要:二軸のドメインにおいて未観測の組合せをゼロショットで回帰する場合、全てのソースデータを利用するとドメインシフトと負の転移が生じる。本研究では、二軸の組合せに対して既存データを自動選別、再利用する方法を提案するカーネル密度推定でターゲット近傍のソースを順次選択し、疑似ターゲット特徴を付与して実測と併せて学習する。誤差に応じて取込みを自動調整し、繰り返し学習することで、未観測組合せへの汎化を達成した。

[2b-R-27] 段階的デコーダTransformerによる 熱間圧延における逐次温度予測
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:竹川修平(早稲田大学), 関本真康(株式会社 TMEIC), 新居稔大(株式会社 TMEIC), 齋藤亮(株式会社 TMEIC), 内田真人(早稲田大学)
概要:熱間圧延の仕上圧延後の温度予測において、リアルタイムな温度変動を反映できない従来課題を解決するため、新しい逐次予測型Transformerモデルを提案する。本モデルは、温度センサの配置順に対応した「段階的デコーダ」を特徴とし、新たな観測値を得るたびに予測を更新する。さらに、予測の一貫性を保つ「双方向監視損失関数」を導入した。実データを用いた実験で、従来手法を上回る高い予測精度を実証した。

[2b-R-28] 顧客の嗜好領域推定のためのBox embeddingを用いた購買予測モデルの分析
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:鷲見優一郎(トヨタ自動車株式会社 未来創生センター), 中西亮輔(トヨタ自動車株式会社 未来創生センター)
概要:Box embeddingは、データを潜在空間内に「箱」の形で表現する埋め込み手法であり、データごとに異なる特徴の広がりを表現できる。我々はこれまでに、Box embeddingを用いた購買予測モデルを提案したが、従来手法であるWord embeddingベースの予測モデルを上回る性能を得られなかった。本研究では、提案モデルを詳細分析し、検討した性能向上手法の効果を検証する。

[2b-R-29] 自然言語指示に基づく結晶構造生成フレームワークの開発
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:伊藤優成 (トヨタ自動車株式会社 Lattice lab), 鈴木雄太 (トヨタ自動車株式会社 Lattice lab), 足立真輝 (トヨタ自動車株式会社 Lattice lab)
概要:所望の物性を実現する結晶構造を設計することは、材料探索における重要な課題である。MatterGenなどの生成モデルを用いた既存手法は、数値的な物性値を条件とした構造生成において有効性を示しているものの、明示的な定量情報を前提とするため、複雑かつ多面的な設計目標を柔軟に扱うことには限界がある。本研究では、自然言語による指示から直接結晶構造を生成可能とする、テキスト条件付き構造生成フレームワークを提案する。

[2b-R-30] なぜ一次モーメント情報のみ残したテキスト埋め込みはうまく動くのか?:単語埋め込み集合における二次モーメント情報の崩壊の分析
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:原知正(東北大学), 栗田宙人(東北大学), 今泉允聡(東京大学, 京都大学, 理化学研究所), 乾健太郎(MBZUAI, 東北大学, 理化学研究所), 横井祥(国立国語研究所, 東北大学, 理化学研究所)
概要:テキスト埋め込みは標準的に単語埋め込み集合の平均プーリングで構築される。しかし平均プーリングは単語埋め込み集合の高次モーメントの情報を潰す。本研究では、単語埋め込み集合の情報を一次と二次のモーメントの情報に分け、二次モーメントの情報がどの程度潰れるかを実際のテキストとモデルで検証する。また、対照学習による追加学習後のモデルは単語埋め込み集合を一次モーメントの情報でよりよく代表することを議論する。

[2b-R-31] 文脈内強化学習を用いた行動認識のための適応的特徴抽出
カテゴリ:機械学習応用一般 (General Machine Learning:Applications)
発表者:関井大気(サイバーエージェント), 佐藤文彬(サイバーエージェント)
概要:行動認識の従来手法の多くは,認識対象の行動クラスに依らない共通のDNNを用いて動画特徴量を抽出するため,学習データの多様性が乏しい場合,各行動の学習時に本来不要であるはずの特徴量を過学習するリスクがある.本発表では,LLMの持つ行動に関する知識に基づき,文脈内強化学習と物体検出技術を用いて,行動ごとに認識に必要な特徴量を適応的に抽出する手法を提案する.

[2b-R-32] 確率的制御不変集合を用いた線形マルコフ決定過程の安全強化学習
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:木村隼己(大阪大学), 池本隼也(大阪大学), 橋本和宗(大阪大学)
概要:本研究では、線形マルコフ決定過程(Linear MDP)を仮定し、確率的制御不変集合(PCIS)を用いた安全強化学習手法を提案する。Linear MDPの仮定の下、未知遷移システムから確率的制御不変集合(PCIS)をデータ駆動的に推定する理論を構築した。さらに、PCISを安全強化学習に応用し、長期的な安全性を保証する方策の構築手法を示し、シミュレーションにより有効性を確認した。

[2b-R-33] 挙動特性変化に適応可能な混合方策学習法の検討
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:池本隼也(大阪大学)
概要:物理システムの制御に強化学習を応用する際,安全性の観点からシミュレータ上で方策の学習を行うことが多い.一般に,シミュレータと実システムの挙動特性にはギャップが存在し,さらに制御中に挙動特性が大きく変化することもある.本発表では,シミュレータ上で異なる環境にて学習した複数の方策を,重み付き平均の形で統合し,重みをオンラインに調整することで,システムの挙動特性変化に適応する手法について検討する.

[2b-R-34] オフラインで完結するモデルフリー強化学習
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:宮口航平(LINEヤフー研究所)
概要:強化学習 (RL) の手法群は環境モデルを直接推定する「モデルベースRL」としない「モデルフリーRL」に大別される。モデルフリーRLは実装がシンプルかつ状態行動空間の次元に対してスケールしやすいという強みを持つが、他方で本番環境での試行錯誤が禁じられたオフライン制約のもとではハイパーパラメタ選択が困難という弱みを抱えている。本研究では、オフラインで完結するモデルフリーRLのためのハイパーパラメタ選択法を提案する。

[2b-R-35] 線形システムに対する方策勾配法の非漸近的な収束レート
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:和田孝之(兵庫県立大学), 福永修一(広島工業大学)
概要:未知の線形システムに対する方策勾配強化学習を考える.この問題は制御指標を標準的な状態と入力に関する二次関数ととるとき,目的関数は非凸ではある.しかし,この関数はPolyak- Lojasiewicz (PL) 条件を満足し,局所最適解が大域最適解となるという特別な性質をもつ.本発表では,このクラスの問題に対して反復法である方策勾配法をいつ停止させれば良いかを明らかにするため,非漸近的な収束率を解析している.

[2b-R-36] ドメイン適応におけるハイブリッドモデリングおよび自動的なモデル構造決定
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:大坂光(東京大学), 武石直也(東京大学), 矢入健久(東京大学)
概要:ニューラルネットワークを用いた微分方程式の学習は、データを活用した物理現象の正確なモデリングに寄与すると期待される一方、ドメインシフトによる性能低下が問題である。本研究では、物理モデルとニューラルネットワークを組み合わせたハイブリッドモデルが効率的なドメイン適応を促し、モデル化性能の向上に貢献することを実験的に示す。またこのようなハイブリッドモデル構造を自動的に決定する手法についても検討する。

[2b-R-37] 群れの相転移現象に基づく動的環境適応のための自律分散マルチエージェント制御
カテゴリ:強化学習・プランニング・制御 (Reinforcement Learning / Planning / Control)
発表者:伊藤潤成(早稲田大学), 和佐泰明(早稲田大学)
概要:Vicsekモデルの相転移現象に着想を得た,動的環境下でのマルチエージェント環境モニタリング手法を提案する.エージェント間の局所的相互作用と環境情報の活用により,探索と被覆の動作モードを自発的に切り替える分散制御の実現を目指す.群れの秩序・無秩序状態の相転移を利用することで,明示的な切り替え機構なしに動的環境への柔軟な適応を可能にする.シミュレーションによる基礎的な挙動解析について報告する.

[2b-R-38] Counterfactual Explanations without Predefined Specifications
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:Jiali Ma (Kyoto University), Ichigaku Takigawa (The University of Tokyo), Akihiro Yamamoto (Kyoto University)
概要:Counterfactual explanations are a widely studied approach to improving the interpretability of machine learning models, offering alternative inputs that flip a model’s decision while remaining close to the original instance. Existing methods typically hard-code desirable properties of counterfactuals—such as robustness, actionability, or plausibility—into their objectives. While effective in narrow settings, this reliance on predefined specifications limits flexibility, requires expert knowledge, and often fails to reflect what end users actually consider useful. Moreover, many preferences are difficult to articulate in advance, making it hard for current approaches to capture them. We present a framework for specification-free counterfactual generation, where the system learns directly from user feedback what makes a counterfactual valuable. Rather than encoding fixed criteria, our method adaptively incorporates user preferences and aligns the generated counterfactuals with these learned requirements. Initial experiments show that our approach can automatically discover and satisfy qualities such as actionability without predefinition. This opens the door to user-aligned counterfactual explanations that adapt to context and stakeholder needs.

[2b-R-39] スパースオートエンコーダを用いたLLMの知識忘却技術
カテゴリ:公平性・安全性・解釈性・プライバシー (Fairness / Safety / Interpretability / Privacy)
発表者:山下智也(NTT), 山田真徳(NTT), 山中友貴(NTT), 三浦尭之(NTT), 芝原俊樹(NTT), 伊藤燦(NTT)
概要:プライバシーや著作権の観点から、LLMに対するMachine Unlearning技術が注目されている。従来手法では特定出力の抑制はできてもモデル内部に知識が残り、モデル崩壊の懸念もある。本研究はスパースオートエンコーダを利用してモデルの内部表現を制御するような追加学習を実施することで、モデル崩壊を起こさずに対象知識を忘却する手法を提案する。

[2b-R-40] Unified Convergence Guarantees for Learning with General Payoff Perturbations in Extensive-Form Games
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:阿部拳之(サイバーエージェント,電気通信大学), 坂本充生(サイバーエージェント), 眞坂航宙(電気通信大学), 蟻生開人(サイバーエージェント), 岩崎敦(電気通信大学)
概要:標準型ゲームやモノトーンゲームの均衡学習では利得関数を摂動させる方法が注目されており,様々な関数を用いた利得摂動が提案されている.しかし,不完全情報ゲームに対しては,KLダイバージェンスに基づく摂動による収束性のみが理論的に解析されている.本研究では,Bregmanダイバージェンスを含む任意の強凸関数に基づく利得摂動を導入し,その下で得られる学習アルゴリズムの収束性が統一的に保証されることを示す.

[2b-R-41] オークション環境の時間変動による収入同値の破れ
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:藤本悠雅(サイバーエージェント), 蟻生開人(サイバーエージェント), 阿部拳之(サイバーエージェント)
概要:Auction is applied for trade with various mechanisms. A simple but practical question is which mechanism, typically first-price or second-price auctions, is preferred from the perspective of bidders or sellers. A celebrated answer is revenue equivalence, where each bidder’s equilibrium payoff is proven to be independent of auction mechanisms (and a seller’s revenue, too). In reality, however, auction environments like the value distribution of items would vary over time, and such equilibrium bidding cannot always be achieved. Indeed, bidders must continue to track their equilibrium bidding by learning in first-price auctions, but they can keep their equilibrium bidding in second-price auctions. This study discusses whether and how revenue equivalence is violated in the long run by comparing the time series of non-equilibrium bidding in first-price auctions with those of equilibrium bidding in second-price auctions. We characterize the value distribution by two parameters: its basis value, which means the lowest price to bid, and its value interval, which means the width of possible values. Surprisingly, our theorems and experiments find that revenue equivalence is broken by the correlation between the basis value and the value interval, uncovering a novel phenomenon that could occur in the real world.

[2b-R-42] 比例的高ノイズレジームにおけるベイズ回帰の漸近挙動
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:徳田悟(九州大学)
概要:我々は「比例的高ノイズレジーム」と呼ぶべきベイズ回帰の新たな漸近理論を開拓した。計測器に内在する分解能と感度のトレードオフ、ならびにそれに起因するモデル選択の相転移現象に動機づけられ、本理論ではノイズ分散とサンプルサイズの比を一定に保ち両者を同時に無限大とする極限を扱う。本発表では対数周辺尤度の漸近解析を行い、非線形回帰を例にモデルミスマッチや有限サイズ効果も評価する。特異学習理論との対応も示す。

[2b-R-43] 文脈内学習における低ランク線形回帰の汎化と暗黙正則化
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:高波海斗(東大理), 髙橋昴(知の物理、理研AIP), 樺島祥介(知の物理)
概要:現代の大規模言語モデルは、さまざまなタスクに対してパラメータを変更せずに対応ができるという文脈内学習と呼ばれる能力を獲得していると言われる。本研究では、事前学習時のタスク間に共通の低ランク構造があるモデルを考え、どのようにタスク間の構造を学習する能力を獲得できるのかを明らかにした。また、有限のコンテキスト長が暗黙正則化を引き起こすことを説明した。

[2b-R-44] 目的関数を一般化したバンディット理論に基づく ExtremeHunter 方策の改良
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:吉川信明(株式会社豊田中央研究所), 大野宏司(株式会社豊田中央研究所)
概要:通常のバンディット問題は総報酬の最大化を目的とする。一方、最大値バンディット問題では得られた報酬の最大値の最大化を目的とする。近年、我々は両者の目的の違いを統一的に扱うために最適腕選択指標を導入し、両者共通の枠組みで理論構築を進めている。本発表では、この枠組みのもと、確率的設定における既存の最大値バンディット方策である ExtremeHunter 方策を改良し、理論オーダーと数値性能を改善したので報告する。

[2b-R-45] 離散拡散モデルにおける逆拡散過程の動的特性解析
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:高橋智栄(東大知の物理), 髙橋昂(東大知の物理), 樺島祥介(東大知の物理)
概要:離散拡散モデルは離散データに対する拡散モデルである。連続データに対する拡散モデルのデータ生成ダイナミクス、すなわち逆拡散過程には動的な3つの特徴的な相が現れること、及びそれらの相境界のデータの次元やデータ数に対するスケーリングが統計力学的解析によって明らかになっている。本研究では離散拡散モデルで同様の解析を行い、連続データとの違いなどを議論し、(離散)拡散モデルの性能理解などに繋げる。

[2b-R-46] 量子エラー訂正のための古典誤り訂正符号の応用: 量子カーネル分類器の分類誤り訂正
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:杉原堅也(三菱電機株式会社)
概要:量子計算機で量子アルゴリズムを実行する際に生じる量子エラーによって演算結果に誤りが発生することが、量子計算機を実用化する上で大きな課題となっている。本発表では、古典誤り訂正符号を用いて測定後の古典ビットの誤りを訂正し、演算結果のビット誤り率を低減する手法を提案する。例として、量子カーネル分類器の推論時における量子エラーによる分類誤りを訂正し、正解率を向上できることをシミュレーションによって示す。

[2b-R-47] バンディット及び遅延フィードバック下でのオンライン構造予測
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:渋川裕生(東京大学), 土屋平(東京大学,理研AIP), 坂上晋作(サイバーエージェント,理研AIP), 山西健司(東京大学)
概要:オンライン構造予測とは,逐次的に得られる入力と過去の観測から複雑な構造を持つラベルを予測する問題であり,オンライン分類問題を一般化した設定である.本研究では,予測による損失値のみが観測可能であるバンディットフィードバックの設定において,新たな勾配推定の枠組みを複数考案し,それに基づくアルゴリズムの考案,リグレット解析,および数値実験による検証を行った.さらに観測が遅延する設定への拡張を実施した.

[2b-R-48] しきい値バンディットによる漸近最適なモンテカルロ木探索手法の提案
カテゴリ:情報理論・学習理論・ゲーム理論 (Information Theory / Learning Theory / Game Theory)
発表者:行木渉真(北海道大学), 中村篤祥(北海道大学), 田畑公次(北海道大学), 小宮山純平(MBZUAI)
概要:モンテカルロ木探索は、ランダムサンプリングによる評価を用いて効率的に木構造を探索する手法である。囲碁における最適手の探索をはじめ、幅広い最適化問題に応用されているが、その理論解析は未だ不十分であり、計算の困難さや性能限界に関する課題が残されている。そこで本研究では、問題を「しきい値以上の解を1つ発見する」形に単純化し、期待停止時刻が漸近的に最適で、かつ計算可能な新しいアルゴリズムを提案する。

[2b-R-49] 最終層の重み行列の零空間射影と特徴量正則化による破滅的忘却の抑制
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:山下穂乃花(筑波大学), 栗田多喜夫(産業技術総合研究所), 大西正輝(産業技術総合研究所)
概要:学習済みの深層学習モデルに別のタスクを追加学習すると,破滅的忘却が起こることが知られている.本稿では追加学習による特徴量の更新分をモデルの最終層の重み行列の零空間のみで学習することで,古いタスクの性能低下を抑制する手法を提案する.検証ではMNISTにFashionMNISTを追加学習させた場合と,ImageNetを学習したResNetの最終層に多層パーセプトロンを追加し,CIFAR 100を20クラスずつ分解して追加学習する場合について,提案手法の有効性を確認した.

[2b-R-50] 拡散生成過程の相転移の幾何学とその制御:局所から大域へ!
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:坂本龍亮 (北海道大学), 坂本航太郎 (東京大学)
概要:拡散モデルの潜在空間におけるスコアベクトル場を幾何学的に解析し,その相転移を手掛かりに生成過程へ軽量な介入を行い,生成結果を制御できることを示す.拡散言語モデルの推論過程の理解への展望についても考察する.

[2b-R-51] 確率的勾配降下法の高次元極限:動的平均場理論による精密解析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:西山颯大(東京大学,理研AIP), 今泉允聡(東京大学,理研AIP)
概要:確率的勾配降下法 (SGD) の理論的な性質を精密に解析することは重要な研究課題である.本研究では,2層ニューラルネットワークを含む高次元なモデルのクラスに対するSGD学習を考え,高次元極限におけるパラメータの分布を,連続時間かつ低次元の確率過程を用いて厳密に導出する.これにより,SGDの挙動とそのハイパーパラメータ依存性の解析が容易になる.解析には,統計物理学に由来する動的平均場理論を用いる.

[2b-R-52] NTK理論を用いた学習不要なネットワーク幅の決定
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:砂田達巳 (東京大学), 山崎俊彦 (東京大学), 牧淳人 (KTH)
概要:本発表では, Neural Tangent Kernel (NTK)を用いてニューラルネットワークの必要最小限な幅を初期化段階で決定する手法を提案する. 無限幅で議論されるNTKの理論を有限幅に拡張し, 有限幅だが十分大きい幅のネットワークにおけるテスト損失とNTKの最小固有値の関係を理論的・実験的に示す. この結果をもとに, ネットワークの最適な幅の決定におけるNTKの最小固有値の有用性を検証する.

[2b-R-53] 効率的境界検出と最適輸送損失による時系列行動セグメンテーションの精度向上
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:光岡日菜子(名城大学), 河野洋平(トヨタ車体株式会社 車両生技部), 堀田一弘(名城大学)
概要:近年の時系列行動セグメンテーションは高精度だが複雑な構造のモデルが増加し、計算コストが問題となっている。そこで本研究では、本タスクのための新たな損失関数を提案する。具体的には、出力チャネルを1だけ追加して動作境界を学習させる損失関数、オーバーセグメンテーションの改善を狙う最適輸送を使用した損失関数を導入する。提案手法は任意の従来法に統合可能であり、計算コストの増加を抑えつつ精度を向上させた。

[2b-R-54] Domain Adaptation and Entanglement: an Optimal Transport Perspective
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:Okan Koc (RIKEN AIP), Alexander Soen (RIKEN AIP & Australian National University), Chao-Kai Chiang (The University of Tokyo), Masashi Sugiyama (The University of Tokyo & RIKEN AIP)
概要:Current machine learning systems are brittle in the face of distribution shifts (DS), where the target distribution that the system is tested on differs from the source distribution used to train the system. This problem of robustness to DS has been studied extensively in the field of domain adaptation. For deep neural networks, a popular framework for unsupervised domain adaptation (UDA) is domain matching, in which algorithms try to align the marginal distributions in the feature or output space. The current theoretical understanding of these methods, however, is limited and existing theoretical results are not precise enough to characterize their performance in practice. In this paper, we derive new bounds based on optimal transport that analyze the UDA problem. Our new bounds include a term which we dub as entanglement, consisting of an expectation of Wasserstein distance between
conditionals with respect to changing data distributions. Analysis of the entanglement term provides a novel perspective on the unoptimizable aspects of UDA. In various experiments with multiple models across several DS scenarios, we show that this term can be used to explain the varying performance of UDA algorithms.

[2b-R-55] Scaling Laws for Upcycling Mixture-of-Experts Language Models
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:Seng Pei Liew (SB Intuitions), Takuya Kato (SB Intuitions), Sho Takase (SB Intuitions)
概要:Pretraining large language models (LLMs) is resource-intensive, often requiring months of training time even with high-end GPU clusters. There are two approaches of mitigating such computational demands: reusing smaller models to train larger ones (upcycling), and training computationally efficient models like mixture-of-experts (MoE). In this paper, we study the upcycling of LLMs to MoE models, of which the scaling behavior remains underexplored. Through extensive experiments, we identify empirical scaling laws that describe how performance depends on dataset size and model configuration. Particularly, we show that, while scaling these factors improves performance, there is a novel interaction term between the dense and upcycled training dataset that limits the efficiency of upcycling at large computational budgets.
Based on these findings, we provide guidance to scale upcycling, and establish conditions under which upcycling outperforms from-scratch trainings within budget constraints.

[2b-R-56] 言語モデルの最終隠れ状態のソフト分割可能な単体複体としての分析
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:石峯拓海(東京大学・国立国語研究所), 日野英逸(統計数理研究所), 横井祥(国立国語研究所・東北大学・理化学研究所)
概要:言語モデルの最終隠れ状態と出力分布の関係を幾何的に考察する。次単語予測で実用上使用される、確率上位のトークンに限った分布は、トークンを頂点とする単体上にあるとみなせること、最終隠れ状態が局所的に確率単体の等長対数比変換と余剰空間の直積とみなせることに着目すると、単体同士の共通部分では座標変換が可能である。最終隠れ状態の分布を、開被覆でソフトに分割可能な複体として理論・実験の両面から分析する。

[2b-R-57] ニューラルネットワークにおけるニューロン間競合の回避と収束の加速
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:渡邉大師 (京都大学), 寺前順之介 (京都大学)
概要:過剰パラメータ化された単層モデルでは、複数のニューロンが同一の特徴を学習しようと競合し、収束が遅くなる問題が知られている。本研究では、ネットワークを深くすることでこの問題が解決されることを示す。具体的には、2層ニューラルネットワークの学習ダイナミクスが、教師信号との初期相関が低いニューロンの貢献度を選択的に抑制することで競合を回避し、指数的収束が達成されることを明らかにする。

[2b-R-58] パッチ埋め込みを用いた Transformer によるベクターフォントの再構成
カテゴリ:深層学習理論・応用 (Deep Learning:Theory and Applications)
発表者:藤岡拓夢(名古屋工業大学), 田中剛平(名古屋工業大学, 東京大学)
概要:フォントは任意の解像度で鮮明に表示可能なベクターフォントが主流である.既存のフォントに関する深層学習手法の多くはビットマップ形式が対象のため,ベクター形式を扱う手法の開発が望まれている.本研究では,パッチ埋め込みを用いた Transformer によりベクターフォントを再構成する手法を提案する.Google Fonts 全体を用いた実験により,提案手法が複雑な字形に対しても有効であることを示した.

[2b-R-59] 最適化1ステップの学習によるUnrolling
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:有竹俊光(一橋大学)
概要:数値最適化は統計・機械学習を支える基盤技術であり、その効率化・高精度化は応用範囲を大きく左右する。近年、更新則を学習により高速化・高精度化するunrollingが注目されている。しかし、従来法は学習が特定インスタンスに依存し、得られる更新則は汎用性に乏しかった。本研究では、最適解近傍で学習した小規模ニューラルネットを用いて、同一クラスに属する多様な凸最適化問題に適用可能なunrolling手法を提案する。

[2b-R-60] The Adaptive Complexity of Finding a Stationary Point
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:Huanjian Zhou (The University of Tokyo)
概要:In large-scale machine learning, highly parallel non-convex optimization is essential. We characterize the adaptive complexity, the minimal number of sequential rounds required to find a stationary point when many queries can be executed in parallel. In high dimensions, we prove tight lower bounds matching the performance of standard gradient- and higher-order methods. In constant dimensions, we present an algorithm achieving stationarity in a fixed number of rounds and establish a corresponding lower bound. All bounds are tight up to logarithmic factors.

[2b-R-61] PL条件を仮定したゼロ次最適化法の次元に依存しない計算量解析
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:秋山俊太 (CyberAgent)
概要:ゼロ次最適化法とは,勾配情報を必要とせず,関数値のみを用いて最適化を行う手法である.一般にゼロ次最適化法では,勾配推定のために次元に依存した計算量が必要となることが知られている.本研究では目的関数がPL条件を満たす場合に,次元の代わりにヘシアンのトレースに依存した計算量上界を導出した.結果として,目的関数が本質的に低次元構造を有する場合,本来の次元に依存しない計算量が得られることを示した.

[2b-R-62] Linesearch-free first-order methods for nonconvex optimization
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:柳下翔太郎(統計数理研究所, データサイエンス共同利用基盤施設), 伊藤勝(日本大学)
概要:勾配法などの一次法において,ステップサイズの適切な選択は最も重要な要素の一つである.ステップサイズの選択には,問題に依存するパラメータの先見情報を用いるか,バックトラッキングに基づく直線探索を用いることが典型的である.近年,それらのどちらも必要としない方法の開発が急速に進んでいる.本研究では,いまだ進展が十分でない非凸最適化に対するシンプルなパラメータフリーかつ直線探索フリーなステップサイズ選択法を提案する.

[2b-R-63] 異なる入力ノイズ分布下でのロバスト解を同時探索するベイズ最適化
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:伊藤凜(三菱電機株式会社), 増井秀之(三菱電機株式会社)
概要:入力ノイズに対するロバストベイズ最適化では、ブラックボックス関数の入力に加わるノイズに対してロバストな解の探索が行われる。設計・生産現場等での実応用を考えると、複数の入力ノイズ分布に対し、各分布下でのロバスト解を提示することが望ましい場合もある。本研究では複数の異なる入力ノイズ分布に対するロバスト解を同時に探索するための効率的なベイズ最適化手法を提案し、数値実験によりその有効性を検証する。

[2b-R-64] 大規模シフト歪対称線形方程式に対する乱択クリロフ部分空間法の提案
カテゴリ:連続最適化・離散最適化 (Continuous Optimization / Discrete Optimization)
発表者:Zhao Xiangwen(大阪大学), 宮武勇登(大阪大学D3センター), 降籏大介(大阪大学D3センター)
概要:行列A=αI+S(ただしSは歪対称)の大規模連立一次方程式Ax=bは、計算流体力学などの科学・工学分野で頻出します。本発表では、クリロフ部分空間法の一種である従来の MRS³ に乱択アルゴリズムを取り入れた RMRS³(Randomized MRS³)法を提案します。本手法はランダムスケッチングで次元を削減し、行列Aへのアクセスを全体で回に抑えつつ、効率的な並列計算を実現します。大規模問題におけるメモリアクセスコスト削減に非常に有効です。