Isolater - Feed

Ax Sidhant Nair, Tanmay Sen, Mrinmay Sen, Sayantan Banerjee 3/25/2026

DP-FedSOFIM: Differentially Private Federated Stochastic Optimization using Regularized Fisher Information Matrix

Proposes differentially private federated learning optimization using regularized Fisher information matrix for faster convergence under privacy constraints.

Ax Arjun Nichani (Richard), Hsiang Hsu (Richard), Chun-Fu (Richard), Chen, Haewon Jeong 3/25/2026

Does Privacy Always Harm Fairness? Data-Dependent Trade-offs via Chernoff Information Neural Estimation

Uses Chernoff information to characterize trade-offs between fairness, privacy, and accuracy in machine learning systems.

Ax Vugar Ismailov 3/25/2026

Universal Approximation Theorem for Input-Connected Multilayer Perceptrons

Theoretical analysis of input-connected MLPs with direct connections from input to hidden neurons and universal approximation properties.

Ax Zhiyu An, Wan Du 3/25/2026

Representational Homomorphism Predicts and Improves Compositional Generalization In Transformer Language Model

Introduces homomorphism error metric to measure representational inconsistencies and predict compositional generalization failures in transformers.

Ax Joseph L. Breeden 3/25/2026

How Understanding Forecast Uncertainty Resolves the Explainability Problem in Machine Learning Models

Analyzes forecast uncertainty in ML model explainability, arguing uncertainty at decision boundaries explains LIME/SHAP instability.

Ax Hongwei Yan, Guanglong Sun, Kanglei Zhou, Qian Li, Liyuan Wang, Yi Zhong 3/25/2026

FlyPrompt: Brain-Inspired Random-Expanded Routing with Temporal-Ensemble Experts for General Continual Learning

Brain-inspired routing method with temporal-ensemble experts for general continual learning from non-stationary data streams.

Ax Dongik Park, Hyunwoo Ryu, Suahn Bae, Keondo Park, Hyung-Sin Kim 3/25/2026

T1: One-to-One Channel-Head Binding for Multivariate Time-Series Imputation

Proposes one-to-one channel-head binding method for imputing missing values in multivariate time series data.

Ax Kevin Vogt-Lowell, Theodoros Tsiligkaridis, Rodney Lafuente-Mercado, Surabhi Ghatti, Shanghua Gao, Marinka Zitnik, Daniela Rus 3/25/2026

When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift

Studies robustness of PPO reinforcement learning under sensor drift using temporal sequence models to handle partial observability.

Ax Bhavesh Kumar, Dylan Feng, Leonard Tang 3/25/2026

MJ1: Multimodal Judgment via Grounded Verification

arXiv paper MJ1: multimodal judge trained with RL enforcing visual grounding through structured verification chains and counterfactual consistency rewards.

Ax Keita Kayano, Takayuki Nishio, Daiki Yoda, Yuta Hirai, Tomoko Adachi 3/25/2026

Multi-Station WiFi CSI Sensing Framework Robust to Station-wise Feature Missingness and Limited Labeled Data

arXiv paper proposing WiFi CSI sensing framework handling station-wise feature missingness and limited labeled data in multi-station deployments.

Ax Emil Hovad 3/25/2026

A Stability-Aware Frozen Euler Autoencoder for Physics-Informed Tracking in Continuum Mechanics (SAFE-PIT-CM)

arXiv paper SAFE-PIT-CM: autoencoder with frozen Euler solver for recovering material diffusion coefficients from continuum mechanics data.

Ax Sonia Laguna, Jorge da Silva Goncalves, Moritz Vandenhirtz, Alain Ryser, Irene Cannistraci, Julia E. Vogt 3/25/2026

Rethinking Machine Unlearning: Models Designed to Forget via Key Deletion

arXiv paper proposing key deletion approach for machine unlearning designed at model development stage rather than post-hoc, addressing privacy regulations and data errors.

Ax Bharat Runwal, Ashish Agrawal, Anurag Roy, Rameswar Panda 3/25/2026

PRISM: Demystifying Retention and Interaction in Mid-Training

arXiv paper PRISM: empirical study of mid-training design choices across 7 LLM base models showing consistent +15 to +40 point gains from 27B token sequences.

Ax Xuan Liu, Xiaobin Chang 3/25/2026

Elastic Weight Consolidation Done Right for Continual Learning

arXiv paper systematically analyzing Elastic Weight Consolidation for continual learning, revealing suboptimal importance estimation and proposing improvements.

Ax Shuai Chen, Huiqiao Jia, Tao Qing, Li Zhang, Xingyu Xiao 3/25/2026

A Dynamic Bayesian and Machine Learning Framework for Quantitative Evaluation and Prediction of Operator Situation Awareness in Nuclear Power Plants

arXiv paper proposing DBML SA framework using dynamic Bayesian machine learning to evaluate operator situation awareness in nuclear control environments.

Ax Tianyang Luo, Tao Feng, Zhigang Hua, Yan Xie, Shuang Yang, Ge Liu, Jiaxuan You 3/25/2026

MemReward: Graph-Based Experience Memory for LLM Reward Prediction with Limited Labels

arXiv paper presenting MemReward, graph-based experience memory framework reducing human labeling needs for LLM reward prediction in RL post-training.

Ax Keith Rush 3/25/2026

Global Convergence of Multiplicative Updates for the Matrix Mechanism: A Collaborative Proof with Gemini 3

arXiv paper analyzing fixed-point iterations for nuclear norm optimization in private machine learning, proved with Gemini 3 collaboration.

Ax Chiyu Ma, Shuo Yang, Kexin Huang, Jinda Lu, Haoming Meng, Shangshang Wang, Bolin Ding, Soroush Vosoughi, Guoyin Wang, Jingren Zhou 3/25/2026

FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization

arXiv paper presenting FIPO reinforcement learning algorithm for improving reasoning in LLMs through fine-grained credit assignment beyond outcome-based rewards.

Ax Dong Liu, Yanxuan Yu, Ben Lengerich, Ying Nian Wu 3/25/2026

MKA: Memory-Keyed Attention for Efficient Long-Context Reasoning

arXiv paper proposing Memory-Keyed Attention (MKA) to reduce KV cache memory costs in long-context LLM inference without sacrificing representation quality.

Ax Woosung Koh, Jeyoung Jeon, Youngjin Song, Yujin Cheon, Soowon Oh, Jaehyeong Choi, Se-Young Yun 3/25/2026

mSFT: Addressing Dataset Mixtures Overfitting Heterogeneously in Multi-task SFT

Algorithm for optimal multi-task dataset mixture selection in LLM supervised fine-tuning. Addresses heterogeneous learning dynamics and overfitting.

Ax Dongxia Wu, Yuhui Zhang, Serena Yeung-Levy, Emma Lundberg, Emily B. Fox 3/25/2026

Uncertainty Quantification for Distribution-to-Distribution Flow Matching in Scientific Imaging

Uncertainty quantification methods for distribution-to-distribution generative models in scientific imaging. Ensures trustworthy cell and medical image generation.

Ax Dongxia Wu, Shiye Su, Yuhui Zhang, Elaine Sui, Emma Lundberg, Emily B. Fox, Serena Yeung-Levy 3/25/2026

CellFluxRL: Biologically-Constrained Virtual Cell Modeling via Reinforcement Learning

Reinforcement learning post-training for virtual cell models to enforce biological constraints. Improves generative model reliability for drug discovery.

Ax Do Edmond Sanou, Christophe Ambroise, Genevi\`eve Robin 3/25/2026

Inference of Multiscale Gaussian Graphical Model

Gaussian Graphical Models with simultaneous clustering and graph inference for high-dimensional data. Dimensionality reduction approach.

Ax Derek Jones, Jonathan E. Allen, Xiaohua Zhang, Behnam Khaleghi, Jaeyoung Kang, Weihong Xu, Niema Moshiri, Tajana S. Rosing 3/25/2026

HD-Bind: Encoding of Molecular Structure with Low Precision, Hyperdimensional Binary Representations

Hyperdimensional binary encoding method for molecular structures in drug discovery. Replaces expensive biophysical calculations.

Ax Lesi Chen, Yaohua Ma, Jingzhao Zhang 3/25/2026

Near-Optimal Nonconvex-Strongly-Convex Bilevel Optimization with Fully First-Order Oracles

Bilevel optimization algorithm using first-order methods for nonconvex-strongly-convex problems. Theoretical optimization analysis.

Ax Richard D. P. East, Guillermo Alonso-Linaje, Chae-Yeun Park 3/25/2026

All you need is spin: SU(2) equivariant variational quantum circuits based on spin networks

Quantum machine learning circuits using SU(2) equivariance and spin networks. Geometric constraints for variational quantum algorithms.

Ax Liyun Zeng, Hao Helen Zhang 3/25/2026

Sparse Learning and Class Probability Estimation with Weighted Support Vector Machines

Weighted Support Vector Machines for classification and probability estimation. Classic machine learning method with applications.

Ax Chunyu Xue, Weihao Cui, Quan Chen, Chen Chen, Han Zhao, Shulai Zhang, Linmei Wang, Yan Li, Limin Xiao, Weifeng Zhang, Jing Yang, Bingsheng He, Minyi Guo 3/25/2026

Arena: Efficiently Training Large Models via Dynamic Scheduling and Adaptive Parallelism Co-Design

Dynamic scheduling system for efficient large model training across GPU clusters. Addresses training efficiency and resource utilization.

Ax Cristian Garc\'ia-Romero, Miquel Espl\`a-Gomis, Felipe S\'anchez-Mart\'inez 3/25/2026

Smart Bilingual Focused Crawling of Parallel Documents

Web crawling method using neural networks to efficiently find parallel bilingual documents. Targets document discovery for translation.

Ax Siddhant Ray, Xi Jiang, Jack Luo, Nick Feamster, Junchen Jiang 3/25/2026

SwiftQueue: Optimizing Low-Latency Applications with Swift Packet Queuing

Network packet queuing optimization technique for low-latency applications. Infrastructure networking approach.

Ax Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Dongmei Zhang, Surajit Chaudhuri 3/25/2026

Table-LLM-Specialist: Language Model Specialists for Tables using Iterative Generator-Validator Fine-tuning

Self-trained fine-tuning paradigm for LLMs on table understanding tasks like NL-to-Code and data cleaning. Reduces need for expensive human labeling.

Ax Huancheng Chen, Jingtao Li, Weiming Zhuang, Chen Chen, Lingjuan Lyu 3/25/2026

Replay-Free Continual Low-Rank Adaptation with Dynamic Memory

Continual learning technique combining parameter-efficient fine-tuning with vision transformers to prevent catastrophic forgetting. Addresses sequential task adaptation.

Ax Alexander Pan, Lijie Chen, Jacob Steinhardt 3/25/2026

LatentQA: Teaching LLMs to Decode Activations Into Natural Language

Method for training LLMs to explain their own internal activations using natural language probes. Advances LLM interpretability research.

Ax Riccardo Bravin, Massimo Pavan, Hazem Hesham Yousef Shalby, Fabrizio Pittorino, Manuel Roveri 3/25/2026

EmbBERT: Attention Under 2 MB Memory

Transformer attention mechanism compressed to run in under 2MB memory for IoT and wearable devices. Enables NLP deployment on ultra-constrained hardware.

Ax Yu-Seung Roh, Joo-Young Kim, Jin-Duk Park, Won-Yong Shin 3/25/2026

Training-free Adjustable Polynomial Graph Filtering for Ultra-fast Multimodal Recommendation

Graph filtering method for multimodal recommendation systems without training overhead. Addresses computational efficiency in recommender systems.

Ax Kasra Borazjani, Payam Abdisarabshali, Naji Khosravan, Seyyedali Hosseinalipour 3/25/2026

Redefining non-IID Data in Federated Learning for Computer Vision Tasks: Migrating from Labels to Embeddings for Task-Specific Data Distributions

Study redefining non-IID data heterogeneity in federated learning by migrating from label to embedding-level task-specific distributions.

Ax Gary Froyland, Kevin K\"uhl 3/25/2026

Learning dynamically inspired bases for Koopman and transfer operator approximation

Learning dynamically-inspired bases for Koopman and transfer operator approximation in complex nonlinear dynamical systems.

Ax Anish R Joishy, Ishwar B Balappanawar, Vamshi Krishna Bonagiri, Manas Gaur, Krishnaprasad Thirunarayan, Ponnurangam Kumaraguru 3/25/2026

Flying Pigs, FaR and Beyond: Evaluating LLM Reasoning in Counterfactual Worlds

CounterLogic benchmark evaluating LLM reasoning in counterfactual scenarios where context contradicts parametric knowledge.

Ax Jaehyun Choi, Jiwan Hur, Gyojin Han, Jaemyung Yu, Junmo Kim 3/25/2026

PRISM: Video Dataset Condensation with Progressive Refinement and Insertion for Sparse Motion

Video dataset condensation approach preserving intrinsic coupling of spatial appearance and temporal dynamics.

Ax Saar Huberman, Or Patashnik, Omer Dahary, Ron Mokady, Daniel Cohen-Or 3/25/2026

Image Generation from Contextually-Contradictory Prompts

Method for text-to-image diffusion models to handle contextually contradictory prompts where concepts implicitly negate each other.

Ax Zhun Wang, Tianneng Shi, Jingxuan He, Matthew Cai, Jialin Zhang, Dawn Song 3/25/2026

CyberGym: Evaluating AI Agents' Real-World Cybersecurity Capabilities at Scale

Large-scale benchmark with 1,507 real-world vulnerabilities evaluating AI agents' dynamic cybersecurity capabilities at scale.

Ax Cheng Wang, Yu Jiang, Zhihao Peng, Chenxin Li, Changbae Bang, Lin Zhao, Wanyi Fu, Jinglei Lv, Jorge Sepulcre, Carl Yang, Lifang He, Tianming Liu, Xue-Jun Kong, Quanzheng Li, Daniel S. Barron, Anqi Qiu, Randy Hirschtick, Byung-Hoon Kim, Hongbin Han, Xiang Li, Yixuan Yuan 3/25/2026

Towards a general-purpose foundation model for fMRI analysis

NeuroSTORM foundation model for fMRI analysis learning generalizable representations with improved transferability.

Ax Jianghong Huang, Luping Ji, Xin Ma, Mao Ye 3/25/2026

BeltCrack: the First Sequential-image Industrial Conveyor Belt Crack Detection Dataset and Its Baseline with Triple-domain Feature Learning

Industrial conveyor belt crack detection dataset with sequential images and triple-domain feature learning baseline.

Ax Jyotishka Datta, Nicholas G. Polson 3/25/2026