Isolater - Feed

Ax Thackshanaramana B 3/18/2026

Hypothesis Class Determines Explanation: Why Accurate Models Disagree on Feature Attribution

Large-scale empirical study demonstrating prediction-equivalent models produce substantially different feature attributions across 24 datasets, challenging explainability assumptions.

Ax Nazia Riasat 3/18/2026

When Stability Fails: Hidden Failure Modes Of LLMS in Data-Constrained Scientific Decision-Making

Study showing LLM stability across repeated runs does not guarantee agreement with statistical ground truth in data-constrained scientific decision-making workflows.

Ax Jeremy J Samuelson 3/18/2026

Informationally Compressive Anonymization: Non-Degrading Sensitive Input Protection for Privacy-Preserving Supervised Machine Learning

Informationally Compressive Anonymization (ICA) method for privacy-preserving ML that protects sensitive data without the performance degradation of differential privacy or homomorphic encryption.

Ax Gabrielle Benabdallah 3/18/2026

Interpretative Interfaces: Designing for AI-Mediated Reading Practices and the Knowledge Commons

arXiv: Design principles for XAI interfaces enabling scientists to probe and interpret LLM behavior in reading and research workflows.

Ax Ezgi Korkmaz 3/18/2026

Counteractive RL: Rethinking Core Principles for Efficient and Scalable Deep Reinforcement Learning

arXiv: Counteractive RL framework addressing exponential state space complexity for efficient deep reinforcement learning.

Ax Rena Mira Krishna, Ramya Sankar, Shadi Ghiasi 3/18/2026

Electrodermal Activity as a Unimodal Signal for Aerobic Exercise Detection in Wearable Sensors

arXiv: Study on electrodermal activity as standalone physiological signal for detecting aerobic exercise in wearables.

Ax Dibakar Sigdel, Namuna Panday 3/18/2026

PhasorFlow: A Python Library for Unit Circle Based Computing

arXiv: Python library for unit circle-based computing using complex phasors and unitary gates on torus topology.

Ax Azwad Anjum Islam, Tisa Islam Erana 3/18/2026

COGNAC at SemEval-2026 Task 5: LLM Ensembles for Human-Level Word Sense Plausibility Rating in Challenging Narratives

arXiv: LLM ensemble approaches for word sense plausibility rating in SemEval-2026 using zero-shot and Chain-of-Thought prompting.

Ax Roberto Morabito, Mallik Tatipamula 3/18/2026

The Internet of Physical AI Agents: Interoperability, Longevity, and the Cost of Getting It Wrong

arXiv: Framework for Internet of Physical AI Agents addressing interoperability, security, and sustainability in IoT environments.

Ax Tin Hoang 3/18/2026

Federated Learning for Privacy-Preserving Medical AI

arXiv: Privacy-preserving federated learning for Alzheimer's classification using 3D MRI with site-aware techniques.

Ax Max Zimmer, Nico Pelleriti, Christophe Roux, Sebastian Pokutta 3/18/2026

The Agentic Researcher: A Practical Guide to AI-Assisted Research in Mathematics and Machine Learning

arXiv: Practical guide to AI-assisted research in mathematics and ML, covering productive tool use and responsible guardrails.

Ax Xiaoyi Li 3/18/2026

Auto Researching, not hyperparameter tuning: Convergence Analysis of 10,000 Experiments

arXiv: Analysis of 10,469 experiments by Claude Opus and Gemini agents across 108k design space cells for ML architecture search.

Ax Srijan Bansal, Jiao Fangkai, Yilun Zhou, Austin Xu, Shafiq Joty, Semih Yavuz 3/18/2026

VIBEPASS: Can Vibe Coders Really Pass the Vibe Check?

arXiv: VIBEPASS empirically evaluates LLM self-diagnosis and repair capabilities for autonomous software engineering.

Ax Nitish Nagesh, Elahe Khatibi, Thomas Hughes, Mahdi Bagheri, Pratik Gajane, Amir M. Rahmani 3/18/2026

Evaluating Causal Discovery Algorithms for Path-Specific Fairness and Utility in Healthcare

arXiv: Benchmarking causal discovery algorithms on synthetic healthcare data for fairness and utility evaluation.

Ax Emil Hardarson, Luka Biedebach, \'Omar Bessi \'Omarsson, Teitur Hr\'olfsson, Anna Sigridur Islind, Mar\'ia \'Oskarsd\'ottir 3/18/2026

Data-Local Autonomous LLM-Guided Neural Architecture Search for Multiclass Multimodal Time-Series Classification

arXiv: LLM-guided neural architecture search for multimodal time-series classification under data-locality constraints for healthcare.

Ax Aleph Alpha, :, Adnen Abdessaied, Artur Baranowski, Lukas Balles, Michael Barlow, Fabien C. Y. Benureau, Felix Berkenkamp, Lukas Bluebaum, Bastian Boll, Thomas F. Burns, Bj\"orn Deiseroth, Constantin Eichenberg, David Friede, Pablo Iyu Guerrero, Ahmed Hammam, Bastian Harren, Johann Higl, Yasser Jadidi, Carina Kauf, Johannes Messner, Jan Hendrik Metzen, Max Meuer, Vedant Nanda, Pit Neitemeier, Koen Oostermeijer, Letitia Parcalabescu, Markus Pernpointner, Felix Reinfurt, Dylan Rodriquez, Gr\'egory Schott, Philipp Siedler, Martin Simonovsky, Till Speicher, Volker Stampa, Stephan W\"aldchen, Samuel Weinbach, Gregor Ziegltrum 3/18/2026

A Family of LLMs Liberated from Static Vocabularies

arXiv: LLM family with dynamic tokenizers eliminating fixed vocabulary constraints, up to 70B parameters, improved domain/language adaptation.

Ax Hanxian Huang, Igor Fedorov, Andrey Gromov, Bernard Beckerman, Naveen Suda, David Eriksson, Maximilian Balandat, Rylan Conway, Patrick Huber, Chinnadhurai Sankar, Ayushi Dalmia, Zechun Liu, Lemeng Wu, Tarek Elgamal, Adithya Sagar, Vikas Chandra, Raghuraman Krishnamoorthi 3/18/2026

MobileLLM-Flash: Latency-Guided On-Device LLM Design for Industry Scale

MobileLLM-Flash methodology designs on-device LLMs optimized for latency constraints using hardware-in-the-loop architecture search.

Ax Zifan Xu, Ran Gong, Maria Vittoria Minniti, Ahmet Salih Gundogdu, Eric Rosen, Kausik Sivakumar, Riedana Yan, Zixing Wang, Di Deng, Peter Stone, Xiaohan Zhang, Karl Schmeckpeper 3/18/2026

ExpertGen: Scalable Sim-to-Real Expert Policy Learning from Imperfect Behavior Priors

ExpertGen automates expert policy generation in simulation for scalable sim-to-real robotic behavior cloning transfer.

Ax Shrey Shah, Justin Wagle 3/18/2026

MoLoRA: Composable Specialization via Per-Token Adapter Routing

MoLoRA enables per-token adapter routing for multimodal generation and mixed-capability requests in multi-adapter serving.

Ax Yeounoh Chung, Rushabh Desai, Jian He, Yu Xiao, Thibaud Hottelier, Yves-Laurent Kom Samo, Pushkar Kadilkar, Xianshun Chen, Sam Idicula, Fatma \"Ozcan, Alon Halevy, Yannis Papakonstantinou 3/18/2026

100x Cost & Latency Reduction: Performance Analysis of AI Query Approximation using Lightweight Proxy Models

Lightweight proxy models reduce LLM query costs and latency 100x for AI-augmented SQL operations.

Ax Callen MacPhee, Yiming Zhou, Koichiro Kishima, Bahram Jalali 3/18/2026

Standardizing Medical Images at Scale for AI

Physics-based preprocessing framework standardizes heterogeneous medical images at scale for improved model generalization.

Ax Jingxiang Chen, Minseok Kim, Seong-Gyun Leem, Yin Huang, Rashi Rungta, Zhicheng Ouyang, Haibin Wu, Surya Teja Appini, Ankur Bansal, Yang Bai, Yue Liu, Florian Metze, Ahmed A Aly, Anuj Kumar, Ariya Rastrow, Zhaojiang Lin 3/18/2026

Aligning Paralinguistic Understanding and Generation in Speech LLMs via Multi-Task Reinforcement Learning

Multi-task RL with chain-of-thought prompting aligns paralinguistic understanding and generation in speech LLMs.

Ax Jaesung Bae, Xiuwen Zheng, Minje Kim, Chang D. Yoo, Mark Hasegawa-Johnson 3/18/2026

Something from Nothing: Data Augmentation for Robust Severity Level Estimation of Dysarthric Speech

Three-stage framework for dysarthric speech severity estimation using pseudo-labeling and data augmentation.

Ax Mohammad Dastgheib, Fatemeh Pourmahdian 3/18/2026

The Midas Touch in Gaze vs. Hand Pointing: Modality-Specific Failure Modes and Implications for XR Interfaces

xr-adaptive-modality platform studies modality-specific interventions for XR interfaces balancing gaze and hand input.

Ax Saisha Pradeep Shetty, Roger Eric Goldman, Vladimir Filkov 3/18/2026

RadAnnotate: Large Language Models for Efficient and Reliable Radiology Report Annotation

RadAnnotate uses LLMs with retrieval augmentation and selective automation for efficient radiology report annotation.

Ax Atharva Sehgal, James Hou, Akanksha Sarkar, Ishaan Mantripragada, Swarat Chaudhuri, Jennifer J. Sun, Yisong Yue 3/18/2026

Evaluating Agentic Optimization on Large Codebases

FormulaCode benchmark evaluates LLM coding agents on repository-level codebase optimization with realistic multi-objective constraints.

Ax Subhransu S. Bhattacharjee, Dylan Campbell, Rahul Shome 3/18/2026

FlatLands: Generative Floormap Completion From a Single Egocentric View

FlatLands dataset and benchmark for bird's-eye view floor completion from single egocentric images.

Ax Fan Huang, Haewoon Kwak, Jisun An 3/18/2026

Understanding Moral Reasoning Trajectories in Large Language Models: Toward Probing-Based Explainability

Probing-based analysis of moral reasoning trajectories in LLMs across six models showing systematic multi-framework deliberation.

Ax Xiaozhou Ye, Feng Jiang, Zihan Wang, Xiulai Wang, Yutao Zhang, Kevin I-Kai Wang 3/18/2026

Collaborative Temporal Feature Generation via Critic-Free Reinforcement Learning for Cross-User Sensor-Based Activity Recognition

Critic-free RL approach for cross-user activity recognition from wearable sensors with temporal feature generation.

Ax Yanru Wu, Weiduo Yuan, Ang Qi, Vitor Guizilini, Jiageng Mao, Yue Wang 3/18/2026

Large Reward Models: Generalizable Online Robot Reward Generation with Vision-Language Models

Framework adapts vision-language models as online reward generators for robotic reinforcement learning policy refinement.

Ax Yuanhe Zhang, Xinyue Wang, Zhican Chen, Weiliu Wang, Zilu Zhang, Zhengshuo Gong, Zhenhong Zhou, Li Sun, Yang Liu, Sen Su 3/18/2026

Resource Consumption Threats in Large Language Models

Survey of resource consumption threats in LLMs including excessive generation, covering efficiency challenges for providers and users.

Ax Ri Chi Ng, Aditi Kumaresan, Yujia Hu, Roy Ka-Wei Lee 3/18/2026

SEAHateCheck: Functional Tests for Detecting Hate Speech in Low-Resource Languages of Southeast Asia

SEAHateCheck introduces functional test dataset for hate speech detection in low-resource Southeast Asian languages.

Ax Hui Shan, Keyang Luo, Ming Li, Sizhe Zheng, Yanwei Fu, Zhen Chen, Xiangru Huang 3/18/2026

Interact3D: Compositional 3D Generation of Interactive Objects

Interact3D generates compositional 3D objects from single images while preserving spatial relationships and handling occlusions.

Ax Chang Nie, Tianchen Deng, Guangming Wang, Zhe Liu, Hesheng Wang 3/18/2026

Towards the Vision-Sound-Language-Action Paradigm: The HEAR Framework for Sound-Centric Manipulation

HEAR framework extends vision-language-action models to incorporate real-time sound for robotic manipulation tasks.

Ax Hui Wang, Tianzhu Hu, Mingming Li, Xi Zhou, Chun Gan, Jiao Dai, Jizhong Han, Songlin Hu, Tao Guo 3/18/2026

RecBundle: A Next-Generation Geometric Paradigm for Explainable Recommender Systems

RecBundle proposes geometric framework for recommender systems addressing information cocoons through topological representation learning.

Ax Tianyi Huang, Ying Kai Deng 3/18/2026

CounterRefine: Answer-Conditioned Counterevidence Retrieval for Inference-Time Knowledge Repair in Factual Question Answering

Inference-time repair layer for retrieval-grounded QA using answer-conditioned counterevidence retrieval to fix commitment errors.

Ax Shin'ya Yamaguchi, Daiki Chijiwa, Tamao Sakao, Taku Hasegawa 3/18/2026

Parallel In-context Learning for Large Vision Language Models

Parallel in-context learning method reducing latency in vision-language models by decoupling demonstration processing from query encoding.

Ax Alejandro Paredes La Torre 3/18/2026

Diffusion Models for Joint Audio-Video Generation

Diffusion models for joint audio-video generation with two high-quality paired datasets.

Ax Elad Hirsch, Shubham Yadav, Mohit Garg, Purvanshi Mehta 3/18/2026

LICA: Layered Image Composition Annotations for Graphic Design Research

Large-scale dataset of 1.55M multi-layer graphic design compositions with hierarchical metadata for layout research.

Ax Noppanat Wadlom, Junyi Shen, Yao Lu 3/18/2026

Efficient LLM Serving for Agentic Workflows: A Data Systems Perspective

LLM serving system optimizing agentic workflows by handling cross-call dependencies and redundancy from speculative execution.

Ax Francesco Pio Monaco, Elia Cunegatti, Flavio Vella, Giovanni Iacca 3/18/2026

Frequency Matters: Fast Model-Agnostic Data Curation for Pruning and Quantization

Data curation method for calibration in LLM compression via frequency-based selection for pruning and quantization.

Ax Peng Zhang 3/18/2026

RepoReviewer: A Local-First Multi-Agent Architecture for Repository-Level Code Review

Local-first multi-agent architecture for automated repository code review with LangGraph orchestration and structured analysis.

Ax Tik Yu Yim, Wenting Tan, Sum Yee Chan, Tak-Wah Lam, Siu Ming Yiu 3/18/2026

ASDA: Automated Skill Distillation and Adaptation for Financial Reasoning

Automated skill distillation and adaptation method for financial reasoning in LLMs without fine-tuning.

Ax Minbing Chen, Zhu Meng, Fei Su 3/18/2026

PathGLS: Evaluating Pathology Vision-Language Models without Ground Truth through Multi-Dimensional Consistency

Reference-free evaluation framework for pathology vision-language models to detect hallucinations without ground truth.

Ax Songcheng Cai, Zhiheng Lyu, Yuansheng Ni, Xiangchao Chen, Baichuan Zhou, Shenzhe Zhu, Yi Lu, Haozhe Wang, Chi Ruan, Benjamin Schneider, Weixu Zhang, Xiang Li, Andy Zheng, Yuyu Zhang, Ping Nie, Wenhu Chen 3/18/2026

SWE-QA-Pro: A Representative Benchmark and Scalable Training Recipe for Repository-Level Code Understanding

Benchmark for repository-level code understanding with executable environments, enabling agentic code automation tasks.

Ax Shesh Narayan Gupta, Nik Bear Brown 3/18/2026

When Generative Augmentation Hurts: A Benchmark Study of GAN and Diffusion Models for Bias Correction in AI Classification Systems

Benchmark comparing generative augmentation strategies (GANs, diffusion) for bias correction in imbalanced classification under low-data conditions.

Ax Mengyuan Li, Qianfan Lu, Jiachen Tian, Hongjun Hu, Yu Han, Xiao Li, Chao-kai Wen, Shi Jin 3/18/2026