Isolater - Feed

Ax Vedanta S P, Ponnurangam Kumaraguru 3/20/2026

I Can't Believe It's Corrupt: Evaluating Corruption in Multi-Agent Governance Systems

Evaluates whether multi-agent LLM governance systems follow institutional rules when granted authority, finding integrity requires pre-deployment safeguards.

Ax Matt Gorbett, Suman Jana 3/20/2026

Secure Linear Alignment of Large Language Models

Studies cross-model alignment of LLM representations for downstream objectives with applications in privacy-preserving and security-constrained settings.

Ax Diego Calvanese, Angelo Casciani, Giuseppe De Giacomo, Marlon Dumas, Fabiana Fournier, Timotheus Kampik, Emanuele La Malfa, Lior Limonad, Andrea Marrella, Andreas Metzger, Marco Montali, Daniel Amyot, Peter Fettke, Artem Polyvyanyy, Stefanie Rinderle-Ma, Sebastian Sardi\~na, Niek Tax, Barbara Weber 3/20/2026

Agentic Business Process Management: A Research Manifesto

Research manifesto proposing Agentic Business Process Management paradigm extending BPM for governing autonomous agents executing organizational processes.

Ax Dario Compagno, Fabio Massimo Zennaro 3/20/2026

Teleological Inference in Structural Causal Models via Intentional Interventions

Extends structural causal models with intentional interventions operator for teleological inference about goal-directed agent behavior in causal systems.

Ax Peng Gang 3/20/2026

Evaluating 5W3H Structured Prompting for Intent Alignment in Human-AI Interaction

Evaluates PPS (5W3H-based structured prompting framework) for reducing intent transmission loss between users and LLMs across business, technical, and travel domains.

Ax Pronob Kumar Barman, Pronoy Kumar Barman 3/20/2026

Unmasking Algorithmic Bias in Predictive Policing: A GAN-Based Simulation Framework with Multi-City Temporal Analysis

GAN-based simulation framework measuring racial bias propagation in predictive policing systems across multiple US cities with temporal analysis.

Ax Chun-Jui Wang, Jian-Ting Guo, Hung Guei, Chung-Chin Shih, Ti-Rong Wu, I-Chen Wu 3/20/2026

Evaluating Game Difficulty in Tetris Block Puzzle

Uses Stochastic Gumbel AlphaZero to evaluate difficulty in Tetris Block Puzzle variants, applying game-playing AI as evaluator for puzzle design.

Ax Rui Chai 3/20/2026

Regret Bounds for Competitive Resource Allocation with Endogenous Costs

Analyzes online resource allocation among interacting modules with endogenous costs under uniform, gated, and competitive allocation paradigms with regret bounds.

Ax Jonah Leshin, Manish Shah, Ian Timmis, Daniel Kang 3/20/2026

Behavioral Fingerprints for LLM Endpoint Stability and Identity

Stability Monitor: behavioral fingerprinting system tracking LLM endpoint identity changes from model updates, quantization, inference engines beyond traditional uptime metrics.

Ax Qiawen Ella Liu, Marina Dubova, Henry Conklin, Takumi Harada, Thomas L. Griffiths 3/20/2026

Serendipity by Design: Evaluating the Impact of Cross-domain Mappings on Human and LLM Creativity

Evaluates whether cross-domain mapping interventions increase creativity equally in humans and LLMs through product feature generation experiments.

Ax Dana\'e Broustail, Anna Tegon, Thorir Mar Ingolfsson, Yawei Li, Luca Benini 3/20/2026

LuMamba: Latent Unified Mamba for Electrode Topology-Invariant and Efficient EEG Modeling

LuMamba: self-supervised Mamba architecture for EEG modeling with topology-invariant electrode handling and improved computational efficiency over Transformers.

Ax Maksym Del, Markus K\"angsepp, Marharyta Domnich, Ardi Tampuu, Lisa Yankovskaya, Meelis Kull, Mark Fishel 3/20/2026

How Uncertainty Estimation Scales with Sampling in Reasoning Models

Studies how uncertainty estimation scales with parallel sampling in reasoning models using self-consistency and verbalized confidence across mathematics and STEM tasks.

Ax Qiang Li, XiangRui Zhang, Haining Wang 3/20/2026

Implicit Patterns in LLM-Based Binary Analysis

Large-scale trace-level study showing multi-pass LLM reasoning in binary vulnerability analysis exhibits structured, token-level exploration patterns across hundreds of steps.

Ax Jonathan Lys, Vincent Gripon, Bastien Pasdeloup, Axel Marmoret, Lukas Mauch, Fabien Cardinaux, Ghouthi Boukli Hacene 3/20/2026

D5P4: Partition Determinantal Point Process for Diversity in Parallel Discrete Diffusion Decoding

D5P4: generalized beam-search framework using determinantal point processes for diverse parallel decoding in discrete diffusion text generation models.

Ax Yuyang Liu 3/20/2026

cuGenOpt: A GPU-Accelerated General-Purpose Metaheuristic Framework for Combinatorial Optimization

cuGenOpt: GPU-accelerated metaheuristic framework for combinatorial optimization balancing generality, performance, and usability across logistics and scheduling problems.

Ax Zou Qiang 3/20/2026

Box Maze: A Process-Control Architecture for Reliable LLM Reasoning

Box Maze framework enforces LLM reasoning integrity through process-control architecture to mitigate hallucination and unreliable reasoning under adversarial prompting.

Ax Zehao Li, Zhenyu Wu, Yibo Zhao, Bowen Yang, Jingjing Xie, Zhaoyang Liu, Zhoumianze Liu, Kaiming Jin, Jianze Liang, Zonglin Li, Feng Wu, Bowen Zhou, Zun Wang, Zichen Ding 3/20/2026

OS-Themis: A Scalable Critic Framework for Generalist GUI Rewards

OS-Themis: scalable multi-agent critic framework using decomposed trajectory milestones for training robust GUI agents with reinforcement learning.

Ax Sawsan Alqahtani, Garima Lalwani, Yi Zhang, Salvatore Romeo, Saab Mansour 3/20/2026

Using Optimal Transport as Alignment Objective for fine-tuning Multilingual Contextualized Embeddings

Uses optimal transport as alignment objective for fine-tuning multilingual contextualized embeddings to improve cross-lingual word representations.

Ax Anna Babarczy, Andras Lukacs, Peter Vedres, Zeteny Bujka 3/20/2026

Do Large Language Models Possess a Theory of Mind? A Comparative Evaluation Using the Strange Stories Paradigm

Comparative study evaluating whether LLMs demonstrate Theory of Mind capabilities using psychological paradigms.

Ax Fangrui Huang, Souhad Chbeir, Arpandeep Khatua, Sheng Wang, Sijun Tan, Kenan Ye, Lily Bailey, Merryn Daniel, Ryan Louie, Sanmi Koyejo, Ehsan Adeli 3/20/2026

TherapyGym: Evaluating and Aligning Clinical Fidelity and Safety in Therapy Chatbots

TherapyGym evaluation framework for therapy chatbots measuring clinical fidelity and safety using psychotherapy rating scales.

Ax Wei Chen, Guoyang Ju, Yuanyuan Qi 3/20/2026

How Confident Is the First Token? An Uncertainty-Calibrated Prompt Optimization Framework for Large Language Model Classification and Understanding

Uncertainty-calibrated prompt optimization framework for LLM classification that measures model confidence to improve reliability.

Ax Yifei Zhu, Songpo Yang, Jiangnan Zhu, Junyan Jiang 3/20/2026

Agentic Framework for Political Biography Extraction

LLM-based agent framework for automated extraction of structured political biography data from unstructured sources at scale.

Ax Penghao Liang, Mengwei Yuan, Jianan Liu, Jing Yang, Xianyou Li, Weiran Yan, Yichao Wu 3/20/2026

DynaRAG: Bridging Static and Dynamic Knowledge in Retrieval-Augmented Generation

DynaRAG framework extending RAG with dynamic API calls for time-sensitive queries; includes sufficiency classification and reranking.

Ax Trishita Dhara, Siddhesh Sheth 3/20/2026

Beyond Accuracy: An Explainability-Driven Analysis of Harmful Content Detection

Analysis of explainability in harmful content detection models, examining predictions on borderline and contextual cases.

Ax Zhenwei Tang, Arun Verma, Zijian Zhou, Zhaoxuan Wu, Alok Prakash, Daniela Rus, Bryan Kian Hsiang Low 3/20/2026

MineDraft: A Framework for Batch Parallel Speculative Decoding

MineDraft framework for batch parallel speculative decoding to accelerate LLM inference by parallelizing draft and verification stages.

Ax Harshita Diddee, Gregory Yauney, Swabha Swayamdipta, Daphne Ippolito 3/20/2026

BenchBrowser -- Collecting Evidence for Evaluating Benchmark Validity

Tool for collecting granular metadata about language model benchmarks to verify alignment with practitioner goals and test coverage.

Ax Jianan Pan, Kejie Huang 3/20/2026

PCOV-KWS: Multi-task Learning for Personalized Customizable Open Vocabulary Keyword Spotting

Multi-task learning framework for personalized open-vocabulary keyword spotting with privacy and customization for voice assistants.

Ax Jianan Pan, Yuanming Zhang, Kejie Huang 3/20/2026

ProKWS: Personalized Keyword Spotting via Collaborative Learning of Phonemes and Prosody

Keyword spotting framework integrating phoneme learning with personalized prosody modeling for speaker-specific voice recognition.

Ax Yongchao Martin Ma, Zhongzhun Deng 3/20/2026

Understanding the Relationship Between Firms' AI Technology Innovation and Consumer Complaints

Study examining relationship between firms' AI technology innovation investments and consumer complaint patterns.

Ax Kyeonghyun Yoo, Wooyong Jung, Namkyung Yoon, Sangmin Lee, Sanghong Kim, Hwangnam Kim 3/20/2026

KD-EKF: Knowledge-Distilled Adaptive Covariance EKF for Robust UWB/PDR Indoor Localization

Adaptive Extended Kalman Filter using knowledge distillation for improved UWB/PDR indoor localization under NLOS conditions.

Ax J. Clayton Kerce 3/20/2026

Engineering Verifiable Modularity in Transformers via Per-Layer Supervision

Method for increasing transformer modularity and interpretability through per-layer supervision to overcome distributed redundancy.

Ax Hao Ke 3/20/2026

Quine: Realizing LLM Agents as Native POSIX Processes

Quine runtime that implements LLM agents as native POSIX processes using OS-level isolation and scheduling instead of application-layer frameworks.

Ax Natalia Wojak-Strzelecka, Szymon Bobek, Grzegorz J. Nalepa, Jerzy Stefanowski 3/20/2026

Towards Differentiating Between Failures and Domain Shifts in Industrial Data Streams

Method for distinguishing between system failures and domain shifts in industrial data streams using anomaly detection.

Ax Scott Thornton 3/20/2026

Semantic Chameleon: Corpus-Dependent Poisoning Attacks and Defenses in RAG Systems

Study of poisoning attacks against RAG systems where adversaries corrupt retrieval corpora to manipulate LLM outputs; includes defenses.

Ax Sunil Prakash 3/20/2026

The Provenance Paradox in Multi-Agent LLM Routing: Delegation Contracts and Attested Identity in LDP

Research on multi-agent LLM routing systems showing that quality-based delegation can fail when agents misreport performance; proposes delegation contracts to address this.

Ax Zhaohui Geoffrey Wang 3/20/2026

NANOZK: Layerwise Zero-Knowledge Proofs for Verifiable Large Language Model Inference

NANOZK: Zero-knowledge proof system enabling cryptographic verification that proprietary LLM API outputs actually used claimed models.

Ax Naichuan Zheng, Hailun Xia, Zepeng Sun, Weiyi Li, Yujia Wang 3/20/2026

S3T-Former: A Purely Spike-Driven State-Space Topology Transformer for Skeleton Action Recognition

S3T-Former: Energy-efficient spike-driven state-space transformer for skeleton-based action recognition on resource-constrained edge devices.

Ax Yi Ting Shen, Kentaroh Toyoda, Alex Leung 3/20/2026

MCP-38: A Comprehensive Threat Taxonomy for Model Context Protocol Systems (v1.0)

MCP-38: Protocol-specific threat taxonomy with 38 threat categories for Model Context Protocol systems derived through systematic methodology.

Ax Timothy Oh 3/20/2026

A Synthesizable RTL Implementation of Predictive Coding Networks

Synthesizable RTL implementation of predictive coding networks enabling online, distributed hardware learning as alternative to backpropagation.

Ax Yi Yu, Junzhuo Ma, Chenghuang Shen, Xingyan Liu, Jing Gu, Hangyi Sun, Guangquan Hu, Jianfeng Liu, Weiting Liu, Mingyue Pu, Yu Wang, Zhengdong Xiao, Rui Xie, Longjiu Luo, Qianrong Wang, Gurong Cui, Honglin Qiao, Wenlian Lu 3/20/2026

Lightweight Adaptation for LLM-based Technical Service Agent: Latent Logic Augmentation and Robust Noise Reduction

Lightweight LLM adaptation framework for technical service agents using latent logic augmentation and noise reduction techniques.

Ax Prince Zizhuang Wang, Shuli Jiang 3/20/2026

SLEA-RL: Step-Level Experience Augmented Reinforcement Learning for Multi-Turn Agentic Training

SLEA-RL: Step-level experience augmentation for multi-turn LLM agent training enabling dynamic retrieval and leveraging accumulated episode experiences.

Ax Ratun Rahman, Dinh C. Nguyen 3/20/2026

Probabilistic Federated Learning on Uncertain and Heterogeneous Data with Model Personalization

Meta-BayFL: Probabilistic federated learning framework with Bayesian neural networks for heterogeneous data and model personalization.

Ax Daisuke Yasui, Toshitaka Matsuki, Hiroshi Sato 3/20/2026

Uncovering Latent Phase Structures and Branching Logic in Locomotion Policies: A Case Study on HalfCheetah

Study uncovering latent phase structures and branching logic in deep RL locomotion policies for HalfCheetah control task interpretability.

Ax Hao Ma, Zhiqiang Pu, Yang Liu, Xiaolin Ai 3/20/2026

Enhancing Reinforcement Learning Fine-Tuning with an Online Refiner

Dynamic constraints framework for reinforcement learning fine-tuning that adapts constraints based on model capabilities to balance stability and optimization.

Ax Thomas Duboudin, Xavier Fontaine, Etienne Andrier, Lionel Guillou, Alexandre Filiot, Thalyssa Baiocco-Rodrigues, Antoine Olivier, Alberto Romagnoni, John Klein, Jean-Baptiste Schiratti 3/20/2026

CytoSyn: a Foundation Diffusion Model for Histopathology -- Tech Report

CytoSyn: Foundation diffusion model for computational histopathology enabling cell segmentation and tumor analysis from digitized slides.

Ax Ciprian Paduraru, Petru-Liviu Bouruc, Alin Stefanescu 3/20/2026

A Trace-Based Assurance Framework for Agentic AI Orchestration: Contracts, Testing, and Governance

Trace-based assurance framework for agentic AI orchestration with contracts, testing, and governance for LLM-coordinated multi-agent systems.

Ax Mohammed Rahman Sherif Khan Mohammad, Ardhendu Behera, Sandip Pradhan, Swagat Kumar, Amr Ahmed 3/20/2026

Training-Only Heterogeneous Image-Patch-Text Graph Supervision for Advancing Few-Shot Learning Adapters

Training-only framework for few-shot CLIP adapters using heterogeneous image-patch-text graph supervision without inference cost overhead.

Ax Rahul D Ray 3/20/2026

ARTEMIS: A Neuro Symbolic Framework for Economically Constrained Market Dynamics

ARTEMIS: Neuro-symbolic framework combining neural operators and SDEs for interpretable, arbitrage-free quantitative finance models.

Ax Santosh Arron 3/20/2026

Discovery of Bimodal Drift Rate Structure in FRB 20240114A: Evidence for Dual Emission Regions

Discovery of bimodal drift rate structure in fast radio burst FRB 20240114A using unsupervised machine learning for astrophysics analysis.

Ax Sahil Tyagi, Feiyi Wang 3/20/2026

Tula: Optimizing Time, Cost, and Generalization in Distributed Large-Batch Training

Tula: Optimization framework for distributed large-batch training balancing communication overhead, computation cost, and generalization performance.