Directional Influence Function: Estimating Training Data Influence in Constrained Learning

ICLR 2026 Conference SubmissionAnonymous Authors

OpenReview Score: 6.0 Download Report PDF

Directional Influence FunctionConstrained LearningDeep LearningSensitivity analysisVariational inequality

Constrained learning has been increasingly applied to various domains to ensure explicit feasibility requirements due to fairness, safety, robustness, regularization, and physics or logic constraints. Understanding how training samples influence the solution (e.g., learned parameters) of constrained learning is crucial for interpretability and robustness. The classical influence function (IF) may becomes unreliable in constrained settings: data perturbations can reshape both the objective and the feasible region, leading to estimates that violate feasibility. In response, we propose the Directional Influence Function (DIF), a new estimator that explicitly incorporates the constraints into influence estimation. DIF formulates the optimality conditions of constrained learning as a variational inequality (VI) and analyzes how perturbing training data affects this VI. We validate DIF in constrained linear regression and demonstrate that it recovers leave-one-out retraining results, whereas IF and penalty-based IF exhibit significant bias. We further apply DIF to fairness-constrained CNNs, where DIF accurately predicts test loss changes under data removal and aligns closely with actual retraining. Our results establish DIF as an efficient and reliable tool for data attribution in constrained learning.

Abstract:

Disclaimer

This report is AI-GENERATED using Large Language Models and WisPaper (A scholar search engine). It analyzes academic papers' tasks and contributions against retrieved prior work. While this system identifies POTENTIAL overlaps and novel directions, ITS COVERAGE IS NOT EXHAUSTIVE AND JUDGMENTS ARE APPROXIMATE. These results are intended to assist human reviewers and SHOULD NOT be relied upon as a definitive verdict on novelty.

NOTE that some papers exist in multiple, slightly different versions (e.g., with different titles or URLs). The system may retrieve several versions of the same underlying work. The current automated pipeline does not reliably align or distinguish these cases, so human reviewers will need to disambiguate them manually.

If you have any questions, please contact: mingzhang23@m.fudan.edu.cn

Overview

Overall Novelty Assessment

The paper introduces the Directional Influence Function (DIF) to estimate how training data perturbations affect solutions in constrained learning settings. It resides in the 'Influence Functions in Constrained Settings' leaf, which contains only two papers total (including this one). This places the work in a relatively sparse research direction within the broader taxonomy of 30 papers across influence estimation, data selection, fairness, and constrained optimization. The limited sibling count suggests that adapting influence functions to handle explicit constraints remains an underexplored niche.

The taxonomy reveals that neighboring branches address related but distinct challenges. 'Dynamics of Learning with Restricted Training Sets' (four papers) examines theoretical properties when training set size is proportional to dimensionality, while 'Instance-Level Fairness Impact Analysis' and 'Fairness-Constrained Classifier Training' focus on bias mitigation rather than general constraint handling. The 'Constrained Optimization and Learning' branch encompasses constraint learning and neural network methods but does not emphasize influence estimation. This structural separation indicates that DIF bridges a gap between classical influence analysis and the broader constrained optimization literature.

Among 30 candidates examined, the variational inequality formulation (Contribution 2) encountered two refutable candidates, suggesting some overlap with existing sensitivity analysis frameworks. In contrast, the core DIF estimator (Contribution 1) and the quadratic programming computation (Contribution 3) each examined 10 candidates with zero refutations, indicating less direct prior work within this limited search scope. The statistics imply that while the VI-based sensitivity framework connects to known techniques, the specific DIF construction and its computational approach appear more distinct among the top-30 semantic matches.

Based on the limited search scope of 30 candidates, the work appears to occupy a relatively novel position at the intersection of influence estimation and constrained learning. The sparse taxonomy leaf and low refutation counts for two of three contributions suggest incremental but meaningful extension of classical influence functions. However, the analysis does not cover exhaustive literature beyond top-K semantic retrieval, leaving open the possibility of additional relevant prior work in optimization theory or fairness-aware machine learning.

Taxonomy

Core-task Taxonomy Papers

Claimed Contributions

Contribution Candidate Papers Compared

Refutable Paper

Research Landscape Overview

Core task: estimating training data influence in constrained learning. The field encompasses methods for understanding how individual training examples shape model behavior when learning is subject to constraints—whether those constraints arise from fairness requirements, optimization structure, or domain-specific restrictions. The taxonomy organizes this landscape into several main branches: Influence Estimation Methods and Theory develops foundational techniques (such as influence functions) to quantify data impact; Training Data Selection and Reduction focuses on pruning or prioritizing examples to improve efficiency; Fairness-Constrained Learning addresses scenarios where models must satisfy demographic parity or similar criteria; Constrained Optimization and Learning covers algorithmic frameworks that incorporate explicit constraints during training; and Application Domains illustrates how these ideas manifest in areas like medical imaging, astronomy, and conversational AI. Representative works such as Dataset Pruning[2] and EraseDiff[1] exemplify data selection strategies, while studies like Training fairness-constrained classifiers[14] and Neural networks for constrained[5] highlight the interplay between constraints and learning dynamics. A particularly active line of work explores how influence functions—originally designed for unconstrained settings—can be adapted when constraints are present, raising questions about computational tractability and theoretical guarantees. The Directional Influence Function[0] sits squarely within this branch, extending classical influence analysis to handle directional constraints and offering a principled way to assess data impact under such restrictions. This contrasts with nearby efforts like Right for Better Reasons[12], which emphasizes interpretability and causal reasoning in constrained contexts, and Understanding instance-level impact[13], which investigates per-example contributions more broadly. Meanwhile, works in fairness-constrained learning (e.g., Training fairness-constrained classifiers[14]) and constrained optimization (e.g., Learning constraints and optimization[11]) tackle related but distinct challenges—balancing multiple objectives or embedding hard constraints—underscoring ongoing debates about scalability, approximation quality, and the trade-offs between influence estimation accuracy and computational cost.

Claimed Contributions

Directional Influence Function (DIF) for constrained learning

10 retrieved papers

The authors introduce DIF, a novel influence estimation method designed specifically for constrained learning problems. Unlike classical influence functions that fail under constraints, DIF uses directional derivatives to quantify how training data affects model solutions while respecting feasibility requirements imposed by constraints.

10 retrieved papers

Variational inequality formulation and sensitivity analysis framework

Can Refute

10 retrieved papers

The authors formalize data attribution for constrained learning by casting optimality conditions as a variational inequality and performing local sensitivity analysis. This VI-based framework enables systematic analysis of how data perturbations affect solutions in the presence of constraints.

10 retrieved papers

Can Refute

Efficient quadratic programming computation of DIF

10 retrieved papers

The authors show that computing DIF reduces to solving a quadratic program, providing an efficient computational method. They also establish that DIF generalizes classical influence functions, recovering them as a special case when no constraints are active.

10 retrieved papers

Core Task Comparisons

Comparisons with papers in the same taxonomy category

[12] Right for Better Reasons: Training Differentiable Models by Constraining their Influence Functions PDF

Xiaoting Shao, Arseny Skryagin, Wolfgang Stammer, Patrick Schramowski, Kristian Kersting, P. Schramowski, Xiao-Ting Shao, K. Kersting (2021)

Contribution Analysis

Detailed comparisons for each claimed contribution

Contribution

Directional Influence Function (DIF) for constrained learning

[41] A set scalarization function and Dini directional derivatives with applications in set optimization problems PDF

Cannot Refute

[42] Directional derivative of the value function for parametric set-constrained optimization problems PDF

Cannot Refute

[43] Policy learning for localized interventions from observational data PDF

Cannot Refute

[44] Dynamic Optimization of Path-Constrained Switched Systems PDF

Cannot Refute

[45] A shape optimization algorithm based on directional derivatives for threeâdimensional contact problems PDF

Cannot Refute

[46] Directional differentiability for shape optimization with variational inequalities as constraints PDF

Cannot Refute

[47] Leveling with Lagrange: an alternate view of constrained optimization PDF

Cannot Refute

[48] Convex directional derivatives in optimization PDF

Cannot Refute

[49] On directional derivative methods for solving optimal parameter selection problems PDF

Cannot Refute

[50] Taylor approximations PDF

Cannot Refute

Contribution

Variational inequality formulation and sensitivity analysis framework

[51] General variational inequalities and optimization PDF

Can Refute

[52] Sensitivity analysis in variational inequalities PDF

Can Refute

[53] Stability and sensitivity analysis for quasi-variational inequalities PDF

Cannot Refute

[54] New Iterative Methods and Sensitivity Analysis for Inverse Quasi Variational Inequalities PDF

Cannot Refute

[55] Solution approaches and sensitivity analysis of variational inequalities PDF

Cannot Refute

[56] Sensitivity analysis of elliptic variational inequalities of the first and the second kind PDF

Cannot Refute

[57] Adaptive projection-free methods for constrained variational inequalities in machine learning PDF

Cannot Refute

[58] Well-Posedness, Optimal Control, and Sensitivity Analysis for a Class of Differential Variational-Hemivariational Inequalities PDF

Cannot Refute

[59] Sensitivity analysis of optimal control problems driven by dynamic history-dependent variational-hemivariational inequalities PDF

Cannot Refute

[60] Charging Pricing in Power-Traffic Systems With Price-Elastic Demand: A Quasi-Variational Inequality Approach PDF

Cannot Refute

Contribution

Efficient quadratic programming computation of DIF

[31] Silvicultural regime shapes understory functional structure in European forests PDF

Cannot Refute

[32] Most influential subset selection: Challenges, promises, and beyond PDF

Cannot Refute

[33] Tube-Based Control Barrier Function With Integral Quadratic Constraints for Unknown Input Delay PDF

Cannot Refute

[34] Computer-controlled finishing via dynamically constraint position-velocity-time scheduler PDF

Cannot Refute

[35] An efficient sequential strategy for non-probabilistic reliability-based topology optimization (NRBTO) of continuum structures with stress constraints PDF

Cannot Refute

[36] A novel stress influence function (SIF) methodology for stress-constrained continuum topology optimization PDF

Cannot Refute

[37] An Inequality Constrained SL/QP Method for Minimizing the Spectral Abscissa PDF

Cannot Refute

[38] Data-Driven Soft Sensor for Online Composition Estimation with Adaptive-Window Regression and QP-Constrained Kalman Estimator PDF

Cannot Refute

[39] Robust autoregressive estimates using quadratic programming PDF

Cannot Refute

[40] Improved model-based wavefront sensorless adaptive optics for extended objects using N+ 2 images PDF

Cannot Refute

Directional Influence Function: Estimating Training Data Influence in Constrained Learning

Overview

Overall Novelty Assessment

Taxonomy

Research Landscape Overview

Claimed Contributions

Core Task Comparisons

[12] Right for Better Reasons: Training Differentiable Models by Constraining their Influence Functions PDF

Contribution Analysis

Directional Influence Function (DIF) for constrained learning

[41] A set scalarization function and Dini directional derivatives with applications in set optimization problems PDF

[42] Directional derivative of the value function for parametric set-constrained optimization problems PDF

[43] Policy learning for localized interventions from observational data PDF

[44] Dynamic Optimization of Path-Constrained Switched Systems PDF

[45] A shape optimization algorithm based on directional derivatives for threeâdimensional contact problems PDF

[46] Directional differentiability for shape optimization with variational inequalities as constraints PDF

[47] Leveling with Lagrange: an alternate view of constrained optimization PDF

[48] Convex directional derivatives in optimization PDF

[49] On directional derivative methods for solving optimal parameter selection problems PDF

[50] Taylor approximations PDF

Variational inequality formulation and sensitivity analysis framework

[51] General variational inequalities and optimization PDF

[52] Sensitivity analysis in variational inequalities PDF

[53] Stability and sensitivity analysis for quasi-variational inequalities PDF

[54] New Iterative Methods and Sensitivity Analysis for Inverse Quasi Variational Inequalities PDF

[55] Solution approaches and sensitivity analysis of variational inequalities PDF

[56] Sensitivity analysis of elliptic variational inequalities of the first and the second kind PDF

[57] Adaptive projection-free methods for constrained variational inequalities in machine learning PDF

[58] Well-Posedness, Optimal Control, and Sensitivity Analysis for a Class of Differential Variational-Hemivariational Inequalities PDF

[59] Sensitivity analysis of optimal control problems driven by dynamic history-dependent variational-hemivariational inequalities PDF

[60] Charging Pricing in Power-Traffic Systems With Price-Elastic Demand: A Quasi-Variational Inequality Approach PDF

Efficient quadratic programming computation of DIF

[31] Silvicultural regime shapes understory functional structure in European forests PDF

[32] Most influential subset selection: Challenges, promises, and beyond PDF

[33] Tube-Based Control Barrier Function With Integral Quadratic Constraints for Unknown Input Delay PDF

[34] Computer-controlled finishing via dynamically constraint position-velocity-time scheduler PDF

[35] An efficient sequential strategy for non-probabilistic reliability-based topology optimization (NRBTO) of continuum structures with stress constraints PDF

[36] A novel stress influence function (SIF) methodology for stress-constrained continuum topology optimization PDF

[37] An Inequality Constrained SL/QP Method for Minimizing the Spectral Abscissa PDF

[38] Data-Driven Soft Sensor for Online Composition Estimation with Adaptive-Window Regression and QP-Constrained Kalman Estimator PDF

[39] Robust autoregressive estimates using quadratic programming PDF

[40] Improved model-based wavefront sensorless adaptive optics for extended objects using N+ 2 images PDF

Table of Contents

[45] A shape optimization algorithm based on directional derivatives for threeâdimensional contact problems PDF