CoDA: Agentic Systems for Collaborative Data Visualization

ICLR 2026 Conference SubmissionAnonymous Authors

OpenReview Score: 7.3 Download Report PDF

LLMmulti-agent systemvisualization

Automating data visualization from natural language is crucial for data science, yet current systems struggle with complex datasets containing multiple files and iterative refinement. Existing approaches, including simple single- or multi-agent systems, often oversimplify the task, focusing on initial query parsing while failing to robustly manage data complexity, code errors, or final visualization quality. In this paper, we reframe this challenge as a collaborative multi-agent problem. We introduce CoDA, a multi-agent system that employs specialized LLM agents for metadata analysis, task planning, code generation, and iterative reflection. We formalize this pipeline, demonstrating how metadata-focused analysis bypasses token limits and quality-driven refinement ensures robustness. Extensive evaluations show CoDA achieves substantial gains in the overall score, outperforming competitive baselines by up to 41.5%. This work demonstrates that the future of visualization automation lies not in isolated code generation but in integrated, collaborative agentic workflows.

Abstract:

Disclaimer

This report is AI-GENERATED using Large Language Models and WisPaper (A scholar search engine). It analyzes academic papers' tasks and contributions against retrieved prior work. While this system identifies POTENTIAL overlaps and novel directions, ITS COVERAGE IS NOT EXHAUSTIVE AND JUDGMENTS ARE APPROXIMATE. These results are intended to assist human reviewers and SHOULD NOT be relied upon as a definitive verdict on novelty.

NOTE that some papers exist in multiple, slightly different versions (e.g., with different titles or URLs). The system may retrieve several versions of the same underlying work. The current automated pipeline does not reliably align or distinguish these cases, so human reviewers will need to disambiguate them manually.

If you have any questions, please contact: mingzhang23@m.fudan.edu.cn

Overview

Overall Novelty Assessment

The paper introduces CoDA, a multi-agent system employing specialized LLM agents for metadata analysis, task planning, code generation, and iterative reflection to automate data visualization from natural language. It resides in the 'Multi-Agent LLM Systems' leaf of the taxonomy, which contains only four papers total, including CoDA itself. This represents a relatively sparse but rapidly growing research direction within the broader field of natural language-driven visualization, suggesting the multi-agent paradigm is still emerging compared to more established single-agent or direct prompting approaches.

The taxonomy reveals that CoDA's immediate neighbors include other multi-agent frameworks like nvAgent and VizGen, which similarly decompose visualization tasks into modular sub-tasks handled by specialized agents. The parent branch, 'Large Language Model-Based Translation Approaches', also encompasses 'Direct LLM Prompting and Code Generation' (five papers) and 'LLM-Based Grammar-Agnostic Generation' (two papers), indicating alternative architectural strategies. Adjacent branches such as 'Conversational Visualization Systems' and 'Exploratory Data Analysis Interfaces' address iterative refinement and dialogue, but through different mechanisms than multi-agent orchestration, highlighting CoDA's focus on agent collaboration rather than conversational interaction patterns.

Among the 30 candidates examined, the contribution-level analysis shows mixed novelty signals. The core 'CoDA multi-agent system' contribution examined 10 candidates and found 3 potentially refuting prior works, suggesting substantial overlap with existing multi-agent architectures. Similarly, 'reframing visualization as collaborative multi-agent problem' examined 10 candidates with 2 refutable matches, indicating this framing has precedent in the limited search scope. However, the 'formalization of metadata-centric preprocessing and iterative reflection pipeline' examined 10 candidates with zero refutable matches, suggesting this specific technical contribution may be more distinctive within the examined literature.

Given the limited search scope of 30 semantically similar candidates, this assessment captures overlap within the most directly related prior work but cannot claim exhaustive coverage of the broader visualization automation literature. The multi-agent leaf's sparsity (four papers) and the relatively high refutation rates for two contributions suggest CoDA builds incrementally on established multi-agent patterns, while its metadata-centric formalization may offer more novel technical detail. A more comprehensive search would be needed to assess whether similar metadata preprocessing or reflection mechanisms exist in adjacent research areas.

Taxonomy

Core-task Taxonomy Papers

Claimed Contributions

Contribution Candidate Papers Compared

Refutable Paper

Research Landscape Overview

Core task: automating data visualization from natural language queries. The field has evolved into a rich ecosystem with several major branches. Natural Language to Visualization Translation Systems form the technical core, encompassing rule-based parsers, neural sequence-to-sequence models, and increasingly sophisticated large language model-based approaches that can generate visualization code or specifications directly from user queries. Domain-Specific and Modality-Specific Visualization Systems tailor these techniques to particular data types (trajectories, medical records, sign language) or specialized domains, while Interactive and Conversational Visualization Interfaces enable iterative refinement through dialogue. Supporting branches include Natural Language Generation for Visualizations (producing textual descriptions of charts), infrastructure work on benchmarks and datasets, and a growing body of Applied Systems targeting real-world deployments in healthcare, business intelligence, and other sectors. Survey and Review Literature helps synthesize progress across these diverse threads. Recent momentum has concentrated in multi-agent LLM systems, where multiple specialized agents collaborate to handle query understanding, data processing, and chart generation. CoDA[0] exemplifies this trend by orchestrating agents for complex visualization tasks, sitting alongside other multi-agent frameworks like nvAgent[15] and VizGen[22] that similarly decompose the problem into modular sub-tasks. This contrasts with earlier single-model approaches such as Chat2vis[1] or LIDA[23], which relied on monolithic LLM prompting. The multi-agent paradigm offers improved modularity and error recovery but introduces coordination overhead. Meanwhile, works like Speech to Visualization[3] extend input modalities beyond text, and evaluation frameworks such as VisEval[5] provide systematic benchmarks to compare these varied architectures. CoDA[0] distinguishes itself within this cluster by emphasizing agent collaboration patterns and task decomposition strategies that balance flexibility with interpretability, positioning it as a representative example of how the field is leveraging LLM capabilities through structured orchestration rather than end-to-end generation alone.

Claimed Contributions

CoDA multi-agent system for data visualization

Can Refute

10 retrieved papers

The authors introduce CoDA, a collaborative multi-agent system that employs specialized LLM agents to automate data visualization from natural language queries. The framework decomposes the task into understanding, planning, generation, and self-reflection phases, using metadata-focused analysis to bypass token limits and quality-driven refinement to ensure robustness in handling complex, multi-file datasets.

10 retrieved papers

Can Refute

Reframing visualization as collaborative multi-agent problem

Can Refute

10 retrieved papers

The authors reconceptualize automated data visualization as a collaborative problem-solving endeavor rather than a monolithic single-pass process. This paradigm shift employs specialized LLM agents with distinct professional personas that use structured communication and quality-driven feedback loops to decompose queries, process data, and iteratively refine outputs.

10 retrieved papers

Can Refute

Formalization of metadata-centric preprocessing and iterative reflection pipeline

10 retrieved papers

The authors formalize a pipeline that uses metadata-centric preprocessing to summarize data structures without full data loading, thereby circumventing LLM context window limits. The framework incorporates iterative reflection through image-based evaluation to verify completion from a human perspective, ensuring visualization quality through feedback loops.

10 retrieved papers

Core Task Comparisons

Comparisons with papers in the same taxonomy category

[15] nvAgent: Automated Data Visualization from Natural Language via Collaborative Agent Workflow PDF

Chen Jingyao, Chen Dongping, Gui, Yi, Wan, Yao, Zhang, Hongyu (2025)

[22] VizGen: Data Exploration and Visualization from Natural Language via a Multi-Agent AI Architecture PDF

Silva, Thushari (2025)

[37] Multi-Agent System for Querying and Visualization Using Large Language Models PDF

Mukhamad Angga Gumilang, Ridi Ferdiana, Indriana Hidayah, Hanung Addi Candra Utomo, Achmad Choirudin Emcha, Ahmad Iwan Fadli (2025) • 2025 IEEE 8th International Conference on Computer and Communication Engineering Technology (CCET)

Contribution Analysis

Detailed comparisons for each claimed contribution

Contribution

CoDA multi-agent system for data visualization

[15] nvAgent: Automated Data Visualization from Natural Language via Collaborative Agent Workflow PDF

Can Refute

[68] PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Feedback PDF

Can Refute

[69] PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Retrieval Feedback PDF

Can Refute

[62] Agentic Visualization: Extracting Agent-based Design Patterns from Visualization Systems PDF

Cannot Refute

[67] Data-to-Dashboard: Multi-Agent LLM Framework for Insightful Visualization in Enterprise Analytics PDF

Cannot Refute

[70] Nli4volvis: Natural language interaction for volume visualization via llm multi-agents and editable 3d gaussian splatting PDF

Cannot Refute

[71] VisCoder2: Building Multi-Language Visualization Coding Agents PDF

Cannot Refute

[72] From data to story: Towards automatic animated data video creation with llm-based multi-agent systems PDF

Cannot Refute

[73] Agent-assisted collaborative learning PDF

Cannot Refute

[74] Automated Visualization Code Synthesis via Multi-Path Reasoning and Feedback-Driven Optimization PDF

Cannot Refute

Contribution

Reframing visualization as collaborative multi-agent problem

[68] PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Feedback PDF

Can Refute

[69] PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Retrieval Feedback PDF

Can Refute

[61] MDA: a multi-agent framework for data analysis task PDF

Cannot Refute

[62] Agentic Visualization: Extracting Agent-based Design Patterns from Visualization Systems PDF

Cannot Refute

[63] Agilecoder: Dynamic collaborative agents for software development based on agile methodology PDF

Cannot Refute

[64] A survey of cooperative multi-agent reinforcement learning for multi-task scenarios PDF

Cannot Refute

[65] Multi-agent visualization for explaining federated learning PDF

Cannot Refute

[66] From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Reasoning-Driven Pedagogical Visualization PDF

Cannot Refute

[67] Data-to-Dashboard: Multi-Agent LLM Framework for Insightful Visualization in Enterprise Analytics PDF

Cannot Refute

[70] Nli4volvis: Natural language interaction for volume visualization via llm multi-agents and editable 3d gaussian splatting PDF

Cannot Refute

Contribution

Formalization of metadata-centric preprocessing and iterative reflection pipeline

[51] PhenoFlow: A Human-LLM Driven Visual Analytics System for Exploring Large and Complex Stroke Datasets PDF

Cannot Refute

[52] An interactive dashboard for analyzing user interaction patterns in the i2b2 clinical data warehouse PDF

Cannot Refute

[53] Visualization-based Iterative Segmentation to Augment Video Game Analytics PDF

Cannot Refute

[54] The importance of being honest: Issues of transparency in digital visualization of architectural heritage PDF

Cannot Refute

[55] Lessons learned from the design and evaluation of visual information-seeking systems PDF

Cannot Refute

[56] Visualization of geospatial metadata for selecting geographic datasets PDF

Cannot Refute

[57] Towards multi-variate visualization of metadata describing geographic information PDF

Cannot Refute

[58] Supporting document use through interactive visualization of metadata PDF

Cannot Refute

[59] FloraVision: A Spatial Crowd-based Learning System for California Native Plants PDF

Cannot Refute

[60] Enhancements in Functionality of the Interactive Visual Explorer for ATLAS Computing Metadata PDF

Cannot Refute

CoDA: Agentic Systems for Collaborative Data Visualization

Overview

Overall Novelty Assessment

Taxonomy

Research Landscape Overview

Claimed Contributions

Core Task Comparisons

[15] nvAgent: Automated Data Visualization from Natural Language via Collaborative Agent Workflow PDF

[22] VizGen: Data Exploration and Visualization from Natural Language via a Multi-Agent AI Architecture PDF

[37] Multi-Agent System for Querying and Visualization Using Large Language Models PDF

Contribution Analysis

CoDA multi-agent system for data visualization

[15] nvAgent: Automated Data Visualization from Natural Language via Collaborative Agent Workflow PDF

[68] PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Feedback PDF

[69] PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Retrieval Feedback PDF

[62] Agentic Visualization: Extracting Agent-based Design Patterns from Visualization Systems PDF

[67] Data-to-Dashboard: Multi-Agent LLM Framework for Insightful Visualization in Enterprise Analytics PDF

[70] Nli4volvis: Natural language interaction for volume visualization via llm multi-agents and editable 3d gaussian splatting PDF

[71] VisCoder2: Building Multi-Language Visualization Coding Agents PDF

[72] From data to story: Towards automatic animated data video creation with llm-based multi-agent systems PDF

[73] Agent-assisted collaborative learning PDF

[74] Automated Visualization Code Synthesis via Multi-Path Reasoning and Feedback-Driven Optimization PDF

Reframing visualization as collaborative multi-agent problem

[68] PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Feedback PDF

[69] PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Retrieval Feedback PDF

[61] MDA: a multi-agent framework for data analysis task PDF

[62] Agentic Visualization: Extracting Agent-based Design Patterns from Visualization Systems PDF

[63] Agilecoder: Dynamic collaborative agents for software development based on agile methodology PDF

[64] A survey of cooperative multi-agent reinforcement learning for multi-task scenarios PDF

[65] Multi-agent visualization for explaining federated learning PDF

[66] From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Reasoning-Driven Pedagogical Visualization PDF

[67] Data-to-Dashboard: Multi-Agent LLM Framework for Insightful Visualization in Enterprise Analytics PDF

[70] Nli4volvis: Natural language interaction for volume visualization via llm multi-agents and editable 3d gaussian splatting PDF

Formalization of metadata-centric preprocessing and iterative reflection pipeline

[51] PhenoFlow: A Human-LLM Driven Visual Analytics System for Exploring Large and Complex Stroke Datasets PDF

[52] An interactive dashboard for analyzing user interaction patterns in the i2b2 clinical data warehouse PDF

[53] Visualization-based Iterative Segmentation to Augment Video Game Analytics PDF

[54] The importance of being honest: Issues of transparency in digital visualization of architectural heritage PDF

[55] Lessons learned from the design and evaluation of visual information-seeking systems PDF

[56] Visualization of geospatial metadata for selecting geographic datasets PDF

[57] Towards multi-variate visualization of metadata describing geographic information PDF

[58] Supporting document use through interactive visualization of metadata PDF

[59] FloraVision: A Spatial Crowd-based Learning System for California Native Plants PDF

[60] Enhancements in Functionality of the Interactive Visual Explorer for ATLAS Computing Metadata PDF

Table of Contents