
谷歌 AI 研究团队近期发布了一项创新性成果——DS STAR(数据科学代理通过迭代规划和验证),这是一个突破性的多智能体框架,能够将抽象的商业问题直接转化为可执行的 Python 代码,彻底颠覆了传统依赖人工分析师的繁琐流程。与常规数据科学代理局限于结构化 SQL 数据库的运作方式不同,DS STAR 拥有更强大的数据处理能力,可以直接解析 CSV、JSON、Markdown 以及各类非结构化文本文件,实现混合格式数据的无缝整合与分析。
DS STAR 的工作流程设计精妙,分为四个核心阶段。首先,系统会派遣名为 Aanalyzer 的智能体深入数据湖,对每个文件进行全面扫描,生成精准的 Python 脚本来提取关键信息,包括列名、数据类型和元数据等。这一步骤相当于为后续分析构建了完整的知识图谱,为整个流程奠定了坚实基础。完成数据解析后,系统将启动迭代规划和验证的智能循环。这一环节由多个专业智能体协同完成,包括 Aplanner、Acoder、Averifier 和 Arouter 等。Aplanner 负责制定初步分析方案,Acoder 将其转化为可执行的 Python 代码,并输出分析结果。Averifier 会根据实际输出评估方案的有效性,如有不足则由 Arouter 智能体进行动态调整。这个智能循环会持续优化,直至获得满意结果或达到预设迭代上限。
为了进一步提升系统稳定性,DS STAR 特别配备了 Adebugger 和 Retriever 两大辅助模块。Adebugger 在脚本执行失败时能够自动修复错误,确保系统在应对模式漂移和列缺失等突发状况时依然保持高效运行。Retriever 则专注于从海量数据中筛选出最相关的文件,为分析过程提供精准的上下文支持。经过在 DABStep、KramaBench 和 DA Code 等多个权威基准测试中的表现,DS STAR 证明了自己在数据分析领域的卓越能力,显著提升了任务分析的准确性。这一成果不仅展示了 DS STAR 将复杂问题转化为可靠 Python 解决方案的强大实力,更标志着数据分析自动化进程迈出了重要一步。

论文链接: https://arxiv.org/pdf/2509.21825
核心亮点:
🌟 DS STAR 是一款革命性的多智能体框架,能够将模糊商业问题转化为可执行的 Python 代码
📊 该系统通过智能体协同完成数据分析、代码生成及结果验证的迭代优化过程
🚀 在权威基准测试中,DS STAR 显著提升了数据科学任务的分析精度,展现了强大的自动化潜力
