这项由东京大学与理化学研究所(RIKEN)联合开展的研究,以预印本形式发布于2026年6月,论文编号为arXiv:2606.07379。研究团队提出了名为CapCode与CapReward的两套框架,专门用于检测和防止AI编程智能体在评测中弄虚作假。
过去这三个月,圈子里那叫一个冰火两极分化。 走访多家企业信息化负责人后能明显感知,不少落地未满一年的AI数据分析系统正遭遇“降温”,部分团队暂停了新上线的AI系统,重新回归Excel人工核算的传统工作模式。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果