当前位置:首页 > 滚动 > 正文

红杉中国推出一套全新AI基准测试 xbench引领AI评估新标准

发布时间:2025-05-26 14:48:14

5月26日,红杉中国推出全新的AI基准测试xbench,并发布相关论文。这项测试由投资机构发起,联合了国内外十余家高校和研究机构的数十位博士研究生共同参与。xbench采用双轨评估体系和长青评估机制,旨在评估和推动AI系统能力的提升,同时量化AI系统在真实场景中的效用价值,并长期跟踪Agent产品的关键突破。