红杉中国推出一套全新AI基准测试 xbench引领AI评估新标准
发布时间:2025-05-26 14:48:14
5月26日,红杉中国推出全新的AI基准测试xbench,并发布相关论文。这项测试由投资机构发起,联合了国内外十余家高校和研究机构的数十位博士研究生共同参与。xbench采用双轨评估体系和长青评估机制,旨在评估和推动AI系统能力的提升,同时量化AI系统在真实场景中的效用价值,并长期跟踪Agent产品的关键突破。
- 上一篇: 我国肿瘤患者五年生存率上升 升至43.7%
- 下一篇: 返回列表