-
GitHub 主仓库(OpenCompass):

- 这是整个评测框架的官方仓库,包含了所有评测基准和工具,OPENCLAW 是该框架下的一个重要组成部分。
- 链接: https://github.com/open-compass/opencompass
-
OPENCLAW 基准的详细介绍与论文:
- OPENCLAW 专为评测大模型的长上下文理解能力设计,包含“夹带”干扰信息的问题,非常有趣且具有挑战性。
- 项目主页与论文: https://opencompass.org.cn/OpenClaw
- 论文(arXiv): https://arxiv.org/abs/2406.14510
-
官方文档:
- 如果您想使用或深入了解 OpenCompass,官方文档是最佳起点。
- 链接: https://opencompass.readthedocs.io/zh-cn/latest/
- OpenCompass:是“大模型评测体系”,一个全面的开源评测平台。
- OPENCLAW:是OpenCompass中的一个“专项考试”,专门考大模型的长文本能力(如信息提取、理解、逻辑推理等)。
要获取所有相关代码、数据和最新更新,访问 GitHub主仓库 是最直接的方式。 要详细了解OPENCLAW基准的细节、任务设计和实验结果,请查看其项目主页和论文。
希望这些信息能帮到您!
标签: OpenCompass OPENCLAW
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。