Evaluation on Peng Tan's AI Blog

Evaluation on Peng Tan's AI Bloghttps://c44db530.hobbytp-github-io.pages.dev/zh/tags/evaluation/一个关注 AI 各领域的专题博客Oolonghttps://c44db530.hobbytp-github-io.pages.dev/zh/evaluate/oolong/oolong/Sun, 09 Nov 2025 00:00:00 +0800https://c44db530.hobbytp-github-io.pages.dev/zh/evaluate/oolong/oolong/Oolong 是一个针对长上下文模型的挑战性聚合基准测试项目，包括相关代码和评估脚本（完整版本即将发布）。其目标是评估模型的长上下文推理和聚合能力。