<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Evaluation on Peng Tan's AI Blog</title><link>https://c44db530.hobbytp-github-io.pages.dev/zh/tags/evaluation/</link><description>一个关注 AI 各领域的专题博客</description><atom:link href="https://c44db530.hobbytp-github-io.pages.dev/zh/tags/evaluation/index.xml" rel="self" type="application/rss+xml"/><item><title>Oolong</title><link>https://c44db530.hobbytp-github-io.pages.dev/zh/evaluate/oolong/oolong/</link><pubDate>Sun, 09 Nov 2025 00:00:00 +0800</pubDate><guid>https://c44db530.hobbytp-github-io.pages.dev/zh/evaluate/oolong/oolong/</guid><description>Oolong 是一个针对长上下文模型的挑战性聚合基准测试项目，包括相关代码和评估脚本（完整版本即将发布）。其目标是评估模型的长上下文推理和聚合能力。</description></item></channel></rss>