Reflect, Retry, Reward on Peng Tan's AI Blog

Reflect, Retry, Reward on Peng Tan's AI Bloghttps://c44db530.hobbytp-github-io.pages.dev/zh/tags/reflect-retry-reward/一个关注 AI 各领域的专题博客Reflect, Retry, Reward: 大型语言模型的自我进化新范式https://c44db530.hobbytp-github-io.pages.dev/zh/papers/reflect_retry_reward_rl_finetunning/Fri, 04 Jul 2025 22:30:00 +0800https://c44db530.hobbytp-github-io.pages.dev/zh/papers/reflect_retry_reward_rl_finetunning/Reflect, Retry, Reward: 大型语言模型的自我进化新范式