<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>强化学习 on Peng Tan's AI Blog</title><link>https://c44db530.hobbytp-github-io.pages.dev/zh/tags/%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0/</link><description>一个关注 AI 各领域的专题博客</description><atom:link href="https://c44db530.hobbytp-github-io.pages.dev/zh/tags/%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0/index.xml" rel="self" type="application/rss+xml"/><item><title>Agent Lightning</title><link>https://c44db530.hobbytp-github-io.pages.dev/zh/mas/agent_lightning/</link><pubDate>Wed, 27 Aug 2025 20:10:00 +0800</pubDate><guid>https://c44db530.hobbytp-github-io.pages.dev/zh/mas/agent_lightning/</guid><description>&lt;h2 id="介绍">介绍&lt;/h2>
&lt;p>微软开源的 &lt;strong>Agent Lightning&lt;/strong> 项目，它的核心价值在于为开发者和研究者提供了一个强大的工具，用于&lt;strong>训练和优化 AI Agent（智能代理）&lt;/strong>，特别是&lt;strong>几乎不需要修改现有 Agent 代码&lt;/strong>就能实现显著的性能提升。&lt;/p></description></item><item><title>多智能体强化学习（MARL）在多智能体系统（MAS）中的应用：理论、算法、应用与展望</title><link>https://c44db530.hobbytp-github-io.pages.dev/zh/mas/mas_reinforcement/</link><pubDate>Sat, 26 Apr 2025 20:10:00 +0800</pubDate><guid>https://c44db530.hobbytp-github-io.pages.dev/zh/mas/mas_reinforcement/</guid><description>本文介绍了多智能体强化学习（MARL）在多智能体系统（MAS）中的应用：理论、算法、应用与展望。</description></item></channel></rss>