当Sheet表非常多的时候,一般我们会在第一张工作表中做一张目录,方便快速查找定位相应表格,以下示例将介绍如何通过宏程序一键生成目录。 效果如下: 参考代码如下:
Sub SheetList()Dim sht As Worksheet, i As Long, s…
给定当前优化的大模型 π \pi π,以及SFT模型 π S F T \pi_{SFT} πSFT
原始优化目标为: max E ( s , a ) ∼ R L [ π ( s , a ) π S F T ( s , a ) A π S F T ( s , a ) ] \max E_{(s,a)\sim RL}[\frac{\pi(s,a)}{\pi_{SFT}(s,a)}A^{\pi_{SFT}}(s,a)] m…