introduction
学习的并不是policy,而是学习critic,critic用来评价policy好还是不好;一种critic:state value function V π ( s ) V^\pi(s) Vπ(s)是给定一个policy π \pi π,在遇到state s s s之后累积的reward的…
六面体网格(1)
Time Domain Solver中使用的Hexahedral Mesh!
网格可以说是为了Maxwell方程式计算,将仿真结构分割成许多小的网格单元。因此,仿真计算中识别的结构是网格结构。
Time Domain Solver中使用的Hexahedra…