蒙特卡洛搜索树
蒙特卡洛方法是通过统计的方式进行问题求解,最简单的例子就是使用蒙特卡洛方法估算$\pi$值。 估算$\pi$值的代码也非常简单: import random exm_turn = 100000 counter = 0 for _ in range(exm_turn): x = random.uniform(-1, 1) y = random.uniform(-1, 1) # dropped in circle if x**2 + y**2 < 1: counter = counter + 1 print("pi:{0}".format((4 * counter / exm_turn))) 但是很容易看出这样估算的值不仅不准确,计算速度还特别慢,但是如果换一个场景,我们并不需要非常精确的数值,但是准确的计算量又过于庞大,那么用这种基于概率的计算方式(猜)通常能更好地达到计算结果。 发展过程 在博弈论中,参与博弈的个体和他们选择的方案带来的结果都可以列成一个表格进行分析,其中有一种算法为极小值极大化,这种算法通常用在零和博弈1,即参与博弈的双方的利益之和为零的博弈,如果一方得利,那另...





