A Libertine of Computer Science

Multi-Armed Bandit Problem [多臂赌博机问题]

首先,据说这个问题名字的来源是这样的,赌场里的老虎机[slot machine]有一个绰号叫单臂强盗[single-armed bandit],因为它即使只有一只胳膊,也会把你的钱拿走。所以,当你进入一个赌场,面对一排老虎机,就像面对了一个多臂强盗,而Multi-Armed Bandit就是这样引申而来[当然还有一个说法是,可以把一排老虎机想象成一个老虎机有很多个臂,其实本质是一样的]。那么问题来了,由于不同老虎机的期望收益和期望损失不同,你采取什么老虎机选择策略来保证你的总收益最高呢?这就是经典的Multi-Armed Bandit问题。

Python Tricks [Python技巧]

Last Updated: Jan. 05, 2022

本文记录了一些笔者在使用 python[如无特别说明,主要是 python3]的技巧或者需要注意的地方,其他 python 的主要特性或者重要的使用方式,会单独成文不会列在这里。本文会持续更新。

[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17]