Reinforcement Learning--Taxonomy
Reinforcement Learning发展至今日已无法进行非常明确而清晰的分类,很多新方法也是博采众长。不过,为了更好的了解强化学习算法主要学习什么以及怎么学习,本文尝试从不同角度对主要的RL算法进行大致分类。
Reinforcement Learning发展至今日已无法进行非常明确而清晰的分类,很多新方法也是博采众长。不过,为了更好的了解强化学习算法主要学习什么以及怎么学习,本文尝试从不同角度对主要的RL算法进行大致分类。
强化学习[Reinforcement Learning]是一个独立的机器学习研究领域,主要任务是根据不同的环境通过训练机器学习的模型来进行一系列决策。
Here are the most important software design principles discussed in this book.
This blog discuss several principles and tips about refactoring the existing code to eliminate some problems.
Chapter 4 argued that modules should be deep. Chapter 5, 6 discuss techniques for creating deep modules.
使用 Python 时,经常会遇到的问题是
TensorFlow 2.x在如火如荼的迭代,1.15.4是TF 1.x的稳定版本。本文介绍在Ubuntu和virtualenv的环境下的tensorflow 1.15.4源码安装过程。源码安装的一个好处是可以自定义cuda和cudnn的次级版本号,比如TF 1.15.4默认支持CUDA 10,但是pip上的预安装的tensorflow 1.15.4是基于10.0,源码安装可以自定义到10.2。
Python中多线程无法利用多核优势,如果想要充分地使用多核CPU的资源,在python中大部分情况需要使用多进程,这里最Python提供了multiprocessing。通过multiprocessing包可以实现多进程,不过因为不是多线程,无法向多线程一样方便的共享数据[因为多线程往往属于一个进程,进程内共享比较方便]。但是, multiprocessing包也提供了共享变量这样的功能。