欢迎查看天授平台中文文档

天授 是一个基于PyTorch的深度强化学习平台,目前实现的算法有:

天授支持所有算法的并行环境采样,所有算法均被重新形式化为基于重放缓冲区的算法。所有算法的Actor均支持循环状态表示(RNN Network)。

与英文文档不同,中文文档提供了一个宏观层面的对天授平台的概览。(其实都是 毕业论文 里面弄出来的)

安装

天授目前发布在 PyPI 中,可以通过

pip3 install tianshou

来在您的Python环境中直接安装(注意Python版本需要是3.6以上)。当然也可以选择从GitHub源代码直接安装最新开发版本:

pip3 install git+https://github.com/thu-ml/tianshou.git@master

如果使用的Python是托管在Anaconda或者Miniconda中,那么可以用如下命令进行安装:

# 搞个新环境并让它自带pip
conda create -n myenv pip
# 激活这个新环境
conda activate myenv
# 安装天授
pip install tianshou

在安装完毕后,打开您的Python并输入

import tianshou as ts
print(ts.__version__)

如果没有异常出现,那么说明已经成功安装了。

贡献

Indices and tables