Gym CartPole 倒立摆 随机策略
import gym
import matplotlib.pyplot as plt
# 1. 产生环境
# env = gym.make(‘CartPole-v0’)
# 注意 gym 新版本 需要说明 render_mode
env = gym.make(‘CartPole-v1’, render_mode=”human”)
# 2. 可视化:回报曲线变化图,回报直方图
# figsize=(a, b) 用来设置图形的大小,a为图形的宽,b
import gym
import matplotlib.pyplot as plt
# 1. 产生环境
# env = gym.make(‘CartPole-v0’)
# 注意 gym 新版本 需要说明 render_mode
env = gym.make(‘CartPole-v1’, render_mode=”human”)
# 2. 可视化:回报曲线变化图,回报直方图
# figsize=(a, b) 用来设置图形的大小,a为图形的宽,b
render_mode=”human” 显示画面
render_mode=”rgb_array” 不显示画面
frames 动画保存,需要rgb_array模式。因此采用cv2进行渲染,解决rgb_array模式下画面显示问题。
import gym
import matplotlib.pyplot as plt
from matplotlib import animation
import cv2
# 保存gif图像
def displa
MountainCar 山地车
import gym
# MountainCar 山地车
env = gym.make(‘MountainCar-v0′, render_mode=’human’)
for i_episode in range(10):
observation = env.reset()
for t in range(100):
env.render()
print(observation)
action = env.action_spa
CartPole 倒立摆
import gym
# CartPole 倒立摆
env = gym.make(‘CartPole-v1’, render_mode=”human”)
for episode in range(10):
env.reset()
print(“Episode finished after {} timesteps”.format(episode))
for _ in range(100):
env.render()
env.st
官网:https://www.gymlibrary.dev/
https://github.com/openai/gym
Gym是一个研究强化学习算法的工具箱。需要安装2个库 gym、pygame。
一、安装库
1、安装gym。最小安装的Gym库只包括少量的内置环境,如算法环境、简单文字游戏环境和经典控制环境。box2d
pip install gym -i https://pypi.tuna.tsinghua.edu.cn/simple/
完整安装。gym库的一些内置的
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
强化学习的常见模型是标准的马尔可夫决策过程(Markov Decision Process, MDP)。按给定条件,强化学习可分为基于模式的强化学习(model-based RL)和无模式强化学习(model-free RL),以及主动强化学习(a