Gym – 蒋智昊的博客

Gym CartPole 倒立摆随机策略

蒋智昊 Gym / 机器学习 2023年3月9日 2023年3月18日留下评论

import gym

import matplotlib.pyplot as plt

# 1. 产生环境

# env = gym.make(‘CartPole-v0’)

# 注意 gym 新版本需要说明 render_mode

env = gym.make(‘CartPole-v1’, render_mode=”human”)

# 2. 可视化：回报曲线变化图，回报直方图

# figsize=(a, b) 用来设置图形的大小，a为图形的宽，b

Gym CartPole 倒立摆保存 gif 动画图像

蒋智昊 Gym / 机器学习 2023年3月8日 2023年3月8日留下评论

render_mode=”human” 显示画面

render_mode=”rgb_array” 不显示画面

frames 动画保存，需要rgb_array模式。因此采用cv2进行渲染，解决rgb_array模式下画面显示问题。

import gym

import matplotlib.pyplot as plt

from matplotlib import animation

import cv2

# 保存gif图像

def displa

强化学习 Gym MountainCar 山地车

蒋智昊 Gym / 机器学习 2023年2月17日 2023年2月17日留下评论

MountainCar 山地车

import gym

# MountainCar 山地车

env = gym.make(‘MountainCar-v0′, render_mode=’human’)

for i_episode in range(10):

observation = env.reset()

for t in range(100):

env.render()

print(observation)

action = env.action_spa

强化学习 Gym CartPole 倒立摆

蒋智昊 Gym / 机器学习 2023年2月17日 2023年2月17日留下评论

CartPole 倒立摆

import gym

# CartPole 倒立摆

env = gym.make(‘CartPole-v1’, render_mode=”human”)

for episode in range(10):

env.reset()

print(“Episode finished after {} timesteps”.format(episode))

for _ in range(100):

env.render()

env.st

强化学习 Gym 安装以及入门

蒋智昊 Gym / 机器学习 2023年2月16日 2023年2月17日留下评论

官网：https://www.gymlibrary.dev/

https://github.com/openai/gym

Gym是一个研究强化学习算法的工具箱。需要安装2个库 gym、pygame。

一、安装库

1、安装gym。最小安装的Gym库只包括少量的内置环境，如算法环境、简单文字游戏环境和经典控制环境。box2d

pip install gym -i https://pypi.tuna.tsinghua.edu.cn/simple/

完整安装。gym库的一些内置的

什么是强化学习？

蒋智昊 Gym / 机器学习 2023年2月15日 2023年2月18日留下评论

强化学习（Reinforcement Learning, RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

强化学习的常见模型是标准的马尔可夫决策过程（Markov Decision Process, MDP）。按给定条件，强化学习可分为基于模式的强化学习（model-based RL）和无模式强化学习（model-free RL），以及主动强化学习（a