type
status
date
slug
summary
tags
category
icon
password
创建基本环境
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fc466f1d4-a794-4e9f-bdf9-13b19f8600bc%2Feac48076-f7de-4a5d-968c-62d554673652%2FUntitled.png?table=block&id=47282eb3-d736-416b-a77f-2a0d2b6d2db4)
import numpy as np np.set_printoptions(threshold=np.inf) 可以打印全部数组
list(数组(210, 160, 3),生命值lives
'episode_frame_number'
:这个键对应的值是0,表示当前回合的帧数(或步数)为0。帧数可以用来跟踪环境中经过的时间步。
'frame_number'
:这个键对应的值也是0,表示整个训练的总帧数(或总步数)为0。这个值可以用来跟踪整个训练过程中的总步数。)
动作:
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fc466f1d4-a794-4e9f-bdf9-13b19f8600bc%2Fa3383963-e028-41e5-99ac-c674ee99654e%2FUntitled.png?table=block&id=46918416-15a8-438a-9c68-c8f14acb69e7)
状态
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fc466f1d4-a794-4e9f-bdf9-13b19f8600bc%2F649dd27b-3f91-4de1-8cdc-1aba472572e5%2FUntitled.png?table=block&id=ff06f7ce-a497-4c47-b889-67ec0c290ade)
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fc466f1d4-a794-4e9f-bdf9-13b19f8600bc%2F0c3fc5d3-b888-4302-b74f-b026ba3437fd%2FUntitled.png?table=block&id=c0132645-919d-4dd0-bc3b-a4b54cc4070f)
走一步
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fc466f1d4-a794-4e9f-bdf9-13b19f8600bc%2F44c7e60d-862d-45c9-97d2-0632f35a7593%2FUntitled.png?table=block&id=82cb63c7-fd2b-434d-9d7a-3942edd8c7d8)
环境终止指的是环境达到了某个终止条件,不再接受代理的动作,并且通常会重置到初始状态。终止可能是由于任务完成、游戏结束或者达到预设的时间步数限制等。当环境终止时,代理通常需要处理收集到的奖励并进行下一步决策。
截断是针对一些特殊情况而言的,例如在某些连续任务中,限制了最大时间步数或者最大轨迹长度。如果在试图执行完整轨迹之前达到了时间步限制或者轨迹长度限制,环境就会被截断。在这种情况下,环境不会重置到初始状态,而是保留当前状态,并返回一个截断标志。
区别在于,终止意味着环境已经完成或达到终止条件,需要进行重置处理,而截断则是在限制时间步或轨迹长度的情况下,环境仍然保持当前状态可以继续与代理进行交互。
在代码段中提到的
"final_observation"
和 "final_info"
用于存储在终止或截断之后最后一步的观测和信息,以便代理可以进一步处理或记录这些结果。 -AI晚安 梦里见
- 作者:MasterYe
- 链接:https://www.masterye.xyz//article/AI-5
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。