全连接神经网络实现(玩Pac-Man游戏)详解

  • 内容
  • 评论
  • 相关

本节使用一个简单的神经网络智能体玩 Pac-Man 游戏,首先创建一组随机权重和偏置,之后让它进行游戏,然后选择玩最长时间的智能体,因为它的策略很有可能是最优决策。

准备工作

这里的智能体不学习任何策略,而是依赖初始权重进行决策,也就是固定策略。智能体根据神经网络算出的概率来选择动作,这个决策完全基于对当前环境的观测。

这里采用全连接神经网络实现这个过程,神经网络的输入由环境的观测空间决定,输出神经元的数目取决于可能的离散动作数。Pac-Man 包含九个动作——等待、右转、左转、向上、向下、向左移动、向右移动、向上移动和向下移动,所以神经网络有 9 个输出神经元。

具体做法

  1. 导入模块,也导入 gym,以便使用它提供的不同环境:



     

本文标题:全连接神经网络实现(玩Pac-Man游戏)详解

本文地址:http://www.hosteonscn.com/4285.html

评论

0条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注