• 什么是强化学习算法

    2016 年 3 月,谷歌公司 DeepMind 团队的 AlphaGo 以 4 比 1 战胜第 18 届世界围棋冠军李世石,这是一场具有历史意义的比赛。



    图 1 围棋落子位置种类

更多...

加载中...