音讯 什么是alphago? -技术百科的定义

什么是alphago? -技术百科的定义

目录:

Anonim

定义-AlphaGo是什么意思?

AlphaGo是一种狭窄的AI,这是由Google DeepMind开发的一种计算机程序,用于玩Go(中国战略棋盘游戏),适用于两个类似于国际象棋的玩家。 AlphaGo是第一个AI程序,它能够在没有障碍的全尺寸棋盘上于2015年10月击败专业的双人棋手Fan Hui。 然后在2016年3月击败了世界上排名最高的人类玩家之一,即9人丹·李·塞多尔(Lee Sedol),赢得了五场比赛中的四场。

技术百科解释了AlphaGo

AlphaGo项目于2014年作为测试平台启动,目的是了解利用深度学习的Google DeepMind神经网络算法在Go上的竞争能力。 AlphaGo的算法结合了树搜索和机器学习技术,并经过了人类和其他计算机参与者的广泛培训而得到了增强。 它使用蒙特卡洛树搜索,并以使用深度神经网络技术实现的政策和价值网络为指导。 策略网络经过训练,可以帮助AI预测最有可能获胜的下一步,而价值网络经过训练可以缩小搜索树的范围并确定这些职位的价值,从而估算每个职位的获胜者,而不是一直向下搜索到游戏结束。

AlphaGo首先从人类选手的历史比赛动作中获得养分,利用了大约3, 000万步动作的数据库,使其模仿人类比赛。 一旦AI达到熟练程度,就可以通过强化学习来改进和学习更多知识,从而使其与自己的实例竞争,从而对AI进行进一步的培训。

2015年10月,AlphaGo的分布式计算版本打败了击败欧洲2项冠军Go Fan的Fan Hui,这是有史以来第一次计算机程序在Go上击败了职业玩家。 范辉在失败后几个月就担任DeepMind团队的顾问。 2016年3月,AlphaGo与世界排名最高的选手之一李·塞多尔(Lee Sedol)搭档,获得了9杆的最高水平。 赢得了Lee的四场比赛,这标志着AI研究的重大突破,因为这意味着DeepMind所使用的深度学习和神经网络算法可以用于任何其他目的,因为它不是真正为玩Go而编写的,而是经过教授的怎么玩围棋。 这为AI研究开辟了一个全新的世界。

什么是alphago? -技术百科的定义