发展历程 什么是强化学习? -技术百科的定义

什么是强化学习? -技术百科的定义

目录:

Anonim

定义-强化学习是什么意思?

在人工智能的背景下,强化学习是一种动态编程,它使用奖励和惩罚系统来训练算法。

强化学习算法或代理通过与环境交互来学习。 代理通过正确执行获得奖励,而错误执行则受到惩罚。 代理通过最大化其奖励和最小化其惩罚而无需人工干预地学习。

技术百科解释了强化学习

强化学习是一种受行为主义心理学启发的机器学习方法。 这类似于儿童学习执行新任务的方式。 增强学习与其他机器学习方法的不同之处在于,该算法并未明确告知如何执行任务,而是独自解决了该问题。

作为一个可能是自动驾驶汽车或下棋程序的代理,它与周围的环境相互作用,并根据其表现获得奖励状态,例如安全地行驶到目的地或赢得游戏。 相反,代理会因执行不当(例如上路或被检查)而受到处罚。

随着时间的推移,代理会使用动态编程来做出决策,以最大化其回报并最小化其惩罚。 这种人工智能方法的优势在于,它允许AI程序进行学习,而无需程序员说明代理应如何执行任务。

什么是强化学习? -技术百科的定义