机器学习的类别

  • 监督学习 从训练资料中学到或者建立一个模式,并依此模式推测新的实例。训练资料是由输入数据和预期输出数据组成。模式的输出可以是一个连续的值(称为回归分析)或者分类标签(称为分类)。
  • 非监督学习 没有给定事先标记过的训练示例,自动对输入的数据进行分类或分群。
  • 强化学习 智能体以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价,而不是告诉强化学习系统(reinforcement learning system, RLS)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

留下评论

电子邮件地址不会被公开。 必填项已用*标注