在本教程中,我们将讨论人工智能中的代理。一个AI系统包含一个代理及其环境。智能代理是一个使人工智能能够采取行动的软件实体。智能代理感知环境,并使用执行器来发起行动,代替用户进行操作。或者简单地说,智能代理(IA)是一个做出决策的实体。
任何通过传感器识别环境并通过执行器对环境采取行动的东西都称为代理。代理周期性地执行识别、思考和行动的任务。代理可以是:
智能代理是一种能够为应用程序执行特定、可预测和重复性任务并具有一定自主性的代理。这些代理可以在执行任务时学习。这些代理具有一些人类的心智属性,如知识、信念、意图等。恒温器、Alexa和Siri都是智能代理的例子。
智能代理的主要功能是
规则1:必须具备识别环境的能力。
规则2:决策是基于观察做出的。
规则3:决策应导致行动。
规则4:行动必须是理性的。
传感器、执行器和效应器是智能代理工作的三个主要组成部分。在进入详细讨论之前,我们应该首先了解传感器、效应器和执行器。
传感器:一种检测环境变化并将信息发送到其他设备的设备。代理通过传感器观察环境。例如:摄像头、GPS、雷达。
执行器:将能量转化为运动的机器部件。执行器负责移动和控制一个系统。例如:电动机、齿轮、导轨等。
效应器:影响环境的设备。例如:轮子和显示屏。

上图显示了这些组件在AI系统中的位置。
智能代理通过传感器接收来自环境的感知或输入。利用这些获取的信息或观察,该代理使用人工智能来做出决策。然后,执行器将触发行动。感知历史和过去的行动将影响未来的决策。

智能代理的结构可以看作是体系结构和代理程序的组合。
IA结构包括三个主要部分
F: P* → A = 代理程序在物理体系结构上运行以产生函数f
简单的代理程序可以定义为一个代理函数,它将每个可能的感知映射到代理可以执行的可能行动。
现在我们对什么是智能代理有了清晰的认识。对于人工智能来说,基于逻辑(理性)的行动非常重要,因为代理每做出一个最佳行动就会得到正向奖励,每做出一个错误行动就会得到负向奖励。现在我们来看看理性和理性代理。
一个理想的理性代理是指能够执行最佳行动并最大化性能度量的代理。从备选方案中选择行动的依据是:
理性代理的行动使代理在给定的感知序列中最成功。性能最高的代理是理性代理。
理性定义了合理、明智和具有良好判断力的程度。它关注于行动和结果,这取决于代理所感知到的内容。理性的衡量标准基于以下几点:
这是一种AI代理工作所依据的模型类型。它用于对相似的代理进行分组。PEAS通过考虑相应代理的环境、执行器和传感器来制定性能度量。
PEAS代表性能度量(Performance Measure)、环境(Environment)、执行器(Actuator)和传感器(Sensor)。
带有PEAS表示法的代理示例
| 代理 | 性能度量 | 环境 | 执行器 | 传感器 |
|---|---|---|---|---|
|
吸尘器 |
清洁度 效率 电池寿命 安全性 |
房间 桌子 木地板 地毯 各种障碍物 |
轮子 刷子 吸尘器 |
摄像头 污垢检测传感器 悬崖传感器 碰撞传感器 红外墙壁传感器 |
|
自动驾驶汽车 |
舒适的旅程 安全性 最大距离 |
道路 交通 车辆 |
方向盘 油门 刹车 后视镜 |
摄像头 GPS 里程表 |
|
医院管理系统 |
患者健康状况 入院流程 支付 |
医院 医生 患者 |
处方 诊断 扫描报告 |
症状 患者反应 |
根据能力和感知智能的水平,智能代理可以分为五个主要类别。

这些代理仅使用当前的感知而不是感知历史来行动。代理函数的基础是条件-行动规则。条件-行动规则是将条件映射到行动的规则。(例如:一个房间清洁代理只有在房间里有污垢时才工作)。环境是完全可观察的,完全可观察的环境对于代理函数的成功是理想的。简单反射代理的设计方法面临的挑战是:
智能非常有限

基于模型的反射代理在行动中会考虑感知历史。这些代理在不完全可观察的环境中仍然可以很好地工作。它们使用一个世界模型来选择相应的行动,并维护一个内部状态。
模型 - 理解世界上事情如何发生,因此被称为基于模型的代理。
内部状态 - 当前状态的未被注意到的特征用感知历史来表示。
更新代理状态需要以下信息:

为了描述能力,基于目标的代理使用目标信息。这些代理比基于模型的反射代理具有更高的能力,因为支持决策的知识被明确建模,从而允许修改。对于这些代理,关于当前状态环境的知识不足以决定该做什么。目标必须描述理想的情况。代理需要知道这个目标。代理选择行动以实现目标。在决定目标是否实现之前,这些代理可能需要考虑一长串可能的行动。目标 - 理想情况的描述。

这些代理的选择基于效用。额外的效用测量组件使它们比基于目标的代理更先进。它们不仅根据目标行动,还根据实现目标的最佳方式行动。当代理必须从多个备选方案中执行最佳行动时,基于效用的代理非常有用。通过将每个状态映射到一个实数来检查每个行动实现目标的效率。

具有从先前经验中学习能力的代理是学习代理。它们开始时基于基本知识行动,然后通过学习可以自动行动和适应。学习代理可以学习、分析性能并改进性能。学习代理具有以下概念性组件:
在许多现实生活情境中,人工智能中的智能代理已经得到了应用。
通过使用搜索引擎进行信息搜索,智能代理增强了信息的访问和导航。智能代理代表用户在短时间内搜索特定的数据对象。
一些公司的某些职能领域,如客户支持和销售,已经自动化以降低运营成本。
患者被视为环境,计算机键盘用作接收患者症状数据的传感器,智能代理利用这些信息来决定最佳行动方案。测试和治疗通过执行器给出。
对于吸尘器来说,待清洁的表面就是环境(例如房间、桌子、地毯)。使用吸尘器中的传感器(摄像头、污垢检测传感器等)感知环境状况。执行器如刷子、轮子和吸尘器被用来执行动作。
在自动驾驶中,摄像头、GPS和雷达被用作传感器来收集信息。行人、其他车辆、道路或路标是环境。各种执行器如刹车被用来启动动作。