人工智能中的智能代理/代理

2022年11月24日， Learn eTutorial

3046

在本教程中，我们将讨论人工智能中的代理。一个AI系统包含一个代理及其环境。智能代理是一个使人工智能能够采取行动的软件实体。智能代理感知环境，并使用执行器来发起行动，代替用户进行操作。或者简单地说，智能代理（IA）是一个做出决策的实体。

什么是代理？

任何通过传感器识别环境并通过执行器对环境采取行动的东西都称为代理。代理周期性地执行识别、思考和行动的任务。代理可以是：

人类代理：眼睛、耳朵和其他器官作为传感器，手、腿、声道作为执行器。
机器人代理：摄像头、红外测距仪、传感器以及各种电机。
软件代理：为特定任务设计的一组程序，例如检查收到的电子邮件内容并将其分组为垃圾邮件、重要邮件、非常重要邮件。

什么是智能代理？

智能代理是一种能够为应用程序执行特定、可预测和重复性任务并具有一定自主性的代理。这些代理可以在执行任务时学习。这些代理具有一些人类的心智属性，如知识、信念、意图等。恒温器、Alexa和Siri都是智能代理的例子。

智能代理的主要功能是

感知：通过传感器完成
行动：通过执行器发起。

AI代理的四条规则

规则1：必须具备识别环境的能力。
规则2：决策是基于观察做出的。
规则3：决策应导致行动。
规则4：行动必须是理性的。

智能代理如何工作？

传感器、执行器和效应器是智能代理工作的三个主要组成部分。在进入详细讨论之前，我们应该首先了解传感器、效应器和执行器。

传感器：一种检测环境变化并将信息发送到其他设备的设备。代理通过传感器观察环境。例如：摄像头、GPS、雷达。

执行器：将能量转化为运动的机器部件。执行器负责移动和控制一个系统。例如：电动机、齿轮、导轨等。

效应器：影响环境的设备。例如：轮子和显示屏。

上图显示了这些组件在AI系统中的位置。
智能代理通过传感器接收来自环境的感知或输入。利用这些获取的信息或观察，该代理使用人工智能来做出决策。然后，执行器将触发行动。感知历史和过去的行动将影响未来的决策。

智能代理的特征

智能代理具有一定程度的自主性，允许它们独立执行某些任务。
IA即使在执行任务时也能学习。
它们可以与其他实体（如代理、人类和系统）进行交互。
可以适应新的规则。
目标导向的习惯

AI代理的结构

智能代理的结构可以看作是体系结构和代理程序的组合。

IA结构包括三个主要部分

体系结构：代理执行的机器或由执行器和传感器组成的设备。例如PC、摄像头等。
代理函数：它用于将感知映射到行动。感知序列指的是智能代理已识别信息的历史记录。
代理程序：它是代理函数的实现。在物理体系结构上执行代理程序会产生代理函数。

F: P* → A = 代理程序在物理体系结构上运行以产生函数f
简单的代理程序可以定义为一个代理函数，它将每个可能的感知映射到代理可以执行的可能行动。
现在我们对什么是智能代理有了清晰的认识。对于人工智能来说，基于逻辑（理性）的行动非常重要，因为代理每做出一个最佳行动就会得到正向奖励，每做出一个错误行动就会得到负向奖励。现在我们来看看理性和理性代理。

理性代理

一个理想的理性代理是指能够执行最佳行动并最大化性能度量的代理。从备选方案中选择行动的依据是：

感知序列
内置知识库

理性代理的行动使代理在给定的感知序列中最成功。性能最高的代理是理性代理。

理性

理性定义了合理、明智和具有良好判断力的程度。它关注于行动和结果，这取决于代理所感知到的内容。理性的衡量标准基于以下几点：

性能度量
关于环境的先验知识
代理可以执行的最佳行动
感知序列

AI中的PEAS表示法

这是一种AI代理工作所依据的模型类型。它用于对相似的代理进行分组。PEAS通过考虑相应代理的环境、执行器和传感器来制定性能度量。
PEAS代表性能度量（Performance Measure）、环境（Environment）、执行器（Actuator）和传感器（Sensor）。

性能度量：每个代理的性能根据其感知而变化，代理的成功使用性能度量单位来描述。
环境：代理在每个瞬间的周围环境。如果相应的代理处于运动状态，环境会随时间变化。环境有5种主要类型：
- 完全可观察 & 部分可观察
- 片段式 & 序列式
- 静态 & 动态
- 离散 & 连续
- 确定性 & 随机性
执行器：代理的一部分，用于发起行动并将行动的输出传递给环境。
传感器：代理的一部分，用于为代理接收输入。

带有PEAS表示法的代理示例

代理	性能度量	环境	执行器	传感器
吸尘器	清洁度效率电池寿命安全性	房间桌子木地板地毯各种障碍物	轮子刷子吸尘器	摄像头污垢检测传感器悬崖传感器碰撞传感器红外墙壁传感器
自动驾驶汽车	舒适的旅程安全性最大距离	道路交通车辆	方向盘油门刹车后视镜	摄像头 GPS 里程表
医院管理系统	患者健康状况入院流程支付	医院医生患者	处方诊断扫描报告	症状患者反应

代理

性能度量

环境

执行器

传感器

吸尘器

清洁度

效率

电池寿命

安全性

房间

桌子

木地板

地毯

各种障碍物

轮子

刷子

吸尘器

摄像头

污垢检测传感器

悬崖传感器

碰撞传感器

红外墙壁传感器

自动驾驶汽车

舒适的旅程

安全性

最大距离

道路

交通

车辆

方向盘

油门

刹车

后视镜

摄像头

GPS

里程表

医院管理系统

患者健康状况

入院流程

支付

医院

医生

患者

处方

诊断

扫描报告

症状

患者反应

AI代理的类型

根据能力和感知智能的水平，智能代理可以分为五个主要类别。

简单反射代理
基于模型的反射代理
基于目标的代理
基于效用的代理
学习代理

1. 简单反射代理

这些代理仅使用当前的感知而不是感知历史来行动。代理函数的基础是条件-行动规则。条件-行动规则是将条件映射到行动的规则。（例如：一个房间清洁代理只有在房间里有污垢时才工作）。环境是完全可观察的，完全可观察的环境对于代理函数的成功是理想的。简单反射代理的设计方法面临的挑战是：
智能非常有限

对当前状态的未识别部分一无所知。
大小难以存储。
无法适应环境变化。

2. 基于模型的反射代理

基于模型的反射代理在行动中会考虑感知历史。这些代理在不完全可观察的环境中仍然可以很好地工作。它们使用一个世界模型来选择相应的行动，并维护一个内部状态。
模型 - 理解世界上事情如何发生，因此被称为基于模型的代理。
内部状态 - 当前状态的未被注意到的特征用感知历史来表示。
更新代理状态需要以下信息：

世界如何演变。
代理的行动如何影响世界。

3. 基于目标的代理

为了描述能力，基于目标的代理使用目标信息。这些代理比基于模型的反射代理具有更高的能力，因为支持决策的知识被明确建模，从而允许修改。对于这些代理，关于当前状态环境的知识不足以决定该做什么。目标必须描述理想的情况。代理需要知道这个目标。代理选择行动以实现目标。在决定目标是否实现之前，这些代理可能需要考虑一长串可能的行动。目标 - 理想情况的描述。

4. 基于效用的代理

这些代理的选择基于效用。额外的效用测量组件使它们比基于目标的代理更先进。它们不仅根据目标行动，还根据实现目标的最佳方式行动。当代理必须从多个备选方案中执行最佳行动时，基于效用的代理非常有用。通过将每个状态映射到一个实数来检查每个行动实现目标的效率。

5. 学习代理

具有从先前经验中学习能力的代理是学习代理。它们开始时基于基本知识行动，然后通过学习可以自动行动和适应。学习代理可以学习、分析性能并改进性能。学习代理具有以下概念性组件：

学习元件：能够从先前经验中学习的元件。
评判器：根据固定的性能标准，提供关于代理表现如何的反馈。
执行元件：选择要执行的行动。
问题产生器：作为反馈代理，执行某些任务，例如提出建议，从而带来新的、有信息价值的体验。

智能代理的应用

在许多现实生活情境中，人工智能中的智能代理已经得到了应用。

信息搜索、检索和导航

通过使用搜索引擎进行信息搜索，智能代理增强了信息的访问和导航。智能代理代表用户在短时间内搜索特定的数据对象。

重复性办公活动

一些公司的某些职能领域，如客户支持和销售，已经自动化以降低运营成本。

医疗诊断

患者被视为环境，计算机键盘用作接收患者症状数据的传感器，智能代理利用这些信息来决定最佳行动方案。测试和治疗通过执行器给出。

吸尘清洁

对于吸尘器来说，待清洁的表面就是环境（例如房间、桌子、地毯）。使用吸尘器中的传感器（摄像头、污垢检测传感器等）感知环境状况。执行器如刷子、轮子和吸尘器被用来执行动作。

自动驾驶

在自动驾驶中，摄像头、GPS和雷达被用作传感器来收集信息。行人、其他车辆、道路或路标是环境。各种执行器如刹车被用来启动动作。

其他教程

查看全部

学习人工智能

AI - 简介

AI - 智能系统

AI - 人工智能的类型

AI - 智能体

AI - 代理环境

AI - 图灵测试

AI - 图灵测试的替代方案

AI - 问题解决

AI - 算法

AI - 搜索算法

AI - 有信息搜索算法

AI - 爬山算法

AI - 对抗性搜索