|
人工智能 |
机器学习 |
|---|---|
|
|
人工智能是使机器模仿人类的技术,而机器学习可以被描述为人工智能的一个子集,是一种实现人工智能的技术。机器学习使系统能够从给定数据中自主学习新技巧,而无需明确编程。
Facebook使用DeepFace(深度学习人脸识别系统)算法进行人脸验证。它基于人脸验证算法,并借助神经网络模型支持人工智能技术。
输入:扫描包含模糊图像、高强度图像、高对比度图像等大量复杂数据的野外形式照片作为输入。
过程:采用4步过程完成现代人脸识别
1. 检测和分析面部特征
2. 比较和对齐特征。
3. 使用3D图表示关键模式。
4. 根据相似性对图像进行分类。
输出:从9层深度神经网络中导出人脸表示。
训练数据:由4000多名用户上传的超过400万张面部图像。
结果:Facebook可以检测两张图像是否代表同一个人。
市场篮子分析是大型零售商使用的一种数据挖掘技术,它解释了交易中经常出现的商品组合,并识别了人们购买的商品之间的关系。
例如,如果一个人购买牙膏,他也有40%的机会购买牙刷。公司可以通过了解商品之间的相关性来提供相关的商品优惠和折扣,从而发展业务。
关联规则挖掘和Apriori算法等机器学习算法是市场篮子分析背后的基本逻辑。
• 关联规则挖掘是一种用于确定项目之间相关性的技术。
• Apriori算法从频繁项集中生成关联规则。它遵循频繁项集的子集也必须是频繁项集的概念。
例如,如果一个人购买商品X,那么他也会购买商品Y。零售商可以宣布一个折扣优惠,即购买商品X和Y可享受商品Z的40%折扣。此类规则使用机器学习生成,然后应用于商品以增加销售额和发展业务。
人工智能是人类智能在人造机器上的模拟。机器经过一系列算法的良好编程。机器可以利用其智能工作并像人类一样行动。
谷歌搜索引擎是人工智能应用最流行的例子之一。我们一打开Chrome浏览器并开始输入内容,就会立即收到推荐选项。人工智能是搜索引擎背后的逻辑。
人工智能使用预测分析、自然语言处理和机器学习向我们推荐相关的搜索。谷歌利用收集到的关于我们的数据(例如搜索历史、位置、年龄等)进行这些推荐。因此,谷歌借助人工智能预测用户可能正在寻找什么。
智能体是一个实体,它借助传感器分析和识别其环境,并通过执行器对其环境采取行动。智能体可以是机器人、程序和人类等。
神经网络/人工神经网络/模拟神经网络是一种模仿人脑功能并与之相似的结构。它接收数据,处理数据,并根据算法和经验数据给出输出。
框架是用于通过表示“刻板情况”来划分子结构的数据结构。它是知识表示和推理方案的广泛组成部分。在脚本中,刻板序列以具有特定顺序的结构化表示进行描述,并且类似于框架。脚本用于以系统应理解的方式组织自然语言理解系统中的知识库。
• Python
• Java
• Julia
• Haskell
• Lisp
| 强人工智能 | 弱人工智能 |
|---|---|
|
|
顾名思义,它关乎学习和模式识别。机器学习算法观察模式并尝试从中学习。机器学习程序将持续学习并尝试在每次尝试中改进。一个很好的例子是我们的Facebook新闻动态。
• 聊天机器人
• 人脸识别
• 图像标记
• 自动驾驶汽车
• 自然语言处理
• 强化学习
• 半监督学习
• 监督学习
• 传导
• 无监督学习
根据能力
• 弱人工智能/狭义人工智能/人工狭义智能
能够智能地执行某些特定任务。
• 通用人工智能/强人工智能/人工通用智能
能够以人类般的效率执行任何智力任务。
• 超人工智能/人工超人类智能
能够执行人类所能做的一切,甚至更多。
根据功能
• 反应式机器
人工智能的基本类型。它只基于当前行动,不能利用经验形成当前决策。
• 有限记忆
过去的经验存储时间有限。
• 心智理论
一种先进的人工智能。它能理解人类情感和现实世界中的人。
• 自我意识
人工智能的未来。它将拥有类似人类的意识、情感和反应。
• 深度学习
• 机器学习
• 专家系统
• 模糊逻辑系统
• 机器人学
• 自然语言处理
• 神经网络。
• Scikit Learn
• PyTorch
• TensorFlow
• MxNet
• Auto ML
强化学习是一种机器学习算法,基于智能体与其环境之间的反馈循环。
通过执行某些动作并分析这些动作的回报和结果,智能体学习如何在环境中行为。这是一种基于试错学习的强化行为驱动技术。
一种人工智能程序,具有特定数据领域的专家级知识,并利用这些信息进行适当的反应。这些系统可用于替代人类专家并解决现实生活中的问题。
一种人工智能中用于检查计算机是否能像人类一样思考的探究方法。如果计算机能在特定条件下模仿人类反应,则可以通过测试,并可被视为智能。
模糊逻辑是人工智能的一个子集,其中人类学习被编码用于人工处理。它伴随着集合论的数学概念。使用IF-THEN规则的表示以及YES和NO的数字值。它基于真理度。
• 股票交易
• 天气预报系统
• 面部图案识别
• 空调、洗衣机和吸尘器
• 医疗诊断和治疗方案
1. 循环神经网络
2. 前馈神经网络
3. 卷积神经网络
博弈论是数学的一个分支。它在多智能体情境中更具相关性。在这里,我们处理从给定选项集中做出决策。由于环境是多智能体的,因此选择将影响对手或其他智能体的选择。在这里,每个智能体都同样理性,并试图获得最大奖励。博弈论不限于游戏,它还与机器学习算法、生成对抗网络等应用相关。
• 随机森林
• K-均值聚类
• 逻辑回归
• 朴素贝叶斯
• 决策制定
• 生物信息学
• 市场细分
• 图像、人脸和语音识别
Python是人工智能中使用最领先的编程语言。
它是一种开源模块化编程语言。其清晰度和可靠的编码方法使其在人工智能行业中处于领先地位。它因其Matplotlib和NumPy等开源库,Scikit-learn等框架,以及TensorFlow和VTK等逻辑版本库而广受欢迎。
人工智能中的神经网络可以定义为人脑功能的数学模型。这种技术使机器能够像人类一样思考和理解。这就是当今技术识别语音、物体等的方式。
它是一个用于机器学习和神经网络研究的开源软件库。它最初由Google Brain团队开发,用于数据流编程。Tensorflow使得将某些人工智能功能集成到自然语言处理和语音识别等应用程序中变得更加容易。
它是机器学习的一个子集,反过来又使系统模仿人类获取某些类型知识的方式。深度学习算法按复杂性递增的层次排列。多层神经网络用于处理数据。用于深度学习的层层堆叠的神经网络称为深度神经网络。
人工智能旨在模仿人类并模拟人脑。可以说人类是视觉的。因此,训练机器分析和分类图像是人工智能的关键部分。图像识别还使机器通过重复处理来学习,以更好地识别图像并处理这些图像。
Q-学习是一种用于强化学习的算法。这里的Q表示质量。在这种情况下,质量表示给定行动在获取未来奖励方面的有用程度。贝尔曼方程是此算法的原理。在这里,智能体从经验中学习一些最优策略,这些策略可以提供最佳行动,以在某些条件下最大化奖励。智能体试图最大化Q的值。
a. 用户界面:用于与专家系统交互或通信以查找问题解决方案。
b. 推理机:专家系统的主要处理单元或大脑。它用于从知识库中提取信息。推理机将不同的推理规则应用于知识库以从中得出结论。
c. 知识库:存储领域特定和高质量知识的存储区域。
它是一种人工智能软件或智能体,利用自然语言处理模拟与用户的对话。交互通过任何应用程序、网站或消息应用程序进行。它可以以文本或语音的形式与人类交互,也称为数字助理。人工智能聊天机器人在商业应用中广泛使用。
• 语义网络表示
• 产生式规则
• 逻辑表示
• 框架表示
a. Rainbird
b. TensorFlow
c. Microsoft Azure AI 平台
d. Infosys Nia
e. IBM Watson
理想的理性智能体是一个能够执行最佳可能行动并最大化性能度量的智能体。从备选方案中选择行动基于:
• 感知序列
• 内置知识库
理性智能体的行动使智能体在给定的感知序列中取得最大成功。理性智能体是性能最高的智能体。
一种图形模型,用于显示一组变量之间的概率关系。它可以描述为具有多条边的循环图,其中每条边代表一个条件依赖关系。
由于这些网络是从概率分布构建的,并使用概率论进行预测和异常检测,因此可以称之为概率性的。它在人工智能中很重要,因为它可以用来回答概率问题,并且基于贝叶斯定理。
| 机器学习 | 深度学习。 |
|---|---|
| 数据量小 训练时间短 无需高性能硬件 准确性低 输出是数值,如分类或分数。 | 需要大量数据 需要大量时间训练 需要高性能硬件 准确性高 输出可以是数值到自由形式元素,如文本和声音。 |
• 监督学习 - 通过使用标记数据进行学习。
• 无监督学习 - 在没有任何指导的情况下从未标记数据中学习。
• 强化学习 - 智能体通过行动与环境交互,并分析错误和奖励。
• 输入层 - 接收输入并将其转发到隐藏层进行分析。
• 隐藏层 - 在这里执行计算,并将结果转发到输出层。根据要解决的问题,隐藏层的数量可能有所不同。
• 输出层 - 信息通过此层从神经网络传输到外部世界。
• 它基于大脑的基本单元——神经元。一个人工神经元(感知器)被开发出来。
• 就像树突用于接收输入一样,感知器接收多个输入并应用各种功能,然后提供一个输出。
• 就像人脑一样,人工神经元(感知器)相互连接形成一个网络,称为深度神经网络。
• 感知器有一组输入,每个输入都被分配了特定的权重。然后感知器对这些加权输入进行一些计算,并给出输出。
前馈神经网络是ANN最简单的形式,数据单向传播。数据通过输入节点并从输出节点传出。隐藏层是条件性的。
• 前馈神经网络
• 卷积神经网络
• 循环神经网络(RNN)
• 自编码器
强化学习智能体遵循奖励最大化原则。为此,强化学习智能体必须经过训练,以便在各种选择中做出最佳选择以获得最大奖励。在每次行动之后,智能体会改变其自身和环境的状态。智能体获得的奖励最大程度地取决于其行动对实现目标的影响程度。
用于确定整个训练过程的参数称为超参数。它们的值无法从数据中估计,并且是模型外部的。例如,学习率、隐藏单元。
• 网格搜索
• 随机搜索
• 贝叶斯优化
文本挖掘是一种用于从结构化和非结构化文本中提取有用见解的技术。可以使用文本处理(如Perl)、统计模型等完成。输出是词频、模式、相关性。
从准确性方面来看,监督分类更适合图像分类。
在监督分类中,图像由机器学习专家手动输入和解释,以创建未来的类别。而在无监督分类中,特征类别由机器学习软件根据图像像素值创建。
| 参数模型 | 非参数模型 |
|---|---|
|
|
• 获取效率
• 推理充分性
• 推理效率
• 表示充分性
• 备用键
• 人工键
• 复合键
• 外键
• 自然键
• 主键
• 超键
随机森林是机器学习项目中使用的一种数据结构。随机森林方法用于为变量开发大量随机决策树。这些算法将改进技术分析复杂数据集的方式。这里采用的基本概念是,多个弱学习器可以组合形成一个强学习器。它可以处理具有大量属性的大型标记和未标记数据集。因此,它是人工智能项目的完美工具。即使有一些缺失数据,它也能保持其准确性。它还可以用于降维。
当出现平稳性问题,或者数据源发生变化时,我们就需要考虑更新算法。
统计人工智能更侧重于归纳思维(归纳趋势)
经典人工智能更侧重于演绎思维(得出结论)
状态空间搜索被认为是规划算法最直接的方法。它负责一切以找到解决方案。
合一是一种替换方法。它通过应用替换使两个不同的逻辑原子表达式相同。它以两个文字作为输入,并通过替换使它们相同。
• 谓词符号必须相同
• 两个表达式必须具有相同数量的参数。
• 同一表达式中没有两个相似的变量。
通过使用合一过程,我们可以使不同的逻辑表达式看起来相同。应用替换以使不同的表达式看起来相同。
• 有效性
• 逻辑等价
• 能力满足
为了从一组句子中提取意义,人工智能使用语义分析。
P*Q 的含义由 P、Q 和 * 决定。这种推导含义的过程称为组合语义学。
目前,几乎所有语音识别系统都使用此模型。它是对序列行为数据建模的常用工具。它用于解决时间概率推理。
HMM 中使用单个离散随机变量来描述过程状态。
世界的可能状态。
附加变量可以添加到时间模型中。
• 算术文字
• 谓词
• 相等和不等
我们可以使用逆消解算法来反转完整的消解。它是学习一阶理论的最佳算法。
语音识别中使用声学信号来识别单词序列。
归纳逻辑编程用于将归纳法与一阶表示的能力相结合。
在贝叶斯网络中,节点与其前驱之间在特定条件下独立是它们之间的结果。
A*算法是一种广泛使用的计算机算法,用于查找路径或遍历图,以找出不同点(称为节点)之间的最优路径。它可以搜索初始状态和最终状态之间的最短路径,或者用于计算初始状态和最终状态之间的最短距离。
它是一种搜索算法,用于减少Minimax算法在搜索树中搜索的节点数量。它可以定义为Minimax算法的一种优化技术。我们可以计算正确的Minimax决策,而无需检查游戏树的每个节点,这种技术称为剪枝。Alpha-Beta剪枝涉及两个用于未来扩展的阈值参数,Alpha和Beta。
• 医疗诊断和治疗方案
• 天气预报系统
• 面部图案识别
• 股票交易
• 地铁系统控制
| 广度优先搜索 | 深度优先搜索 |
| 不适合用于游戏和谜题的决策树 适合搜索离源头更近的顶点 使用队列数据结构 遍历最少数量的边从源头到达目的地。 | 更适合游戏或谜题问题 适合寻找远离源头的解决方案 使用栈数据结构 遍历更多边从源头到达目的地。 |
如果每次迭代的成本相同,则可以说一致代价搜索算法与BFS相同。它按路径到特定节点的成本递增顺序进行排序。
它是一种强大的机器学习算法,用于预测建模。它由一组基于贝叶斯定理的通用原则的算法组成。每个特征对结果都有独立且相等的贡献是朴素贝叶斯的基本假设。
它是一种无监督学习算法。未标记数据集被分组到不同的簇中,其中每个数据集只属于一个具有相似属性的组。这里的K用于定义在此过程中必须创建的预定义簇的数量。
| 智力 | 知识 |
| 与生俱来 每个人独有 无法通过练习获得 帮助决定如何处理情况或解决问题 | 通过学习过程获得 多才多艺,不同人可以相同 通过持续练习获得 帮助了解情况和将要发生的事情。 |
马尔可夫决策过程可以描述为强化学习问题形式化的一种数学方法。它旨在通过选择最优策略获得最大的正向奖励。在此过程中,智能体执行动作 A 以从初始状态过渡到最终状态。智能体在执行此动作 A 时将获得一些奖励。智能体执行的一系列动作称为策略。
• 删除不必要的特征
• 正则化
• 交叉验证
• 提前停止训练。
• 集成学习
• 使用更多数据进行训练
过拟合是机器学习中的主要问题之一。当机器学习算法试图捕获所有数据点时,它们也会意外地捕获数据中的噪声,从而导致模型过拟合。由于这种过拟合问题,算法在输出中显示出低偏差和高方差。
Dropout 技术
这是一种正则化技术,用于避免神经网络模型中的过拟合问题。它在训练过程中随机选择神经元并将其丢弃。从而避免了训练数据上的复杂协同适应。
1. 自然语言理解
2. 自然语言生成
计算机视觉是人工智能的一个领域。它用于训练计算机从视觉世界获取信息。计算机视觉利用人工智能解决图像处理、物体检测等问题。
• 逻辑表示
• 语义网络表示
• 框架表示
• 产生式规则
• Q-学习
• 深度Q神经网络
• SARSA
• 自动驾驶交通
• 人工智能驱动的教育系统。
• 医疗保健
• 预测性警务
• 太空探索
• 娱乐等
• F1 分数
• 混淆矩阵
• AUC-ROC 曲线
• 增益和提升图
• 基尼系数
• 交叉验证
• 均方根误差
在没有单个数据元素唯一标识结构的情况下,集成多个元素以创建结构体的唯一标识符。
启发式方法是处理游戏问题的最佳方式。它使用智能猜测技术。
该方法适应不同应用领域的容易程度用“泛化性”一词表示。
需要三项;一个条件概率和两个无条件概率。
它是一种用于实现关联数组的数据结构,可以将键值映射起来。它还可以计算数组的索引,从而找到所需的值。它由两部分组成:存储数据的数组和称为哈希函数的映射函数。
首先,必须根据业务问题创建一个问题陈述。这将有助于确保我们完全了解问题的类型以及问题的输入和输出。该陈述必须简单且在一句话之内。然后我们必须从以下组中选择一个适合我们试图解决的问题的算法
• 分类算法
• 聚类算法
• 回归算法
• 推荐算法
• 数据收集
• 数据准备
• 选择合适的模型
• 训练数据集
• 评估
• 参数调优
• 预测
电子商务网站使用机器学习向客户推荐产品。将具有相似购物行为的用户进行比较,并向具有相似购物行为的新用户推荐产品的过程称为协同过滤,这是推荐引擎的基本思想。