python 机器学习概述

发布时间 2023-07-13 16:31:19作者: 创客未来

1.1 人工智能概述

1.2 人工智能发展历程

  1.图灵测试

  2.达特矛斯会议(1956年,人工智能元年)

1.3 人工智能的主要分支

  1.人工智能、机器学习和深度学习的关系

    机器学习是人工智能的一个实现途径

    深度学习是机器学习的一个方法发展而来

  2.主要分支介绍

    通讯、感知与行动是现代人工智能的三个关键能力。

  分支一: 计算机视觉

    计算机视觉(CV)是指机器感知环境的能力。这一个技术类别中的经典有图像形成、图像提取和图像的三维推理。物体检测和人脸识别是其比较成功的研究领域。

  分支二: 语音识别

    语音识别是指识别语音并将其转换成对应文本的技术。相反的任务(文本转语音)也是这一领域内一个类似的研究主题。语音识别领域仍然面临着声纹识别和鸡尾酒会效应等一些特殊情况的难题。现代语音识别系统严重依赖于云,在离线时可能就无法取得理想的工作效果。

  分支三: 文本挖掘/分类

    主要指文本分类,用于理解、组织和分类结构化或非结构化文档。

  分支四: 机器翻译

    利用机器的力量自动将一种自然语言的文本翻译成另一种语言。

  分支五: 机器人

  3.人工智能必备三要素

    数据

    算法

    计算力

1.4 机器学习工作流程

1.什么是机器学习?

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。

 2.机器学习的工作流程

 机器学习的工作流程:

  1> 获取数据、

  2> 数据基本处理

  3> 特征工程

  4> 机器学习(模型训练)

  5> 模型评估

3.获取到的数据集介绍

专有名词

  一行数据我们称为一个样本

  一列数据我们称为一个特征

  有些数据有目标值(标签值),有些数据没有目标值。

数据类型构成

  类型一:特征值+目标值

    目标值分为离散还是连续

  类型二:只有特征值,没有目标值

数据划分

  训练数据(训练集) -- 构建模型

    0.7-0.8

  测试数据(测试集)-- 模型评估

    0.2-0.3

4.数据基本处理

  对数据进行缺失值、去除异常值等处理