人工智能基础知识

  • 人工智能学科的诞生标志:1956年达特茅斯会议

  • 1982年,物理学家 John Hopfield 证明Hopfield 网络,提供一种全新的方式学习处理信息。大约在同时(早于 Paul Werbos)David Rumelhart 推广了反向传播算法,一种神经网络训练方法。这些发现使 1970 年以来一直遭人遗弃的联结主义重获新生。

  • 人工神经网络模拟了人脑的神经元之间连接权值调整来实现智能。

  • 明斯基佩珀特提出的感知器问题曾一度导致神经网络研究陷入低潮

  • 科学家艾伦·图灵提出图灵测试,用于判断机器是否具有智能

  • 人工智能研究的三大学派符号主义行为主义连接主义

  • Transformer 架构由2017年 Google 提出,凭借自注意力机制彻底改变了自然语言处理领域,并成为大语言模型的基础。

  • 2024年诺贝尔物理学奖授予霍普菲尔德辛顿表彰他们利用物理学方法构建人工神经网络,为现代机器学习奠定基础。

  • 人工智能领域技术:包括机器学习自然语言处理模式识别

  • 自然语言处理(NLP):可用于情感分析,其核心语义分析

  • 无监督学习

    • 定义:又称非监督式学习,是机器学习的一种方法,没有给定事先标记过的训练
    • 示例自动对输入的资料进行分类分群
    • 典型任务聚类分析降维处理
    • 算法K-means 算法主成分分析
  • 监督学习

    • 定义:使用标记数据集训练算法,以便对数据进行分类或准确预测结果
    • 分类算法有:线性分类器支持向量机(SVM)、决策树k 近邻随机森林逻辑回归
    • 回归算法有:线性回归多项式回归
  • 深度学习三要素:模型算法数据

  • 支持向量机(SVM):一种基于统计学习理论的监督学习算法,通过构建最大间隔的超平面实现对样本的高效分类。

  • 生成对抗网络(GANs)由生成器判别器组成,通过二者之间的对抗博弈训练生成器,使其能够生成逼真数据。

  • 统计语言模型:为了简化计算,通常做一个马尔可夫假设,即一个词出现的概率只与它前面有限个词有关

  • 词嵌入技术(如 Word2Vec):将词语映射到稠密的实数向量空间中,使得语义相似的词语在空间中的距离更近

  • 模型训练中 Loss值越小,表示模型性能越优

  • 数据增强可以提高模型的泛化能力

  • 深度神经网络:在残差网络中引入残差连接,以解决梯度消失/爆炸问题,使得网络可以构建更深

  • 模型推理阶段不需要反向传播。

  • 使用公开数据集,需要注明来源

  • 人工智能项目主要环节数据采集模型训练模型部署推理测试

  • 人工智能安全领域,针对对抗样本攻击的常见防御方法包括对抗训练

  • Transformer 架构中,注意力机制核心是计算 QueryKeyValue 向量,以动态计算不同位置的重要性权重

Python 编程基础

  • Python 中#用于注释代码。

  • 定义字典类型变量:使用键值对形式,如{“key”: “value”}。

  • 函数:使用 print()函数进行输出;使用函数 sum()计算列表中元素求和

  • 循环结束语句

    • break:直接结束循环,执行循环后面的代码
    • continue:跳过当前循环的剩余部分,并继续执行下一次循环
    • pass:是空语句,是为了保持程序结构的完整性。
  • 删除

    • del:用于删除对象的引用。它可以用于删除变量、列表中的元素、字典中的键值对以及释放对象占用的内存空间
    • remove:用于移除列表中某个值的第一个匹配项。
    • pop:用于移除列表中的最后一个元素,并且返回该元素的值。
  • 读取 Excel 文件数据常用pandas库。

  • 导入 NumPy 库语句:import numpy as np

  • 数据类型:包括 intfloatstringlistdictboolset 等。

  • 机器学习开发编程语言有 PythonC++JavaScala

  • 文本预处理(包括文本清洗分词词性标注等)是一个重要的数据处理步骤。

神经网络与深度学习

  • 深度学习框架:包括 TensorFlowPyTorchCaffePaddlePaddle

  • 机器学习中提到的从信息中找重要成分的方法包括:主成分分析独立成分分析因子分析

  • 数据集

    • 训练集用于模型训练
    • 验证集用于模型训练过程性能评估
    • 测试集用于模型训练完成后最终性能评估
  • 卷积神经网络

    • 基本层次输入层输出层隐含层(包括卷积层池化层全连接层归一化和正则化层激活函数)。
    • 卷积层作用:特征提取
    • 池化层作用:减少特征图维度保留关键信息
  • 卷积操作主要参数卷积核大小步长填充

  • 卷积层中卷积核数量决定输出特征图的通道数

  • 激活函数

    • ReLU缓解梯度消失
    • Sigmoid, Tanh梯度易消失
    • Softmax分类输出
  • 常用损失函数包括 CrossEntropy(交叉熵)、MSE(均方误差)、L1Loss

  • 过拟合

    • 表现:模型在训练集上表现优异,但在测试集上表现较差
    • 解决:包括 Dropout早停法数据增强正则化
  • 欠拟合

    • 原因:训练集太少
    • 解决:增加模型复杂度
  • 梯度消失

    • 表现:会导致模型训练不稳定无法收敛
    • 解决:ReLU激活函数可缓解。
  • 反向传播算法:训练人工神经网络的核心方法

  • 模型评估指标

    • 准确率(Accuracy)的含义是模型正确分类的比例;
    • 精确率(Precision)
  • 分类模型性能评估常用指标:包括准确率精确率召回率F1 分数

  • 训练性能影响因素:学习率批次大小数据质量显卡性能

  • 模型可调整优化参数学习率批次大小优化器激活函数

  • 降维技术

    • 线性包括主成分分析(PCA)线性判别分析(LDA)
    • 非线性包括核主成分分析(KPCA)t-SNE
  • 训练过程步骤:包括前向传播反向传播计算损失更新参数

  • 卷积神经网络CNN)应用场景:图像分类图像分割视频分析自动驾驶

  • 循环神经网络RNN)应用场景:自然语言处理语音识别视频分析图像序列生成和分析

  • 人工神经网络ANN

    • 基本特征:非线性非局限性非常定性非凸性
    • 构成:
      • 结构:结构指定了网络中的变量和它们的拓扑关系
      • 激励函数:定义如何根据其他神经元的活动来改变自己的激励值
      • 学习规则:指定了如何随着时间推进来调整网络中的权重
    • 分类:
      • 学习策略(Algorithm)分:监督式学习网络、无监督式学习网络、混合式学习网络、联想式学习网络、最适化学习网络。
      • 网络架构(Connectionism)分:前馈神经网络、循环神经网络、强化式架构。

MindSpore 框架

  • 基本单元nn.Cell,用于定义神经网络

  • 核心模块mindspore.train 用于模型训练。

  • 加载已保存模型参数函数:load_checkpoint()

  • 保存模型函数:save_checkpoint()

  • 运行模式:支持动态图(PyNative)和静态图(Graph)两种。

  • 运行环境:可以运行在 GPU 上。

  • 特点:支持动态图昇腾芯片自动微分不限于仅 CPU

  • 图模式下的数据类型

    • Python 内置数据类型
      • 当前支持的 Python 内置数据类型包括:numberstringlisttupledictionary
      • 对标 Python 内置数据类型,复数 complex 和集合 set 类型是不支持的。
      • 列表 list 和字典 dictionary 的一些高阶用法在基础语法场景下是不支持的。
    • 自定义数据类型
      • 当前自定义数据类型包括:tensorprimitivecellparameter

YOLO 模型

  • 全称:You Only Look Once

  • 作用:实现端到端单阶段目标检测模型。

  • 特点:速度快参数少端到端训练;相比 Faster R-CNN 的最大特点是速度快。

  • 输出:边界框类别

  • 训练命令参数--batch-size 表示一次迭代样本数

数据处理与标注

  • RGB 是计算机中表示颜色常用模型

  • CMYK 是一种减色模型,典型的用途是彩色印刷

  • 图像通道数:为 1 表示灰度图;为 3 表示彩色图

  • 数据清洗主要目的去除噪声异常值

  • 数据清洗方法:填充缺失值去除异常值标准化

  • 人工智能训练师处理文本标注任务:首要保证标注的准确性

  • 大规模文本数据标注工具LabelStudio

  • 人工智能训练师向开发团队反馈数据问题:重点说明问题出现的概率影响范围

  • 模型训练不一定需要调整全部参数,取决于训练策略

  • 结果可追溯性:人工智能训练师需确保标注训练结果可追溯。

职业素养与规范

  • 职业素养遵守数据保密规定尊重他人的知识产权保证标注数据的准确性不允许伪造实验结果

  • 职业规范保密数据不泄露模型尊重知识产权不允许随意复制使用他人模型不注明来源

  • 道德要求保守秘密诚实守信团队协作不允许投机取巧

  • 掌握技能数据标注模型训练结果评估报告撰写

Logo

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。

更多推荐