机器学习是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。
机器学习是实现人工智能的一个途径之一,即以机器学习为手段,解决人工智能中的部分问题。
机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。
分类
机器学习可以分成下面几种类别:
监督学习
监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类
非监督学习
监督学习和非监督学习的差别就是训练集目标是否有人为标注。他们都有训练集 且都有输入和输出
无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有生成对抗网络(GAN)、聚类。
增强学习
增强学习机器为了达成目标,随着环境的变动,而逐步调整其行为,并评估每一个行动之后所到的回馈是正向的或负向的
总结
机器学习是计算机从数据中学习的总称
机器可以通过很多不同的方式(“算法”)来学习
-算法可以分为监督,无监督和强化算法
-你提供给机器学习算法的数据可以是输入输出对,也可以只是输入
-监督学习算法需要输入输出对(即它们需要输出)
无监督学习只需要输入数据(不需要输出)
-一般来说,监督算法是如何工作的:
-你给它一个示例输入,然后是相关的输出
-你重复上面的步骤很多很多次
最终,算法会在输入和输出之间找到一种模式
现在,你可以给它一个全新的输入,它会为你预测输出
-一般来说,无监督算法是如何工作的:
-你给它一个示例输入(没有关联的输出)
-重复以上步骤多次
-最终,算法将你的输入分组
现在,你可以给它一个全新的输入,算法会预测它属于哪个集群