RELATEED CONSULTING
相关咨询
选择下列产品马上在线沟通
服务时间:9:30-18:00
你可能遇到了下面的问题
关闭右侧工具栏

技术支持

机器学习学习类型 - 监督学习
  • 作者:成都软件开发
  • 发表时间:2019-03-15 21:53
  • 来源:未知
 
什么是学习机器?
据说一台机器从某些类任务中学习过去的经验(数据输入),如果它在给定任务中的性能随着经验而提高。
 
监督学习:
监督学习是指模型在标记数据集上接受培训。标记数据集是具有输入和输出参数的数据集。在这种类型的学习中,训练和验证数据集都标记为如下图所示。
 
以上两个数据都标有数据集 -
 
图A:它是购物商店的数据集,用于预测客户是否会根据他/她的性别,年龄和工资购买正在考虑的特定产品。
输入:性别,年龄,工资
输出:购买,即0或1; 1表示客户将购买,0表示客户不会购买。
图B:它是一个气象数据集,用于根据不同参数预测风速。
输入:露点,温度,压力,相对湿度,风向
输出:风速
 
Ť 下雨的系统:
当训练模型,数据通常划分为80:20即80%作为训练数据的比率和休息作为测试数据。在训练数据中,我们为80%的数据提供输入和输出。该模型仅从训练数据中学习。我们使用不同的机器学习算法(我们将在下一篇文章中详细讨论)来构建我们的模型。通过学习,这意味着模型将构建自己的逻辑。
一旦模型准备好,那么最好进行测试。在测试时,输入是从模型以前从未见过的剩余20%数据中提供的,模型将预测某些值,我们将其与实际输出进行比较并计算准确度。
 
监督学习的类型:
 
分类:它是一种监督学习任务,其中输出具有已定义的标签(离散值)。例如,在上图A中,输出 - 已购买已定义标签,即0或1; 1表示客户将购买,0表示客户不会购买。这里的目标是预测属于特定类的离散值并基于准确度进行评估。
它可以是二进制或多类分类。在二进制分类中,模型预测为0或1; 是或否,但在多类分类的情况下,模型预测多个类。
示例: Gmail会对多个类(如社交,促销,更新,论坛)中的邮件进行分类。
回归:这是一项监督学习任务,其中输出具有连续值。
上图中的示例图B,输出 - 风速没有任何离散值,但在特定范围内是连续的。这里的目标是预测一个与我们的模型可以更接近实际输出值的值,然后通过计算误差值来完成评估。误差越小,回归模型的准确性越高。
 
监督学习算法的示例:
 
线性回归
最近的邻居
高斯朴素贝叶斯
决策树
支持向量机(SVM)
随机森林