机器学习,数据挖掘,人工智能,统计学的一点随笔

  • 1.机器学习(ML):考察计算机如何基于数据来学习(或提高性能),也就是通过数据,得到目标函数f的近似g。可分为:监督学习(基本上就是分类),学习中的监督来自训练数据集中标记的实例;无监督学习(本质上就是聚类),输入实例没有类标记;半监督学习,学习模型时,使用标记和未标记的实例,标记的实例可用来学习类模型,未标记的实例可用来改进类边界;主动学习,可能要求用户对一个可能来自未标记的实例集或有学习程序合成的实例进行标记。
  • 2.数据挖掘(DM)使用大量数据发现有趣的(有用的)性质或属性。
  • 比较:对于分类和聚类任务,机器学习通常关注模型的准确率。除准确率之外,数据挖掘强调数据挖掘方法在大型数据集上的有效性和可伸缩性,以及处理复杂数据类型的方法,并开发新的、非传统的方法。如果“有趣的性质”same as g,那么DM=ML。
  • 3.人工智能(AI)顾名思义,人工智能就是需要通过计算来实现一些智能行为。显然,ML就是实现AI的一种方法。
  • 4.统计学研究数据的收集、分析、解释和表现。利用数据来推论未知的过程、事件。统计模型是一组数学函数,它们用随机变量及其概率分布刻画目标类对象的行为。统计学方法可用来验证数据挖掘的结果,也可是实现ML的一种实现方法。需要注意,许多统计学方法都具有很高的计算复杂度。
    原文作者:JLOGAN
    原文地址: https://blog.csdn.net/ASSaSSINangJIE/article/details/50548727
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞