• 欢迎访问数智,大数据学习

标签:机器学习

【ML第九节】:机器学习之K-means聚类算法

聚类属于无监督学习,它将相似的对象归到同一个簇中。这里描述 K-means聚类算法,之所以把它称为 K-means 是因为它可以发现 k 个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据K-均值是发现给定数据集的 k 个簇的算法,簇个数 k 是由用户给定……

【ML第八节】:机器学习之逻辑回归算法

逻辑斯特回归虽然在名字上叫做回归,但是这个算法是用于分类的。思想:根据现有数据对分类边界线建立回归公式,以此进行分类。       优点:计算代价不高,易于理解和实现       缺点:容易欠拟和,分类精度可能不高       适用数据类型:数值型和标称型数据我们在构造逻辑回归模型是需要这样一个数学函数,当我们输入一个数据后他会把它归类,输出比如 ……

【ML第八节】:机器学习之线性回归算法

前面主要是关于分类问题的算法描述,下面讨论一些关于回归问题的算法;回归来历:最初的回归提出是由 Glton 发明的,它根据上一代豌豆种子的尺寸预测出了下一代种子的尺寸。他在大量对象上应用了回归分析,甚至包括人的身高,他注意到,如果双亲的高度比平均高度高,他们的子女也倾向于比平均高度高,但尚不及双亲。孩子的高度向着平均高度回退(回 归 )。在多项研究上都注意……

【ML第七节】:机器学习之人工神经网络

了解人工神经网络:以人脑中的神经网络为启发,是一种模仿生物神经网络(动物的中枢神经系统)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。人工神经网络由大量的人工神经元联结进行计算,大多数情况下人工神经网络能够在外界信息的基础上改变内部结构,是一种自适应系统。M-P神经元模型:如图 1,在图中的 M-P 神经元模型中,神经元接收到来自 n 个其他……

【ML第六节】:机器学习之支持向量机SVM算法

了解SVM:英文名 support vector machine,因此简称 SVM,它是一种二分类模型,基本模型定义为特征空间上的间隔最大的线性分类器,学习策略是间隔最大化,最终转化为一个凸二次规划问题的求解。引出:在描述支持向量机之前,先看一个有趣的问题:在这两副图里面,如果要将黑白两类点分为两类,那么那一根直线会比较好呢(后面解答)?因为两类点之……

【ML第五节】:机器学习之朴素贝叶斯算法

贝叶斯决策论:在概率论的框架下对样本进行分类的方法, 在所有相关概率都已知的理想情形下, 贝叶斯决策考虑基于这个概率和误判损失来对样本进行分类。设有 N 种可能的类别, 即 y={c1,c2,…,cN}. λij 是将一个真实类别为 cj 的样本判为 ci 的损失。 基于后验概率可得将样本分类所产生的期望损失, 或者成为条件风险(Conditi……

【ML第四节】:机器学习之K近邻算法详解

    概念理解:最近邻规则算法又称 K 近邻算法,采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用范围:数值型和标称型工作原理:存在一个训练集,并且这些训练集的数据都存在标签,那我们知道每一个数据的所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与训练集中每……

【ML第三节】:机器学习之决策树算法详解

决策树备注:关于决策树的学习资料主要来源《机器学习实战》基本认识:决策树是一类常见的机器学习方法,它是一个类似于流程图的树结构。其中每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或类分布,树的最顶层根节点;比较浅显易懂的说吧:一个游戏名叫猜数,游戏由两人组层,一人首先想好一个数字,比如是 56,另一个人进行猜测,比如他……

【ML第一节】:机器学习基本概念

1.1 认识机器学习基本认识:机器学习是人工智能领域中最能体现智能的一个分支学科,它横跨计算机科学,工程技术和统计学等多个学科,它能从海量的数据或者数据集中获取对我们有用的知识,来体现数据背后的真正含义。机器学习研究的主要内容是关于在计算机从数据中产生模型的算法,即“学习算法”,在报告后面,我会将学习的机器学习的经典算法做一定的介绍和演示。机器学习概念:……