设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 创业者 数据 手机
当前位置: 首页 > 创业 > 模式 > 正文

学习!机器学习算法优缺点综述

发布时间:2020-06-19 02:30 所属栏目:25 来源:站长网
导读:副标题#e# 正则化算法(Regularization Algorithms) 集成算法(Ensemble Algorithms) 决策树算法(Decision Tree Algorithm) 回归(Regression) 人工神经网络(Artificial Neural Network) 深度学习(Deep Learning) 支持向量机(Support Vector Mach

¼

 正则化算法(Regularization Algorithms)  集成算法(Ensemble Algorithms)  决策树算法(Decision Tree Algorithm)  回归(Regression)  人工神经网络(Artificial Neural Network)  深度学习(Deep Learning)  支持向量机(Support Vector Machine)  降维算法(Dimensionality Reduction Algorithms)  聚类算法(Clustering Algorithms)  基于实例的算法(Instance-based Algorithms)  贝叶斯算法(Bayesian Algorithms)  关联规则学习算法(Association Rule Learning Algorithms)  图模型(Graphical Models)

学习!机器学习算法优缺点综述

正则化算法(Regularization Algorithms)

学习!机器学习算法优缺点综述

它是另一种方法(通常是回归方法)的拓展,这种方法会基于模型复杂性对其进行惩罚,它喜欢相对简单能够更好的泛化的模型。

例子:

 岭回归(Ridge Regression)  最小绝对收缩与选择算子(LASSO)  GLASSO  弹性网络(Elastic Net)  最小角回归(Least-Angle Regression)

优点:

 其惩罚会减少过拟合  总会有解决方法

缺点:

 惩罚会造成欠拟合  很难校准

集成算法(Ensemble algorithms)

学习!机器学习算法优缺点综述

集成方法是由多个较弱的模型集成模型组,其中的模型可以单独进行训练,并且它们的预测能以某种方式结合起来去做出一个总体预测。

该算法主要的问题是要找出哪些较弱的模型可以结合起来,以及结合的方法。这是一个非常强大的技术集,因此广受欢迎。

 Boosting  Bootstrapped Aggregation(Bagging)  AdaBoost  层叠泛化(Stacked Generalization)(blending)  梯度推进机(Gradient Boosting Machines,GBM)  梯度提升回归树(Gradient Boosted Regression Trees,GBRT)  随机森林(Random Forest)

优点:

 当先最先进的预测几乎都使用了算法集成。它比使用单个模型预测出来的结果要精确的多

缺点:

 需要大量的维护工作

决策树算法(Decision Tree Algorithm)

学习!机器学习算法优缺点综述

决策树学习使用一个决策树作为一个预测模型,它将对一个 item(表征在分支上)观察所得映射成关于该 item 的目标值的结论(表征在叶子中)。

树模型中的目标是可变的,可以采一组有限值,被称为分类树;在这些树结构中,叶子表示类标签,分支表示表征这些类标签的连接的特征。

例子:

 分类和回归树(Classification and Regression Tree,CART)  Iterative Dichotomiser 3(ID3)  C4.5 和 C5.0(一种强大方法的两个不同版本)

优点:

 容易解释  非参数型

缺点:

 趋向过拟合  可能或陷于局部最小值中  没有在线学习

回归(Regression)算法

学习!机器学习算法优缺点综述

回归是用于估计两种变量之间关系的统计过程。当用于分析因变量和一个 多个自变量之间的关系时,该算法能提供很多建模和分析多个变量的技巧。具体一点说,回归分析可以帮助我们理解当任意一个自变量变化,另一个自变量不变时,因变量变化的典型值。最常见的是,回归分析能在给定自变量的条件下估计出因变量的条件期望。

回归算法是统计学中的主要算法,它已被纳入统计机器学习。

例子:

 普通最小二乘回归(Ordinary Least Squares Regression,OLSR)  线性回归(Linear Regression)  逻辑回归(Logistic Regression)  逐步回归(Stepwise Regression)  多元自适应回归样条(Multivariate Adaptive Regression Splines,MARS)  本地散点平滑估计(Locally Estimated Scatterplot Smoothing,LOESS)

优点:

 直接、快速  知名度高

缺点:

 要求严格的假设  需要处理异常值

人工神经网络

学习!机器学习算法优缺点综述

人工神经网络是受生物神经网络启发而构建的算法模型。

它是一种模式匹配,常被用于回归和分类问题,但拥有庞大的子域,由数百种算法和各类问题的变体组成。

例子:

 感知器  反向传播  Hopfield 网络  径向基函数网络(Radial Basis Function Network,RBFN)

优点:

 在语音、语义、视觉、各类游戏(如围棋)的任务中表现极好。  算法可以快速调整,适应新的问题。

缺点:

 需要大量数据进行训练  训练要求很高的硬件配置  模型处于黑箱状态,难以理解内部机制  元参数(Metaparameter)与网络拓扑选择困难。

深度学习(Deep Learning)

学习!机器学习算法优缺点综述

深度学习是人工神经网络的最新分支,它受益于当代硬件的快速发展。

众多研究者目前的方向主要集中于构建更大、更复杂的神经网络,目前有许多方法正在聚焦半监督学习问题,其中用于训练的大数据集只包含很少的标记。

例子:

 深玻耳兹曼机(Deep Boltzmann Machine,DBM)  Deep Belief Networks(DBN)  卷积神经网络(CNN)  Stacked Auto-Encoders

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读