0
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
创作中心
发布
  • 发文章

  • 发资料

  • 发帖

  • 提问

  • 发视频

创作活动

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

使用TensorFlow决策森林创建提升树模型

谷歌开发者 来源:TensorFlow 作者:TensorFlow 2022-04-19 10:46 次阅读

发布人:TensorFlow 团队的 Mathieu Guillame-Bert 和 Josh Gordon

随机森林和梯度提升树这类的决策森林模型通常是处理表格数据最有效的可用工具。与神经网络相比,决策森林具有更多优势,如配置过程更轻松、训练速度更快等。使用树可大幅减少准备数据集所需的代码量,因为这些树本身就可以处理数字、分类和缺失的特征。此外,这些树通常还可提供开箱即用的良好结果,并具有可解释的属性。

尽管我们通常将 TensorFlow 视为训练神经网络的内容库,但 Google 的一个常见用例是使用 TensorFlow 创建决策森林。

08660ec6-bf00-11ec-9e50-dac502259ad0.gif

对数据开展分类的决策树动画

如果您曾使用 2019 年推出tf.estimator.BoostedTrees 创建基于树的模型,您可参考本文所提供的指南进行迁移。虽然 Estimator API 基本可以应对在生产环境中使用模型的复杂性,包括分布式训练和序列化,但是我们不建议您将其用于新代码。

如果您要开始一个新项目,我们建议您使用 TensorFlow 决策森林 (TF-DF)。该内容库可为训练、服务和解读决策森林模型提供最先进的算法,相较于先前的方法更具优势,特别是在质量、速度和易用性方面表现尤为出色。

首先,让我们来比较一下使用 Estimator API 和 TF-DF 创建提升树模型的等效示例。

以下是使用 tf.estimator.BoostedTrees 训练梯度提升树模型的旧方法(不再推荐使用)

import tensorflow as tf

# Dataset generators
def make_dataset_fn(dataset_path):
    def make_dataset():
        data = ... # read dataset
        return tf.data.Dataset.from_tensor_slices(...data...).repeat(10).batch(64)
    return make_dataset

# List the possible values for the feature "f_2".
f_2_dictionary = ["NA", "red", "blue", "green"]

# The feature columns define the input features of the model.
feature_columns = [
    tf.feature_column.numeric_column("f_1"),
    tf.feature_column.indicator_column(
       tf.feature_column.categorical_column_with_vocabulary_list("f_2",
         f_2_dictionary,
         # A special value "missing" is used to represent missing values.
         default_value=0)
       ),
    ]

# Configure the estimator
estimator = boosted_trees.BoostedTreesClassifier(
          n_trees=1000,
          feature_columns=feature_columns,
          n_classes=3,
          # Rule of thumb proposed in the BoostedTreesClassifier documentation.
          n_batches_per_layer=max(2, int(len(train_df) / 2 / FLAGS.batch_size)),
      )

# Stop the training is the validation loss stop decreasing.
early_stopping_hook = early_stopping.stop_if_no_decrease_hook(
      estimator,
      metric_name="loss",
      max_steps_without_decrease=100,
      min_steps=50)

tf.estimator.train_and_evaluate(
      estimator,
      train_spec=tf.estimator.TrainSpec(
          make_dataset_fn(train_path),
          hooks=[
              # Early stopping needs a CheckpointSaverHook.
              tf.train.CheckpointSaverHook(
                  checkpoint_dir=input_config.raw.temp_dir, save_steps=500),
              early_stopping_hook,
          ]),
      eval_spec=tf.estimator.EvalSpec(make_dataset_fn(valid_path)))

使用 TensorFlow 决策森林训练相同的模型

import tensorflow_decision_forests as tfdf

# Load the datasets
# This code is similar to the estimator.
def make_dataset(dataset_path):
    data = ... # read dataset
    return tf.data.Dataset.from_tensor_slices(...data...).batch(64)

train_dataset = make_dataset(train_path)
valid_dataset = make_dataset(valid_path)

# List the input features of the model.
features = [
  tfdf.keras.FeatureUsage("f_1", keras.FeatureSemantic.NUMERICAL),
  tfdf.keras.FeatureUsage("f_2", keras.FeatureSemantic.CATEGORICAL),
]

model = tfdf.keras.GradientBoostedTreesModel(
  task = tfdf.keras.Task.CLASSIFICATION,
  num_trees=1000,
  features=features,
  exclude_non_specified_features=True)

model.fit(train_dataset, valid_dataset)

# Export the model to a SavedModel.
model.save("project/model")

附注

  • 虽然在此示例中没有明确说明,但 TensorFlow 决策森林可自动启用和配置早停

  • 可自动构建和优化“f_2”特征字典(例如,将稀有值合并到一个未登录词项目中)。

  • 可从数据集中自动确定类别数(本例中为 3 个)。

  • 批次大小(本例中为 64)对模型训练没有影响。以较大值为宜,因为这可以增加读取数据集的效率。

TF-DF 的亮点就在于简单易用,我们还可进一步简化和完善上述示例,如下所示。

如何训练 TensorFlow 决策森林(推荐解决方案)

import tensorflow_decision_forests as tfdf
import pandas as pd

# Pandas dataset can be used easily with pd_dataframe_to_tf_dataset.
train_df = pd.read_csv("project/train.csv")

# Convert the Pandas dataframe into a TensorFlow dataset.
train_ds = tfdf.keras.pd_dataframe_to_tf_dataset(train_df, label="my_label")

model = tfdf.keras.GradientBoostedTreeModel(num_trees=1000)
model.fit(train_dataset)

附注

  • 我们未指定特征的语义(例如数字或分类)。在这种情况下,系统将自动推断语义。

  • 我们也没有列出要使用的输入特征。在这种情况下,系统将使用所有列(标签除外)。可在训练日志中查看输入特征的列表和语义,或通过模型检查器 API 查看。

  • 我们没有指定任何验证数据集。每个算法都可以从训练样本中提取一个验证数据集作为算法的最佳选择。例如,默认情况下,如果未提供验证数据集,则 GradientBoostedTreeModel 将使用 10% 的训练数据进行验证。

下面我们将介绍 Estimator API 和 TF-DF 的一些区别。

Estimator API 和 TF-DF 的区别

算法类型

TF-DF 是决策森林算法的集合,包括(但不限于)Estimator API 提供的梯度提升树。请注意,TF-DF 还支持随机森林(非常适用于干扰数据集)和 CART 实现(非常适用于解读模型)。

此外,对于每个算法,TF-DF 都包含许多在文献资料中发现并经过实验验证的变体 [1, 2, 3]。

精确与近似分块的对比

TF1 GBT Estimator 是一种近似的树学习算法。非正式情况下,Estimator 通过仅考虑样本的随机子集和每个步骤条件的随机子集来构建

默认情况下,TF-DF 是一种精确的树训练算法。非正式情况下,TF-DF 会考虑所有训练样本和每个步骤的所有可能分块。这是一种更常见且通常表现更佳的解决方案。

虽然对于较大的数据集(具有百亿数量级以上的“样本和特征”数组)而言,有时 Estimator 的速度更快,但其近似值通常不太准确(因为需要种植更多树才能达到相同的质量)。而对于小型数据集(所含的“样本和特征”数组数目不足一亿)而言,使用 Estimator 实现近似训练形式的速度甚至可能比精确训练更慢。

TF-DF 还支持不同类型的“近似”树训练。我们建议您使用精确训练法,并选择使用大型数据集测试近似训练。

推理

Estimator 使用自上而下的树路由算法运行模型推理。TF-DF 使用 QuickScorer 算法的扩展程序。

虽然两种算法返回的结果完全相同,但自上而下的算法效率较低,因为这种算法的计算量会超出分支预测并导致缓存未命中。对于同一模型,TF-DF 的推理速度通常可提升 10 倍。

TF-DF 可为延迟关键应用程序提供 C++ API。其推理时间约为每核心每样本 1 微秒。与 TF SavedModel 推理相比,这通常可将速度提升 50 至 1000 倍(对小型批次的效果更佳)。

多头模型

Estimator 支持多头模型(即输出多种预测的模型)。目前,TF-DF 无法直接支持多头模型,但是借助 Keras Functional API,TF-DF 可以将多个并行训练的 TF-DF 模型组成一个多头模型。

了解详情

您可以访问此网址,详细了解 TensorFlow 决策森林。

如果您是首次接触该内容库,我们建议您从初学者示例开始。经验丰富的 TensorFlow 用户可以访问此指南,详细了解有关在 TensorFlow 中使用决策森林和神经网络的区别要点,包括如何配置训练流水线和关于数据集 I/O 的提示。

您还可以仔细阅读Estimator 迁移到 Keras API,了解如何从 Estimator 迁移到 Keras。

原文标题:如何从提升树 Estimator 迁移到 TensorFlow 决策森林

文章出处:【微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红
  • Google
    +关注

    关注

    5

    文章

    1638

    浏览量

    56442
  • 模型
    +关注

    关注

    1

    文章

    1668

    浏览量

    46991
  • tensorflow
    +关注

    关注

    13

    文章

    296

    浏览量

    59426
收藏 人收藏

    评论

    相关推荐

    如何在EasyEDA中创建圣诞

    描述Gerber_PCB_test_2_2022-02-08这是用于教育目的的假日 PCB。如何在 EasyEDA 中创建它的教程在 Youtube 上的“初学者圣诞 PCB 设计教程”下。
    发表于 06-29 08:00

    如何在STM32cube中使用最终模型

    的我正在使用 LSM6DSOX 和 ProfiMEMS 板。我基于 WEKA(决策树创建了我的模型,并在 Unico v.8 中对其进行了测试并且它有效。现在的问题是如何在 STM32cube 中使用我的最终模型(我在 MLC 中加载的模型)?程序如何?预先感谢您的帮助。
    发表于 01-12 09:14

    关于 TensorFlow

    在没有特殊硬件的前提下,在你的笔记本上跑一下机器学习的新想法?Tensorflow可以办到这点。准备将你的训练模型在多个CPU上规模化运算,又不想修改代码?Tensorflow可以办到这点。想要
    发表于 03-30 19:57

    使用 TensorFlow, 你必须明白 TensorFlow

    , 通常在构建阶段创建一个图来表示和训练神经网络, 然后在执行阶段反复执行图中的训练 op.TensorFlow 支持 C, C++, Python 编程语言. 目前, TensorFlow
    发表于 03-30 20:03

    关于决策树,这些知识点不可错过

    的一种算法。它既是分类算法,也是回归算法,还可以用在随机森林中。咱们学计算机的同学经常敲if 、else if、else其实就已经在用到决策树的思想了。决策树是一种简单常用的分类器,通过训练好的决策树
    发表于 05-23 09:38

    不可错过 | 集成学习入门精讲

    的估计区间 4、随机森林随机森林(Random Forest)是Bagging的扩展变体。随机森林在以决策树为基学习器构建Bagging集成的基础上,进一步在决策树的训练过程中引入了随机属性选择。简单
    发表于 06-06 10:11

    森林手持测径仪器的研发

    和完善。20世纪40年代后国内外测威廉希尔官方网站 突飞猛进,新产品不断涌现。  常规的测仪器是森林资源调查的主要工具,数据采集仪器陈旧、效率低下、费用昂贵,严重妨碍森林资源调査工作的进度,加之调查准确度要求
    发表于 10-18 09:27

    基于决策树的CART算法识别印第安人糖尿病患者

    利用决策树中CART算法识别印第安人糖尿病患者
    发表于 05-06 12:16

    决策树在机器学习的理论学习与实践

    决策树在机器学习的理论学习与实践
    发表于 09-20 12:48

    分类与回归方法之决策树

    统计学习方法决策树
    发表于 11-05 13:40

    机器学习的决策树介绍

    机器学习——决策树算法分析
    发表于 04-02 11:48

    李航统计学习第五章之决策树

    李航统计学习第五章-决策树
    发表于 04-29 15:12

    关于模型的一些理解

    模型的一些理解
    发表于 05-22 09:40

    Tensorflow保存和恢复模型的方法

    Tensorflow+Keras入门——保存和恢复模型的方法学习
    发表于 06-03 16:30

    ML之决策树与随机森林

    ML--决策树与随机森林
    发表于 07-08 12:31

    情地使用Tensorflow吧!

    GPU上运行,比如说可以运行在台式机、服务器、手机移动设备等等。想要在没有特殊硬件的前提下,在你的笔记本上跑一下机器学习的新想法?Tensorflow可以办到这点。准备将你的训练模型在多个CPU上规模
    发表于 07-22 10:13

    TensorFlow是什么

    、Caffe 和 MxNet,那 TensorFlow 与其他深度学习库的区别在哪里呢?包括 TensorFlow 在内的大多数深度学习库能够自动求导、开源、支持多种 CPU/GPU、拥有预训练模型,并支持常用
    发表于 07-22 10:14

    浅谈深度学习之TensorFlow

    神经网络和深度学习的概念,但为了完整起见,我们将在这里介绍基础知识,并探讨 TensorFlow 的哪些特性使其成为深度学习的热门选择。神经网络是一个生物启发式的计算和学习模型。像生物神经元一样,它们从其他
    发表于 07-28 14:34

    TensorFlow常用Python扩展包

    学习模型,如卷积、LSTM、BatchNorm、BiRNN、PReLU、残差网络和生成网络。它只适用于TensorFlow 1.0 或更高版本。请使用 pip install tflearn 安装
    发表于 07-28 14:35

    TensorFlow实现简单线性回归

    。可以对数据进行归一化处理: 为训练数据声明 TensorFlow 占位符: 创建 TensorFlow 的权重和偏置变量且初始值为零: 定义用于预测的线性回归模型: 定义损失函数: 选择梯度下降优化
    发表于 08-11 19:34

    TensorFlow实现多元线性回归(超详细)

    选择在这里对数据进行归一化处理,也可以添加偏置并对网络数据重构: 为训练数据声明 TensorFlow 占位符。观测占位符 X 的形状变化: 为权重和偏置创建 TensorFlow 变量。通过随机数
    发表于 08-11 19:35

    TensorFlow逻辑回归处理MNIST数据集

    。mnist.train.images 的每项都是一个范围介于 0 到 1 的像素强度: 在 TensorFlow 图中为训练数据集的输入 x 和标签 y 创建占位符: 创建学习变量、权重和偏置: 创建逻辑回归模型
    发表于 08-11 19:36

    labview测试tensorflow深度学习SSD模型识别物体

    安装labview2019 vision,自带深度学习推理工具,支持tensorflow模型。配置好python下tensorflow环境配置好object_detection API下载SSD模型
    发表于 08-16 17:21

    如何提升模型能力?

    目标检测的模型集成方法及实验常见的提升模型能力的方式
    发表于 02-24 07:10

    labview+yolov4+tensorflow+openvion深度学习

    tensorflow进行ssd/faster-rcnn模型的训练4、学会利用labview实现观察模型训练过程loss曲线5、学会利用labview调用tensorflow进行ssd/faster-rcnn模型的评估6
    发表于 05-10 22:33

    labview调用深度学习tensorflow模型非常简单,附上源码和模型

    本帖最后由 wcl86 于 2021-9-9 10:39 编辑 `labview调用深度学习tensorflow模型非常简单,效果如下,附上源码和训练过的模型:[hide][/hide
    发表于 06-03 16:38

    使用RTL8722DM运行 TensorFlow Lite Hello World 示例

    开发人员可以轻松构建和部署学习驱动的应用程序。TensorFlow Lite而管理微控制器的 TensorFlow Lite (TFL) 专注于机器电脑数据记忆的微控制器和其他设备上运行学习模型。核心
    发表于 06-21 15:48

    介绍支持向量机与决策树集成等模型的应用

    本文主要介绍支持向量机、k近邻、朴素贝叶斯分类 、决策树决策树集成等模型的应用。讲解了支持向量机SVM线性与非线性模型的适用环境,并对核函数技巧作出深入的分析,对线性Linear核函数、多项式
    发表于 09-01 06:57

    森林航空灭火仿真系统

    森林火灾具有突发性和复杂性,需要指挥员在短时间内判断林火的发展趋势, 实时掌握现场状况,并及时采取相应决策措施。但森林火灾这种大规模灾难场景难以在平时复现,因此在复杂任务的训练方面,多采用模拟仿真
    发表于 09-08 16:24

    深度学习模型是如何创建的?

    具有深度学习模型的嵌入式系统应用程序带来了巨大的好处。深度学习嵌入式系统已经改变了各个行业的企业和组织。深度学习模型可以帮助实现工业流程自动化,进行实时分析以做出决策,甚至可以预测预警。这些AI
    发表于 10-27 06:34

    用tflite接口调用tensorflow模型进行推理

    摘要本文为系列博客tensorflow模型部署系列的一部分,用于实现通用模型的部署。本文主要实现用tflite接口调用tensorflow模型进行推理。相关源码见链接引言本文为系列博客
    发表于 12-22 06:51

    如何创建小型模板设备

    如何创建小型模板设备
    发表于 12-23 07:43

    如何创建Proteus仿真模型

    我们紧接着介绍以原理图方式创建Proteus仿真模型的详细过程。有些读者可能会想:不就是从器件库中调出元件创建嘛,我可以做一个超级器件,里面包含51、AVR、PIC等单片机器件构成的超级模组,反正
    发表于 01-24 08:08

    人工智能算法有哪些?

    很像一棵的枝干,故称决策树。随机森林在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别输出的类别的众数而定。逻辑回归逻辑回归,是一种广义的线性回归分析模型,常用于数据挖掘
    发表于 03-05 14:15

    Mali GPU支持tensorflow或者caffe等深度学习模型

    Mali GPU 支持tensorflow或者caffe等深度学习模型吗? 好像caffe2go和tensorflow lit可以部署到ARM,但不知道是否支持在GPU运行?我希望把训练
    发表于 09-16 14:13

    怎样使用UNICO生成具有多个决策树的UCF文件呢

    使用 UNICO(v9.10.0.0),生成具有多个决策树的 UCF 文件的过程似乎是:1.加载所有决策树的所有测试数据,像对单个一样标记每个数据集(大概标签需要在所有中是唯一的)2.使用MLC
    发表于 12-26 06:30

    服务网格授权决策的UCONA模型

    基于授权谓词决策的使用控制模型表达能力较弱。该文给出一种委托凭证模型细粒度表达决策结果,用委托凭证处理过程的状态组合替换原来的简单访问状态。决策组件根据请求时
    发表于 03-31 10:10 10次下载

    森林

    森林:•基本概念•:n > o 个结点的集合,根、其余结点分为m >= 0 个集合,每一个集合本身又是一棵(子树)•度、叶子、父结点、儿子结点、祖先结点、层次
    发表于 08-13 13:50 28次下载

    森林的基本概念

    森林:•基本概念•:n > o 个结点的集合,根、其余结点分为m >= 0 个集合,每一个集合本身又是一棵(子树)•度、叶子、父结点、儿子结点、祖先结点、层次
    发表于 08-13 13:50 10次下载

    决策树威廉希尔官方网站 在汽车销售中的应用

    介绍了决策树分类威廉希尔官方网站 ,并用其对汽车销售企业的调查问卷进行数据分析,挖掘出最近一年内有购车意愿的客户的特征,从而提高营销的成功率。证明了决策树数据挖掘威廉希尔官方网站 在汽车
    发表于 09-09 15:49 12次下载

    一个基于粗集的决策树规则提取算法

    一个基于粗集的决策树规则提取算法:摘要:决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往
    发表于 10-10 15:13 12次下载

    基于决策树与相异度的离群数据挖掘方法

    在数据挖掘中我们往往会忽略离群数据,可是这些数据却往往包含重要的信息。本文采用了将决策树与相异度相结合的方式进行离群数据的挖掘。通过计算决策树中各属性的信息
    发表于 01-15 14:28 5次下载

    电子称重仪表决策树建模研究

    引入了基于粗糙集理论的属性约简进行属性的降噪和排序处理,然后结合决策树理论的C4.5算法来对自诊断电子称重仪表进行分析,取信息增益率最大的结点作为决策树的根,以此使分裂
    发表于 10-08 14:43 24次下载
    电子称重仪表<b>决策树</b>建模研究

    改进决策树算法的应用研究

    该方法利用决策树算法构造决策树,通过对分类结果中主客观属性进行标记并逻辑运算,最终得到较客观的决策信息,并进行实验验证。
    发表于 02-07 11:38 26次下载
    改进<b>决策树</b>算法的应用研究

    基于决策树学习的智能机器人控制方法

    基于决策树学习的智能机器人控制方法!资料来源网络,如有侵权,敬请见谅
    发表于 11-30 11:33 15次下载

    决策树的介绍

    关于决策树的介绍,是一些很基础的介绍,不过是英文介绍。
    发表于 09-18 14:55 18次下载

    基于C5.0决策树算法的考试结果预测研究_潘峰

    基于C5.0决策树算法的考试结果预测研究_潘峰
    发表于 03-01 21:57 0次下载

    基于随机森林模型的短时交通流预测方法_程政

    基于随机森林模型的短时交通流预测方法_程政
    发表于 03-04 18:03 0次下载

    统计关联规则决策树在医疗数据中的应用_王旭晨

    统计关联规则决策树在医疗数据中的应用_王旭晨
    发表于 03-04 18:07 0次下载

    梯度提升决策树助力Facebook提升用户体验

    Facebook 使用机器学习和排序模型给所有用户带来最佳体验,例如发送什么通知,在你的消息推送中放入什么文章,以及对于你想关注的人提些什么建议。高质量的机器学习模型对于找出最相关的内容来说很重
    发表于 10-09 15:38 0次下载

    基于ID3的决策树算法研究

    路径最短,从而提升分类的速度和准确率。通过实例对改进算法生成决策树产生的结果分析,表明了该算法生成的决策树结构更简单,时间复杂度更优。算法更有效。
    发表于 11-14 14:08 1次下载
    基于ID3的<b>决策树</b>算法研究

    基于Bagging决策树优化算法

    针对经典C4.5决策树算法存在过度拟合和伸缩性差的问题,提出了一种基于Bagging的决策树改进算法,并基于MapReduce模型对改进算法进行了并行化。首先,基于Bagging威廉希尔官方网站 对C4.5算法
    发表于 11-21 11:57 1次下载
    基于Bagging<b>决策树</b>优化算法

    一种新型的决策树剪枝优化算法

    目前关于决策树剪枝优化方面的研究主要集中于预剪枝和后剪枝算法。然而,这些剪枝算法通常作用于传统的决策树分类算法,在代价敏感学习与剪枝优化算法相结合方面还没有较好的研究成果。基于经济学中的效益成本
    发表于 11-30 10:05 0次下载
    一种新型的<b>决策树</b>剪枝优化算法

    基于贪心算法的非一致决策表的决策树分析方法

    决策树威廉希尔官方网站 在数据挖掘的分类领域中被广泛采用。采用决策树从一致决策表f即条件属性值相同的样本其决策值相同)中挖掘有价值信息的相关研究较为成熟,而对于非一致决策表(即条件属性值相同的样本其决策
    发表于 12-05 14:30 0次下载
    基于贪心算法的非一致<b>决策</b>表的<b>决策树</b>分析方法

    使决策树规模最小化算法

    决策树威廉希尔官方网站 在数据挖掘的分类领域应用极其广泛,可以从普通决策表(每行记录包含一个决策值)中挖掘有价值的信息,但是要从多值决策表(每行记录包含多个决策值)中挖掘潜在的信息则比较困难。多值决策表中每行记录
    发表于 12-05 15:47 0次下载
    使<b>决策树</b>规模最小化算法

    MATLAB编译生成AUTOLISP代码实现可变ID3基因分型决策树分类图的绘制

    决策树分类器,是一种基于实例的分类算法,广泛被应用于人工智能领域。ID3算法是最为经典的决策树建树算法,它通过递归和逐次挑选信息量最多的属性来构造决策树决策树的结构有时非常庞大和复杂,而决策树分类
    发表于 12-07 11:23 0次下载
    MATLAB编译生成AUTOLISP代码实现可变ID3基因分型<b>决策树</b>分类图的绘制

    基于粗决策树的动态规则提取算法

    针对静态算法对大数据和增量数据处理不足的问题,构造了基于粗决策树的动态规则提取算法,并将其应用于旋转机械故障诊断中。将粗集与决策树结合,用增量方式实现样本抽取;经过动态约简、决策树构造、规则提取
    发表于 12-29 14:24 0次下载

    海量嘈杂数据决策树算法

    针对当前决策树算法较少考虑训练集的嘈杂程度对模型的影响,以及传统驻留内存算法处理海量数据困难的问题,提出一种基于Hadoop平台的不确定概率C4.5算法-IP-C4.5算法。在训练模型
    发表于 01-13 09:41 0次下载

    如何使用最优二叉决策树分类模型进行奶牛运动行为的识别

    针对奶牛行为分类过程中决策树算法构建主观性强、阈值选取无确定规则,易导致分类精度差的问题,该文提出一种基于最优二叉决策树分类模型的奶牛运动行为识别方法,首先选取描述奶牛腿部三轴加速度数值大小、对称性
    发表于 04-24 08:00 0次下载
    如何使用最优二叉<b>决策树</b>分类<b>模型</b>进行奶牛运动行为的识别

    广义可能性模糊时态计算逻辑的模型检测

    为了增强计算逻辑在时序上的表达能力,以广义可能性测度、决策过程和计算逻辑为基础,硏究了具有决策过程的广义可能性模糊时态计算逻辑的模型检测。首先采用广乂可能性决策过程作为系统模型;然后引λ模糊
    发表于 05-12 15:26 4次下载

    基于非均衡数据分类的犹豫模糊决策树

    为优化针对非均衡数据的分类效果,结合犹豫模糊集理论与决策树算法,提出一种改进的模糊决策树算法。通过 SMOTE算法对非均衡数据进行过采样处理,使用K- means聚类方法获得各属性的聚类中心点,利用
    发表于 06-09 15:51 5次下载

    基于加权随机森林等的恶意软件检测

    Android软件的权限信息和硬件组件信息,分析各类特征的占比差,并将特征属性作为分类模型的输入。在此基础上,对随机森林中的模型赋予不同的权值,验证模型对最终分类结果的影响。实验结果表明,与神经网络方法相比,基于特征占比差的特征构
    发表于 06-10 10:47 14次下载

    基于遗传优化决策树的建筑能耗预测模型

    基于遗传优化决策树的建筑能耗预测模型
    发表于 06-27 16:19 6次下载

    在MaaXBoard RT上运行几乎任何TensorFlow模型

    电子发烧友网站提供《在MaaXBoard RT上运行几乎任何TensorFlow模型.zip》资料免费下载
    发表于 10-31 10:28 2次下载
    在MaaXBoard RT上运行几乎任何<b>TensorFlow</b><b>模型</b>

    解读决策树与随机森林模型的概念

    为什么要引入随机森林呢。我们知道,同一批数据,我们只能产生一颗决策树,这个变化就比较单一了,这就有了集成学习的概念。
    发表于 10-18 17:47 3169次阅读
    解读<b>决策树</b>与随机<b>森林</b><b>模型</b>的概念

    决策树的构建设计并用Graphviz实现决策树的可视化

    树种涉及到的算法进行总结并附上自己相关的实现代码。所有算法代码以及用于相应模型的训练的数据都会放到GitHub上。 本文中我将一步步通过MLiA的隐形眼镜处方数集构建决策树并使用Graphviz将决策树可视化。
    发表于 11-15 13:10 1.4w次阅读
    <b>决策树</b>的构建设计并用Graphviz实现<b>决策树</b>的可视化

    机器学习:决策树--python

    今天,我们介绍机器学习里比较常用的一种分类算法,决策树决策树是对人类认知识别的一种模拟,给你一堆看似杂乱无章的数据,如何用尽可能少的特征,对这些数据进行有效的分类。 决策树借助了一种层级分类的概念
    发表于 11-16 01:50 1151次阅读

    机器学习之决策树生成详解

    根据给定的数据集创建一个决策树就是机器学习的课程,创建一个决策树可能会花费较多的时间,但是使用一个决策树却非常快。创建决策树时最关键的问题就是选取哪一个特征作为分类特征,好的分类特征能够最大化的把
    发表于 08-27 14:38 1.6w次阅读
    机器学习之<b>决策树</b>生成详解

    人工智能机器学习之随机森林(RF)

    决策树主要用来解决分类和回归问题,但是决策树(DT)会产生过拟合现象,导致泛化能力变弱。过拟合是建立决策树模型时面临的重要挑战之一。鉴于决策树容易过拟合的缺点,由美国贝尔实验室大牛们提出了采用随机森林(RF)投票机制来改善决策树
    发表于 05-30 06:59 2608次阅读

    带你了解一下人工智能中的决策树(DT)

    决策树(DT)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵的枝干,故称决策树。从数据产生决策树的机器学习威廉希尔官方网站 叫做
    发表于 05-29 07:12 1331次阅读

    大神教你怎么用Python抓取婚恋网用户数据,用决策树生成自己择偶观

    机器学习中,决策树是一个预测模型,它代表的是对象属性与对象值之间的一种映射关系。中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所
    的头像 发表于 05-28 10:53 3558次阅读
    大神教你怎么用Python抓取婚恋网用户数据,用<b>决策树</b>生成自己择偶观

    构建一个决策树并查看它如何进行预测

    正如你所看到的,决策树非常直观,他们的决策很容易解释。 这种模型通常被称为白盒模型。 相反,正如我们将看到的,随机森林或神经网络通常被认为是黑匣子模型。 他们做出了很好的预测,并且我们可以轻松检查他们执行的计算以进行这些预测; 然而,通常很难用简单的术语来解释为什么会做出预测
    的头像 发表于 07-16 17:12 1.3w次阅读
    构建一个<b>决策树</b>并查看它如何进行预测

    数据挖掘算法:决策树算法如何学习及分裂剪枝

    决策树(decision tree)算法基于特征属性进行分类,其主要的优点:模型具有可读性,计算量小,分类速度快。决策树算法包括了由Quinlan提出的ID3与C4.5,Breiman等提出的CART。其中,C4.5是基于ID3的,对分裂属性的目标函数做出了改进。
    的头像 发表于 07-21 10:13 4703次阅读
    数据挖掘算法:<b>决策树</b>算法如何学习及分裂剪枝

    结合深度神经网络和决策树的完美方案

    “ANT的出发点与mGBDT类似,都是期望将神经网络的表示学习和决策树的特点做一个结合,不过,ANT依旧依赖神经网络BP算法进行的实现,”冯霁说:“而深度森林(gcForest/mGBDT)的目的
    的头像 发表于 07-25 09:39 8373次阅读
    结合深度神经网络和<b>决策树</b>的完美方案

    深度神经决策树:深度神经网络和模型结合的新模型

    近日,来自爱丁堡大学的研究人员提出了一种结合深度神经网络和模型的新型模型——深度神经决策树(Deep Neural Decision Trees, DNDT)。
    的头像 发表于 08-19 09:14 1.1w次阅读

    如何利用Tensorflow搭建神经网络?

    尽管对于初学者而言使用Tensorflow看起来并不那么习惯,需要各种步骤,但简单来说,Tensorflow搭建模型实际就是两个过程:创建计算图和执行计算图。
    的头像 发表于 09-17 17:20 2736次阅读

    浅谈随机森林在人脸对齐上的应用~

    由 无名氏 于 星期二, 2018-09-18 16:38 发表 1. 随机森林回顾 随机森林由N棵决策树组成,每一棵决策树都具有不同的初始训练样本,在训练过程中,还需要一个属性候选集,训练样本
    发表于 09-18 22:25 182次阅读

    决策树的原理和决策树构建的准备工作,机器学习决策树的原理

    希望通过所给的训练数据学习一个贷款申请的决策树,用于对未来的贷款申请进行分类,即当新的客户提出贷款申请时,根据申请人的特征利用决策树决定是否批准贷款申请。
    的头像 发表于 10-08 14:26 4999次阅读

    什么是决策树?决策树算法思考总结

    C4.5算法:基于ID3算法的改进,主要包括:使用信息增益率替换了信息增益下降度作为属性选择的标准;在决策树构造的同时进行剪枝操作;避免了的过度拟合情况;可以对不完整属性和连续型数据进行处理,提升了算法的普适性。
    的头像 发表于 02-04 09:45 8192次阅读
    什么是<b>决策树</b>?<b>决策树</b>算法思考总结

    决策树和随机森林模型

    我们知道决策树容易过拟合。换句话说,单个决策树可以很好地找到特定问题的解决方案,但如果应用于以前从未见过的问题则非常糟糕。俗话说三个臭皮匠赛过诸葛亮,随机森林就利用了多个决策树,来应对多种不同场景。
    的头像 发表于 04-19 14:38 6766次阅读
    <b>决策树</b>和随机<b>森林</b><b>模型</b>

    详解机器学习决策树的优缺点

    决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。
    的头像 发表于 01-19 17:06 6469次阅读

    详谈机器学习的决策树模型

    决策树模型是白盒模型的一种,其预测结果可以由人来解释。我们把机器学习模型的这一特性称为可解释性,但并不是所有的机器学习模型都具有可解释性。
    的头像 发表于 07-06 09:49 2537次阅读
    详谈机器学习的<b>决策树</b><b>模型</b>

    一文知道决策树的优缺点

    决策树易于理解和解释,可以可视化分析,容易提取出规则。
    发表于 08-27 09:50 1.1w次阅读

    决策树的构成要素及算法

    决策树是一种解决分类问题的算法,决策树算法采用树形结构,使用层层推理来实现最终的分类。
    发表于 08-27 09:52 2399次阅读

    机器学习中常用的决策树算法威廉希尔官方网站 解析

    决策树是最重要的机器学习算法之一,其可被用于分类和回归问题。本文中,我们将介绍分类部分。
    发表于 10-12 16:39 950次阅读
    机器学习中常用的<b>决策树</b>算法威廉希尔官方网站
解析

    建立决策树的逻辑

    像上面的这样的二叉树状决策在我们生活中很常见,而这样的选择方法就是决策树。机器学习的方法就是通过平时生活中的点点滴滴经验转化而来的。
    的头像 发表于 10-10 10:44 1946次阅读
    建立<b>决策树</b>的逻辑

    使用基尼不纯度拆分决策树的步骤

    决策树是机器学习中使用的最流行和功能最强大的分类算法之一。顾名思义,决策树用于根据给定的数据集做出决策。也就是说,它有助于选择适当的特征以将分成类似于人类思维脉络的子部分。
    发表于 01-13 09:37 956次阅读
    使用基尼不纯度拆分<b>决策树</b>的步骤

    决策树的基本概念/学习步骤/算法/优缺点

    本文将介绍决策树的基本概念、决策树学习的3个步骤、3种典型的决策树算法、决策树的10个优缺点。
    发表于 01-27 10:03 1520次阅读
    <b>决策树</b>的基本概念/学习步骤/算法/优缺点

    决策树的一般流程及应用

    所有的机器学习算法中,决策树应该是最友好的了。它呢,在整个运行机制上可以很容易地被翻译成人们能看懂的语言,也因此被归为“白盒模型”。
    发表于 01-29 09:36 5777次阅读
    <b>决策树</b>的一般流程及应用

    决策树的判断标准及算法

    决策树中,可能有多个特征,但是一些特征是无关重要的,一些则是对分类(target)起到决定作用的。
    发表于 02-18 10:06 2972次阅读
    <b>决策树</b>的判断标准及算法

    什么是决策树模型决策树模型的绘制方法

    决策树是一种解决分类问题的算法,本文将介绍什么是决策树模型,常见的用途,以及如何使用“亿图图示”软件绘制决策树模型
    发表于 02-18 10:12 1w次阅读
    什么是<b>决策树</b><b>模型</b>,<b>决策树</b><b>模型</b>的绘制方法

    决策树的结构/优缺点/生成

    决策树(DecisionTree)是机器学习中一种常见的算法,它的思想非常朴素,就像我们平时利用选择做决策的过程。决策树是一种基本的分类与回归方法,当被用于分类时叫做分类,被用于回归时叫做回归
    发表于 03-04 10:11 6245次阅读

    如何在TensorFlow2里使用Keras API创建一个自定义CNN网络?

    概述 本示例工程中我们会在 TensorFlow2 下使用 Keras API 创建一个自定义 CNN 网络,在 Vitis-AI 1.3 环境下编译成 Xilinx DPU 上运行的模型文件,并在
    的头像 发表于 04-15 11:36 1632次阅读

    如何在ESP32上使用代码运行TensorFlow模型

    该项目使用在ESP32上运行的TensorFlow Lite创建一个语音控制的机器人。它可以响应简单的单字命令:“左”,“右”,“前进”和“后退”。
    的头像 发表于 04-27 14:54 3137次阅读

    随机森林的概念、工作原理及用例

    随机森林是一种监督式算法,使用由众多决策树组成的一种集成学习方法,输出是对问题最佳答案的共识。随机森林可用于分类或回归。
    的头像 发表于 08-05 10:00 2356次阅读

    利用随机森林进行特征重要性评估

    随机森林是以决策树为基学习器的集成学习算法。随机森林非常简单,易于实现,计算开销也很小,更令人惊奇的是它在分类和回归上表现出了十分惊人的性能,因此,随机森林也被誉为“代表集成学习威廉希尔官方网站 水平的方法”。
    的头像 发表于 10-10 17:14 585次阅读

    大数据—决策树

    大数据————决策树(decision tree) 决策树(decision tree):是一种基本的分类与回归方法,主要讨论分类的决策树。 在分类问题中,表示基于特征对实例进行分类的过程,可以
    的头像 发表于 10-20 10:01 347次阅读

    下载硬声App