文章目录 1 前言 2 随机森林(RF)简介 3 特征重要性评估 4 举个例子 5 参考文献 1 前言 随机森林是以决策树为基学习器的集成学习算法。随机森林非常简单,易于实现,计算开销也很小,更令人惊奇的是它在分类和回归…
标签:机器学习
matplotlib坐标轴中文乱码问题解决
用了一晚上时间一直在搞这个问题,网上解决方法众多,没有一个实用的,最后终于解决了。 系统: win10 环境: VS Code1.16 python 2.7.13 方法 找到matplotlib的配置文件位置 impor…
机器学习:算法中的泛化误差、偏差、方差、噪声的理解(超详细)
摘要:在现实任务中,我们往往有多种学习算法可供选择,甚至对同一个学习算法,当使用不同的参数配置时,也会产生不同的模型,那么,我们该如何选用哪一个学习算法,使用哪一种参数配置呢?这就是机器学习中的“模型选择”问题,理想的解…
【机器学习】凸集、凸函数、凸优化、凸优化问题、非凸优化问题概念详解
目录 1 基本概念 2 凸优化问题 3 非凸优化问题 4 总结 1 基本概念 (1)凸集和非凸集 凸集是一个点集, 这个点集有一个性质, 就是在这个集合中任取不同的两个点x和y, 他们之间的线段(包括端点)上的点都属于这…
算法工程师大致是做什么的
作者: 龙心尘 时间:2021年1月 出处:https://blog.csdn.net/longxinchen_ml/article/details/113074403 其实这是一个不太好解释的问题,因为并没有一个完备的…
5种常用的相关分析方法
from: http://bluewhale.cc/2016-06-30/analysis-of-correlation.html 相关分析(Analysis of Correlation)是网站分析中经常使用…
一文读懂迁移学习和预训练
转载:https://zhuanlan.zhihu.com/p/27657264 引言 跟传统的监督式机器学习算法相比,深度神经网络目前最大的劣势是什么? 贵。 尤其是当我们在尝试处理现实生活中诸如图像识别、声音辨识等实…
机器学习中不平衡数据的处理方式
https://blog.csdn.net/pipisorry/article/details/78091626 不平衡数据的场景出现在互联网应用的方方面面,如搜索引擎的点击预测(点击的网页往往占据很小的比例),电子商务…
多变量LSTM模型
多变量时间序列数据是指每个时间步长有多个观察值的数据。 对于多变量时间序列数据,我们可能需要两种主要模型; 他们是: 多输入系列。 多个并联系列。 1、多输入系列 问题可能有两个或更多并行输入时间序列和输出时间…
超级干货 :一文读懂社交网络分析(附应用、前沿、学习资源)
转自:http://op.inews.qq.com/m/20171020B02CN500?refer=100000355&chl_code=kb_news_tech&h=0 本文主要阐述: 社交网络的结构…