决策树的可视化呈现

11 sec read

上一篇决策树学习的文章中讲到决策树其中的一个优点是决策树模型可以可视化,非常直观。今天就一起来学习下如何使用决策树将模型可视化出来。

决策树的可视化一般使用的工具是Graphviz。在使用Graphviz之间还是有些门道。具体流程为:

  1. 安装Graphviz的可执行包,并在环境变量的PATH添加安装路径
  2. 安装需要的Python库: pip install graphviz ,并在代码中使用graphviz

方法一:使用export_graphviz 将树导出为 Graphviz 格式

这里生成的iris.dot是一个纯文本文件,可直接打开查看,但是为了更好的可视化,可以使用graphviz可执行包中的dot程序将其转化为可视化的PDF文档。具体方法为执行如下命令: dot -Tpdf iris.dot -o iris.pdf

方法二:使用 pydotplus 直接生成 iris.pdf

先安装pydotplus的Python库: pip install pydotplus ,然后就可以执行执行如下代码生成PDF文档了:

方法三:直接在 jupyter notebook 中生成

打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

黑客马拉松 (Hackathon):POI去重记录

10月24日参加了公司举办的黑客马拉松,我们选的题目是POI的去重。给到的数据格式如下: 目标是去重重复数据。
标点符
2 min read

scikit-learn中的文本特征提取

文本分析是机器学习算法的主要应用领域。由于大部分机器学习算法只能接收固定长度的数值型矩阵特征,导致文本字符串等
标点符
2 min read

斯坦福大学自然语言处理包StanfordNLP

最近在推荐点评的影响抽取,中间涉及到分词后的词性识别,看了各种开源分词工具,主要是词性标注集存在差异,最终选定
标点符
3 min read

2 Replies to “决策树的可视化呈现”

  1. 博主你好,中文乱码如何解决?我在电脑上实验, jupyter notebook上面不会出现乱码,但是图无法保存

发表评论

电子邮件地址不会被公开。 必填项已用*标注