在 Python 中可视化树
由于许多不同的原因,决策树是一种常见的监督学习技术。 决策树的优点包括我们可以将它们用于分类和回归,它们不需要特征缩放,而且决策树易于阅读。
本文介绍了 Python 的 Graphviz 来显示决策树。
在 Python 中可视化树
Graphviz 或图形可视化是一种开源软件,它将结构信息表示为抽象图形和网络的图表。 例如,Graphviz 在数据科学中的一种用途是可视化决策树。
安装 Graphviz 包
安装 Graphviz 通常需要将点文件转换为图像文件(PNG、JPG、SVG 等),这取决于您的操作系统和其他几个因素。
如果您收到错误 dot: command not found
,可能是您还没有安装 dot 语言。
要安装 Graphviz,请运行以下命令。
-
Windows:
winget install graphviz
-
Mac:
brew install graphviz
-
Ubuntu:
sudo apt install graphviz
安装后,验证您的 Graphviz 安装是否在其安装目录中包含 dot.exe 文件,因为稍后我们将需要它来生成点文件的可视化。 通常,默认安装路径在 C:\Program Files\Graphviz\bin 下。
将树转换为点文件
Graphviz 的要求之一是点格式的树,但首先,我们需要一个示例树。 我们可以转到这篇关于树如何在 Python 中工作的文章,或者我们可以使用下面的命令来方便地阅读本文。
示例代码:
tree = 'digraph G {Hello->World}'
open('sample.dot','w').write(tree)
上面的代码片段将一个简单的 Hello->World 2 节点树结构写入满足我们要求的 sample.dot 文件。 然而,如果我们想要一个更复杂的树,我们可以使用这个在线树生成器,它也可以方便地让我们直接以点格式下载它。
将点文件转换为图像
现在我们有了点文件,我们需要使用点应用程序在 Graphviz 中运行它。 早些时候,我们要求您记下我们的 Graphviz dot.exe 路径,因为我们将在本节中需要它。
在命令提示符下使用命令 cd 转到 dot.exe 路径。
cd C:\Program Files\Graphviz\bin
我们这样做是因为在大多数情况下,Graphviz 安装不在我们的环境变量中包含点,因此我们可以使用 dot.exe
来运行以下代码片段。
# dot.exe -Tpng <path of the dot file> -o <destination path of the png file>
dot.exe -Tpng C:\PS\sample.dot -o C:\PS\sample.png
执行后,这应该会产生使用 PNG 格式的树的可视化表示。
相关文章
在 Python 中打印二叉树
发布时间:2023/06/14 浏览次数:101 分类:Python
-
本文将讨论二叉树以及我们如何使用它。 我们还将看到如何使用 Python 打印它。我们将了解在处理二叉树时使用的术语。 我们还将研究使用 Python 代码的二叉树示例。
Python 中的二维插值
发布时间:2023/06/14 浏览次数:149 分类:Python
-
本文展示了如何在 Python 中进行插值,并研究了不同的 2d 实现方法。 我们将讨论用于双变量插值的有用函数,例如 scipy.interpolate.interp2d、numpy.meshgrid 和 Python 中使用的用于平滑/插值 (RBF) 的径向
Python 中的 3D 插值
发布时间:2023/06/13 浏览次数:121 分类:Python
-
插值是在离散集的定义范围内构造新数据点的方法。 插值意味着找到点或曲线之间的值。从数学的角度来看,插值是获取位于其他已知数据点之间的特定未知数据点的值。插值的重要性
在 Python 中重新抛出异常
发布时间:2023/06/13 浏览次数:53 分类:Python
-
Python 为我们提供了 try-except 块来处理程序中的异常。 它还为我们提供了 raise 语句来手动抛出异常。本文将讨论如何在 Python 程序中重新抛出异常。在 Python 中抛出异常
Python 模拟引发异常
发布时间:2023/06/13 浏览次数:160 分类:Python
-
本文的主要目的是演示如何在使用单元测试库 unittest 时抛出异常。在 Python 中使用单元测试库 unittest 时抛出异常
Python打开文件异常处理
发布时间:2023/06/13 浏览次数:146 分类:Python
-
要打开文件,Python 有一个名为 open() 的内置函数,用户可以通过它读取或写入文件,但是如果在任何情况下文件丢失或编译器无法访问,那么,我们 遇到 FileNotFoundError。 本文将介绍如何处理
Python 绘图 CSV
发布时间:2023/06/13 浏览次数:67 分类:Python
-
CSV 代表逗号分隔值,一种存储结构化数据的流行格式。 CSV 文件包含具有行和列的表格形式的数据。我们经常需要可视化存储在 CSV 文件中的数据。 为此,Python 提供了不同类型的数据可视化图
Python 绘制决策边界
发布时间:2023/06/13 浏览次数:52 分类:Python
-
为此,我们将使用 Sklearn 库提供的内置预处理数据(无缺失数据或异常值)数据集包来绘制数据的决策边界。 然后我们将使用 Matplotlib 的库来绘制决策边界。
Python 中的 Soundex
发布时间:2023/06/13 浏览次数:184 分类:Python
-
Python 的 soundex 函数是将文本字符串转换为 Soundex 代码的函数。 它有助于在数据库中索引名称或查找相似名称。名字的 Soundex 代码是基于它的发音,而不是它的拼写。 它是比较发音不同但拼写准