数据挖掘实验1.完成时间:2022.11.29。仅供参考
相关文章:用python实现决策树分类实验报告
数据源及代码:
链接:https://pan.baidu.com/s/1OjRUSajy4aHcVFqD9ZY8Uw
提取码:sovc
1、环境配置
概述:windows10 python3.9
需要用到的库:pandas、sklearn、numpy、graphviz
2、文件说明

主要: tree-2.py、Source.gv、Source.pv.pdf
可供尝试的方法二: tree.py、tree.dot、tree.png
可视化测试文件: test.py、测试.pv、测试.gv.pdf
3、代码测试
正常流程:在IDE中打开tree-2.py,配置好相关环境后直接运行即可,会生成Source.pv.pdf,i为BLCA,k为BRCA(内容如下)

需要修改的话: tree-2.py。红框内修改文件路径,蓝框内修改对应癌症类型名称,上面那个对应最后class=i,下面那个对应class=k。

PS:graphviz环境的配置
1、安装好Graphviz后,在VSC内可安装Graphviz Interactive Prev插件,在VSC中打开生成的tree.dot文件。
右侧自动会生成预览(未生成的话,在vsc内部命令面板中运行第一个插件提供的命令 graphviz interactive: preview (beside) )

2、安装Graphviz库的教程
(1)去官网(Graphviz)下载最新稳定版,然后在电脑命令行输入
dot -v
确定已安装

(2)然后,我们需要在python使用时输出我们画的图还需要安装一下graphviz的包
打开Anaconda Prompt(win10在电脑左下方搜索框就能找到) 输入pip install graphviz或者conda install graphviz
如果报错,则选择安装python-graphviz,conda install python-graphviz
(3)在VSC的settings.json文件中添加路径
文件→首选项→设置,点击右上角json

添加下面这句话(记得修改路径到自己安装的位置)
"graphvizPreview.dotPath": "D:\\Graphviz\\bin\\dot.exe"

(4)这个时候就搞定了,可以用下述代码测试(对应test.py)
from graphviz import Digraph
import os
os.environ["PATH"] += os.pathsep + 'D:/Program Files/Graphviz/bin/'
dot = Digraph('测试')
dot.node("1", "Hello")
dot.node("2", "World")
dot.edge('1', '2')
dot.view()
生成

本报告详细介绍了使用Python进行数据挖掘实验的过程,包括环境配置、所需库的安装与使用,特别是利用决策树进行分类的具体实现。提供了完整的代码示例与可视化的结果。

3789

被折叠的 条评论
为什么被折叠?



