text-cnn裁判文书分类

本文介绍了一个基于Text-CNN的裁判文书分类项目,详细讲述了从数据集爬取、预处理到模型训练及成果展示的全过程。通过爬取26万份裁判文书并进行6分类实验,展示了文本分类的实际应用。

text-cnn裁判文书分类

一、数据集

使用爬虫获取的26万份裁判文书,可以在链接:
链接: 全国范围内爬取的26万份裁判文书.提取码:t2nh
训练模型源自链接: Text Classification with CNN and RNN.

二、训练过程

一共训练5轮
数据格式为目录:标签名,文本为内容
在这里插入图片描述
在这里插入图片描述
写入方法

def wenshu_cut():
	with open(r"J:\PyCharm项目\github项目\文本分类\罪名分类\罪名分类.json", "r")as f:
    	train_text = {}
    	global one
    	text = f.read()
    	#text = json.dumps(text)
    	text = json.loads(text)
    	#print(list(text.keys()))
    	path = os.path.dirname(__file__) + "\\test"


    	for key in text.keys():
        	values = text[key]
        	if values != []:
 
评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值