====================================================
chardet 2.1.1 for py3
====================================================
chardet 是python的第三方库,chardet是一个非常优秀的编码识别模块。但是一直没有python3的版本,
由于自己需要用到,因此试着修改到python3下能够运行。
一、本软件基于chardet-2.1.1,安装python 3的新特性和语法进行修改后修改版,修改时参照了此篇文章:
http://woodpecker.org.cn/diveintopython3/case-study-porting-chardet-to-python-3.html#running2to3
二、但由于版本不同,修改之处也不尽相同,修改点也多于文章中所提之处。
本人测试环境为python3.3。
三、另外,由于python3对于字符串编码的调整,因此对于str类型侦测编码就变得没有意义了,因此,修改过后的版本
是用来检测bytes类型的编码的。
四、测试程序test.py是根据该文章中的编码的来,原软件包中并无此文件。
五、安装时仍用原有安装方式:python setup.py install
六、其他事项参加chartdet的文档或网上文章。
====================================================
*********** 佣工7001 2012.12.18 ***********
====================================================
@@@注:本软件一切权利归属原作者,如果有问题,本人概不负责
chardet 2.1.1 for py3
====================================================
chardet 是python的第三方库,chardet是一个非常优秀的编码识别模块。但是一直没有python3的版本,
由于自己需要用到,因此试着修改到python3下能够运行。
一、本软件基于chardet-2.1.1,安装python 3的新特性和语法进行修改后修改版,修改时参照了此篇文章:
http://woodpecker.org.cn/diveintopython3/case-study-porting-chardet-to-python-3.html#running2to3
二、但由于版本不同,修改之处也不尽相同,修改点也多于文章中所提之处。
本人测试环境为python3.3。
三、另外,由于python3对于字符串编码的调整,因此对于str类型侦测编码就变得没有意义了,因此,修改过后的版本
是用来检测bytes类型的编码的。
四、测试程序test.py是根据该文章中的编码的来,原软件包中并无此文件。
五、安装时仍用原有安装方式:python setup.py install
六、其他事项参加chartdet的文档或网上文章。
====================================================
*********** 佣工7001 2012.12.18 ***********
====================================================
@@@注:本软件一切权利归属原作者,如果有问题,本人概不负责
测试程序运行画面抓图
本文介绍了一位开发者如何将chardet-2.1.1这个流行的编码识别库从Python2移植到Python3的过程。经过一系列的修改与调整,使其能正确识别bytes类型的编码。文中还提供了测试程序及安装方法。

388

被折叠的 条评论
为什么被折叠?



