想试一试NLP的一些工具,首先是word2vec。刚刚做到“利其器”,记录一下,要“善其事”估计还早吧。
懒人专用下载包,分享密码4865,解压无密码,已编译并下载好了训练例集。自己做时,是这样的步骤:
首先,下载源码:http://word2vec.googlecode.com/svn/trunk/。
其次,编译。对于Visual Studio不含pthread.h的问题,有两种简单的方法:dev-cpp或安装win版的phread。其他方法还有,如:Cygwin64(没试过,猜的)等。word2vec

本文记录了在Windows系统中使用word2vec进行自然语言处理的步骤,包括下载预编译包、编译源码(解决pthread.h问题)、准备训练数据以及简单介绍word2vec将单词转化为向量以计算文本相似度的功能。

1万+

被折叠的 条评论
为什么被折叠?



