词性 一起来看看词性标注( 二 )


https://github . com/sebastiaruder/NLP-progress/blob/master/English/词性_tagging.md
最后放一个词性标注任务数据集(人民日报1998词性标注数据集):
https://pan.baidu.com/s/1fW908EQmyMv0XB5i0DhVyQ
04
词性标注工具推荐
1.洁巴
【词性 一起来看看词性标注】“结巴”中文分词:做最好的Python中文分词组件,标注词性。
https://github.com/fxsjy/jieba

词性 一起来看看词性标注


文章图片

2.SnowNLP
SnowNLP是python编写的类库,可以轻松处理中文文本内容。
https://github.com/isnowfy/snownlp

词性 一起来看看词性标注


文章图片

3.THULAC
Thulac(中文Thu词法分析器)是清华大学自然语言处理与社会人文计算实验室开发的一套中文词法分析工具包,具有中文分词和词性标注功能。
https://github.com/thunlp/THULAC

词性 一起来看看词性标注


文章图片

4.StanfordCoreNLP
斯坦福NLP集团是开源的,支持python接口。
https://github.com/Lynten/stanford-corenlp

词性 一起来看看词性标注


文章图片

5.中文分词
HanLP是由一系列模型和算法组成的nLP工具包,以快速搜索和完全开源为主,旨在推广自然语言处理在生产环境中的应用。
https://github.com/hankcs/pyhanlp

词性 一起来看看词性标注


文章图片

6.自然语言工具包
NLTK是Python搭建的高效处理人类自然语言数据的平台。
https://github.com/nltk/nltk
官网:http://www.nltk.org/

词性 一起来看看词性标注


文章图片

7.SpaCy
工业自然语言处理工具,可惜不支持中文。
Gihub地址:https://github.com/explosion/spaCy
官网:https://spacy.io/

词性 一起来看看词性标注


文章图片

作者简介
余全乐,湖南大学硕士研究生,研究机器学习和自然语言处理。曾在IJCAI、TASLP等会议/期刊上发表多篇文章。欢迎志同道合的朋友在微信官方账号“AI小白入门”里和我交流学习。

推荐阅读