词性 一起来看看词性标注( 二 )
https://github . com/sebastiaruder/NLP-progress/blob/master/English/词性_tagging.md
最后放一个词性标注任务数据集(人民日报1998词性标注数据集):
https://pan.baidu.com/s/1fW908EQmyMv0XB5i0DhVyQ
04
词性标注工具推荐
1.洁巴
【词性 一起来看看词性标注】“结巴”中文分词:做最好的Python中文分词组件,标注词性。
https://github.com/fxsjy/jieba
文章图片
2.SnowNLP
SnowNLP是python编写的类库,可以轻松处理中文文本内容。
https://github.com/isnowfy/snownlp
文章图片
3.THULAC
Thulac(中文Thu词法分析器)是清华大学自然语言处理与社会人文计算实验室开发的一套中文词法分析工具包,具有中文分词和词性标注功能。
https://github.com/thunlp/THULAC
文章图片
4.StanfordCoreNLP
斯坦福NLP集团是开源的,支持python接口。
https://github.com/Lynten/stanford-corenlp
文章图片
5.中文分词
HanLP是由一系列模型和算法组成的nLP工具包,以快速搜索和完全开源为主,旨在推广自然语言处理在生产环境中的应用。
https://github.com/hankcs/pyhanlp
文章图片
6.自然语言工具包
NLTK是Python搭建的高效处理人类自然语言数据的平台。
https://github.com/nltk/nltk
官网:http://www.nltk.org/
文章图片
7.SpaCy
工业自然语言处理工具,可惜不支持中文。
Gihub地址:https://github.com/explosion/spaCy
官网:https://spacy.io/
文章图片
作者简介
余全乐,湖南大学硕士研究生,研究机器学习和自然语言处理。曾在IJCAI、TASLP等会议/期刊上发表多篇文章。欢迎志同道合的朋友在微信官方账号“AI小白入门”里和我交流学习。
推荐阅读
- 一群医生组团苦练滑雪,只为……
- 一口勾魂!5分钟加热2小时嗨吃!老北京羊蝎子,心动马上行动!
- 王者荣耀:新赛季第一天5款新皮肤上线,伴生皮肤碧珀绯影开启
- 连烧数月难寻因 河南小伙肺毁损 医生耗时一个月摸到发烧“开关”小伙写千字长文妙语连珠谢医护
- 有一个重男轻女的母亲是怎样的体验?
- 常敲“一氧化碳中毒”警钟 科学防范 温暖过冬
- 广西中医药大学第一附属医院:“内”“外”兼并 大力弘扬中医药文化
- 一个女人,如果她什么都懂,那她一定恋爱过
- 嫁给一个不爱自己的男人是什么感受?
- 女人主动加男生微信,这没什么不合适