Python - Corpora Access_Python教程_我爱模板网 - 提供下载各种免费建站资源，免费网站模板，免费网页特效，让你爱上建站！

Python - Corpora Access

来源：作者：类型：文章教程点击次数：发布时间：2020-11-26 14:20:52

Corpora是一个展示多个文本文档集合的组。单个集合称为语料库。其中一个着名的语料库是古腾堡语料库，其中包含大约25,000本免费电子书，网址是： http://www.gutenberg.org/ 。在下面的例子中，我们只访问语料库中那些文件的名称，这些文件是纯文本，文件名以.txt结尾。

from nltk.corpus import gutenberg
fields = gutenberg.fileids()

print(fields)

TAGS: Python - Corpora Access Python文

上一篇: Python - 标记单词

下一篇: Python - WordNet界面