很多时候,我们需要通过一些预先定义的标准将可用文本分类为各种类别。nltk提供此类功能作为各种语料库的一部分。在下面的示例中,我们查看电影评论语料库并检查可用的分类。
# Lets See how the movies are classified
from nltk.corpus import movie_reviews
all_cats = []
for w in movie_reviews.categories():
all_cats.append(w.lower())
print(all_cats)