Python - 频率分布_Python教程_我爱模板网 - 提供下载各种免费建站资源，免费网站模板，免费网页特效，让你爱上建站！

Python - 频率分布

来源：作者：类型：文章教程点击次数：发布时间：2020-11-26 14:20:51

在文本处理期间经常需要计算文本主体中单词出现的频率。这可以通过应用 word_tokenize（） 函数并将结果附加到列表以保持单词的计数来实现，如下面的程序所示。

from nltk.tokenize import word_tokenize
from nltk.corpus import gutenberg

sample = gutenberg.raw("blake-poems.txt")

token = word_tokenize(sample)
wlist = []

for i in range(50):
    wlist.append(token[i])

wordfreq = [wlist.count(w) for w in wlist]
print("Pairs\n" + str(zip(token, wordfreq)))

TAGS: Python - 频率分布 Python文本

上一篇: Python - 文本摘要

下一篇: Python - 文本包装