标记是文本处理的基本特征,我们将单词标记为语法分类。我们借助tokenization和pos_tag函数来为每个单词创建标签。
import nltk
text = nltk.word_tokenize("A Python is a serpent which eats eggs from the nest")
tagged_text=nltk.pos_tag(text)
print(tagged_text)
标记是文本处理的基本特征,我们将单词标记为语法分类。我们借助tokenization和pos_tag函数来为每个单词创建标签。
import nltk
text = nltk.word_tokenize("A Python is a serpent which eats eggs from the nest")
tagged_text=nltk.pos_tag(text)
print(tagged_text)