首页 > 建站教程 > Python教程 >
  • Python - 文本分类

    Python - 文本分类

    很多时候,我们需要通过一些预先定义的标准将可用文本分类为各种类别。nltk提供此类功能作为各种语料库的一部分。在下面的示例中,我们查看电影评论语料库并检查可用的分类。

    Python - 文本分类  Python文本  21次
  • Python - Bigrams

    Python - Bigrams

    一些英语单词更频繁地出现在一起。例如 - 天空高,做或死,最佳表现,大雨等。因此,在文本文档中,我们可能需要识别这样的一对词,这将有助于情绪分析。首先,我们需要从现有

    Python - Bigrams  Python文本处  221次
  • Python - 处理PDF

    Python - 处理PDF

    Python可以从中提取文本后读取PDF文件并打印出内容。为此,我们必须首先安装所需的模块 **PyPDF2**。以下是安装模块的命令。您应该已经在python环境中安装了pip。```pypip install pypdf2```成功

    Python - 处理PDF  Python文本处  17次
  • Python - 处理Word文档

    Python - 处理Word文档

    要阅读word文档,我们将获得名为docx的模块的帮助。我们首先安装docx,如下所示。然后编写一个程序,使用docx模块中的不同函数按段落读取整个文件。我们使用以下命令将docx模块放入我

    Python - 处理Word文档  Pyth  11次
  • Python - 阅读RSS提要

    Python - 阅读RSS提要

    RSS(丰富站点摘要)是一种用于提供定期更改的Web内容的格式。许多与新闻相关的网站,网络日志和其他在线发布商将其内容作为RSSFeed联合到任何想要它的人。在python中,我们借助以下

    Python - 阅读RSS提要  Pytho  18次
  • Python - 情感分析

    Python - 情感分析

    语义分析是关于分析观众的一般意见。这可能是对一则新闻,电影或任何有关正在讨论的事项的推文的反应。通常,此类反应来自社交媒体,并通过NLP分组到文件中进行分析。我们将首

    Python - 情感分析  Python文本  15次
  • Python - 搜索和匹配

    Python - 搜索和匹配

    使用正则表达式有两个基本操作看起来相似但有显着差异。该 **re.match()** 检查只在字符串的开头匹配,而 **re.search()** 检查匹配字符串中的任何地方。这在文本处理中起着重要作用

    Python - 搜索和匹配  Pytho  23次
  • Python - 文本Munging

    Python - 文本Munging

    Munging一般意味着通过改造它们来清理任何杂乱的东西。在我们的例子中,我们将看到如何转换文本以获得一些结果,这些结果为我们提供了一些理想的数据更改。在一个简单的层面上,

    Python - 文本Munging  Python文  10次
  • Python - 文本包装

    Python - 文本包装

    从某些来源抓取的文本格式不正确无法在可用的屏幕宽度内显示时,需要进行文本换行。这可以通过使用以下包来实现,该包可以使用以下命令安装在我们的环境中。```pypip install paraw

    Python - 文本包装  Python文本  21次
  • Python - 频率分布

    Python - 频率分布

    在文本处理期间经常需要计算文本主体中单词出现的频率。这可以通过应用 **word_tokenize()** 函数并将结果附加到列表以保持单词的计数来实现,如下面的程序所示。```pyfrom nltk.tokeni

    Python - 频率分布  Python文本  16次
104条 上一页 1 2 3 4 5 6 7 8 9 10 11 下一页