Python 基础教程

Python 高级教程

Python 相关应用

Python 笔记

Python FAQ

original icon
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.knowledgedict.com/tutorial/python-nltk-resource-punkt-not-found.html

python 使用 nltk 时,报错信息 Resource punkt not found 的解决方法

Python 笔记 Python 笔记


python 使用 nltk 模块进行分词等自然语言处理时,如果没有提前安装 punkt,会报出 Resource punkt not found 错误,那下面介绍如何解决该问题。

解决方法

错误信息中,可能会包含如下解决方法:

  >>> import nltk
  >>> nltk.download('punkt')

但是很有可能,实际操作中会报 Connection refused 或 ssl 验证等错误,那就需要进行笔者提供的下一步解决方案。

  1. 到官方网站下载地址:https://github.com/nltk/nltk_data/blob/gh-pages/packages/tokenizers/punkt.zip 下载 punkt 压缩包;
  2. 解压后,在如下目录之一(如没有就新建)下建立 tokenizers 目录,然后将解压的 punkt 文件夹迁移到该目录下;

      Attempted to load tokenizers/punkt/PY3/english.pickle
      Searched in:
        - '/Users/xxx/nltk_data'
        - '/usr/share/nltk_data'
        - '/usr/local/share/nltk_data'
        - '/usr/lib/nltk_data'
        - '/usr/local/lib/nltk_data'
        - ''
Python中not关键字有如下3种用法: ...
使用 java jstack jmap 等命令工具查看 java 进程信息时,会报错 Unable to open socket file: ...
在使用 xgboost 训练数据和检验模型时,如果测试集的特征最大编号数大于训练集的特征最大编号数,在测试时,会报 ValueError: ...
Python 使用 Redis 采用 redis 模块,该模块采用直连模式和连接池模式。redis-py 提供 Redis 和 Strict ...
python 使用 geohash 时,报错 ModuleNotFoundError: No module named 'geohash', ...