Python 基础教程

Python 高级教程

Python 相关应用

Python 笔记

python 使用 nltk 时,报错信息 Resource punkt not found 的解决方法

Python 笔记 Python 笔记


python 使用 nltk 模块进行分词等自然语言处理时,如果没有提前安装 punkt,会报出 Resource punkt not found 错误,那下面介绍如何解决该问题。

解决方法

错误信息中,可能会包含如下解决方法:

  >>> import nltk
  >>> nltk.download('punkt')

但是很有可能,实际操作中会报 Connection refused 或 ssl 验证等错误,那就需要进行笔者提供的下一步解决方案。

  1. 到官方网站下载地址:https://github.com/nltk/nltk_data/blob/gh-pages/packages/tokenizers/punkt.zip 下载 punkt 压缩包;
  2. 解压后,在如下目录之一(如没有就新建)下建立 tokenizers 目录,然后将解压的 punkt 文件夹迁移到该目录下;

      Attempted to load tokenizers/punkt/PY3/english.pickle
      Searched in:
        - '/Users/xxx/nltk_data'
        - '/usr/share/nltk_data'
        - '/usr/local/share/nltk_data'
        - '/usr/lib/nltk_data'
        - '/usr/local/lib/nltk_data'
        - ''