在NLTK 3.0中使用Wordnet从Synset中提取Word

2018-06-22 05:44:26

前段时间，SO上的某人问了如何使用NLTK的wordnet wrapper来检索给定synset的单词列表。这是建议的回应之一：

for synset in wn.synsets('dog'):
    print synset.lemmas[0].name

使用NLTK 3.0运行此代码会产生TypeError: 'instancemethod' object is not subscriptable 。

我尝试了以前提出的每个解决方案（上面链接的页面中描述的每个解决方案），但每个解决方案都会引发错误。因此，我想问一下：是否可以打印出与NLTK 3.0同义词列表的单词？我会很感激别人可以就这个问题提供的任何建议。

WordNet在NLTK 3.0中正常工作。您只是以错误的方式访问引号（和名称）。试试这个：

>>> import nltk
>>> nltk.__version__
'3.0.0'
>>> from nltk.corpus import wordnet as wn
>>> for synset in wn.synsets('dog'):
    for lemma in synset.lemmas():
        print lemma.name()


dog
domestic_dog
Canis_familiaris
frump
dog
dog
cad
bounder
blackguard
...

synset.lemmas是一种方法，并且没有__getitem__()方法（因此不是可自定义的）。

您也可以直接使用lemma_names()直接找到lemma_names()名称：

>>> wordnet.synset('dog.n.1').lemma_names()
['dog', 'domestic_dog', 'Canis_familiaris']

它适用于多种语言

>>>> wordnet.synset('dog.n.1').lemma_names(lang='jpn')
['イヌ', 'ドッグ', '洋犬', '犬', '飼犬', '飼い犬']

使用：

wn.synset('dog.n.1').name()

代替：

wn.synset('dog.n.1').name

因为NLTK改变了集合属性来取代函数。见https://github.com/nltk/nltk/commit/ba8ab7e23ea2b8d61029484098fd62d5986acd9c

这是适合py3.x的NLTK API更改列表：https：//github.com/nltk/nltk/wiki/Porting-your-code-to-NLTK-3.0

链接地址: http://www.djcxy.com/p/62413.html

上一篇: Extract Word from Synset using Wordnet in NLTK 3.0

下一篇: How do I include pronouns and other types of words in Wordnet?