generated at
WordNet
#nltk で扱える(らしい)
>現在、広く利用されているPrinceton WordNetは、語を類義関係のセット (synset)でグループ化している点に特徴があり、一つのsynsetが一つの概念に対 応します。また、各synsetは上位下位関係などの多様な関係で 結ばれています。
>シソーラスデータ WordNet では個々の言葉 wordを重複無しに管理するために synset ID と呼ばれる識別子を振り, 概念接続 Sense, 概念 Synset, 概念間の関係 Synlink などのデータから成っており, 概念間はその link で接続されており, Synonims(同義語), Hypernims (上位概念), Hyponims (下位概念), Instances(実例)などといった 25 種類の決められた関係を構築している(多段自然言語処理における NLP, シソーラス, オントロジー辞書データ統合の提案 3.3)