要求很簡單,把wordnet這本開源詞典的內(nèi)容爬下來存到數(shù)據(jù)庫里面即可。具體要求少所有釋義例句,以及詞匯之間的相關(guān)性??梢韵瓤匆幌履繕司W(wǎng)站:wordnetweb.princeton.edu/Perl/webwn
或者直接從nltk里面的wordnet中提取相關(guān)內(nèi)容,存為結(jié)構(gòu)化數(shù)據(jù),這種方式更快。從網(wǎng)站爬可能很慢(因為目前通過網(wǎng)站查詢一個單詞的數(shù)據(jù)都要十幾秒)。