lexicoR
provides access to Chinese Wordnet by wrapping CwnGraph
, a python package to query Chinese Wordnet.
In order to use this functionality, you need to have Python 3 installed on the computer.
The code below exposes cwn
(python object) to the R environment:
You can also use a virtual environment provided by virtualenv
(on Linux or Mac) or conda
(on Windows):
lemmas[0]$senses
#> [<CwnSense[06613601](電腦): 一種資料處理裝置,能自動接受並儲存、處理輸入的資料,然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>, <CwnSense[06613602](電腦): 研究或操作電腦的知識。>, <CwnSense[06613603](電腦): 比喻計算或記憶能力很強的人。>]
lemmas[0]$senses[0]$relations
#> [('has_facet', <CwnFacet[0661360101](電腦): 普通名詞。電腦的功能,通常包括程式、軟體等。>), ('has_facet', <CwnFacet[0661360102](電腦): 普通名詞。電腦的實體,特別指外表,通常包括螢幕、鍵盤、主機等。>), ('is_synset', <CwnSense[syn_004128](----): >), ('hypernym', <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>), ('hyponym(rev)', <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>)]
senses <- py_to_r(lemmas[0]$senses)
for (sense in senses) {
print(sense)
print(sense$relations)
cat('----\n\n')
}
#> <CwnSense[06613601](電腦): 一種資料處理裝置,能自動接受並儲存、處理輸入的資料,然後經由一組預先存放在機器內的指令逐步引導下產生輸出結果。>
#> [[1]]
#> [[1]][[1]]
#> [1] "has_facet"
#>
#> [[1]][[2]]
#> <CwnFacet[0661360101](電腦): 普通名詞。電腦的功能,通常包括程式、軟體等。>
#>
#>
#> [[2]]
#> [[2]][[1]]
#> [1] "has_facet"
#>
#> [[2]][[2]]
#> <CwnFacet[0661360102](電腦): 普通名詞。電腦的實體,特別指外表,通常包括螢幕、鍵盤、主機等。>
#>
#>
#> [[3]]
#> [[3]][[1]]
#> [1] "is_synset"
#>
#> [[3]][[2]]
#> <CwnSense[syn_004128](----): >
#>
#>
#> [[4]]
#> [[4]][[1]]
#> [1] "hypernym"
#>
#> [[4]][[2]]
#> <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>
#>
#>
#> [[5]]
#> [[5]][[1]]
#> [1] "hyponym(rev)"
#>
#> [[5]][[2]]
#> <CwnSense[06582901](工具): 工作時必須使用的具有特定功能的器具。>
#>
#>
#> ----
#>
#> <CwnSense[06613602](電腦): 研究或操作電腦的知識。>
#> [[1]]
#> [[1]][[1]]
#> [1] "is_synset"
#>
#> [[1]][[2]]
#> <CwnSense[syn_016365](----): >
#>
#>
#> ----
#>
#> <CwnSense[06613603](電腦): 比喻計算或記憶能力很強的人。>
#> [[1]]
#> [[1]][[1]]
#> [1] "is_synset"
#>
#> [[1]][[2]]
#> <CwnSense[syn_014518](----): >
#>
#>
#> ----
cwn$find_senses(lemma="^車$")
#> [<CwnSense[06665201](車): 在陸地上以輪子行駛的運輸工具。>, <CwnSense[06665202](車): 以車子為形象製成的人造物。>, <CwnSense[06665203](車): 開放式用於乘載或放置物品的有輪子的工具。>, <CwnSense[06665204](車): 相互連結用在軌道上行駛的運輸工具中的一節。>, <CwnSense[06665205](車): 計算一車承載物的量的單位。>, <CwnSense[06665206](車): 利用機械切削特定物品。>, <CwnSense[06665207](車): 大型的紡織機械。>, <CwnSense[06665208](車): 利用機器來縫製衣物。>, <CwnSense[07021501](車): 姓。>, <CwnSense[07021601](車): 象棋遊戲中所使用的棋子之一,走直線。>]
senses_related_to_wheel <- py_to_r(cwn$find_senses(definition="輪子"))
for (sense in senses_related_to_wheel) {
print(sense)
}
#> <CwnSense[03027001](輛): 計算有輪子的機械裝置的單位。>
#> <CwnSense[04082906](台): 計算有輪子的機械裝置的單位。>
#> <CwnSense[04153906](臺): 計算有輪子的機械裝置的單位。>
#> <CwnSense[05075709](部): 計算有輪子的機械裝置的單位。>
#> <CwnSense[05131903](輪): 計算輪子的單位。>
#> <CwnSense[05131904](輪): 形狀像輪子的物體。>
#> <CwnSense[06521401](車子): 在陸地上以輪子行駛的運輸工具。>
#> <CwnSense[06552201](汽車): 在陸地上行駛的有四個以上的輪子的運輸工具。>
#> <CwnSense[06665201](車): 在陸地上以輪子行駛的運輸工具。>
#> <CwnSense[06665203](車): 開放式用於乘載或放置物品的有輪子的工具。>
#> <CwnSense[08008101](胎): 輪子外面包覆的環形橡膠製品。為英語tire的音譯。>
#> <CwnSense[09004101](汽): 在陸地上行駛的有四個以上的輪子的運輸工具。>
cwn$find_senses(examples="學步車")
#> [<CwnSense[05041401](連): 兩物體在空間上相連。>, <CwnSense[06665203](車): 開放式用於乘載或放置物品的有輪子的工具。>]
spend_senses <- cwn$find_senses(lemma="花費")
spend_senses[0]$facets
#> [<CwnFacet[0506490101](花費): 消耗後述時間或能量。>, <CwnFacet[0506490102](花費): 付出金錢。>, <CwnFacet[0506490103](花費): 付出金錢。>]
spend_senses[0]$all_examples()
#> ['總統對中油努力探勘油源所<花費>的心力,表示肯定。', '因為資訊實在太多,即使走馬看花,也要<花費>不少時間。', '薄薄的一張證明,又不需要<花費>很大人力,卻要索價三百元。', '第一階段選擇場址評估約需<花費>一千五百萬元。', 'IBM相當重視研究開發,每年<花費>在此方面的經費不下數十億美元。', '整體經營與制度化,導致包括交通、住宿及其他<花費>的資金,大多未能流入當地社會。', '職業訓練是投資,而不是<花費>。', '只要有興趣,就不會在乎金錢上的<花費>。', '計有卅八宗個案,<花費>金額為四十六萬五千五百廿五元。']