詞庫
From Wikipedia, the free encyclopedia
詞庫(粵讀:ci4 fu3),或者借英文叫 lexicon(粵讀:lek1 sik4 kan4),係指一隻語言或者一套知識裏面啲詞彙嘅總和。例如粵語嘅詞庫包嗮所有喺粵語口語會用嘅詞彙-詞彙(粵讀:ci4 wui6)呢隻詞粵語口語會用,算係粵語詞庫嘅一部份[1][2];除此之外,一門知識都可以有佢哋嘅詞庫,例如係 AI 噉,做 AI 相關嘅工作會用到好多概念同埋行話(例:人工神經網絡),呢啲嘢入面包含嘅詞彙,可以算係 AI 呢個領域嘅詞庫,形成所謂嘅 AI 詞彙。
喺語言學上,詞庫係一個重要嘅概念:一隻語言可以大致睇做詞庫同文法結合埋一齊而成嘅總體[3]-詞庫包括咗大拃嗰隻語言裏面嘅詞彙,用語言嘅人要攞住啲詞彙,跟文法將啲詞彙砌埋做句子,達致表達佢哋想表達嘅意思;例如攞住粵語嘅詞彙[4]
再跟粵語嘅文法規則砌成「畀本書我。」噉嘅句子[註 1]。因為詞庫咁基本,對佢哋嘅研究喺語言學同自然語言處理等語言相關嘅工作上相當受到重視。
詞彙學(lexicology)就係語言學嘅一門子領域,顧名思義專研究詞庫。