V2EX  ›  英汉词典
Enqueued related words: Language-model

Unigram

释义 Definition

unigram(名词):在文本分析与自然语言处理中,指由单个词/符号构成的基本单位(即 n-gramn = 1)。常用于分词、词频统计、语言模型等任务。(也可指“按单词为单位的统计特征”。)

发音 Pronunciation

/ˈjuːnɪɡræm/

例句 Examples

Unigrams are the simplest features in text classification.
一元词(unigram)是文本分类中最简单的特征。

Compared with bigrams, unigrams ignore word order and capture only individual token frequency.
与二元词(bigram)相比,一元词(unigram)忽略词序,只捕捉单个词元的出现频率。

词源 Etymology

由 **uni-**(“一、单一”,源自拉丁语 unus)+ -gram(“书写的东西/记录”,源自希腊语 gramma)构成,字面意思是“单个单位的记录”。在计算语言学里借用 n-gram 这一术语体系,用来表示长度为 1 的序列。

相关词 Related Words

文学作品中的用例 Literary Works

unigram 更常见于计算语言学与机器学习教材/论文中,而非传统文学作品;在文学语境中通常不会直接出现该术语。较常见的学术性来源包括:

  • Jurafsky & Martin, Speech and Language Processing(涉及 n-gram/语言模型与相关概念)
  • Manning, Raghavan & Schütze, Introduction to Information Retrieval(讨论词项、词频与文本特征工程,常以 unigram/bigram 为例)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   720 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 20:58 · PVG 04:58 · LAX 12:58 · JFK 15:58
♥ Do have faith in what you're doing.