首页注册登录

Enqueued related words: Language-model

Unigram

释义 Definition

unigram（名词）：在文本分析与自然语言处理中，指由单个词/符号构成的基本单位（即 n-gram 中 n = 1）。常用于分词、词频统计、语言模型等任务。（也可指“按单词为单位的统计特征”。）

发音 Pronunciation

/ˈjuːnɪɡræm/

例句 Examples

Unigrams are the simplest features in text classification.
一元词（unigram）是文本分类中最简单的特征。

Compared with bigrams, unigrams ignore word order and capture only individual token frequency.
与二元词（bigram）相比，一元词（unigram）忽略词序，只捕捉单个词元的出现频率。

词源 Etymology

由 **uni-**（“一、单一”，源自拉丁语 unus）+ -gram（“书写的东西/记录”，源自希腊语 gramma）构成，字面意思是“单个单位的记录”。在计算语言学里借用 n-gram 这一术语体系，用来表示长度为 1 的序列。

相关词 Related Words

文学作品中的用例 Literary Works

unigram 更常见于计算语言学与机器学习教材/论文中，而非传统文学作品；在文学语境中通常不会直接出现该术语。较常见的学术性来源包括：

Jurafsky & Martin, Speech and Language Processing（涉及 n-gram/语言模型与相关概念）
Manning, Raghavan & Schütze, Introduction to Information Retrieval（讨论词项、词频与文本特征工程，常以 unigram/bigram 为例）

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 720 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 14ms · UTC 20:58 · PVG 04:58 · LAX 12:58 · JFK 15:58
♥ Do have faith in what you're doing.