trigram(名词):三元组/三字符组;在语言学与计算机科学中,指由三个连续的字母、符号或词组成的序列,用于文本分析、拼写纠错、信息检索、自然语言处理等。(在某些语境中也可指由三条线构成的“卦象/三画符号”,但更常见于“NLP/文本处理”的含义。)
/ˈtraɪɡræm/
A trigram is a sequence of three characters.
三字符组(trigram)是由三个字符构成的序列。
The search engine uses trigram indexing to find similar words even when the spelling is wrong.
搜索引擎使用三字符组索引(trigram indexing),即使拼写错误也能找到相似的词。
由 tri-(“三”,源自希腊语 treis)+ -gram(“写下的东西/记录/符号”,源自希腊语 gramma)构成,字面意思是“三个单位组成的记录/符号”。在现代技术语境里,常用于描述“以三个为一组”的文本单位(类似 bigram=二元组、ngram=n 元组)。