tagset(名词):标注集/标签集;指在语言学、语料库或自然语言处理(NLP)中,用来给词或文本片段做标注的一整套标签体系(常见如词性标注的标签集)。也可泛指某个任务可用的全部标签集合(例如命名实体类别集合)。
/ˈtæɡsɛt/
This tagset includes tags for nouns, verbs, and adjectives.
这个标签集包含名词、动词和形容词等标签。
If you switch to a different tagset, you may need to remap old annotations and retrain the model to keep the evaluation consistent.
如果你换用另一套标签集,可能需要重新映射旧标注并重新训练模型,以保证评测结果一致。
由 tag(标签、标记)+ set(集合)构成的复合词,字面意思是“一组标签”。在计算语言学与语料标注实践中逐渐固定为术语,用来指某项标注任务所采用的标准化标签体系(例如 Penn Treebank tagset)。