自监督的;自监督学习的:一种机器学习方法,不依赖人工标注的“正确答案”,而是从数据本身构造学习目标(例如用文本的上下文预测被遮盖的词、用图像的一部分预测另一部分),从而学习有用的表示。常见于自然语言处理与计算机视觉等领域。(也常与 unsupervised 接近,但强调“监督信号来自数据自身”。)
/ˌself.suːˈpɝː.vaɪzd/
Self-supervised learning can use millions of unlabeled images.
自监督学习可以利用数百万张未标注的图像。
By pretraining a model in a self-supervised way and then fine-tuning it on a small labeled dataset, we can often improve accuracy while reducing annotation costs.
先用自监督方式进行预训练,再在少量有标注的数据上微调,通常能在降低标注成本的同时提升准确率。
由 **self-**(“自我;自身”)与 supervised(“受监督的”)组合而来。这里的 “supervised” 并非指外部老师提供标签,而是指训练过程中仍然存在“监督信号”,只是这个信号由数据内部结构自动生成,因此称为“自监督”。