从代价敏感(cost—sensitive)的角度来讲,这样代价往往太高。本文的贡献在于:(1)在选择那些需要专家标注的无标注数据时,使用集成学习方法和置信度差异度量方法,以有效减少标注噪声对学习性能的影响;(2)采用一种自我训练方法(self-train—ing)c引,将那些置信度高的数据,直接加入有标记数据集中,无需向专家咨询,从而...