《中国人工智能学会通讯》——11.33 研究内容与主要贡献
11.33 研究内容与主要贡献 实现跨领域、多模态、弱标记大数据的智能化分析是机器学习的前沿方向之一。迁移学习能在异构分布的领域之间学习不变特征和无偏模型,实现标记知识的迁移和复用,是经典监督学习在非平稳环境下的扩展和深化。迁移学习的关键挑战是负迁移,即源领域数据对目标任务产生负面效果。本文创新了深度迁移学习新范式,提出一系列深度迁移学习的模型和方法以及面向大数据分析的可扩展性优化算法,各部分具体研究内容和主要贡献如下。 分布差异度量准则:根据迁移学习理论[7] ,迁移学习的泛化误差界由两部分之和界定:训练数据上的经验风险、训练数据与测试数据之间的分布差异。因此,分布差异度量准则是迁移学习成功的关键因素之一。根据统计双样本检验原理,现有迁移学习方法通常采用基于核嵌入的分布差异度量准则,即通过将输入数据嵌入高维甚至无穷维核空间中,在可再生核希尔伯特空间中度量训练数据和测试数据的分布期望距离。然而,这类度量准则在次优核空间中缺乏双样本检验功效,难以充分降低分布差异,提高了负迁移风险。本文研究了多核分布差异度量准则,通过多核学习选择最优核空间,使基于核嵌入的分布差异度量准则达到最大检验功效。...









