《中国人工智能学会通讯》——11.30 深度迁移学习
11.30 深度迁移学习 随着互联网技术在各个领域的广泛应用,特别是社会网络,以及移动计算的崛起,文本、图像、视频等非结构化数据呈现出指数式增长,迫切需要有效的数据分析方法和高效的数据处理算法。机器学习作为大数据智能化分析的主要技术基石,在理论和实践两方面都取得了飞速进展,特别是在深度学习[1]上取得了革命性突破。 虽然人们已经能够通过信息系统、社会媒体、移动计算、工业互联网等渠道收集到大规模、多模态、高维度、快速变化的大数据,但大数据中高价值的标记数据还是比较稀缺的。从监督机器学习的视角来看,只有大规模的标记数据才是真正有用的大数据。例如当前取得革命性突破的深度神经网络需要在百万规模以上的标记数据集上进行分布式并行训练,才能获得理想的准确率和运行效率[2] 。由于大数据具有多数据源、异构模态、快速变化的特点,因此在进行特定领域、特定模态、特定时段的数据分析任务时,常常会出现标记数据稀缺,包括深度神经网络在内的监督学习无法成功应用的问题,这极大地限制了监督学习在大数据分析中的应用范畴和实用价值。 为了应对标记数据稀缺问题,增强对大数据的内容分析和语义理解能力,推出了基于群体智慧的知识图...