《大数据分析原理与实践》一一3.3 相关分析
3.3 相关分析
相关关系是一种非确定性的关系,例如,以X和Y分别表示一个人的身高和体重,或分别表示每公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系。在一些问题中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即两组变量之间的相关关系。典型相关分析就是研究两组变量之间相关程度的一种多元统计分析方法。
典型相关分析是研究两组变量之间相关关系的一种统计分析方法。为了研究两组变量X1,X2,…,Xp和Y1,Y2,…,Yq之间的相关关系,采用类似于主成分分析(将在9.2节中介绍)的方法,在两组变量中,分别选取若干有代表性的变量组成有代表性的综合指数,通过研究这两组变量之间的相关关系,来代替这两组变量之间的相关关系,这些综合指数称为典型变量。