《大数据分析原理与实践》一一
本节书摘来自华章计算机《大数据分析原理与实践》一书中的第3章,第3.3节,作者:王宏志 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3.3 相关分析
相关关系是一种非确定性的关系,例如,以X和Y分别表示一个人的身高和体重,或分别表示每公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系。在一些问题中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即两组变量之间的相关关系。典型相关分析就是研究两组变量之间相关程度的一种多元统计分析方法。
典型相关分析是研究两组变量之间相关关系的一种统计分析方法。为了研究两组变量X1,X2,…,Xp和Y1,Y2,…,Yq之间的相关关系,采用类似于主成分分析(将在9.2节中介绍)的方法,在两组变量中,