三个数据分析里最难攻破的“悖论”,每一个都令人费解
跟数据打的交道越多,就越可能对数据产生绝对的信赖感,但其实在实际业务中,数据往往会“说谎”,今天给大家介绍三个数据分析中常见的悖论: 1、辛普森悖论 辛普森悖论是数据分析中最常见的悖论之一,举个最实际的例子来说: 鸭堡某学期期末考试,考数学、物理、化学三科,A的数学比B高2分,物理比B高15分,化学比C高3分,请问A的总分是否比B高? 很多人会说,这不是废话么,问题太简单了,当然是A的总分比B高了! 实际上很可能A的总成绩低于B,别急着惊讶,我们不妨再看一个例子: 很多人都爱看NBA比赛,最近几年的骑勇大战,使得詹姆斯和库里在球迷心目中的印象非常深,有一场骑勇大战,詹姆斯和库里的两分球与三分球命中率如下表所示: 其中: 两分球命中率 = 两分球命中数 / 两分球出手数 * 100% 三分球命中率 = 三分球命中数 / 三分球出手数 * 100% 那么请问本场比赛,詹姆斯的投篮命中率,是否低于库里? 投篮命中率 = (两分球命中数 + 三分球命中数) / (两分球出手数 + 三分球出手数) * 100% 很多人也会说,这不是跟上面期末考试那个题一样简单嘛,这还用说嘛,肯定是詹姆斯的投...
