一篇文章带你读懂智能家居与大数据
为何叫“大数据”? 数据体量大(VOLUMES) 代指大型数据集,一般在10TB规模左右。但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量。未来智能家居领域也有许多这种企业,目前国内智能家居领域的数据量级总和已经达到100TB以上,非结构化数据规模正在以更快的速度增长。 数据类别大(variety) 数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。也就是说,大数据最重要的变化是处理对象由结构化数据拓展到了半结构化和非结构化数据,每年非结构化数据存储总量较结构化数据增长率高出10到50倍。 非结构化数据可以看成所有无法简单转化到结构化关系型数据库中的所有数据,非结构化数据如企业的邮件和其它形式的电子通讯记录;网站上的资料,包括点击量和社交媒体相关的内容;还有设备产生的数据,如RFID、GPS传感器产生的数据、日志文件等。 数据处理速度快(Velocity) 在数据量非常庞大的情况下,也能够做到数据的实时处理。 数据真实性高(Veracity) 随着社交数据、企业内容、交易与应用数据等新数据源的兴起,传...
