与猪(pig)共舞
版权声明:本文为半吊子子全栈工匠(wireless_com,同公众号)原创文章,未经允许不得转载。 https://blog.csdn.net/wireless_com/article/details/42043951 猪在吃东西的时候稍有浪费,pig 也有类似的情况. pig执行时消耗的内存,一般对没有压缩的数据,将会占用4倍于本地磁盘空间的内存空间。Pig中的NULL与SQL中的NULL概念一样,类型转换的语法与Java中的语法是一样的,是强类型的。 过程函数 Pig Latin 是一种数据流语言,每个处理步骤都产生一个新的数据集,或产生一个新的关系。无论关系还是字段都是以字母字符开头,大小写敏感,注释和java相同。 任何一种数据流处理的第一步都是指定输入,pig通过load语句完成。默认加载函数是PigStorage,加载存放在HDFS中且以制表符分割的文件,可以使用相对路径或绝对路径。 更多情况是应用Using 语句指定指定加载函数,例如 Using HBaseStorage() 是从HBase中加载数据。 进一步,使用as语句确定加载的数据指定模式。同时,PigStorag...