Apache Pig是MapReduce的一個抽象,它是一個工具/平臺,用于分析較大的數據集,并將它們表示為數據流。
Apache Pig是MapReduce的一個抽象,它是一個工具/平臺,用于分析較大的數據集,并將它們表示為數據流。Pig通常與Hadoop 一起使用;我們可以使用Pig在Hadoop中執(zhí)行所有的數據處理操作。
本教程面向所有從事Hadoop的專業(yè)人員,他們希望執(zhí)行MapReduce操作,而不必在Java中鍵入復雜的代碼。
為了充分掌握本教程,你應該充分了解Hadoop和HDFS命令的基礎知識,而如果你善于SQL會更有幫助。