本階段介紹Hive 是基于Hadoop 的一個數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供簡單的sql 查詢功能,可以將sql 語句轉(zhuǎn)換為MapReduce 任務進行運行。其優(yōu)點是學習成本低,可以通過類SQL 語句快速實現(xiàn)簡單的MapReduce 統(tǒng)計,不必開發(fā)專門的MapReduce 應用,十分適合數(shù)據(jù)倉庫的統(tǒng)計分析。