环境:ubuntu-12.04-server-amd64
JDK1.7
hidoop分布式请看http://blog.ziki.cn/984.html
如把hadoop当作数据库的存储部分的话,那么hive可以理解为一个sql语言解释器,或者可以叫执行类SQL语言的shell解释器。
使用hive中可以使用表的操作select/insert/create来映射到hadoop的hdfs系统中一系列文本操作,可以理解为sql对hdfs的行为映射.
更可以通过实现自定义的udf、udaf来实现复杂的筛选select,这些带有函数的select语句hive会自动翻译成hadoop的mapre[......]