Hadoop篇
- 排序的意义到底在哪里?
- 每个节点一般是100map 每个block一个map
- mapred的master jobtracker 以及tasktracker与hdfs有关系吗 有没有那种对应关系
- pkg格式的怎么安装
- reduceTask任务个数怎么理解。分区个数将会决定reduce的个数。如果没有设置这个分区那么,默认reduceTask个数将会是一个。这么理解正确吗?这种情况下如果我们在程序中显示的设置NumReduceTasks数目。最终是以这个为准?
- 为什么Mapres只适合处理一些批量任务 Hive基于mapred和hdfs——》Hive执行时间长,就算在小的表在Hive上执行查询,时间也是分级别的。
- ad_hoc问题到底是什么
8.sql数据库中count(*) 和count(1)与count(列名),前两者没有什么大的区别好像是sql优化。后者是只统计该列值不为NULL的情况。前面两者具体的区别还是有待一研究