hadoop - 在Hadoop中,gzip BZip2文件读取

  显示原文与译文双语对照的内容

我听说我们可以使用多个映射器在Hadoop中并行地读取一个bzip2文件的不同部分,以提高性能。 但搜索后找不到相关的样本。 如果有人可以指出相关的代码段,请欣赏。 谢谢。

BTW: gzip与( 多个映射程序并行处理一个gzip文件的不同部分) 有相同的特性。

时间: 原作者:

...