hive関連

keydefault valueabout
hive.tez.container.size-1tezのコンテナを使うメモリサイズ
hive.tez.auto.reducer.parallelismfalsereducerの並列有効化
hive.exec.reducers.bytes.per.reducer256,000,0001つのreducer辺りの処理サイズ
hive.exec.dynamic.partition.modestricdynamic partitionを使用するときのモード。stricの場合partitionをselectで明示的に指定しなければいけない。
hive.exec.compress.outputfalsequeryの最終結果を圧縮するかどうかを決める。圧縮方式は「mapred.output.compress*」から取得

mapreduce関連

keydefault valueabout
mapred.reduce.tasks-1Hadoopジョブで使用するReduceタスク数
mapred.output.compression.codecHadoopジョブの主力するファイルを圧縮するときのCodecのClass
mapreduce.output.fileoutputformat.compress.codec
  • 圧縮CodecのClass
    • DefaultCodec: DEFLATEアルゴリズムを使用したzlib形式により圧縮・伸長。圧縮ファイルを分散して処理することはできない
    • GzipCodec: DEFLATEアルゴリズムを使用したgzip形式により圧縮・伸長。分散して処理することはできないがgzipコマンドを使用して参照することはできる。
    • Bzip2Codec: bzip2アルゴリズムを使用したbzip2形式により圧縮・伸長。分散して処理できるが、圧縮・伸長性能は劣る。bzipコマンドを使用して参照することができる。
    • SnappyCodec: Snappyアルゴリズムを使用したSnappy形式により圧縮・伸長。分散して処理することはできないが、圧縮・伸長性能はたかい。Snappyネイティブライブラリをインストールする必要がある。
    • https://hadoop.apache.org/docs/r2.7.2/api/org/apache/hadoop/io/compress/package-summary.html

hdfs(NameNode)関連

keydefault valueabout
io.compression.codecs使用できる圧縮するときのCodecのclass

tez関連

keydefault valueabout
tez.queue.nametezのqueue名
tez.tez-ui-history-url.basehttp://<webserver-host:9999/tez-ui/TezUIのホスト
tez.am.view-aclsView権限を与えるacl