最近、仕事でEMRを使うようになって調べていたことがあったのでメモっておきます。
タイトルの通りなんですけど、elastic-mapreduce-rubyで–inputを複数指定する方法が分からなかったんですが、解決しました。まぁ、こんな感じで単純にカンマ区切りに指定すればよかったというオチでした。
elastic-mapreduce --create --stream \ --mapper s3n://bucket/path/to/mapper \ --reducer s3n://bucket/path/to/reducer \ --master-instance-type m1.small \ --slave-instance-type m1.small \ --num-instances 3 \ --input s3n://bucket/path/to/dir1/*,s3n://bucket/path/to/dir2/* |