Cinco comandos de depuración de código para Hadoop Map Reduce

Se listan algunos comandos interesantes de Hadoop Map Reduce para obtener resultados intermedios y poder depurar nuestro código para evitar errores:

cat datos.txt | python ./miMapper.py

cat datos.txt | python ./miMapper | sort -k1,1

cat datos.txt | python ./miMapper | sort -k1,1 | python ./miCombiner.py

cat datos.txt | python ./miMapper | sort -k1,1 | python ./miCombiner.py | sort -k1,1

cat datos.txt | python ./miMapper | sort -k1,1 | python ./miCombiner.py | sort -k1,1 | python ./miReducer.py

Lo siento, debes estar conectado para publicar un comentario.