Cuando trabajamos con un DataFrame, especialmente si es extenso, podemos tener problemas con lo valores NaN. Los NaN («Not a Number«) son valores vacíos no computables que debemos tratar en nuestros conjuntos de datos antes de trabajar con ellos. Veremos algunos códigos de Python que pueden ayudarnos a trabajar con los NaN. Este código nos […]
Cinco comandos de depuración de código para Hadoop Map Reduce
Se listan algunos comandos interesantes de Hadoop Map Reduce para obtener resultados intermedios y poder depurar nuestro código para evitar errores: Salida de los mappers: Entrada de los combiners: Salida de los combiners: Entrada de los reducers: Salida del reducer tras ejecutar un combiner: Para saber más:Mordiendo Hadoop: Instalación y primeras pruebas.Ejemplo WordCount y primeros […]
Creación y ejecución de un programa Python para Hadoop Map Reduce en Linux
Vamos a ejecutar un sencillo programa Python en Hadoop Map Reduce. El programa va a calcular la temperatura máxima de cada año a partir de un registro histórico. Para el ejemplo usaremos CentOS aunque es válido para cualquier otra distribución de Linux. Si no tienes aún instalado Hadoop quizás te interese el siguiente post: Instalación […]
Instalación paso a paso de Hadoop en Linux y un ejemplo de uso
Esta es una guía sencilla, que explica paso a paso como instalar y ejecutar Hadoop en una máquina Linux. Si ya tienes instalado Hadoop, quizás te interese: Creación y ejecución de un programa Python para Hadoop Map Reduce en Linux En primer lugar instalamos Java, ya que Hadoop se ejecuta sobre este lenguaje. Para el […]
Cómo eliminar filas de un DataFrame de Python Pandas según una condición
Sencillo ejemplo de cómo eliminar una fila de un DataFrame Pandas de Python en función de una expresión condicional. Como bonus track al final vemos cómo eliminar también una columna. Partimos de este sencillo DataFrame creado en Excel como ejemplo: La forma de cargar en Pandas éste DataFrame desde un archivo Excel es la siguiente: […]
Listado de números primos en Python
Pues estaba haciendo un pequeño programa para listar un secuencia de números primos y he pensado que seria interesante compartirla en el blog. Lo primero, recordar que un número primo no es más que un número que sólo es divisible entre 1 y si mismo. Por ejemplo, el número 7 es primo ya que solo […]
¿Cuánto tarda en salir un número aleatorio en Python?
Propongo un ejercicio en Python que consiste en lo siguiente: Se elige un número aleatorio comprendido entre ‘1’ y un valor especificado por el usuario. El algoritmo debe mostrar el número de veces que tarda en volver a salir ese mismo número de forma aleatoria un número ‘n’ especificado por el usuario de veces. ‘a’ es […]
El test de “Random Fizz Buzz” en Python
Si echáis un rápido vistazo por este blog ya habréis visto que le he dedicado un par de posts al test de «Fizz Buzz«, una simple pero curiosa prueba que algunas empresas utilizan como test entre aspirantes a un puesto de trabajo. La premisa es sencilla: Escribir un código en cualquier lenguaje de programación (incluso […]
El test de “Fizz Buzz” en Python
Ya escribí un post en este blog sobre el test de «Fizz Buzz», una pequeña prueba usada por muchas compañías durante una entrevista de trabajo para evaluar los conocimientos de programación del candidato al puesto. No es una prueba difícil pero durante una entrevista ya se sabe que los nervios pueden jugarte una mala pasada. […]
Programa en Python para calcular el número de días entre dos fechas
El siguiente código es un programa en Python que calcula el número de días transcurridos entre dos fechas cualesquiera. Reconozco que me ha llevado mi tiempo programarlo y no ha sido fácil para un novato en Python como yo, lo que posiblemente lleve a que el código se pueda optimizar de muchas formas. En cualquier […]