Codificar categorías de alta cardinalidad sin morir en el intento

Cuando una variable categórica tiene muchísimas categorías (códigos de cliente, ciudades, SKU…), el One-Hot Encoding tradicional explota el número de columnas, consume memoria y puede sobre ajustar. En este post vemos tres enfoques prácticos para tratar la alta cardinalidad sin perder el control: 0- Dataset de ejemplo Como ejemplo, usaremos un dataset ficticio con una […]

Leer más

¿Cuál es la Web del futuro? Linked Data y Linked Open Data

Hace 25 años el inglés Tim Berners-Lee con la ayuda del belga Robert Cailliau desarrollaron las ideas fundamentales que estructuran la web. Crearon lo que se denomina Lenguaje HTML (HyperText Markup Language), el protocolo HTTP (HyperText Transfer Protocol) y el sistema de localización de objetos en la web URL (Uniform Resource Locator). Los documentos e información disponibles hasta ese momento estaban en diferentes […]

Leer más