Skip to main content

Exponentis

  • Índice
  • Acerca de

Etiqueta: Elbow

Ejemplo de clustering con k-means en Python

julio 15, 2019agosto 28, 2019 Gliese710 6 comentarios

Sin duda k-means es uno de los algoritmos de aprendizaje automático no supervisado más popular. El objetivo de k-means es simple: agrupa puntos de datos similares con el objetivo de descubrir patrones subyacentes. Para lograr este objetivo, k-means busca un número fijo (k) de agrupamientos (clústers) en el conjunto de datos . 1. Funcionamiento básico […]

Leer más

Parametrización automática de DBSCAN en R a partir de la curva elbow

junio 14, 2019agosto 27, 2019 Gliese710 Deja un comentario

En el anterior post titulado Ejemplo de uso de DBSCAN en Python para eliminación de outliers se vio cómo ejecutar un algoritmo DBSCAN para detección de outliers en Python; sus parámetros se eligieron de forma más o menos visual a partir de la nube de puntos y de la curva elbow. El problema que esto […]

Leer más

Ejemplo de uso de DBSCAN en Python para eliminación de outliers

junio 4, 2019agosto 27, 2019 Gliese710 2 comentarios

Dentro de los algoritmos de clustering de aprendizaje no supervisado, uno de los más interesantes -y quizás no tan conocido- es DBSCAN, un algoritmo de agrupamiento basado en la densidad, que modela los clústers como cúmulos de alta densidad de puntos. Por lo cual, si un punto pertenece o no a un clúster, debe estar […]

Leer más

Categorías

Aplicación de la ciencia de datos a los negocios y a la toma de decisiones Aprendizaje estadístico y Minería de Datos Diseño e implantación de soluciones de Inteligencia de Negocio Machine Learning Miscelánea Métodos Estadísticos para el Análisis e Interpretación de datos masivos Métodos para extracción procesamiento y almacenamiento de datos masivos desde Internet Programación Sistemas y tecnologías para la gestión de la información en entornos Big Data Visualización de datos

Entradas recientes

  • Eliminación de columnas de un DataFrame en Python según el porcentaje de NaNs
  • La metodología en Ciencia de Datos: transformar problemas en soluciones
  • Cómo evitar el error «ValueError: All arrays must be of the same length» al cargar un JSON en Pandas
  • Creación de entornos en Anaconda
  • Ejecución secuencial de scripts de Python dentro de otro script con control de errores

Etiquetas

Aprendizaje no supervisado Aprendizaje supervisado Big Data Business intelligence CentOS Clustering Código Data Analytics Data mining Data science DBSCAN Definición dplyr Elbow Fizz Buzz Funciones agregadas HAC Hadoop IBM Java Joblib KBinsDiscretizer Kohonen Linux Machine learning Mapa Auto-Organizado Map Reduce Modelado mutate NaN NULLS Pandas PCA Persistencia de modelos Plot 3D PySpark Python R RDF scripts SOM Spark SQL TED Train/Test Split

Comentarios recientes

  • Gliese710 en Listado de números primos en Python
  • Gliese710 en Listado de números primos en Python
  • jean pool yantas en Listado de números primos en Python
  • diego en Cómo eliminar filas de un DataFrame de Python Pandas según una condición
  • reynaldo en Uso de la función mutate() de dplyr junto a un condicionante ifelse en R

Archivos

  • marzo 2025
  • abril 2023
  • enero 2023
  • octubre 2020
  • julio 2020
  • marzo 2020
  • noviembre 2019
  • octubre 2019
  • septiembre 2019
  • agosto 2019
  • julio 2019
  • junio 2019
  • abril 2019
  • enero 2019
  • octubre 2018
  • julio 2018
  • mayo 2018
  • diciembre 2017
  • noviembre 2017
  • octubre 2017
Licencia de Creative Commons Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional. Theme por Colorlib Desarrollado por WordPress