Skip to main content

Exponentis

  • Índice
  • Acerca de

Mes: junio 2019

Parametrización automática de DBSCAN en R a partir de la curva elbow

junio 14, 2019agosto 27, 2019 Gliese710 Deja un comentario

En el anterior post titulado Ejemplo de uso de DBSCAN en Python para eliminación de outliers se vio cómo ejecutar un algoritmo DBSCAN para detección de outliers en Python; sus parámetros se eligieron de forma más o menos visual a partir de la nube de puntos y de la curva elbow. El problema que esto […]

Leer más

Ejemplo de uso de DBSCAN en Python para eliminación de outliers

junio 4, 2019agosto 27, 2019 Gliese710 2 comentarios

Dentro de los algoritmos de clustering de aprendizaje no supervisado, uno de los más interesantes -y quizás no tan conocido- es DBSCAN, un algoritmo de agrupamiento basado en la densidad, que modela los clústers como cúmulos de alta densidad de puntos. Por lo cual, si un punto pertenece o no a un clúster, debe estar […]

Leer más

Categorías

Aprendizaje estadístico y Minería de Datos Machine Learning Miscelánea Métodos Estadísticos para el Análisis e Interpretación de datos masivos Métodos para extracción procesamiento y almacenamiento de datos masivos desde Internet Programación Sistemas y tecnologías para la gestión de la información en entornos Big Data Visualización de datos

Entradas recientes

  • Creación de entornos en Anaconda
  • Ejecución secuencial de scripts de Python dentro de otro script con control de errores
  • Funciones agregadas dentro de funciones agregadas en SQL
  • Eliminación de columnas de un dataframe en R en función del porcentaje de NULLS que contengan
  • Uso de la función mutate() de dplyr junto a un condicionante ifelse en R

Etiquetas

Aprendizaje no supervisado Aprendizaje supervisado Big Data Business intelligence CentOS Clustering Código Data Analytics Data mining Data science DBSCAN Definición Discretización dplyr Elbow Fizz Buzz Funciones agregadas HAC Hadoop Java Joblib KBinsDiscretizer Kohonen Linux Machine learning Mapa Auto-Organizado Map Reduce Modelado mutate NaN NULLS Pandas PCA Persistencia de modelos Plot 3D PySpark Python R RDF Samsung SOM Spark SQL TED Train/Test Split

Comentarios recientes

  • Gliese710 en Listado de números primos en Python
  • Gliese710 en Listado de números primos en Python
  • jean pool yantas en Listado de números primos en Python
  • diego en Cómo eliminar filas de un DataFrame de Python Pandas según una condición
  • reynaldo en Uso de la función mutate() de dplyr junto a un condicionante ifelse en R

Archivos

  • enero 2023
  • octubre 2020
  • julio 2020
  • marzo 2020
  • noviembre 2019
  • octubre 2019
  • septiembre 2019
  • agosto 2019
  • julio 2019
  • junio 2019
  • abril 2019
  • enero 2019
  • octubre 2018
  • julio 2018
  • mayo 2018
  • diciembre 2017
  • noviembre 2017
  • octubre 2017
Licencia de Creative Commons Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional. Theme por Colorlib Desarrollado por WordPress
Cleantalk Pixel