La
sigla KDD es el acrónimo de Knowledge Discovery in databases (Descubrimiento de
conocimiento en bases de datos) y designa el conjunto de procesos, técnicas y
abordajes que propician el contexto en el cual la minería de datos tendrá
lugar.
Dicho proceso extrae conclusiones que pueden utilizarse para el
beneficio de la empresa o la persona.
El
proceso recoge evidencias y explicaciones que pueden eventualmente llevar a la
construcción de un modelo.
¿En
qué se divide este modelo? Eso lo veremos a continuación
Selección de datos
En
esta etapa los datos importantes son extraídos de las fuentes o bases de datos
de donde proviene la información
Preprocesamiento
Se limpian datos inconsistentes o en
blanco, obteniendo una estructura de datos adecuada para su transformación
Transformación
Aquí se realizan operaciones de
normalización o agregación para consolidar los datos para la fase siguiente
Data mining
En
esta fase se aplican modelos para identificar patrones en los datos ya
transformados
Interpretación y evaluación
Se identifican
patrones obtenidos basados en algunas medidas y se realiza una evaluación de
resultados
Bibliografía
Luis
Vieira, Iván Ortiz y Santiago Ramírez. (2009). Introducción a la minería de
datos. Río de Janeiro, Brasil: E-Papers.
Web
Mining Consultores. (2011). KDD: Proceso de Extracción de conocimiento. 2017, de WebMining
Sitio web:
http://www.webmining.cl/2011/01/proceso-de-extraccion-de-conocimiento/
No hay comentarios:
Publicar un comentario