sábado, 26 de agosto de 2017

Proceso de Minería de Datos, ¿qué es KDD?


La sigla KDD es el acrónimo de Knowledge Discovery in databases (Descubrimiento de conocimiento en bases de datos) y designa el conjunto de procesos, técnicas y abordajes que propician el contexto en el cual la minería de datos tendrá lugar. 

Dicho proceso extrae conclusiones que pueden utilizarse para el beneficio de la empresa o la persona.

El proceso recoge evidencias y explicaciones que pueden eventualmente llevar a la construcción de un modelo.


¿En qué se divide este modelo? Eso lo veremos a continuación



Selección de datos

            En esta etapa los datos importantes son extraídos de las fuentes o bases de datos de donde proviene la información

Preprocesamiento

            Se limpian datos inconsistentes o en blanco, obteniendo una estructura de datos adecuada para su transformación

Transformación

            Aquí se realizan operaciones de normalización o agregación para consolidar los datos para la fase siguiente

Data mining

            En esta fase se aplican modelos para identificar patrones en los datos ya transformados

Interpretación y evaluación

            Se identifican patrones obtenidos basados en algunas medidas y se realiza una evaluación de resultados

Bibliografía

Luis Vieira, Iván Ortiz y Santiago Ramírez. (2009). Introducción a la minería de datos. Río de Janeiro, Brasil: E-Papers.

Web Mining Consultores. (2011). KDD: Proceso de Extracción de conocimiento. 2017, de WebMining Sitio web: http://www.webmining.cl/2011/01/proceso-de-extraccion-de-conocimiento/

No hay comentarios:

Publicar un comentario