Adán Mohamed Ali Fadlalla
La minería de datos es el proceso de identificar patrones válidos, novedosos, útiles y comprensibles en los datos y la extracción o descubrimiento de resúmenes útiles de patrones de datos o conocimiento a partir de una gran cantidad de datos y también se denomina descubrimiento de conocimiento KDD en bases de datos. Un proceso KDD incluye limpieza de datos, minería de datos, selección de datos, transformación, integración de datos, evaluación de patrones y presentación de conocimiento. Es un crecimiento explosivo de datos de terabytes a petabytes. La confluencia de múltiples disciplinas incluye aprendizaje automático, estadísticas, inteligencia artificial, visualización, computación de alto rendimiento, tecnología de bases de datos, algoritmos, reconocimiento de patrones. Sus aplicaciones incluyen análisis de datos biológicos y médicos: clasificación, análisis de conglomerados y análisis de datos de microarrays, minería web.