¿Qué es la minería de datos?

utiliza una cantidad relativamente grande de potencia de computación que operan en un gran conjunto de datos para determinar las regularidades y las conexiones entre los puntos de datos. Los algoritmos que utilizan técnicas de estadística, aprendizaje automático y reconocimiento de patrones se utilizan para buscar grandes bases de datos de forma automática. La es también conocido como el conocimiento de Discovery en bases de datos (KDD).

Al igual que el término inteligencia artificial , la minería de datos es un término general que se puede aplicar a una serie de variables actividades. En el mundo corporativo, minería de datos se utiliza con mayor frecuencia para determinar la dirección de las tendencias y predecir el futuro. Se emplea para construir modelos y sistemas de apoyo a las decisiones que dar a la gente información que pueden utilizar. La minería de datos toma un papel de vanguardia en la lucha contra el terrorismo. Se cree que fue utilizado para determinar el líder de la 9 /11 ataques.

mineros de datos estadísticos que se utilizan técnicas con nombres como cerca de los modelos vecino , k-means , método reducto , k veces validación cruzada , el dejar-uno-fuera , y así sucesivamente. Técnicas de regresión se utilizan para restar los patrones irrelevante, dejando sólo la información útil. El término Bayesiano se ve con frecuencia en el campo, en referencia a una clase de técnicas de inferencia que permiten predecir la probabilidad de eventos futuros mediante la combinación de las probabilidades a priori y probabilidades basadas en eventos condicionales. Filtrado de spam es, sin duda una forma de minería de datos, lo que automáticamente pone los mensajes en relevancia a la superficie de un mar caótico de intentos de phishing y campos de Viagra.

Los árboles de decisión se utilizan para filtrar las montañas de datos. En un árbol de decisión, todos los datos pasa a través de un nodo de entrada, donde se enfrenta a un filtro que separa los datos en las corrientes en función de sus características. Por ejemplo, los datos sobre el comportamiento del consumidor es probable que se filtra sobre la base de factores demográficos. La minería de datos no es principalmente acerca de los gráficos de lujo y técnicas de visualización, pero no los emplean para mostrar lo que ha encontrado. Se sabe que podemos absorber más información estadística verbal y visual de este formato de presentación puede ser muy persuasivo y de gran alcance si se utiliza en el contexto adecuado.

A medida que nuestra civilización se vuelve cada vez más saturado de datos y sensores se distribuyen de forma masiva en nuestro medio ambiente local, que sin querer descubrir cosas que pueden pasar desapercibidas en el primer pasar por alto. La minería de datos nos permitirá corregir estos errores y descubrir nuevas perspectivas sobre la del pasado, que nos da más por nuestro dinero almacenamiento de datos.

Deja un comentario