Data Mining y generacion de valor en la firma.

AutorSapoznik, Ezequiel

INTRODUCIÓN

En forma permanente las empresas agregan millones de datos a sus bases de información. La disminución en los costos de almacenamiento y la mayor velocidad de procesamiento de las computadoras lo permiten. La capacidad de los discos se duplica año a año o inclusive en un lapso menor. El primer disco creado por IBM en la mitad de la década de los años cincuenta tenía una capacidad de almacenamiento de 5 megabyte y un costo de 35,000 dólares (o podía ser alquilado por 7000 dólares anuales por megabyte). Desde ese momento hubo una evolución no solo en la capacidad sino también en el tamaño. De acuerdo a diversos estudios, en el año 2010 una computadora hogareña va a contar con discos de 200 terabytes. Esto implica una importante cantidad de información.

Para hacer una comparación, el contenido completo de la Biblioteca del Congreso de los Estados Unidos, considerada una de las mayores del mundo, puede ser almacenado en aproximadamente 20 terabytes. Llevado al ámbito de las empresas, es sencillo darse cuenta de la cantidad enorme de información que cualquier industria puede tener sobre sus clientes y que puede no estar aprovechando. Justamente como esta información crece de manera exponencial, es clave la habilidad de acceder a la información que se necesita y en el momento que se requiere. Es posible generar consultas en SQL (Structured Query Language) y armar agregaciones multidimensionales para contestar preguntas como cuánto me ingreso por tal o cuál campaña de marketing ó cuantos clientes tiene cada sucursal de un banco ó cuantos clientes de un supermercado hicieron compras con su tarjeta de fidelidad.

Si bien esto es muy valioso para las empresas, estos análisis no permiten predecir la cancelación de un contrato en forma anticipada o la probabilidad de compra de un producto o cuándo un cliente va a cometer fraude en una tarjeta de crédito. Sin embargo es factible usar Minería de Datos (o Data Mining) para poder armar modelos que permitan contestar esas preguntas.

Existen muchas definiciones de Data Mining en innumerables publicaciones, sin embargo hay una que por su sencillez permite comprender la esencia de esta herramienta:

El Data Mining automatiza la detección de patrones relevantes dentro de una base de datos (1).

Ahora bien, vamos a ver un ejemplo de la vida real para entender de qué se trata el Data Mining.

Supongamos que usted va siempre a comer al mismo lugar al mediodía durante un año. Usted sabe que entre las 13 y 15 hrs. el lugar estará lleno. Sabe además que el restaurante sirve un plato cada día de la semana y el menú se repite todas las semanas. Si usted quiere almorzar tranquilo, sin hacer cola, en una mesa que usted pueda elegir y un plato diferente al del menú del día seguramente irá antes de las 13 horas (o después de las 15) o buscará otro lugar para variar la comida. Siendo obvio, este ejemplo sirve para entender como los datos pueden ser transformados en información para hechos accionables: se almacena información histórica que luego va a ser usada para estimar que pasará en el futuro.

El campo de aplicación del Data Mining es extenso. Se aplica tanto en empresas como así también en medicina o economía. Publicaciones de Harvard dieron a conocer recientemente que diversos centros de investigación médica, entre los que se encuentra el Harvard Medical School y el Boston Medical Center, identificaron un método para predecir el riesgo de derrames cerebrales usando Data Mining...

Para continuar leyendo

Solicita tu prueba

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR