Este es un resumen de una de las charlas a las que asistí en el Oracle OTN Tour Latino américa 2013. Su titulo: "Del Big Data a los analíticos en memoria".
En el mundo solo el 20% de la información es estructurada (Existente en tablas de bases de datos o estructuras controladas por las aplicaciones), y el 80% es no estructurada (Producto de redes sociales, google, correo electrónico, etc). De esta información no estructurada el 80% es texto, los datos pueden no ser confiables y se dispone de grandes volumenes (Terabytes, o Petabytes). A esto se le conoce como Big data.
Tradicionalmente para análisis de grandes cantidades de datos se hace uso de data ware houses que son alimentados por procesos ETL para su posterior procesamiento con herramientas de inteligencia de negocio. El problema con este enfoque es que no se da en tiempo real, muchas veces toma días e incluso semanas para entregar indicadores que apoyen la toma de decisión de las empresas. Hoy se habla de Analíticos en memoria que entregan información casi en tiempo real (Procesar en RAM es 50.000 veces mas rápido que hacerlo en disco). Todo esto es posible porque en la actualidad el costo de la memoria es considerablemente menor. Un módulo cuesta 25 veces menos que en el pasado y tiene 64 veces mas capacidad.
El siguiente es un proceso de análisis de negocio con procesamiento de Big Data en memoria:
- Adquirir: Conseguir los datos que van a ser objetos de análisis a partir de diferentes fuentes de información tanto estructurada como no estructurada. Normalmente los datos son almacenados en bases de datos no relacionales y bases de datos en memoria.
- Organizar: Su objetivo es convertir toda esta información en datos estructurados que puedan ser sujetos a análisis (Bases de datos relacionales, cubos, etc).
- Analizar: Se analiza la información organizada previamente y se generan indicadores para el negocio.
- Decidir: Las personas del negocio toman decisiones con base en los indicadores generados.
El proceso se ejecuta continuamente, generando indicadores en tiempo real que permitan a los gerentes actuar de manera pro-activa a través de una mejor toma de decisiones.
Imaginen la posibilidad de publicar una oferta de mercadeo y conocer en tiempo real lo que las personas están diciendo sobre el producto en facebook o twitter. Esto es posible con análisis de datos en memoria, el enfoque tradicional tal vez nos permita conocer la información un día después cuando sea demasiado tarde y no podemos hacer nada para salvar la campaña publicitaria.