jueves, 22 de marzo de 2018

OLAP VS OLTP


OLTP - On-Line Transactional Processing

Los sistemas OLTP son bases de datos orientadas al procesamiento de transacciones. Una transacción genera un proceso atómico (que debe ser validado con un commit, o invalidado con un rollback), y que puede involucrar operaciones de inserción, modificación y borrado de datos. El proceso transaccional es típico de las bases de datos operacionales.

- El acceso a los datos está optimizado para tareas frecuentes de lectura y escritura. (Por ejemplo, la enorme cantidad de transacciones que tienen que soportar las BD de bancos o hipermercados diariamente).

- Los datos se estructuran según el nivel aplicación (programa de gestión a medida, ERP o CRM implantado, sistema de información departamental...).

-Los formatos de los datos no son necesariamente uniformes en los diferentes departamentos (es común la falta de compatibilidad y la existencia de islas de datos).

-El historial de datos suele limitarse a los datos actuales o recientes.




OLAP - On-Line Analytical Processing

Los sistemas OLAP son bases de datos orientadas al procesamiento analítico. Este análisis suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer algún tipo de información útil: tendencias de ventas, patrones de comportamiento de los consumidores, elaboración de informes complejos… etc. Este sistema es típico de los datamarts.

-El acceso a los datos suele ser de sólo lectura. La acción más común es la consulta, con muy pocas inserciones, actualizaciones o eliminaciones.

-Los datos se estructuran según las áreas de negocio, y los formatos de los datos están integrados de manera uniforme en toda la organización.

-El historial de datos es a largo plazo, normalmente de dos a cinco años.

-Las bases de datos OLAP se suelen alimentar de información procedente de los sistemas operacionales existentes, mediante un proceso de extracción, transformación y carga (ETL).

Comparativa 
OLAP
OLTP
DEFINICIÓN
El procesamiento analítico en línea (OLAP). Son diseñados para cumplir con un conjunto de metas. Se puede decir, qué es una solución utilizada en el campo de la llamada inteligencia artificial.
El procesamiento de transacciones en línea es un tipo de proceso, especialmente rápido en el que las solicitudes de los usuarios son resueltos de inmediato.
OBJETIVOS
Asistir en el análisis de negocios, identificando tendencias, comprende periodos, gestiones, mercados, etc.
Asistir a aplicaciones específicas.
Mantener la integridad de los datos.
ALINEACIÓN DE DATOS
Los OLAP están alineados por aplicación. Diferentes sistemas tienen distintos tipos de datos, los cuales son estructurados por aplicación. Se focaliza en el cumplimiento de requerimientos de una aplicación en especial o una tarea especifica.
Los OLTP están alineados por dimensión todos los tipos integrados en un solo sistema. Los datos organizados definiendo dimensiones de negocios.
INTEGRACIÓN DE DATOS
En OLAP los datos deben estar alineados-integrados. Son conocidos como datos derivados o datos DSS.
Los OLTP son datos que se encuentran típicamente no integrados, son calificados como datos primitivos o datos operacionales.
HISTORIA
LOS OLAP almacenan tanta historia como sea necesaria para el análisis de negocios típicamente dos a cinco años.
Los OLTP usualmente retiene datos para 60 a  90 días después son resguardados por los administradores de  base de datos  en  almacenamientos secundarios fuera de línea.
ACCESO Y MANIPULACIÓN DE DATOS
Los sistemas operacionales realizan una manipulación de datos registro por registro con grandes cantidades de INSERT,UPDATES
La validación de datos, se realiza antes o después de la carga, principalmente se realizan sentencias select.
PATRONES DE USO
Tiene un patrón de uso liviano con picos de usos eventuales en el  tiempo.



Mantiene un patrón de uso constante requiriendo grandes cantidades de recursos y consumiendo solo el tiempo requerido a la transacción.
GRANULARIDAD DE DATOS
Contenían información sumarizada hasta cierto nivel (el permitido por los volúmenes de consolidación de los cubos multidimensionales de los 80´s.
En los sistemas operacionales se encuentran los a nivel detallado o transaccional.
PERFIL DEL USUARIO
En este tipo de sistemas corresponden a la comunidad gerencial.
Tiene por objetivo asistir a aplicaciones específicas y asegurar la integridad de datos.

https://asiel-bda.webnode.es/trabajos/tarea-1/cuadro-comparativo-olap-oltp/
http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx

Concepto de Bases de Datos Multidimensionales

Para entender una base de datos multidimensional de algunos términos que necesitamos entender.

El primer término es el de procesamiento de transacciones online comúnmente conocido como OLTP. Como su nombre indica, consiste en sistemas basados en transacciones, los cuales frecuentemente utilizan una base de datos relacional como almacén de datos. Los sistemas OLTP suelen centrarse en tiempos de respuesta rápida y necesidades de servicio inmediatas.

Un buen ejemplo de un sistema OLTP es un cajero automático. Cuándo vas a retirar dinero del cajero automático no estás realmente interesado en analizar un montón de datos. Estás allí sólo para hacer una retirada de dinero y terminar para que la siguiente persona que espera pueda completar también su transacción. El sistema OLTP facilita estos procesos.
Esto nos lleva a otro término conocido como OLAP, que nos ayuda con el procesamiento analitico online. El enfoque OLAP se centra en el análisis de datos, y típicamente los datos provienen de los sistemas OLTP. Esto no quiere decir que la tecnología OLAP sea más lenta que la tecnología OLTP, sino que los dos se centran en cosas completamente diferentes. OLTP se enfoca en hacer el trabajo y OLAP en analizar los resultados del trabajo.
Un sistema OLTP puede tener miles de millones de registros por lo que intentar ejecutar informes en un sistema OLTP es malo ya que podríamos ralentizarlo o hacer que deje de funcionar. Los sistemas OLTP suelen ser de misión crítica para el negocio y no es conveniente sobrecargarlos.
Ahí es donde entra la tecnología OLAP. Podemos coger los datos del sistema OLTP y cargarlos en nuestro sistema OLAP, y cuando hablamos de OLAP nos estamos refiriendo realmente a una base de datos multidimensional. Los dos términos significan esencialmente lo mismo. También es posible que escuches el término cubo o cubo OLAP para referirse también a esto. Realmente los términos base de datos multidimensional, cubo y cubo OLAP se utilizan de forma bastante intercambiable.

El proceso de carga de datos desde el sistema OLTP a la base de datos multidimensional suele ser complicado y pueden requerir retocar los datos para tenerlos de forma que puedan ser analizados en la base de datos multidimensional. El término para este proceso de carga se denomina ETL (extracción, transformación y carga) y hay muchas herramientas sl en el mercado que realizan esta función.

Habitualmente se realiza una carga nocturna mediante una herramienta ETL que se ejecuta contra los datos en el sistema OLTP. Estos datos se cargan en la base de datos multidimensional OLAP y a la mañana siguiente el analista puede utilizarlos y encontrar respuestas a sus preguntas

Lo interesante es que el uso de una base de datos multidimensional permite analizar los datos sin afectar al sistema OLTP. Éste sigue ejecutando procesos de negocio mientras que el analista puede hacer análisis crítico de datos importantes que pueden ayudar a determinar cómo el negocio está funcionando y cómo se puede mejorar.

Ejemplos de Bases de datos Multidimensionales
Algunas empresas que trabajan con base de datos multidimensionales son las siguientes:
Carrefour
La cadena de supermercados ha impuesto un sistema para incrementar la periodicidad de las visitas a sus centros y el volumen de la cesta de la compra. El proyecto consiste en analizar los datos de la compra de sus clientes y ofrecerles descuentos que caducan en días concretos.
American Express
La entidad está analizando las operaciones que hacen sus clientes VIP con su tarjeta para ofrecerles productos relacionados con su estilo de vida. Por ejemplo, si hay una persona que gasta mucho dinero en gastronomía, puede invitarle a reservar en restaurantes concretos.
Caixabank y BBVA
La entidad catalana está montando una infraestructura multicanal enfocada al cliente y manejando información en tiempo real. BBVA ha cambiado su cúpula directiva para enfocarse en el negocio digital porque cree que se va a producir una revolución en el sector bancario y quiere estar preparado para afrontarla.