miércoles, 4 de abril de 2012

BDE - DATA WAREHOUSE


PROCESO DE NEGOCIO

Un proceso de negocio es un conjunto de tareas relacionadas lógicamente llevadas a cabo para lograr un resultado de negocio definido. Cada proceso de negocio tiene sus entradas, funciones y salidas. Las entradas son requisitos que deben tenerse antes de que una función pueda ser aplicada. Cuando una función es aplicada a las entradas de un método, tendremos ciertas salidas resultantes.
Es una colección de actividades estructurales relacionadas que producen un valor para la organización, sus inversores o sus clientes. Es, por ejemplo, el proceso a través del que una organización ofrece sus servicios a sus clientes.
Un proceso de negocio puede ser parte de un proceso mayor que lo abarque o bien puede incluir otros procesos de negocio que deban ser incluidos en su función. En este contexto un proceso de negocio puede ser visto a varios niveles de granularidad. El enlace entre procesos de negocio y generación de valor lleva a algunos practicantes a ver los procesos de negocio como los flujos de trabajo que efectúan las tareas de una organización. Los procesos poseen las siguientes características:
  1. Pueden ser medidos y están orientados al rendimiento.
  2. Tienen resultados específicos.
  3. Entregan resultados a clientes o “stakeholders”.
  4. Responden a alguna acción o evento específico.
  5. Las actividades deben agregar valor a las entradas del proceso.

EJEMPLOS DE PROCESOS DE NEGOCIO:

.Manufactura y producción: Ensambla el producto, verifica la calidad y crea las listas de materiales.
.Ventas y mercadotecnia: Identifica los clientes, crea el conocimiento del cliente.
.Contabilidad y finanzas: Paga a los acreedores, crea estados financieros, administra las cuentas de efectivo.

DEFINICIÓN DE UN SISTEMA TRANSACCIONAL

Es un tipo de sistema de informacióndiseñado para recolectar, almacenar,modificar y recuperar todo tipo de informaciónque es generada por las transacciones en unaorganización. Una transacción es un evento oproceso que genera o modifica la información que se encuentran eventualmente almacenados en un sistema de información.
Estos sistemas se dirigen principalmente alas áreas de ventas y mercadotecnia,administración y finanzas y al área derecursos humanos.
 Clasificación de un Sistema Transaccional:
•Los sistemas transaccionales se clasifican por ser la primera cara de una empresa con elusuario, sea éste último un trabajador delpropio negocio o un cliente.
•Éste tipo de sistemas se caracteriza porque sufuncionamiento es en línea y permite realizar las operaciones cotidianas del negocio.•Se clasifica también por administrar lastransacciones, por lo general en línea, capturala información que se produce y cuando ocurreuna transacción, no la procesa sino que laentrega a otro sistema.

EJEMPLO DE OLTP:

 Un sistema transaccional debe controlar lastransacciones para mantener la seguridad yconsistencia de los datos involucrados. Por ejemplo, un cliente transfiere dinero de unacuenta a otra cuenta dentro de un mismobanco; la cantidad de dinero que se descuentade la cuenta emisora debe ser igual a la que sesuma en la cuenta receptora. De no ser así, laacción (transacción) no se realiza.

SISTEMA ANALÍTICO

OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.
La razón de usar OLAP para las consultas es la rapidez de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas (aunque peor desde el punto de vista operativo) es una base de datos multidimensional.
La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE

EJEMPLO DE OLAP

Un analista financiero podría querer ver los datos de diversas formas, por ejemplo, visualizándolos en función de todas las ciudades (que podrían figurar en el eje de abscisas) y todos los productos (en el eje de ordenadas), y esto podría ser para un período determinado, para la versión y el tipo de gastos. Después de haber visto los datos de esta forma particular el analista podría entonces querer ver los datos de otra manera y poder hacerlo de forma inmediata. El cubo podría adoptar una nueva orientación para que los datos aparezcan ahora en función de los períodos y el tipo de coste. Debido a que esta reorientación implica resumir una cantidad muy grande de datos, esta nueva vista de los datos se debe generar de manera eficiente para no malgastar el tiempo del analista, es decir, en cuestión de segundos, en lugar de las horas que serían necesarias en una base de datos relacional convencional.


DIMENSIÓN

Una dimensión de base de datos es una colección de objetos relacionados, denominados atributos, que se pueden usar para proporcionar información sobre los datos de hechos de uno o varios cubos. Por ejemplo, los atributos típicos de una dimensión de producto pueden ser el nombre, la categoría, la línea, el tamaño y el precio del producto.Estos objetos están enlazados a una o varias columnas de una o varias tablas de una vista del origen de datos. De manera predeterminada, estos atributos están visibles como jerarquías de atributo y se pueden utilizar para comprender los datos de hechos en un cubo. Los atributos se pueden organizar en jerarquías definidas por el usuario que proporcionan rutas de navegación para ayudar a los usuarios al examinar los datos de un cubo.
Los cubos contienen todas las dimensiones en las que los usuarios basan sus análisis de los datos de hechos. Una instancia de una dimensión de base de datos en un cubo se denomina dimensión de cubo y se relaciona con uno o más grupos de medida en el cubo. Una dimensión de base de datos se puede utilizar varias veces en un cubo. 

EJEMPLO DE DIMENSIÓN


Por ejemplo, una tabla de hechos puede tener varios hechos relacionados con el tiempo y se puede definir una dimensión de cubo independiente que sirva de ayuda para analizar cada uno de ellos. Sin embargo, solo es necesario que haya una dimensión de base de datos relacionada con el tiempo, lo que significa también que solo es necesario que haya una tabla de base de datos relacional relacionada con el tiempo para admitir varias dimensiones de cubo basadas en el tiempo.



DATA WAREHOUSE


En el contexto de la informática, un almacén de datos (del inglésdata warehouse) es una colección de datosorientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata, sobre todo, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente OLAPprocesamiento analítico en línea). El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sean necesario.

EJEMPLO DE DATA WAREHOUSE

HECHOS O MEDIDAS

•Las medidas representan los valores que son analizados:
–Cantidad de pacientes admitidos
–Llamadas efectuadas.
–ImporteTotal = precioProducto * cantidadVendida
–Rentabilidad = utilidad / PN
–CantidadVentas = cantidad
–PromedioGeneral = AVG(notasFinales)
 Valores numéricos porque estos valores son las bases de las cuales el usuario puede realizar cálculos.
 Si la medida es no numérica debemos codificarla a un valor numérico y cuando tengamos que exponerla decodificarla para  mostrarla con el valor original.
Características de las medidas:
–Deben ser numéricas.
–Cruzan todas las dimensiones en todos los niveles.
Las medidas pueden clasificarse en:
  • Naturales
  • Estas formas de agregación pueden ser:
  • Suma: es la operación que suma los valores de las columnas
  • Cuenta: realiza un conteo de los valores
  • Mínima: devuelve un valor mínimo
  • Máxima: proporciona el mayor de los valores
  • Cuenta de Distintos: cuenta los valores diferentes
  • Calculadas
  • Cálculos Matemáticos
  • Expresiones condicionales
  • Alertas

Tablas de Hechos

Las tablas de hechos contienen hechos.
Los hechos o medidas son los valores de datos que se analizan (son numéricos).
La tabla de hechos tiene una clave primaria compuesta por las claves primarias de las tablas de dimensiones relacionadas a este.
Los hechos son aquellos datos que residen en una tabla de hechos y que son utilizados para crear indicadores, a través de sumarizaciones preestablecidas al momento de crear un cubo multidimensional.

No hay comentarios:

Publicar un comentario