BI o la tecnología aplicada al negocio
El sector del BI o business inteligence se puede describir como uno de los sectores que se ha dado cuenta de la cantidad de información que se almacena hoy en día en todos los sectores y centrándose en los negocios ofrece la posibilidad de cargar sus datos de manera masiva permitiendo realizar cálculos sobre ellos para facilitar un análisis exhaustivo que sin estas herramientas sería imposible de cuantificar hasta este punto.
Este procedimiento que realiza se define como ETL el cual permite realizar la carga de los datos en tres puntos básicos:
- Extract: Fase en la cual se conecta en la base de datos y carga las tablas concretas (data sources).
- Transform: Estos datos que se han cargado puede pasar por fases de transformación donde sus datos se les pueden aplicar operaciones matemáticas, de renombrado .. generado la estructura interna de tablas nuevas que se usaran (data warehouse). Estas tablas internas deberan estar conectadas entre ellas a través de indicadores para permitir a la herramienta vincular correctamente los datos. En la siguiente imagen por ejemplo tenemos como tabla central un conjunto de ventas vinculadas con el cliente que las ha realizado, el vendedor, el territorio y la descripción de la venta.
- Load: Después de pasar por la fase de transformación, finalmente los datos son cargados y disponibles para pasar a ser procesados a través de una variedad de indicadores y gráficos. Todos estos datos estarán vinculados de manera que se podrán realizar selecciones de ellos realizando filtrados.
Orígen: http://www.keylink.net.au/etl
Una vez procesados y disponibles estos datos tenemos un gran conjunto de objetos que permitirán darle sentido a los datos de las tablas del data warehouse que tenemos preparados en base a dos puntos:
- Dimensiones: Cada columna de cada tabla del data warehouse de ejemplo que se ha puesto (Name, Country, OrderDate … )se puede usar como dimensión pudiéndose listar en los objetos cada uno de los valores de los que disponga la dimensión.
- Expresiones: Si sobre una columna se le aplica una expresión en vez de tener listado los resultados de la dimensión dispondremos del cálculo de esa expresión sobre cada uno de los valores de la dimensión. Si además queremos que la expresión venga delimitada por dimensiones, el cálculo de la expresión se aplicará sobre la dimensión que se decida pero con los datos separados para cada una de las dimensiones. Por ejemplo si sólo definimos una operacion sum(SalesAmount) nos devolverá el sumatorio total de la columna SalesAmount de la tabla Sales, pero si indicamos que sobre esta expresión usamos como dimensión Name de la tabla Territory tendremos ese sumatorio distribuido por cada territorio.
Sobre los objetos que permiten definir dimensiones y expresiones, algunos de ellos son los siguientes:
- Tablas simples: Para realizar un volcado literal de los datos según las columnas que se elijan visualizar. Sólo trabajan con dimensiones.
- Gráficos de barras: A partir de unas dimensiones configuradas permite realizar una comparación de las expresiones aplicadas sobre ellas. Por ejemplo poniendo dimensión un departamento y como expresión sus ventas.
- Gráficos de tarta: Para saber la distribución sobre unas mediciones se puede ver de manera gráfica el peso de los datos de una dimensión sobre una expresión.
- Gráficos de líneas: Para ver la evolución de unas mediciones.
- Gráfico de indicador: Para visualizar ratios.
- Gráfico de bloques: Otro gráfico visual para ver distribuciones
Teniendo en cuenta esta variedad de objetos la decisión sobre cuales usar residen en la cantidad de dimensiones y expresiones que se tengan que listar.
Para finalizar este primer post sobre BI os dejo una tabla ejemplo dando una referencia sobre el uso de las dimensiones y expresiones según la cantidad que se quiera mostrar.
Objeto | Dimensiones | Expresiones |
Listado | Una dimensión | O una expresión |
Tabla simple | Tantas dimensiones como se quieran listar | No se admiten |
Gráfico de barras | Múltiples dimensiones | Múltiples expresiones |
Gráfico de líneas | 1-2 | 1-2 |
Gráfico de radar | Una dimensión | Una expresión visible a la vez (se pueden intercambiar) |
Gráfico de tarta | 1-2 | 1 |
Gráfico de bloques | 1-2 | 1 |
En mi siguiente post daré unas explicaciones paso a paso sobre un proceso ETL a través de QlikView (en mi caso la herramienta de business inteligence con la que trabajo) y el uso explícito sobre algún objeto de los explicados antes.
Espero que os haya parecido interesante.
Saludos!