Proyecto de creación de un modelo de datos

Resumen

Creación de un base de datos comprimida en relación con la fuente de datos original y enriquecida con un conjunto de objetos tales como tablas, particiones, relaciones, jerarquías, medidas y KPI que permiten hacer un mejor análisis de los datos. La creación de columnas calculadas representa una forma sencilla de enriquecer y mejorar sus datos. Crear nuevas métricas para ver segmentos concretos de los datos. Establecer el tipo y el formato de una columna o medida constituye otro modo de optimizar la información para que se procese correctamente.

Posibles escenarios

  • Una empresa quiere conocer como la ven sus clientes y para ello necesita crear indicadores de satisfacción de clientes, desviaciones en acuerdos de servicio, reclamos resueltos sobre el total de reclamos.
  • Una empresa desea conocer su estado financiero y para ello necesita crear indicadores que midan sus ganancias, su rendimiento económico, su desarrollo y rentabilidad.
  • Una empresa desea conocer como están funcionando los procesos internos de la empresa de cara a la obtención de la satisfacción del cliente y logro de altos niveles de rendimiento financiero para lo cual debe crear indicadores que midan los procesos:
    • indicadores de operaciones como costos, calidad, tiempos o flexibilidad de los procesos
    • indicadores de la gestión de clientes: selección, captación, retención y crecimiento de clientes

Tareas:

  1. Extracción: Recuperar los datos de las distintas fuentes de información. Por ejemplo, desde una base de datos de un ERP. Al finalizar dispondremos de los datos en bruto.
  2. Limpieza: Comprobar la calidad de los datos, eliminar los duplicados, corregir los valores erróneos y completar los valores en blanco.
  3. Validación: Validar la consistencia de los datos acorde a las definiciones y formatos del destino.
  4. Integración de datos: Eliminar todas las inconsistencias de los datos. Uno de los principales problemas que surgen cuando se analizan sistemas heterogéneos, es la de identificar como una misma entidad, elementos que aparecen con nombres y descripciones diferentes, pero que se refieren a lo mismo. Se trata de un tipo de preparación de datos esencial para que las analíticas y otras aplicaciones sean capaces de utilizar los datos con éxito.
  5. Diseño del destino: Diseñar el modelo que mejor se ajuste: estrella o copo de nieve, así como las tablas de hechos, que contendrán los datos, y las tablas de dimensiones, que contendrán las descripciones de los datos que queremos analizar.
  6. Tipo de modelo de datos: Escoger entre un modelo tabular o multidimensional en dependencia de los recursos de la empresa.
  7. Carga de datos: Añadir los nuevos datos al destino.
  8. Crear objetos del modelo: Crear columnas, tablas, jerarquías, métricas e indicadores que enriquecerán el conjunto de los datos.
  9. Actualización: Configurar y programar la actualización de los datos.

Metodología

  1. Entrevista con los clientes finales del proyecto para la recogida de las necesidades de información que determinarán las fuentes de los datos, el destino donde se almacenarán los datos una vez transformados y los indicadores necesarios.
  2. Estudio de los distintos orígenes de datos para determinar las transformaciones necesarias.
  3. Planificación del Proyecto
  4. Determinar la tecnología a utilizar, teniendo en cuenta los recursos de los clientes.
  5. Presentar una propuesta de diseño del producto de acuerdo con los requerimientos, especificaciones y orígenes de datos del cliente.
  6. Definir los recursos necesarios para llevar a cabo el proyecto.
  7. Implementación del proyecto.
  8. Puesta a punto y entrega del proyecto.
  9. Entrega de la documentación del proyecto: documentación de los orígenes de datos, de la obtención y transformación de datos, del modelo.
  10. Programa de seguimiento donde te ayudaremos a:
    • Resolver dudas técnicas, incidencias y dar soporte en la elaboración de nuevos indicadores.
    • Programación automática de la actualización.
    • Crear alertas y enviar mensajes cuando se produzcan errores en la actualización.