Desde la actualización de Power BI de diciembre de 2020, cuando conecté a dos conjuntos de datos desde un mismo modelo me surgió una curiosidad, ¿Cómo relacionar los conjuntos para poder mostrar en un mismo objeto visual medidas de los dos?
En realidad tengo una idea de como hacerlo y quiero probar que funciona. Para ello seguiré los pasos siguientes:
- Crearé dos modelos y los publicaré en el servicio de Power BI, en la misma área de trabajo.
- Crearé un tercer modelo de datos en Power BI Desktop y desde aquí voy a conectar con los dos conjuntos de datos publicados.
- Enlazaré ambos conjuntos de datos en el modelo usando las tablas de los dos modelos.
- Añadiré en la vista de informe una matriz que combine medidas de los dos conjuntos de datos y veré que tal va el nuevo modelo.
- Finalmente comprobaré la consulta que se envía y los tiempos de demora en ejecutarse.
Crear los dos modelos y publicarlos
El primer modelo es de ventas y contiene las tablas Productos, Clientes, Ventas y Calendario. Debajo tienen una imagen del modelo.

Siguiendo las prácticas de un buen diseño he añadido una tabla de calendario en ambos modelos, he añadido medidas explicitas. También he ocultado todas las columnas que no son necesarias para los informes, como por ejemplo, las columnas que solo se utilizan para relacionar las tablas.
El segundo modelo es de marketing y contiene las tablas Campañas, Productos, Marketing y Calendario, debajo tienen una imagen:

Este modelo también sigue las buenas prácticas de diseño por lo que tendrá su propia tabla de calendario.
Por lo tanto, los dos modelos tienen dos tablas en común: Productos y Calendario. Las dos tablas de Calendario contienen los mismos datos. En el caso de Productos, la tabla del modelo de marketing contiene solo los productos que están asociados a alguna campaña.
El siguiente paso es crear el tercer modelo que combine ambos conjuntos de datos.
Crear un modelo de datos en Power BI Desktop que conecte con los dos conjuntos de datos publicados.
He creado un tercer modelo y añadido primero el conjunto de datos de las ventas. Debajo tenemos una imagen del nuevo modelo con el conjunto de datos añadido.

Podemos observar que excepto por el borde superior negro en cada tabla, el modelo es igual al original. Este borde negro indica que las tablas vienen del servicio de Power BI, como en este caso, o de Azure Analysis Services.
A continuación, seleccionamos el segundo conjunto de datos de Power BI, el de marketing, y nos muestra el siguiente mensaje:

Que nos indica que para combinar un conjunto de datos con otro origen en un modelo es necesario cambiar el modo de conexión a DirectQuery. Esto también ocurriría no solo con otro conjunto de datos sino con cualquier otra fuente de datos, aunque sea un archivo local.
A continuación, nos muestra otro mensaje de advertencia acerca del riesgo potencial de seguridad que puede implicar crear un modelo compuesto.

Una vez aceptado el mensaje y configurada la privacidad se añade el segundo conjunto de datos al modelo como se muestra en la figura.

Podemos ver la primera diferencia en la vista del modelo, para cada conjunto de datos los encabezados de las tablas tienen un color diferente. El color azul identifica el primer conjunto de datos que conectamos y rojo el segundo.
Las tablas Calendario y Producto se repiten en los dos modelos, dejando en el primero los nombres originales y añadiendo en el nombre del segundo un 2.
Ahora toca relacionar las tablas de los dos modelos, pero ¿Cómo lo haremos?
Relacionar los dos conjuntos de datos en el modelo
No podemos pensar en modificar los modelos de Ventas y Marketing eliminando las tablas Calendario y Productos de uno de los dos porque ese modelo quedaría incompleto. Esto no permitiría hacer análisis por categoría de producto ni de inteligencia de tiempo. No sería una buena idea.
Podemos relacionar la tabla Producto del primer modelo con la tabla Campaña del segundo modelo. También podemos relacionar la tabla Calendario del primer modelo con la tabla Marketing del segundo modelo. Luego habría que hacer lo mismo pero en sentido inverso, relacionar las tablas Calendario 2 y Productos 2 con la tabla de Ventas del primer modelo. Pero eso crearía muchas más relaciones entre ambos modelos.
En mi opinión la solución es relacionar ambos modelos por las tablas comunes como se muestra en la imagen:

Las relaciones que se crean tienen una cardinalidad 1 : 1 y sentido bidireccional. Esto nos permite utilizar cualquiera de los dos calendarios en los informes, ambos contienen los mismos datos. En el caso de la tabla Productos utilizaremos la tabla del modelo de ventas que es la que contiene todos los productos.
Ocultamos las tablas Calendario 2 y Productos 2 en la vista de informe ya que no serán necesarias.
En la vista de informe crearemos una visualización que combine datos de ambos modelos.
Crear vista de informe
Representamos en una matriz el campo Codigo Producto de la tabla Productos, las medidas Unidades e Ingresos de la tabla Ventas y Nro. Ventas e Importe Ventas de la tabla Marqueting.
Añadimos dos segmentaciones Año y Semana de la tabla Calendario y el informe queda como se muestra debajo.

Podemos observar que los datos se filtran bien y la visualización es bastante rápida.
Uno de los efectos negativos del cambio del modelo a DirectQuery es que las medidas perdieron el formato que tenían.
Medir el rendimiento del modelo
Para analizar el rendimiento del modelo utilizaré la herramienta externa DAX Studio.
Desde el Analizador de rendimiento de Power BI Desktop copié la consulta que se genera para cargar la matriz, y la importé a DAX Studio. Esto me permitió ver que se generaba una consulta con el código de todos los productos y todas las fechas de calendario comprendidas en el período seleccionado. En el ejemplo el Año es 2020 y la Semana es la 27.

El tiempo de demora no ha sido muy significativo. Debajo tienen una captura de los tiempos en DAX Studio:

También probé mostrar los mismos datos filtrando por un año del Calendario y se enviaban todas las fechas de ese año del calendario.
Esta es una imagen del tiempo de ejecución para un año.

No ocurre lo mismo si las dimensiones y medidas corresponden a un mismo modelo. Por ejemplo, eliminemos de la matriz los valores de la tabla Marketing y solo dejamos los de la tabla Ventas. La consulta resultante solo se pasa el valor del año que está filtrado y no se pasan los códigos de los productos:

Además, el tiempo de demora es mucho menor:

En los dos modelos de ejemplo los cálculos eran muy simples y solo utilizamos las funciones SUM() y SUMX(). Habría que estudiar que ocurre si los modelos son más complejos y contienen muchas más medidas y más complicadas.
10 comentarios
Francisco MullorDic 21, 2020 - 6:22 pm
Hola Diana, excelente post, como siempre.
¿Has probado si con relaciones más naturales el rendimiento es mejor? Me refiero a que (en caso de que las dimensiones de calendario y de producto sean exactamente iguales) dado que Producto 2 y Calendario 2 vas a ocultarlas, no es más natural una relación 1 a N desde las dimensiones de producto y calendario que vas a mantener visibles con respecto a la tabla de hechos del modelo 2?
Un saludo
Diana Aguilera ReynaDic 21, 2020 - 8:45 pm
Hola Francisco,
Muchas gracias por tu comentario. No lo he probado, quizás en este modelo, que es sencillo, funcione igual o mejor que ahora, pero pensando en otros modelos más complejos pienso que esta es la mejor solución. Por ejemplo, en el caso que la tabla Marketing tuviera más de un campo de fecha y hubiera medidas que usen la función USERELATIONSHIP() habría que crear esas medidas para el otro calendario.
De todas formas lo pruebo y actualizo la entrada con los resultados.
Saludos,
Diana.
Francisco MullorDic 22, 2020 - 9:27 am
Si, visto de esa manera es probable que sea la mejor opción, pero la veo tan antinatural que me chirría un poco. En todo caso es un paso impresionante hacia adelante y seguro que pronto tendremos muchísima literatura sobre ello. Simplemente el hecho de permitir a un modelo empresarial certificado incluirle una tabla sin tocar el modelo certificado ya es una pasada.
Gracias Diana por tu aporte
AlexandraJun 22, 2021 - 2:26 am
Hola Diana, sabes que estoy intentando combinar dos modelos publicados, pero cuando selecciono se reemplaza el anterior. sólo muestra uno… puedes mencionar en qué parte específicamente cargas el segundo modelo? y muchas gracias! había estado tiempo buscando esto y llegué a pensar que no se podía.
Saludos!
Diana Aguilera ReynaJun 22, 2021 - 9:39 pm
Hola Alexandra,
Revisa en que área de trabajo está el modelo que utilizas. No debe estar en el área personal sino en una de aplicaciones.
Si necesitas ayuda escríbeme, nos conectamos por Teams y lo vemos.
Saludos,
Diana.
BelénJun 23, 2021 - 10:55 pm
Estimada Diana: Muy buena tu publicación.
Estoy teniendo la misma duda que Alexandra.
No puedo incorporar el segundo conjunto de datos. Cómo debería hacer para lograr agregarlo?
Muchas gracias!
Diana Aguilera ReynaJun 24, 2021 - 9:14 am
Hola Belén, gracias por tus comentarios.
Para poder crear modelos compuestos a partir de dos conjuntos de datos debes tener una cuenta con licencia PRO, como mínimo y los conjuntos de datos no deben estar almacenados en tu área personal sino en un área de aplicación.
Si se cumplen estos requisitos desde Power BI Desktop conéctate al primer conjunto de datos y luego al segundo. De esta forma ya tendrías el modelo compuesto.
Gracias y saludos!
DanielEne 7, 2022 - 4:18 pm
Felicitaciones Diana. Muy útil y novedoso. Tengo la misma duda que Belén y Alexandra; he seguido lo que indicas pero luego de cargar el primer modelo no puedo cargar el segundo. Mi licencia es PRO. Saludos!
Diana Aguilera ReynaEne 7, 2022 - 4:48 pm
Hola Daniel,
Debes activar la opción DirectQuery para AS y conjuntos de datos de PBI en Power BI Desktop.
Saludos,
Diana.
DanielEne 7, 2022 - 7:40 pm
¡Funcionó! Muy agradecido Diana