Hoy vamos a ver un ejemplo de normalización de bases de datos en Power BI: cómo se hace y por qué. En el diario vivir, nosotros en las oficinas manejamos muy buenas bases de datos en Excel, consolidando los datos más importantes. Pero recuerden que no con la visión de utilizar un modelo dimensional. Entonces, este video es sobre cómo normalizar una base de datos que está desnormalizada.
Contenido
Comencemos
Es muy sencillo. Ya cargué previamente las tres bases que tengo acá. Recuerden que estamos haciendo el modelo dimensional de una empresa de servicios. En el video anterior vimos cómo lo hacíamos cuando ya la base estaba normalizada con su site y todo. Ahora, pues lo vamos a ver desde más atrás, o sea, en el evento de que tuviésemos la base desnormalizada, mejor dicho, como la utilizamos en nuestro diario laboral.
Tablas de hechos y dimensionales
Tenemos tres tablas de hechos: facturas, cobranzas y servicios. Y tenemos que crear cuatro tablas dimensionales: canal de venta, ventas, clientes y sucursales.
Entonces, ¿cómo lo hacemos? Muy sencillo. Nos vamos al editor de consultas de Power BI y lo primero que hacemos es armar un grupo que se llame «Tablas de hechos» (las que ya tenemos) y creamos otro grupo que es el que vamos a armar de «Tablas dimensionales».
Creando la tabla de canal de ventas
Primero miramos tabla por tabla a ver si tenemos los datos necesarios para hacer la tabla de canal de ventas. Necesitamos los datos que están en facturas, específicamente donde esté el canal de venta. Duplicamos la consulta, le cambiamos el nombre a «Canal de ventas», lo pasamos a tablas dimensionales, seleccionamos «Canal de ventas», clic derecho, eliminamos las otras columnas, clic derecho y «Quitar duplicados». Y ya tenemos el canal de ventas con registros únicos.
Recordando las formas normales
Las formas normales son tres:
- La primera habla de que son registros únicos, que cada columna contiene solo un valor y no se pueden repetir los grupos.
- La segunda habla de que cada campo (columna) debe ser dependiente de una llave primaria.
- La tercera dice que ningún campo no clave dependerá de otro campo no clave (valores calculados que no se podían dejar en las dos tablas).
En realidad, las dos formas más importantes son la primera y la segunda.
Ahora que ya tenemos registros únicos, agregamos un ID. Vamos a agregar columnas, seleccionamos y lo llamamos «ID Canal de ventas». Hacemos el merge con la consulta de facturas, seleccionamos la tabla que estamos construyendo (Canal de ventas), aceptamos, expandimos lo necesario y quitamos duplicados. Y ya tenemos la tabla de canal de ventas lista.
Creando las tablas de vendedores, clientes y sucursales
Repetimos el mismo proceso para crear las tablas de vendedores, clientes y sucursales. Duplicamos la consulta, eliminamos las columnas innecesarias, agregamos un ID, hacemos el merge con la consulta correspondiente, y quitamos duplicados.
Relaciones entre tablas
Ahora, vamos a las relaciones para establecer las conexiones entre nuestras tablas de hechos y las tablas dimensionales recién creadas. Esto se hace en el apartado de relaciones de Power BI. Seleccionamos las tablas y creamos las relaciones según los campos de ID correspondientes.
Conclusión
Así se hace la normalización de una base de datos en Power BI. Espero que este video les haya sido de utilidad. Este tipo de ejercicios se utilizan mucho en el día a día para transformar los datos que nos pasan de Excel de esta manera. Practiquen mucho y, si les gustó el video, no olviden compartirlo y suscribirse. ¡Nos vemos en el próximo video!