Conceptos Básicos de Normalización Base de Datos y Modelo Dimensional

Tiempo de lectura: 2 minutos

En este artículo aprenderás sobre los conceptos básicos de Normalización en una base de datos. La Normalización es un método para estructurar de una forma adecuada las bases de datos con el fin de optimizarlas para el manejo masivo de información con Power Bi y, de esta manera, aprovechar al máximo los recursos disponibles.

Objetivos de la Normalización de una Base de Datos para Power Bi

Los objetivos principales de la Normalización son los siguientes:

  • Organizar la base de datos con base a grupos simples que tengan relaciones directas y lógicas entre ellos.
  • Hacer la base de datos más flexible al facilitar el proceso de modificación o eliminación de algún dato en específico.
  • Optimizar los recursos disponibles al eliminar la redundancia y las dependencias incoherentes entre los datos.

¿Cómo Normalizar una Base de Datos?

Para ello, hay tres formas normales (o pasos) para Normalizar una base de datos, a continuación te los explicaré:

Primera forma normal

En esta primera forma, debes procurar que la tabla cumpla las siguientes características:

  • Que la tabla tenga registros únicos.
  • Cada columna de la tabla debe contener un único valor.
  • No se pueden repetir grupos.

Como ves, esta forma busca dar un orden lógico a los datos, así como que se establezcan relaciones necesarias entre ellos. De manera que los debes priorizar que se clasifique la información siguiendo estas 3 reglas para optimizar tus bases de datos.

Segunda forma normal

Para esta forma, debes tener en cuenta que un campo o columna debe ser dependiente enteramente de una llave primaria y por ningún motivo puede repetirse. Vale la pena aclarar que el concepto de llave primaria se refiere al registro único que se le asigna a un dato o grupo de datos.

Para ello, es muy útil crear una tabla externa para poder relacionarla a diferentes conjuntos de datos. Por ejemplo, si tienes diferentes conjuntos de datos como Pedidos, Envíos, Facturas y Cuentas por cobrar y todos están utilizando la ciudad en la que vive el cliente, podría ser más útil crear una tabla aparte que relacione cada ciudad con un código y que este se le asigne al cliente en los diferentes conjuntos.

Tercera forma normal

La última forma indica que ningún campo no clave dependerá de otro campo no clave, es decir, que para aquellos datos que cambien con frecuencia merece la pena considerar si se debe crear una tabla aparte para su almacenamiento. 

Esto, si bien es deseable, no siempre se podrá cumplir, pues hay casos en los que realizar este tipo de ejercicios empeora el rendimiento del conjunto de datos en vez de optimizarlo. Aunque si la razón para no hacerlo es la capacidad de procesamiento, puede evaluarse, pues esta mejora cada vez más y no es necesario evitar la normalización por esta razón.

Normalización VS Denormalización

En la siguiente tabla verás una comparación más precisa de una tabla normalizada respecto a una no normalizada (denormalizada):

Tabla Denormalizada:

Conceptos Básicos de Normalización Base de Datos

Tabla normalizada:

Conceptos Básicos de Normalización Base de Datos y Modelo Dimensional

De las anteriores tablas, se puede concluir que:

NormalizaciónDenormalización
– Orientado a Máquinas (servidores).
– Relaciones tienden a ser complejas entre tablas.
– Procesamiento rápido de transacciones.
– Elimina redundancia de datos.
– Orientados a humanos.
– Relaciones simples. Ejemplo: todo el modelo puede estar en una tabla.
– Velocidad de respuesta al usuario. Ejemplo de esto es que cada tabla puede incluir montos calculados.
– Utilizamos redundancia para simplificar el modelo.

Modelo dimensional

El modelo dimensional es una técnica de diseño lógica, esta se aplica a modelos de Data Warehousing (grandes almacenes que administran miles o millones de datos). 

Es importante conocer este modelo porque está entre los más utilizados en el mercado por su practicidad y fiabilidad para el manejo de grandes grupos de información. 

Las consultas en este modelo se basan en Queries (búsqueda por conjuntos), por lo que simplifica el manejo de información para el usuario final y contiene la misma información que un modelo de datos normalizado. 

El modelo dimensional puede parecer muy simple porque maneja menos tablas que un modelo normalizado, pero puede ser bastante complejo a la hora de modelar el negocio (o la información) según sus estándares.

Se compone por: hechos, dimensiones y atributos.

  • Los hechos son, por lo general, los valores que se pueden agregar.
  • Las dimensiones son grupos de jerarquías, es decir, que las dimensiones serán quienes definan el hecho.
  • Y, a su vez, las dimensiones tienen atributos que definen los quiénes, los qué y los por qué del modelo. Estos atributos permiten agrupar la información.

El modelo dimensional en práctica

Este modelo en la práctica se compone por dos tipo de Tablas: de Hechos y Dimensionales (o Maestras).

Por un lado, la Tabla de Hechos son las más importantes y grandes del modelo, pues contienen los datos del negocio. Los Hechos son numéricos y agregables como suma, promedio, etc. 

Es necesario que las medidas que se utilicen sean del mismo nivel, es decir, que si estás colocando la cantidad de una factura, ya no podrás poner el costo de un grupo de facturas como otro Hecho.

Las Tablas de Hechos se catalogan en 3 tipos: Transaccionales, Periódicas y Acumulativas. 

Por otro lado, las Tablas Dimensionales son atributos que describen el negocio como Tipo de cliente, Canal de Venta, etc. Entre más atributos, puede ser más beneficioso, pues se desglosa más la información. 

Por lo general son pocas filas y casi no tienen cambios, esto porque cada Tabla tiene una llave primaria (PK). Y por esto mismo se debe evitar el uso de códigos, pues se necesita la información lo más clara posible y, de esta manera, evitar la redundancia. 

Esto hace que los cambios sean muy fáciles de realizar, pues se puede cambiar el atributo en esta Tabla y se aplicará en todas las demás que la estén utilizando.

Como ejemplo, te traigo los dos modelos más comunes para organizar los datos:

Esquema de Estrella

Este modelo de datos tiene una tabla de hechos, que la rodean las tablas de dimensiones.  

Modelo Dimensional de Estrella

Esquema Copo de Nieve

Por su parte, este modelo normaliza a través de la creación de más tablas, por lo que dependiendo qué es lo que desees crear y en qué volumen puede serte más o menos útil.

Modelo Dimensional de Copo de Nieve

Con estos modelos concluyo este artículo, espero que hayas aprendido con esta introducción a los conceptos básicos, ¡hasta la próxima!

Video de Conceptos Básicos de Normalización Base de Datos y Modelo Dimensional

¿De cuánta utilidad te ha parecido este contenido?

¡Haz clic en una estrella para puntuarlo!

Promedio de puntuación 0 / 5. Recuento de votos: 0

Hasta ahora, ¡no hay votos!. Sé el primero en puntuar este contenido.

Deja un comentario