¿Cuáles son las dimensiones en dataware house?

Las dimensiones son un tipo de tabla específica para esquemas en estrella. Un esquema en estrella consiste principalmente en tablas de hechos que contienen medidas de interés y dimensiones que proporcionan el contexto en el que se tomó esa medida. Un ejemplo simple podría ser un esquema de ventas en el que medimos hechos como la cantidad vendida, el precio total, el costo de los bienes y el monto de las ganancias. Nos gustaría poder ver eso desde diferentes perspectivas para agregar dimensiones para el producto, la tienda, el cliente y la fecha. Los hechos (medidas) se toman al nivel de un valor único para cada dimensión, por lo que tendríamos una fila de hechos que mostrara las medidas para el producto A en la tienda B por el cliente C en la fecha D. Esto se conoce como la granularidad del hecho. . Entonces podríamos usar nuestras herramientas de consulta para hacer cosas como sumar todas las cantidades vendidas para una tienda determinada, calcular el beneficio promedio para un cliente determinado, etc.

Los esquemas de estrellas también son la base para construir cubos. Los cubos son objetos multidimensionales diseñados para consultas de alto rendimiento. Hacer agregaciones en tablas de hechos grandes (miles de millones y trillones de filas) no es eficiente en los sistemas relacionales, por lo que se construyen cubos. Durante el proceso de construcción, el cubo en realidad calcula y almacena las agregaciones para cada combinación de valores de dimensión (simplificación leve, pero se entiende la idea). Cuando consulta un cubo, en realidad no está calculando la respuesta, sino que la está buscando en el cubo.

Una dimensión es una estructura que clasifica hechos y medidas para permitir a los usuarios responder preguntas comerciales. Las dimensiones de uso común son personas, productos, lugar y tiempo.

En un almacén de datos, las dimensiones proporcionan información de etiquetado estructurado para medidas numéricas de otro modo desordenadas. La dimensión es un conjunto de datos compuesto por elementos de datos individuales que no se superponen. Las funciones principales de las dimensiones son triples: proporcionar filtrado, agrupación y etiquetado.

Un almacén de datos organiza atributos descriptivos como columnas en tablas de dimensiones. Por ejemplo, los atributos de una dimensión de cliente podrían incluir nombre y apellido, fecha de nacimiento, sexo, etc., o una dimensión de sitio web incluiría el nombre del sitio y los atributos de URL.

Una tabla de dimensiones tiene una columna de clave principal que identifica de forma exclusiva cada registro de dimensión (fila). La tabla de dimensiones está asociada con una tabla de hechos que utiliza esta clave. Los datos en la tabla de hechos se pueden filtrar y agrupar (“divididos y cortados en cubitos”) por varias combinaciones de atributos. Por ejemplo, se puede consultar un hecho de inicio de sesión con las dimensiones Cliente, Sitio web y Fecha para “el número de hombres entre 19 y 25 años que iniciaron sesión en http://www.example.com más de una vez durante la última semana de septiembre de 2010, agrupados por día “.

Entonces, podría estar pensando ahora … ¿Qué es una tabla de dimensiones?

Bueno … las tablas de dimensiones son referenciadas por tablas de hechos usando claves. Al crear una tabla de dimensiones en un almacén de datos, se utiliza una clave generada por el sistema para identificar de forma exclusiva una fila en la dimensión. Esta clave también se conoce como clave sustituta. La clave sustituta se utiliza como clave principal en la tabla de dimensiones. La clave sustituta se coloca en la tabla de hechos y se define una clave externa entre las dos tablas. Cuando se unen los datos, lo hace como cualquier otra unión dentro de la base de datos.

Al igual que las tablas de hechos, las tablas de dimensiones a menudo están muy desnormalizadas, ya que estas estructuras no están diseñadas para administrar transacciones, están diseñadas para permitir a los usuarios analizar datos lo más fácilmente posible.

Realmente espero que esto te ayude
Saludos 🙂

Las dimensiones definen el modelo dimensional y explican quién, qué, dónde, cuándo, por qué y cómo de la situación. Añaden contexto y significado a las medidas contenidas en la tabla de hechos asociada.

Image Ref Sales Data Warehouse

Ejemplo en video

Bueno para leer

  • Almacenamiento de datos: aspectos básicos de la dimensión

Espero que ayude 🙂

En informática, un almacén de datos (DW o DWH), también conocido como almacén de datos empresariales (EDW), es un sistema utilizado para informes y análisis de datos, y se considera un componente central del entorno de inteligencia empresarial. Los DW son depósitos centrales de datos integrados de una o más fuentes dispares.

Los datos vocacionales son hechos para un DW y se almacenan en la tabla de hechos

Y los datos que proporcionan más información a los datos transaccionales son dimensiones y se almacenan en tablas dimensionales

P.ej

Hiciste una transacción de cajero automático, por lo que la cantidad que dispensabas será un hecho y de qué cajero retiraste, fecha, a qué hora n todos tendrán datos dimensionales

Puede leer aquí sobre las dimensiones en el almacén de datos: http://dwbimaster.com/types-of-d

Las dimensiones en este caso se refieren a personas, productos, lugar y tiempo. Las dimensiones del almacén de datos proporcionan información de etiquetado estructurado a datos cuantitativos no organizados.