Diferença entre tabela de fatos e tabela de dimensões

Autor: Laura McKinney
Data De Criação: 1 Abril 2021
Data De Atualização: 17 Poderia 2024
Anonim
Diferença entre tabela de fatos e tabela de dimensões - Tecnologia
Diferença entre tabela de fatos e tabela de dimensões - Tecnologia

Contente


A Tabela de Fatos e a Tabela de Dimensões, são os fatores essenciais para criar um esquema. O registro de uma tabela de fatos é uma combinação de atributos de diferentes tabelas de dimensões. A tabela de fatos ajuda o usuário a analisar as dimensões do negócio, o que o ajuda na tomada de decisões para melhorar seus negócios. Por outro lado, as tabelas de dimensões ajudam a tabela de fatos a coletar dimensões nas quais as medidas devem ser tomadas.

O ponto que distingue tabela de fatos e tabela de dimensões é que o tabela de dimensões contém atributos pelos quais as medidas são tomadas tabela de fatos. Existem alguns outros fatores que criam diferenças entre a Tabela de fatos e a Tabela de dimensões para visualizá-las. Vamos dar uma olhada no gráfico de comparação mostrado abaixo.

  1. Gráfico de comparação
  2. Definição
  3. Figura
  4. Principais diferenças
  5. Conclusão

Gráfico de comparação

Base para ComparaçãoTabela de fatosTabela de dimensões
BasicA tabela de fatos contém a medida ao longo dos atributos de uma tabela de dimensões. A tabela de dimensões contém os atributos pelos quais a tabela de fatos calcula a métrica.
Atributo e registros A tabela de fatos contém menos atributos e mais registros.A tabela de dimensões contém mais atributos e menos registros.
Tamanho da tabelaTabela de fatos cresce verticalmente.A tabela de dimensões cresce horizontalmente.
Chave A tabela de fatos contém uma chave primária que é uma concatenação de chaves primárias de todas as tabelas de dimensões. Cada tabela de dimensão contém sua chave primária.
CriaçãoA tabela de fatos pode ser criada apenas quando as tabelas de dimensões são concluídas.As tabelas de dimensões precisam ser criadas primeiro.
Esquema Um esquema contém menos número de tabelas de fatos.Um esquema contém mais número de tabelas de dimensões.
AtributosA tabela de fatos pode conter dados em formato numérico e ual.A tabela de dimensões sempre contém atributos no formato ual.


Definição da tabela de fatos

Uma tabela de fatos é uma tabela que contém medições ao longo dos atributos das tabelas de dimensões. Pode conter as informações no nível mais baixo possível. Alguma tabela de fatos contém apenas dados resumidos, chamados como Tabela de fatos agregados. A tabela de fatos quase contém o data carimbada dados. Vamos discutir as características de uma tabela de fatos.

Chave concatenada
A tabela de fatos contém a chave Concatenada, que é a concatenação das chaves primárias de todas as tabelas de dimensões. A tabela de fatos concatenados deve identificar exclusivamente a linha em uma tabela de fatos.

Data Grain
A granularidade dos dados mostra até que ponto as medidas na tabela de fatos foram armazenadas. A granulação de dados deve estar no nível mais alto possível.


Medidas aditivas
Os atributos da tabela de fatos podem ser totalmente aditivo ou semi-aditivo. Medidas totalmente aditivas são aquelas que podem ser facilmente resumidas para todas as dimensões da tabela de fatos. Por exemplo quantidade_ordenada, é um atributo que pode ser resumido para todas as dimensões. Assim, podemos retirar a quantidade total de pedidos, para um cliente, região, data, marca, etc. Medidas semi-aditivas são aquelas que podem ser somadas em algumas dimensões da tabela de fatos, mas não em todas as dimensões. Assim, o valor do saldo não pode ser resumido ao longo do tempo, pois muda ao longo do tempo.

Dados esparsos
Às vezes, podemos ver os registros na tabela de fatos que possui atributos com medidas nulas. Por exemplo, pode não haver nenhum pedido em um feriado. Portanto, os atributos para esta data terão medidas nulas. Não precisamos armazenar medidas para esse tipo de registro, pois ele não fornece nenhuma informação.

Dimensões degeneradas
Às vezes, você pode encontrar algumas dimensões na tabela de fatos, que não são de forma alguma aditivas. Por exemplo, number_number, customer_id, você não pode adicionar esses tipos de dimensões. No entanto, no caso, você precisa encontrar os pedidos feitos por um cliente específico neste mês; você precisará do customer_id para relacionar sua pesquisa. Esses tipos se atributos ou dimensões da tabela de fatos forem chamados Dimensão degenerada.

Definição da tabela de dimensões

A tabela de dimensões é um componente essencial para o esquema inicial. Uma tabela de dimensões contém os atributos que representam as dimensões, ao longo das quais as medidas são tomadas na tabela de fatos. Além disso, discutiremos algumas características de uma tabela de dimensões.

Atributos e Chaves
Toda tabela Dimension deve ter um chave primária que identifica exclusivamente cada registro da tabela. É comum observar que a tabela de dimensões contém muitos atributos. Portanto, parece ser Largo ou seja, quando você cria uma tabela de dimensões, a espalha horizontalmente.

Valores de atributo
Os valores dos atributos na tabela de dimensões raramente são numéricos, na maioria das vezes você encontrará os valores nos atributos formato ual. Por exemplo, nome do produto, marca, categoria, subcategoria, etc.

Relação entre atributos
Com frequência, você pode observar que os atributos encontrados em uma tabela de dimensões não estão diretamente relacionados. Assim, Product_brand não tem nada a ver com o package_date, mas ainda assim ambos podem ser os atributos da tabela de dimensões do produto.

Normalização
A tabela de dimensões é não deveria ser Normalizado. Isso ocorre porque normalizar uma tabela criaria muitas tabelas intermediárias. Quando uma consulta seleciona um atributo da tabela de dimensões e recupera medições ao longo da tabela de fatos, a consulta precisa passar pelas tabelas intermediárias que se tornam ineficientes. Portanto, as tabelas de dimensão não são normalizadas.

Perfurando, rolando para cima
Os atributos da tabela de dimensões permitem obter os detalhes, passando do nível mais alto de atributos agregados para atributos de nível mais baixo. Por exemplo, se você deseja encontrar a venda total em uma região, pode fazer uma busca detalhada para encontrar vendas por estado, cidade, CEP. Você pode até acumular para encontrar o total de vendas primeiro pelo CEP, depois pela cidade e depois pelo estado.

Hierarquia múltipla
Geralmente, a tabela de dimensões oferece várias hierarquias. Por exemplo, temos uma tabela de dimensões do produto para uma loja departamental. Agora, temos dois departamentos de marketing e departamento de contabilidade.

O departamento de marketing fará uma busca detalhada entre os atributos da tabela de dimensões do produto em uma determinada hierarquia para obter medições para a tabela de fatos.

Por outro lado, o departamento de contabilidade detalha os atributos da tabela de dimensões do produto na hierarquia diferente para obter medições para a tabela de fatos.

Portanto, a tabela de dimensões deve ter várias hierarquias ou nível de agregação de atributos para permitir que o usuário faça uma busca detalhada em qualquer uma das múltiplas hierarquias.

Registros
Embora uma tabela de dimensão tenha muitos atributos, ela possui menos registros.

  1. A tabela de fatos contém medidas ao longo da dimensão / atributos de uma tabela de dimensões.
  2. A tabela de fatos contém mais registros e menos atributos em comparação com a tabela de dimensões, enquanto que a tabela de dimensões contém mais atributos e menos registros.
  3. O tamanho da tabela de fatos aumenta verticalmente, enquanto o tamanho da tabela de dimensões cresce horizontalmente.
  4. Cada tabela de dimensões contém uma chave primária para identificar cada registro da tabela, enquanto que a tabela de fatos contém uma chave concatenada, que é uma combinação de todas as chaves primárias de todas as tabelas de dimensões.
  5. A tabela de dimensões deve ser registrada antes da criação da tabela de fatos.
  6. Um esquema contém menos tabelas de fatos, mas mais tabelas de dimensões.
  7. Os atributos na tabela de fatos são numéricos e também ual, mas os atributos da tabela de dimensão possuem apenas atributos ual.

Conclusão:

Ambos são igualmente importantes para a criação de esquema, mas a tabela de dimensões deve ser registrada antes da tabela de fatos. Como é impossível criar tabela de fatos sem dimensões.