Dentro de um Data Warehouse, utilizamos as dimensões para
prover perspectivas de analise para nossas métricas, para uma boa modelagem, é
importante conhecer quais colunas vamos encontrar em uma dimensão, isso
facilita a aplicação de boas práticas, pois elas se baseiam nessa nomenclatura
básica.
Então, podemos resumir as colunas de uma dimensão nas
seguintes:
- Attributes – utilizadas para análise do tipo pivoting;
- Keys – identificam unicamente as entidades;
- Names Collumns – nomes amigáveis para entidades;
- Members Properties – utilizadas como rótulos para relatórios;
- Lineage Collumns – responsável pela auditoria, nunca exposta ao usuário.
Quando tratamos colunas do tipo attribute, estamos considerando as colunas utilizadas para análise
do tipo Pivot em uma consulta BI. Este nome não pode ser confundido com
atributos de uma tabela OLTP, pois em bancos relacionais attributes são como nomeamos todas as colunas, sem distinção.
Colunas do tipo atribute devem ser o mais distintas possíveis, isso evita que
ao analisar gráficos por exemplo, vários resultados apareçam na tela. Um
gráfico com mais de 10 colunas por exemplo, já se torna difícil de entender.
Para solucionar este tipo de problema, quando encontramos attributes com muitas colunas distintas, utilizamos uma técnica
conhecida como Discretizing.
Assim como em bancos relacionais para aplicações LOB (Line
Of Business), as dimensões possuem colunas identificadoras, estas colunas
identificam unicamente uma entidade e por isso são conhecidas como Keys.
Para entendermos as colunas do tipo Named Columns, precisamos apenas pensar em como um usuário gostaria
de identificar um produto por exemplo, ao invés de fornecermos um código, através
das colunas Named, criamos dados amigáveis.
Assim como precisamos adicionar campos com informações extras sobre ao Produto,
como categoria, peso etc ... este tipo de informação salva dentro de uma
dimensão tem como proposito apenas servir como rótulos em relatórios, e na
terminologia padrão, são conhecidos como Members
Properties. Então, para que nossa dimensão tenha dados mais legíveis,
precisamos criar Named Columns e Members Properties.
Por fim, dentro de uma dimensão, podemos ter colunas de
Lineage, este tipo de coluna é responsável por armazenar informações de
auditoria de uma dimensão. Dados como hora de carga da dimensão e data podem
servir como base para uma análise de desempenho do seu Data Warehouse.
Produto
|
|
IDProduto
|
Key
|
DescProduto
|
Name Column
|
DataProcessamento
|
Lineage Column
|
DescCategoriaProduto
|
Member Properties
|
* Attributes - utilizados para pivot com a fato
Assim, conhecemos os tipos de colunas que vamos encontrar em
uma dimensão, agora você pode analisar seu Data Warehouse e distinguir este
tipo de informação.
;) até mais ...
Nenhum comentário:
Postar um comentário