segunda-feira, 31 de março de 2014

BI: Tipos de colunas de uma Dimensão

Dentro de um Data Warehouse, utilizamos as dimensões para prover perspectivas de analise para nossas métricas, para uma boa modelagem, é importante conhecer quais colunas vamos encontrar em uma dimensão, isso facilita a aplicação de boas práticas, pois elas se baseiam nessa nomenclatura básica.





Então, podemos resumir as colunas de uma dimensão nas seguintes:
  •    Attributes – utilizadas para análise do tipo pivoting;
  •    Keys – identificam unicamente as entidades;
  •    Names Collumns – nomes amigáveis para entidades;
  •    Members Properties – utilizadas como rótulos para relatórios;
  •    Lineage Collumns – responsável pela auditoria, nunca exposta ao usuário.

Quando tratamos colunas do tipo attribute, estamos considerando as colunas utilizadas para análise do tipo Pivot em uma consulta BI. Este nome não pode ser confundido com atributos de uma tabela OLTP, pois em bancos relacionais attributes são como nomeamos todas as colunas, sem distinção. Colunas do tipo atribute devem ser o mais distintas possíveis, isso evita que ao analisar gráficos por exemplo, vários resultados apareçam na tela. Um gráfico com mais de 10 colunas por exemplo, já se torna difícil de entender. Para solucionar este tipo de problema, quando encontramos attributes com muitas colunas distintas, utilizamos uma técnica conhecida como Discretizing.

Assim como em bancos relacionais para aplicações LOB (Line Of Business), as dimensões possuem colunas identificadoras, estas colunas identificam unicamente uma entidade e por isso são conhecidas como Keys.

Para entendermos as colunas do tipo Named Columns, precisamos apenas pensar em como um usuário gostaria de identificar um produto por exemplo, ao invés de fornecermos um código, através das colunas Named, criamos dados amigáveis. Assim como precisamos adicionar campos com informações extras sobre ao Produto, como categoria, peso etc ... este tipo de informação salva dentro de uma dimensão tem como proposito apenas servir como rótulos em relatórios, e na terminologia padrão, são conhecidos como Members Properties. Então, para que nossa dimensão tenha dados mais legíveis, precisamos criar Named Columns e Members Properties.


Por fim, dentro de uma dimensão, podemos ter colunas de Lineage, este tipo de coluna é responsável por armazenar informações de auditoria de uma dimensão. Dados como hora de carga da dimensão e data podem servir como base para uma análise de desempenho do seu Data Warehouse.

Produto
IDProduto
Key
DescProduto
Name Column
DataProcessamento
Lineage Column
DescCategoriaProduto
Member Properties
* Attributes - utilizados para pivot com a fato

Assim, conhecemos os tipos de colunas que vamos encontrar em uma dimensão, agora você pode analisar seu Data Warehouse e distinguir este tipo de informação.

;) até mais ...



Nenhum comentário:

Tags

Microsoft (82) Google (33) Windows (23) Internet (20) Windows 7 (15) Internet Explorer (13) Segurança (12) Games (11) Gmail (5) Jogos (5) Mobile (5) Mozila Firefox (5) Visual Studio 2010 (5) Banco de Dados (4) Kinect (4) Orkut (4) Video Game (4) Videos (4) 3D (3) Chrome Os (3) Twitter (3) Web Designer (3) YouTube (3) Acessibilidade (2) Adobe (2) Analise (2) Artigos (2) Asp.Net (2) HTML5 (2) Internet Explorer 9 (2) Live Messenger (2) SqlServer (2) Steve Jobs (2) Sun (2) Telefonia (2) Wifi (2) Yahoo (2) blizzard (2) .Net (1) 3G (1) 4G (1) App Store (1) CEO (1) Cinema (1) Firefox (1) IBM (1) Java (1) Mozilla (1) Música (1) Nuvem (1) PS3 (1) PSN (1) Steve Ballmer (1) Televisor (1) Visual Studio 11 (1) Web 2.0 (1) eBook (1) w3c (1)