domingo, 10 de fevereiro de 2008

Administração de Dados

ADMINISTRAÇÃO DE DADOS

PADRONIZAÇÃO PARA NOMES E IDENTIFICADORES

Por Ricardo Lima Caratti

Uma breve introdução sobre Administração de Dados


A Administração de Dados é um tema pouco abordado em livros e em periódicos. Em muitos dos casos ela é confundida com a Administração de Banco de Dados e, quando existente em uma corporação, é exercida de forma tácita e não institucional. Muitos acreditam que o papel do Administrador de Dados (AD) se limita a criar e impor padrões que deverão ser seguidos por toda a equipe de desenvolvimento. Embora a padronização seja umas das ferramentas de trabalho para o uso estratégico da informação, veremos que a Administração de Dados é algo muito mais abrangente e de extrema importância para uma corporação.


Objetivos Principais da Administração de Dados


A Administração de Dados tem como principal objetivo gerenciar as estruturas de dados da corporação, promovendo sua conceituação, segurança, integridade e compartilhamento. Poderíamos detalhar isso da seguinte forma:


Garantir o uso estratégico das informações, identificando suas necessidades e oportunidades;

Melhorar a qualidade, a precisão e integridade dos dados;

Melhorar o compartilhamento dos dados na corporação;

Manter os modelos de informações atualizados;

Retirar dos Analistas e Desenvolvedores a responsabilidade da organização e estruturação dos dados;

Fornecer suporte a equipe de desenvolvimento;

Refinar e reaproveitar as informações da corporação.


Atividades da Administração de Dados

As principais atividades de um AD são:


Participar dos levantamentos de dados, eventos/funções e regras de negócio junto às áreas funcionais da corporação;

Elaborar e acompanhar a confecção dos modelos Conceituais de Dados.

Participar da integração do planejamento de sistemas com os modelos de Dados.

Responsabilizar-se pela qualidade e compatibilidade dos modelos de dados com os modelos de implementação;

Planejar e coordenar a evolução do Banco de Dados da corporação;

Definir, manter e auditar o Dicionário de Dados;

Desenvolver os mecanismos necessários para a adaptação dos sistemas legados.


Instrumentos de apóio a Administração de Dados


Dicionário de Termos;

Dicionário de Dados;

Dicionário de Acrônimos e Abreviações;

Documentação dos Projetos;


Perfil do Administrador de Dados


Análise de Sistema, sobretudo no que se refere a levantamentos de requisitos;

Boa capacidade de abstração;

Habilidade de mensurar a qualidade dos dados, segurança e facilidade de acesso;

Bom relacionamento com os envolvidos em cada projeto da corporação;

Boa noção sobre a metodologia aplicada para o desenvolvimento de sistema;

Conhecimento em Modelagem de Dados;

Conhecimento em ferramentas de apóio a modelagem de dados;

Conhecimento desejável:

Experiência em desenvolvimento de Sistemas;

Sistemas de Gerenciamento de Banco de Dados;

Linguagem SQL ou correlata;

UML;


PADRONIZAÇÃO DE NOMES DE ENTIDADES E ATRIBUTOS


Os “Nomes” são utilizados para identificar fatos sobre objetos, conceitos e eventos. Eles são de extrema relevância para a disseminação do conhecimento existente sobre os dados de uma corporação. Um bom padrão deve ser construído de tal forma a ser fácil de ser seguido por todos os envolvidos, desde o mais alto escalão da corporação até os gerentes de projeto, analistas, programadores e, em alguns casos, os usuários finais. Assim, a padronização de nomes deve estar presente tanto no modelo lógico quanto no modelo físico de dados. Nesse contexto, definimos “Nome” como uma palavra ou combinação de palavras no qual um elemento de dado pode ser conhecido. Assim, cada nome deve ser identificado dentro de um contexto, cada elemento de dado deve ter pelo menos uma palavra que o identifique.


Para abordar aspectos referentes a padronização de “Nomes” alguns conceitos podem ajudar na compreensão.


“Metadados"


Em sistemas de informações, entende-se por metadados informações sobre os dados. Ele é, sem sombra de dúvida, a ferramenta mais utilizada no gerenciamento de dados. Por isso, a padronização é um elemento necessário para assegurar que usuários e desenvolvedores entendam as informações que serão acessadas.


“Metadados” pode ser classificado em “metadado de negócio” e “metadados técnico”. “Metadados” de negócio são usados por analistas e usuários e provêem descrição sobre os elementos de informação. Eles estão mais associados aos modelos lógicos de dados. Os meta dados técnico são utilizados por administradores de sistema, desenvolvedores e ferramentas de software. Eles provêem descrições sobre os dados e as operações relacionadas a eles.


A utilização de um repositório de “Metadados” possibilita um meio para gerenciar informações sobre dados, aumentando assim, a produtividade no desenvolvimento de sistema de informação além de orientar usuários finais na localização e compreensão dos dados;


Modelo lógico de dados


O modelo lógico de dados serve para mostrar os dados que as aplicações devem armazenar satisfazendo os requisitos de negócios. Ele também mostra como esses dados estão relacionados. Em geral ele pode ser criado sem nenhum ambiente computacional em mente, ou seja, sem nenhuma consideração a questão de performance, armazenamento de dados, ambiente de desenvolvimento e hardware.


Modelo físico de dados


O modelo físico de dados serve para mostrar como os elementos de dados serão armazenados no banco de dados. As entidades e atributos do modelo lógico são mapeados para tabelas e colunas do modelo físico. O modelo físico muitas vezes pode introduzir objetos que não contribuem diretamente com os requisitos de negócios. Esses objetos podem ser criados por motivos de performance, redução de necessidade de armazenamento ou até mesmo para simplificar o desenvolvimento da aplicação.


PRINCÍPIOS DE CONVENÇÃO DE “NOMES” E IDENTIFICADORES


Nomes ou identificador podem ser definidos como palavras ou combinação de palavras dos quais os elementos de dados são conhecidos. Nomes podem ser combinados de tal forma a seguir uma regra de formação. Em muitos dos casos essas regras são construídas e utilizadas de acordos com as necessidades de uma corporação. No entanto a idéia de uma regra de formação permanece constante.


As regras ou conjunto de regras para formação de nomes devem ser seguidas e utilizadas em qualquer nível de desenvolvimento de uma corporação, ou seja, não deve ser restrita ao desenvolvimento de aplicação computacionais. Dado a importância do tema, a ISO desenvolveu um padrão para formação de nomes. Ele é baseado nas regras de composição de nome descritas acima. Trata-se da ISO/IEC -11179, que consiste das seguintes partes: 1-Cuida da especificação e padronização de elementos de dados; 2 – Classificação de elementos de dados; 3 - Atributos Básicos e Registro de “metamodelos”; 4 – Regras e guias para definição de formulação de dados; 5 – Princípios de formação de Nomes e Identificadores; 6 – Registro de elementos de dados. Falaremos aqui sobre a parte 5 do ISO/IEC – 11179.


O Padrão ISO/IEC 11179-5


Principais Características


Possibilita acesso e busca por conteúdo semântico em coleções de “metadados”;

Promove o uso de padrões para maior interoperabilidade;

Descreve a padronização e registro de elementos dados para fazer com que eles sejam compreensíveis e compartilhados;

Fornece um guia para regra de formação de nomes e definição de elementos de dados;

Nome de tags em XML seguem a convenção W3C que é baseada na ISO11179;

Dentre várias vantagens em utilizar o padrão ISSO/IEC 11179 destacam-se: É um padrão internacional estabelecido, é amplamente utilizado pelas agências governamentais; é facilmente integrável em esquemas de banco de dados e pode ser facilmente implementado em um LDAP (serviço de diretório);


As três regras principais para a composição de um nome são:


Regras semânticas, que são baseadas combinação de nomes, ou seja, utiliza qualificadores para enquadrar elementos de dados em um contexto;

Regras sintáticas, que descrevem como serão arranjados os elementos dentro de um nome;

Regras Léxicas, que diz respeito aos aspectos de um idioma ou linguagem, ou seja, termos preferidos e não preferidos, Sinônimos, Abreviações, Tamanhos, Conjunto de caracteres permitidos, utilização de maiúsculos e minúsculos;


Sugestões para formação de nomes


Como dito anteriormente, modelos lógicos de dados são gerados, além de outras coisas, para identificação de cada entidade e de seus atributos. Uma entidade ou objeto pode ser uma pessoa, uma coisa ou ainda um evento. O nome para definir cada objeto deve ser único dentro da corporação. A mesma idéia deve ser entendida para nomes de atributos, ou seja, ele deve ser único dentro de uma entidade. Assim, nomes para entidades e atributos devem ser o mais próximos do mundo real. Isso facilitará a leitura e compreensão dos modelos de dados.


Regra geral


Cada nome deve consistir de uma ou mais palavras que defina precisamente o propósito ou uso do elemento de dado;

O nome deve refletir o significado do negócio muito mais que o meio onde ele será armazenado ou processado;

Nome para elemento de dado deve estar no singular (Exemplo: Para entidade Funcionário, utilize “Funcionario” e não “Funcionarios”);

A palavra principal que compõe um elemento de dado não deve ser abreviada;

Utilize abreviações somente se for de aceitação e conhecimento geral da corporação;

Use todos os modificadores necessários para completa identificação do elemento de dados (Exemplo: Para “Nome do Empregado”, utilize NomeEmpregado no lugar de Nome);

Coloque os modificadores em uma seqüência lógica de tal forma que dê um significado preciso em Português (Exemplo: Para “Data de Nascimento”, utilize DataNascimento e não NascimentoData);

Se uma das palavras que compõe um Nome for um verbo, utilize-a no presente;

Usar a forma no substantivo sempre que possível (Exemplo: FUNCIONARIO, ORGAO, etc);

Se oportuno, para tornar mais claro, usar substantivo + adjetivo da seguinte forma: substantivo_adjetivo ou SubstantivoAdjetivo. Exemplo: HISTORICO_FUNCIONAL ou HistoricoFuncional. Lembrando que algumas implementações de SGBD não fazem distinção de maiúsculas e minúsculas. Assim, HistoricoFuncional poderia se tornar HISTORICOFUNCIONAL, podendo dificultar a compreensão.

Acrônimos ou siglas são bem vindos quanto estes são universalmente aceito. Exemplo: RG para registro geral, CEP para código de endereçamento postal, etc. Siglas podem ser oportunas para compor o nome de um esquema de banco de dados. Exemplo: Sistema de Recursos Humanos poderia ficar SRH. Entende-se por esquema de banco de dados como uma descrição de um banco de dados e não o banco de dados em si.

Evite tamanho de nomes muito longos. Sabe-se que algumas plataformas de banco de dados não suportam tamanhos maiores que 18 caracteres;

Utilize os Caracteres de A-Z e a-z para a identificação. Evite caracteres acentuados, espaços e outros que possam causar problemas quando incorporados a um SGBD. Leve sempre em consideração a portabilidade;



Exemplos de “Nomes” utilizados para Entidades e Atributos


A tabela abaixo mostra um pequeno exemplo de adoção de nomes para Entidades e Atributos.


Entidade


Atributo


Descrição








Funcionario


Matricula


Identificação do Funcionário




NomeFuncionario


Nome do Funcionário




DataNascimento


Data de Nascimento do Funcionário




NomePai


Nome do Pai do Funcionário




NomeMae


Nome da Mãe do Funcionário




CodigoEscolaridade


Código da Escolaridade do Funcionário




CodigoGrupoSanguineo


Código do Grupo Sangüíneo do Funcionário




.....



Escolaridade


Código Escolaridade


Código da Escolaridade




Descrição


Descrição da Escolaridade




....



GrupoSanguineo


CodigoGrupoSanguineo


Código do Grupo Sangüíneo




Descrição


Descrição do Grupo Sangüíneo




....



Tabela 1 – Exemplo de Nomes de Entidades e Atributos




Conclusão


A precisão e a integridade dos dados bem como a garantia do uso estratégico das informações de uma corporação são, dentre outros, os principais desafios da Administração de Dados. A utilização de um padrão de regra de formação de “Nomes” pode servir de ferramenta de trabalho para o Administrador de Dados. Nesse sentido, o padrão ISO/IEC 11179 poderá ajudar na utilização de um bom padrão.

Referências


Padrão ISO/IEC 11179-5, ISSO/IEC JTC1 SC36 N0555;

UC Davis Information Naming Standards, Data Administration Plan & Budget Office, Universidade da California, Versão 1.2, 22/07/1999;

University of Pennsylvania, http://www.upenn.edu/computing/da/;

Southwest Oregon Province, http://ims.reo.gov/website/swop/html/swop_slide_show/swop_sdm_whitepaper/sdm.htm#IV.

The University of Arizona, http://w3fp.arizona.edu/dataadmn/



Um comentário:

Anônimo disse...

Muito obrigado pelos esclarecimentos de convenção de nomes! Procurei por toda a internet e seu blog foi o melhor lugar que encontrei para conseguir essas informações. Abraço!