Uma estratégia de Governança de Dados bem aplicada traz inúmeros benefícios. Isso acontece porque a Governança atua garantindo que os dados sejam acessíveis, protegidos e confiáveis.
Uma ferramenta muito útil da Governança de Dados que você deve conhecer é a Linhagem de Dados, e você pode começar a utilizá-la hoje mesmo!
Essa ferramenta é uma forte aliada quando lembramos das regulamentações e leis de proteção de dados que estão cada vez mais exigentes. Ter clareza, por exemplo, onde e como os dados são utilizados, quanto tempo eles são guardados e quem pode acessá-los é essencial.
Clica aqui para conferir nosso post sobre como criar uma Linhagem de Dados com o Excel!
O que é Linhagem de Dados na Governança de Dados?
A ideia central da Linhagem de Dados é registrar a “viagem” que os dados fazem por dentro do seu empreendimento, de modo a facilitar a sua administração.
Em outras palavras, capturamos o ciclo de vida dos dados e como eles fluem de um lugar para outro dentro do infraestrutura construída para abrigar e processá-lo.
Ao rastrear o fluxo dos dados, do início até o destino final, a Linhagem de Dados, criamos um tipo de mapa que permite o fácil entendimento da origem dos dados, como foram parar onde estão, por quais processos eles passaram, qual o seu próximo destino, e muito mais.
Cada etapa da transformação ou movimentação dos dados deve ser registrada. Tendo essa ferramenta aliada à uma documentação que explica o porquê e o que é feito entre os passos, garantimos que todos os nossos processos sejam entendidos por qualquer interessado e facilitamos a resolução de problemas ou futuras alterações.
“A linhagem de dados é uma descrição do caminho da fonte de dados até sua localização atual e as alterações feitas nos dados ao longo do caminho.” (DAMA)
Por que utilizar a Linhagem de Dados num Programa de Governança de Dados?
A Linhagem de Dados reduz o risco fornecendo a origem dos dados e informações sobre como as informações estão trafegando pelo sistema, trazendo clareza sobre todos os processos.
Além disso, fornece o rastreamento necessário para a resolução de erros e reduz o tempo e recursos necessários para migrações de sistema. Com essa ferramenta, desenvolvimentos novos e alterações de processos existentes podem ser feitos com maior segurança e rapidez, uma vez que se conhecem as fontes de dados e os locais onde os dados são armazenados, assim como detalhes sobre processos intermediários.
A Qualidade dos Dados também é aumentada pois sabemos por quais tratamentos os dados efetivamente passam e garantimos que sempre cumpram requerimentos de regulações de proteção de dados.
Conheça o ebook gratuito Guia Prático das Dimensões de Qualidade de Dados aqui.
A Linhagem de Dados ajuda a garantir que os dados sejam provenientes de uma fonte confiável, tenham sido transformados corretamente e carregados no local especificado, desempenhando um papel importante quando as decisões estratégicas dependem de informações precisas. Se os processos de dados não forem rastreados corretamente, a verificação dos dados será muito mais cara e demorada.
Todos esses pontos aumentam a confiança nos dados por parte dos desenvolvedores e outros responsáveis da área, que podem trabalhar com mais agilidade e eficiência. Além disso, ter maior confiança nos dados significa que o resultado de análises e modelos também passa a ser mais preciso, o que eleva a reputação do empreendimento.
Exemplos de uso
Linhagem de Dados para verificar problemas em relatórios
Quando a equipe de negócios pergunta sobre um possível erro no resultado final, o desenvolvedor deve conseguir dar uma explicação do que está acontecendo dentro de um prazo razoável, sendo um erro ou não. Com a Linhagem de Dados, o desenvolvedor pode rastrear a origem dos dados em questão e inspecionar cada etapa na cadeia para determinar o que está acontecendo.
Avaliação de impacto com Linhagem de Dados
Alterações em processos, tabelas, fontes de dados, ou qualquer etapa envolvendo dados são frequentes. Determinar quem e o que pode ser afetado se a mudança é implementada é crucial. Ao invés de perguntar para cada equipe se eles acreditam que podem ser impactados, que tal usar a Linhagem de Dados?
Assim, você não vai deixar espaço para ignorar um impacto que não seja de fácil visibilidade. Assim, todos os objetos, processos e pessoas antes e depois da alteração podem ser identificados e analisados com maior detalhe.
Proteção de Dados facilitada
Se todos os fluxos de dados são conhecidos, então podemos identificar para onde as informações pessoais estão “caminhando” em qualquer etapa. Um bônus adicional é que saber quais relatórios contêm informações pessoais facilita o controle sua divulgação – tanto dentro como fora do negócio.
Problemas no ETL
No ELT, os dados são retirados de uma origem, carregado no banco de dados de destino e, em seguida, transformado. Ocasionalmente podem haver erros devido a algum problema nos dados ou mudança não informada.
A Linhagem de Dados permite que a equipe rastreie o caminho até o processo em erro, e possa investigar se alguma coisa mudou neste caminho e corrigi-lo. Mais importante ainda, a Linhagem de Dados permite identificar qual o exato processo com problema, permitindo detectar a causa raiz da situação e corrigir.
Migrações
Quando ocorre uma migração, por exemplo para a nuvem, o fluxo de dados também deve ser replicado. Isso significa compreender a Linhagem de Dados existente, de modo a entender seus processos profundamente.
A Linhagem de Dados permite uma compreensão maior de como o processos de negócio foram implementado. Além disso, também facilita a identificação de processos que foram desativados ou que não são mais utilizados.
Gostou desta Ferramenta? Que tal conhecer outras?
Saiba mais sobre a Caixa de Ferramentas da Gestão e Governança de Dados!
Como criar uma Linhagem de Dados?
Hoje em dia existes softwares que criam a Linhagem de Dados de forma automatizada. Essas opções geralmente vêm acompanhada de outras ferramentas automáticas de Governança de Dados. É o caso, por exemplo, da Collibra, Manta e Octopai.
Mas você não precisa disso para começar a criar a sua própria Linhagem de Dados com o Excel ou outra plataforma de planilha eletrônica.
É claro que processos manuais dependem de mais atenção e treinamento por parte do usuário, porém, é possível criar uma planilha de fácil compreensão e criar um guia de como preenchê-la corretamente.
Clica aqui para conferir nosso post sobre como criar uma Linhagem de Dados com o Excel!
Pingback: Como criar uma Linhagem de Dados - Diário de Dados