Já sabemos que não adianta ter acesso às ferramentas mais modernas e aos modelos mais complexos se você não estiver atento à Qualidade dos seus Dados.
Se seus dados não estiverem de acordo com as 6 Dimensões da Qualidade de Dados, a chance das suas análises e predições serem inconsistentes é muito alta.
Neste post, vamos entender alguns motivos de termos dados sem qualidade, como aumentar a Qualidade de Dados na coleta de dados e perceber como podemos melhorar os processos de entrada de informações nas nossas bases de dados.
Começando pelo Começo: a coleta de dados
Por vezes algumas coisas são tão simples e óbvias que acabam passando despercebidas. Uma delas é que a razão dos seus dados não terem qualidade é devido à forma com que eles são coletados ou inseridos.
Existem maneiras manuais e automáticas para a criação de dados e, em todos os casos, existem riscos a serem avaliados e mitigados para aumentar a Qualidade de Dados.
Vamos entender um pouco mais?
Leia mais: Qualidade de Dados com ALCOA+
Erros de entrada
Esse é o erro mais comum e, eventualmente, irá acontecer nos seus processos de coleta de dados.
Pode ser um erro de digitação, uma palavra que não se sabia escrever corretamente, um selecionar errado numa lista, uma falta de atenção, um termo abreviado… São diversas justificativas que podem levar uma pessoa a cadastrar uma informação errada.
Nestes casos, para aumentar a Qualidade de Dados, pode-se utilizar testes de validação. Deve-se buscar definir o formato dos dados, possíveis valores ou outro tipo de verificação que faça o papel de checar se o dado inserido não está inconsistente com as possibilidades.
Alguns exemplos: verificar se a quantidade de dígitos de um número de telefone satisfaz o esperado e tem apenas números; um e-mail deve conter “@” e “.com”.
Outra solução para a coleta de dados é a de criar valores pré-definidos a serem selecionados em uma lista. Entretanto, apesar de manter os valores padronizados, ainda existe a possibilidade de seleção errada.
É possível que pessoas com mais conhecimento na área específica do negócio consigam captar esses erros de maneira mais rápida, portanto, ter uma comunicação aberta com todas as equipes e avaliar constantemente os valores de cada atributo são chaves de sucesso para encontrar inconsistências devido a dados de entrada inseridos incorretamente e aumentar a Qualidade de Dados.
Processos de Entrada de Dados
É muito comum nos dias de hoje preencher formulários online na coleta de dados. Seja para se cadastrar em um site, receber um conteúdo digital, comprar ingressos ou fazer comprar no supermercado.
Se o formulário não for bem idealizado e organizado, é muito fácil que haja alguma dificuldade de interpretação – além da possibilidade de um erro de digitação, como vimos acima.
Ao criar um processo de entrada de dados é importante pensar em quem vai inserir esses dados. O que é óbvio para mim pode não ser óbvio para você, e isso se aplica a este caso.
Para aumentar a Qualidade de Dados, considere sempre testar os formulários e, quando possível, também atribuir testes de validação nos campos.
Nos casos de coleta de dados em que o mesmo formulário será preenchido por uma equipe ou pessoa específica, é interessante desenvolver um treinamento ou guia com as devidas explicações e dúvidas que possam surgir.
Simplificar é sempre chave. O tamanho do fomulário e complexidade das questões também pode influenciar na quantidade de erros possíveis.
O Problema do Valor Nulo
Pode parecer brincadeira, mas a verdade é que um campo em branco pode significar muita coisa: não existe, não se sabe, está incompleto, será acrescentado depois?
E qual a diferença de um valor nulo para um espaço em branco ou para NA, N/A, e tantas outras formas que podemos dizer que um valor não existe ou não é aplicável?
Para aumentar a Qualidade de Dados, leia mais sobre este tópico aqui.
Erros Deliberados
Sim, pode acontecer que a pessoa responsável por criar os dados, os faça de maneira errada de propósito. Mas, atenção, nem sempre isso será por falta de consideração ou má vontade!
Uma pessoa pode não saber o dado correto a ser inserido e, por não ser considerado um importante ou urgente, essa pessoa pode computar um valor errado e sem sentido.
Nesses casos, para aumentar a qualidade dos dados na coleta de dados, é interessante criar um procedimento ou valor padrão para quando não se sabe o valor a ser inserido, ou que este ainda será computado.
Muito melhor do que deixar passar um dado completamente inconsistente com a realidade!
Treinamentos e guias de melhores práticas também são importantes para a conscientização de sempre prezar por informações consistentes.
O dado pode não ser importante no momento, mas, eventualmente, pode ser crucial.
Agora, voltando o exemplo de formulários em cadastros, também existe a possibilidade do usuário não querer fornecer a informação correta.
Quem nunca inventou um sobrenome ou o telefone? Nesses casos pode ser muito complicado de verificar a integridade da informação.
Deve-se levar em consideração a possibilidade de inutilização de alguns registros e qual o processo de identificação e limpeza desses registros a ser utilizado.
Um outro ponto a ser observado para aumentar a Qualidade de Dados na coleta de dados, é a possibilidade de falsificações. De modo geral, as falsificações acontecem para que um ganho indevido seja recebido.
Um funcionário pode reportar mais vendas do que realmente fez, determinados serviços tem valores diferentes para cada região pode-se inserir um endereço diferente, a data de compra de um equipamento pode ser alterada para que a garantia seja utilizada… são muitas possibilidades.
As regras e políticas do empreendimento devem estar em congruência com essas eventualidades, e auditorias podem ser uma solução para evitar esse problema.
Erros de Sistema
Cada vez mais os sistemas e bases de dados tem se tornado mais confiáveis. Entretanto, ainda podem existir falhas pontuais, sistemas que saem do ar por algum tempo, bugs e falta de conexão entre servidores.
Nestes casos, é possível haver dúvida se um novo registro foi criado ou se foi alterado de forma esperada. Isso pode levar a registros errados ou, até mesmo, duplicados.
Aqui, para aumentar a Qualidade de Dados, também é importante o treinamento da equipe responsável pela entrada de dados, para que todos saibam como agir no caso de falhas e verificar se o trabalho foi completado corretamente.
Por vezes, o problema pode ser tão simples como a falta de ter clicado no botão de salvar.
Pingback: Os melhores memes sobre Qualidade de Dados - Diário de Dados