Análise de Dados

5 dicas para organizar totalmente seus dados

binary-1327495_1280

Executar uma análise de dados quantitativa ou qualitativa com objetivo de extrair boas informações não é uma tarefa fácil. Requer muita atenção nos passos essenciais para construção desse processo.

Para deixar seu entendimento em relação a como organizar melhor os dados de seu projeto de pesquisa totalmente demais, vejamos 5 dicas de ouro em análise de dados. Vamos analisar?

Estruturar base de dados é fundamental!

Se estamos falando em analisar, é preciso ter organização. Por isso estruturar base de dados, por menor que seja sua amostra, é extremamente importante para as análises.

A organização principal para uma base de dados é ter uma coluna exclusiva para cada variável participante do projeto. Agora, lembre-se: Para estruturar base de dados não precisa ter um banco de dados SQL, Oracle ou similar.

Como mencionei, para projetos de pesquisa com amostras podendo variar entre 10 e 10 mil observações (ou mais), uma boa planilha Excel ou mesmo uma planilha Google resolve muito bem o problema.

Como exemplo inseri a imagem 1 (abaixo), mostrando com detalhes o que deve ser feito. Se pensarmos em um programa como Excel, devemos trabalhar as colunas (letras) sendo as variáveis e para cada linha teremos um registro.

Planilha Variável Coluna 2

Analise a amostra na imagem 1. Note, chamamos de variável os dados de alguns pacientes, por exemplo. Para esse exemplo, usamos 4 variáveis: Nome, Idade, Peso e Altura. E, em cada linha de nossa planilha Excel, temos um registro referente a cada paciente. Desse modo será mais fácil compreender os dados a serem estudados.

E lembre-se sempre de manter uma linha (registro) por paciente, onde cada item referente a ele será uma nova variável. Dessa maneira, seu projeto já está começando totalmente demais.

Variáveis quantitativas e qualitativas: Cada uma em seu lugar.

Quando for organizar suas variáveis deve ter atenção! Não misture variáveis quantitativas e qualitativas em uma mesma coluna. Isso pode lhe render algumas horas perdidas.

Variáveis qualitativas são baseadas em qualidades da observação e não podem ser mensuradas numericamente. Variáveis quantitativas são numericamente mensuráveis, podem serem utilizadas para cálculos, contagens e outras análises. Como exemplo, nossa imagem 2 (abaixo) mostra o NOME como variável qualitativa e IDADE, PESO e ALTURA, como variáveis quantitativas. Vejam!

Planilha Variável Coluna 3

Agora, com um conhecimento sobre como posicionar os dados em sua base de dados, vamos falar sobre processos e sua importância, variáveis-chave para identificação de seus registros e sumarização de dados com estatística descritiva. Siga em frente!

Padronizar processos é tudo!

Padrão é fundamental quando o assunto for organizar. Muitas vezes um projeto de pesquisa não será realizado sozinho, por isso algumas normas devem ser definidas desde o início para organização dos dados.

Falamos em variáveis e registros, padrões merecedores de respeito por toda equipe envolvida no projeto de pesquisa. Mas, além disso, mantenham as mesmas configurações ao adicionar novos registros. Como exemplo, se estamos inserindo um novo registro em nossa planilha de Excel, e a variável ALTURA está configurada com duas casas decimais, é importante manter o padrão.

Para variáveis qualitativas o problema é bem mais complicado. Podem existir situações onde cada paciente poderá ter mais de um registro. Seja em um tratamento com alguns acompanhamentos posteriores (na medicina), ou mesmo registros de vendas (no marketing). Por exemplo, se tudo está  escrito em maiúsculo, então devemos seguir assim até o fim. Vejam a imagem 3, abaixo!

Planilha Variável Coluna 4

Visto isso, é fundamental ter um padrão para entrada de dados nas variáveis quantitativas e qualitativas. Agora, como cada registro deve ser muito bem identificado e ainda existem estudos onde base de dados poderá conter diversos registros com referente ao mesmo objeto de observação, como facilitar essa identificação? Variáveis-chave!

Variáveis-chave: Seus dados precisam delas.

Se tem uma, ou mais, variáveis que não poderão faltar em sua base de dados, essas são as variáveis-chave. Pensando simples, cada registro, paciente ou cliente — chame de acordo com sua pesquisa — deve ser muito bem identificado e diferenciado dos demais.

Vamos chamar esse nova variável de ID. Nela devemos usar alguma numeração ou código que seja único ao registro. Como em nossa planilha Excel de exemplo os registros não se repetem, apenas uma sequência numérica atende nossa necessidade. Vejam a imagem 4, abaixo!

Planilha Variável Coluna 5

Fazendo isso, além de identificar cada registro com apenas um número, fica fácil não cometer erros. Já vi diversos projetos onde o pesquisador utilizava o nome como variável-chave, até ver o mesmo nome escrito de maneiras diferentes em mais de uma planilha e identificar problemas em contagens ou algumas estatísticas. Visto isso, não deixe de usar variáveis-chave em suas tabelas.

E por falar em estatísticas, vamos fechar falando delas?

Use estatística descritiva e descubra o que você tem!

Com sua base de dados pronta, um primeiro passo é conhecê-la! Para isso trabalhar com estatística descritiva é um ótimo caminho.

Seguindo esse caminho, você terá um panorama de seus dados. Essa pode ser a base para muitas tomadas de decisão em relação ao caminho da pesquisa e também um bom pedaço de suas descrições ou discussões, caso esteja escrevendo algum trabalho acadêmico.

Não falo em fazer nenhum cálculo complexo, mas sim média, moda, mediana, desvio padrão e contagens. Caso julgue necessário, pode apresentar alguns gráficos também. Veja nosso exemplo na imagem 5.

Planilha Variável Coluna 6

Com estatísticas simples é possível conhecer melhor o conjunto de dados de sua pesquisa. Sempre tenha esses números ao seu alcance. Serão úteis em diversos momentos de seu trabalho. Palavra de quem entende!

Gostou das dicas? Sabe quem precisa delas? Compartilhe!

Gostou das imagens no post? Baixe um infográfico das imagens clicando aqui.

Tagged , , , , ,

4 thoughts on “5 dicas para organizar totalmente seus dados

  1. Uma correção: No exemplo de variável qualitativa aparece o nome da pessoa… ” o nome da pessoa ” não e uma variável de pesquisa…seria correto apresentar: sexo, estado civil, etc..

    1. Olá Anônimo, tudo bem? Realmente trabalhar com variáveis qualitativas como sexo, estado civil, religião, entre outras, seria muito mais interessante. Contudo, em muitos trabalhos acadêmicos que já participei, vejo muitas pessoas trabalhando com o nome sendo a chave de uma tabela. É claro, vi muito isso com amostras pequenas.

      Geralmente em trabalhos de Bioestatística. Vejo isso como algo errado e sugiro, no post, a criação de um ‘id’. De certa forma o nome também está qualificando a pessoa (ou paciente) observada. Nestas pesquisas pode não ser útil, mas o IBGE também dá uma utilidade aos nomes dos brasileiros, verificando a frequência de nascimentos por década (http://censo2010.ibge.gov.br/nomes/#/search/response/75).

      Enfim, entendo seu comentário, mas ao qualificar a variável nome, sua classificação será qualitativa e não quantitativa. Eu fico muito feliz que tenha lido o post. Logo falarei mais sobre variáveis e com certeza mostrarei de outras e de outras maneiras! Muito obrigado pelo comentário! 😉

  2. Apenas uma correção, onde está escrito “Variáveis quantitativas são baseadas em qualidades da observação e não podem ser mensuradas numericamente.” O correto é Variáveis QUALITATIVAS são baseadas em qualidades da observação e não podem ser mensuradas numericamente. Creio que houve erro na digitação.

    1. Olá Alessandra, tudo bem? Realmente é um erro de digitação. Muito obrigado por me ajudar. Fico feliz por ter lido o post. Vou corrigir agora mesmo. Grande abraço, Alessandra. 😉

Deixe uma resposta