Bioestatística, Estatística, Excel

Teste Qui-quadrado no Excel: Aprenda definitivamente como fazer o teste para tabelas de contingência!

Teste Qui-quadrado no Excel 06

O objetivo desse post é ensinar aos iniciantes, ou quem tiver dúvidas, como realizar um teste Qui-quadrado no Excel, para tabelas de contingência. Esse teste é muito famoso, devido sua simplicidade de execução e eficácia no resultado.

Pode ser simples, mas vamos por partes. Primeiro é preciso entender o que é um teste Qui-quadrado e em quais situações podemos utilizá-lo. Em seguida, veremos o que é uma tabela de contingência. Por último falaremos sobre as fórmulas do teste e sua realização em uma planilha Excel. Vamos em frente?

O que é um teste Qui-quadrado?

O Qui-quadrado é um teste de hipótese com o objetivo de encontrar um valor da dispersão entre duas variáveis, sendo essas nominais (qualitativas), avaliando a associação existente entre elas.

É um teste não paramétrico, ou seja, não tem a dependência de parâmetros populacionais como média ou variância, por exemplo.

Em resumo, a base de um teste Qui-quadrado é comparar as proporções das categorias das variáveis qualitativas, buscando divergências significantes entre as frequências observadas e esperadas para determinado evento.

E um teste Qui-quadrado para tabelas de contingência?

Em tabelas de contingência, ou tabelas de dupla entrada, o teste Qui-quadrado tem o mesmo objetivo. Contudo, avalia a distribuição das categorias de uma variável, dentro das categorias de outra variável, também qualitativa.

Teste Qui-quadrado no Excel 01
Imagem 01 – Tabela de Contingência: Frequências observadas para o cruzamento da Faixa Etária e o Tratamento A/B.

Veja a Imagem 01. Temos uma tabela de contingência como exemplo, onde podemos nos questionar: Os tratamentos A e B são influenciados pela faixa etária dos pacientes? Vamos ver como isso funciona!

Como esse teste funciona?

Na prática, como supracitado, falamos de variáveis qualitativas, ou seja, variáveis que possuem categorias. Essas categorias, para serem avaliadas se existe ou não algum tipo de associação, devem ser contadas. Isso mesmo, estamos falando do processo simples de contagem.

Como mostramos na Imagem 01, cada quadrante (célula) da tabela cruzada tem a frequência correspondente ao cruzamento entre uma determinada faixa etária e um determinado tratamento.

Na tabela da Imagem 01 temos os frequências observados, ou frequências reais de nosso estudo. As frequências que realmente foram observadas na amostra e resultaram nessa tabela. Contudo, devemos calcular as frequências esperadas. Essas são as frequências esperadas para cada tratamento, de acordo com a proporção (representatividade) existente para cada faixa etária. Vejam a Imagem 02.

Imagem 02
Imagem 02 – Tabela de Contingência: Frequências esperadas para o cruzamento da Faixa Etária e o Tratamento A/B.

Para calcular as frequências esperadas, serão utilizados o total de cada linha e total de cada coluna. Por exemplo, para calcular a frequência esperada do Tratamento ‘A’, na Faixa Etária ‘Até 20’, devemos fazer o seguinte cálculo:

(Frequência total da faixa ‘Até 20’ * Frequência Total do Tratamento ‘A’ ) / Tamanho da Amostra = (46 * 60) / 140 = 19,7

Após ter as frequências esperadas, o teste Qui-quadrado utiliza a seguinte fórmula matemática (Imagem 03) para identificar um valor denominado de Qui-quadrado calculado (X²calc.). Na fórmula, a letra o refere-se as frequências observadas e a letra e, as frequências esperas. O n é o tamanho amostral, i representa cada elemento amostral e o Qui-quadrado é representado por .

Teste Qui-quadrado no Excel 03
Imagem 03 – Fórmula para calcular o Qui-quadrado.

Após ter essa estatística calculada, recorremos a tabela de distribuição Qui-quadrado. Nessa tabela existem valores ‘prontos’ para o Qui-quadrado, de acordo com seu grau de liberdade e o nível de significância do teste em questão. Como padrão, usaremos um nível de significância de 0,05, ou 5%. Mas vamos esclarecer bem esses dois assuntos.

O que é Grau de Liberdade?

Vamos esclarecer esse ponto muito importante para diversas situações na Estatística.

Pense em uma amostra com 5 elementos. Para calcular sua variância, devemos conhecer sua média. Essa será igual a 20. Para calcular esse novo parâmetro, quantos elementos dessa amostra temos a disposição para que possam variar (exercer diversos valores), com tranquilidade?

Temos 4 valores (n – 1). Mas por quê? Veja que, se temos n = 5 e média = 20, o somatório de todos os elementos dessa amostra será 100 (5 x 20 = 100). Sendo assim, se tivermos nessa amostra os valores 18, 24, 19 e 16, o quinto valor não poderá variar. Neste caso, esse quinto valor tem apenas a opção de ser igual a 23 para que a soma dos 5 elementos seja igual a 100.

Contudo, os 4 elementos “livres”, podem exercer diversos valores. São Graus Livres da amostra para que o parâmetro populacional Variância seja estimado. Por isso, neste caso devemos calcular os número de graus de liberdade fazendo n-1, ou a quantidade de elementos na amostra (n) – 1.

No caso do teste Qui-quadrado para tabelas de contingência, utiliza-se a quantidade de linhas e colunas para esse cálculo, como a seguir.

G.L. = (Número de Linhas 1) * (Número de Colunas 1)

E nesse caso, como para o teste t, o Grau de Liberdade serve para determinar, ou caracterizar, qual derivada da curva Qui-quadrado está sendo utilizada. Veja exemplos de derivadas na Imagem 03, de acordo com os Graus de Liberdade (gl).

Teste Qui-quadrado no Excel 04
Imagem 04 – Derivadas para distribuição de uma Qui-quadrado.

E o nível de significância?

O nível de significância está ligado a confiança que se tem em um teste. Um resultado significante na Estatística, indica ser improvável que o mesmo tenha ocorrido ao acaso.

Sendo assim, se um teste tem nível de significância de 5% (0,05), entende-se que 95% dos casos das amostras testadas não rejeitarão a hipótese nula do teste. Ou seja, aceita-se 5% de rejeições dessa hipótese e entende-se que realmente não aconteceu por acaso, são significantes.

Mas qual é essa hipótese nula? No caso do teste Qui-quadrado para tabelas de contingência, ou para independência, a hipótese nula afirma que uma variável está distribuída independentemente da outra variável. Ou seja, não há associação entre as variáveis. Quando essa hipótese for violada, rejeita-se a hipótese nula e as variáveis são consideradas dependentes. Existe uma associação entre elas.

Veja a Imagem 05. Essa é uma curva padrão de Qui-quadrado, onde c é a região crítica.

Teste Qui-quadrado no Excel 05
Imagem 05 – Distribuição Qui-quadrado.

A fronteira entre a região crítica (c) e seu complemento (1-c), ou região de aceitação do teste, está o X² crítico, valor máximo aceitável para que a hipótese nula não seja rejeitada. Caso o valor de X² calculado supere esse valor, estaremos dentro da região crítica, ou seja, rejeitaremos a hipótese de independência entre as variáveis.

Esse valor crítico deve ser extraído da tabela de Qui-quadrado, como veremos no vídeo. Vamos entender como calcular e avaliar nosso teste? Vamos em frente!

Como fazer o teste Qui-quadrado no Excel?

Agora, vamos entender como realizar esse cálculo, criar a tabela de valores esperados e também avaliar a existência ou não de associação entre as variáveis Faixa Etária e Tratamento.

Vamos para o Excel? Para isso, preparei um vídeo explicando como realizar o teste Qui-quadrado no Excel. Vamos conferir, agora!

Lembre-se das restrições!

Para terminarmos, é importante lembrar que não será possível sair por ai fazendo teste Qui-quadrado de qualquer maneira, ou em qualquer amostra. É preciso validar algumas premissas! Vamos ver quais são?

  1. As variáveis devem ser independentes;
  2. A amostra deve ser aleatória;
  3. As observações devem ser frequências ou contagens;
  4. Cada observação deve pertencer a uma e somente uma categoria;
  5. A amostra deve conter pelo menos 5 observações em cada quadrante (célula) da tabela.

Seguindo essas premissas, seu teste Qui-quadrado no Excel tem tudo para dar certo e ser muito útil em pesquisas ou mesmo em situações do dia a dia de uma empresa.

Baixe sua planilha Excel clicando aqui!

Se este post te ajudou, ajude um amigo e compartilhe esse conhecimento nas redes sociais! Não paga nada. 😉

Tagged , , , , , ,

Deixe uma resposta