Pensar em hipóteses decorrentes de uma decisão é uma atividade extremamente valiosa na busca pela construção de estratégias consistentes que ajudarão seu negócio prosperar. Entretanto, para que essas hipóteses tenham uma validade real, nada melhor do que executar um teste que a comprove, tornando as estratégias escolhidas ainda mais precisas. É justamente esse o intuito da ferramenta teste de hipóteses.
O que é teste de hipóteses?
O teste de hipóteses é uma ferramenta estatística que tem como objetivo confirmar que uma determina hipótese, suposição, tem validade e é plausível frente ao contexto e às necessidades da empresa. Para isso, a metodologia usa uma amostra (a hipótese testada) que está inserida dentro de um universo populacional (que seriam outros possíveis cenários decorrentes de uma decisão).
Como fazer um teste de hipóteses?
O teste de hipóteses é uma metodologia que envolve a tão temida matemática. Nesse sentido, para construir seu diagrama de forma correta, é interessante separar os dados por categorias e conhecer os tipos de hipóteses, evitando que você se confunda na hora de fazer o teste de hipóteses.
Em primeiro lugar, considere que:
- μ, σ, p, n: são símbolos comumente usados para representar os parâmetros populacionais a serem avaliados.
- H0: representa a hipótese nula, que é o exato oposto da hipótese tentada, ou seja, aquela que deve ser provada.
- H1: representa a hipótese alternativa, que é uma espécie de “terceira opção”, que entra em jogo se nem a hipótese testada, nem a hipótese nula forem verdadeiras.
- Erro do tipo I: também chamado de erro de primeira espécie, o erro do tipo I acontece quando a hipótese nula é verdadeira, mas foi rejeitada.
- Erro do tipo II: o erro do tipo II, ou erro de segunda espécie, acontece quando a hipótese nula é falsa, mas foi aceita.
Geralmente, ao se fazer um teste de hipóteses, os responsáveis definem que cometer o erro do tipo I é mais grave do que cometer o erro do tipo II. Isso acontece porque rejeitar uma hipótese verdadeira costuma trazer muitos mais problemas para uma empresa do que aceitar uma hipótese que, apesar de ser falsa, está mais próxima da verdadeira.
Outros conceitos:
- Nível de significância: é a probabilidade de se cometer o erro do tipo I (que é o mais perigoso). Ele é calculado antes do teste de hipóteses e geralmente fica entre o 1% e os 5%.
- Estatísticas de teste: a estatística de teste é um número variável obtido a partir dos dados coletados na amostra escolhida para o teste de hipóteses. Esse número resulta de um cálculo feito com uma determinada fórmula, que varia de acordo com o objetivo da análise.
- Região de aceitação: são os valores que fazem com que a hipótese nula seja aceita.
- Região crítica: são os valores que fazem com que a hipótese nula seja recusada.
Estes conceitos apresentados nos ajudarão a chegar na conclusão do teste de hipóteses. Entretanto, ao longo dos artigos, apresentaremos outros conceitos com valores aplicáveis, obtidos através de fórmulas específicas.
Os 3 tipos de teste de hipóteses:
Existem várias maneiras de se aplicar um teste de hipóteses, entretanto, três se destacam: os testes de significância, os testes por intervalos de confiança e os testes por valor da prova.
- Testes de significância: também chamado de Método de Fisher, tem como objetivo refutar a hipótese nula.
- Testes por intervalo de confiança: formulado por Jerzy Neyman, esse teste pretende estimar um intervalo de confiança dentro de um parâmetro populacional (que pode ser a média). Assim, se o resultado estiver dentro desse intervalo, haverá indícios suficientes para aceitar ou negar uma hipótese.
- Testes por valor da prova: o valor da prova (p-valor) é um número que indica a probabilidade do “acaso”, ou seja, é a probabilidade de você ter escolhido uma amostra populacional que indica a validade de uma hipótese, entretanto, essa amostra não reflete de fato o resultado, que teria sido apenas uma “coincidência”. Dessa forma, os testes por valor da prova visam quantificar as evidências que vão contra a hipótese nula para, então, saber se a amostra populacional escolhida é suficiente para aceitar ou negar uma hipótese.
As 5 etapas do teste de hipóteses
Sabendo os 5 passos de como fazer um teste de hipóteses, fica mais fácil entender o raciocínio por traz da ferramenta e a sua construção e uso provavelmente serão mais eficientes.
Junto ao passo a passo de como fazer um teste de hipóteses, optamos por apresentar um exemplo prático em diferentes versões. Assim, você poderá fazer uma adaptação para o contexto do seu negócio de acordo o objetivo pré-estabelecido.
As 5 etapas do teste de hipóteses são:
- Estruturar a hipótese nula e a hipótese alternativa
- Coletar dados e definir uma estatística de teste
- Determinar um nível de significância
- Definir regiões de aceitação da hipótese nula e a região crítica
- Calcular o teste, chegando a uma conclusão sobre as hipóteses apresentadas
Exemplo: Uma empresa colocou ao ar uma nova versão de seu site, com a intenção de diminuir o tempo de compra de 10 minutos para 5 minutos. Nesse sentido, a gestão, então, decide fazer um teste de hipóteses com o método teste de significância para confirmar que essa nova versão realmente está diminuindo o tempo de compra.
1. Hipótese nula e hipótese alternativa
- H0: A nova versão do site não reduziu o tempo de compra – μnovo ≥10;
- H1: A nova versão do site reduziu o tempo de compra – μnovo <10;
Aqui, deve-se considerar que o site pode ter sim reduzido o tempo de compra (fazendo com que ele fique menor do que 10 minutos), mas não ter chegado aos 5 minutos.
2. Dados coletados e estatística de teste:
Os responsáveis pelo teste decidiram pegar uma amostra de 50 compras realizadas no novo site. Os dados obtidos foram:
- Versão nova: dessas 50 compras, a média de tempo que as pessoas passaram no site foi de 5 minutos.
- Desvio padrão: o desvio padrão é o grau de variação. Nesse caso, acharam uma variação de 1 minuto.
- Tamanho da amostra (n): 50 compras.
Neste caso, como a amostra (n) é maior do que 30, usa-se a fórmula do Teste Z:
Xˉ=5 (média amostral)
μ0=10 (média sob a hipótese nula)
σ= 1 (desvio padrão populacional)
n=50 (tamanho da amostra)
3. Determinar nível de significância (α)
Para determinar o nível de significância (α) é preciso, primeiro encontrar o p-valor. Dessa forma, esse valor está relacionado ao valor encontrado no teste Z e existem tabelas que mostram esse valor. Assim, como o resultado foi –35,46, é muito pequeno o p-valor pode ser desconsiderado.
Nesse caso, qualquer nível de significância (α) escolhido (geralmente vai de 1% a 5%) será irrelevante ao comparar com o p-valor, que é muito baixo. Ou seja, a hipótese nula pode ser descartada, chegando à conclusão de que a nova versão está sim diminuindo o tempo de compra.
4. Definir região de aceitação da hipótese nula e a região crítica
Escolhendo um nível de significância (α) de 5% (0,05) no nosso teste, que é um teste unilateral à esquerda (pois a hipótese nula é maior ou igual a um número), é preciso encontrar o valor crítico, que separa a região de aceitação da região crítica.
Existe uma tabela chamada Tabela Z, que pode ser usada para quando o desvio padrão for entre 0 e 1. Nesse sentido, segundo a tabela, a região crítica para nosso exemplo seria de -1,645, separando a região crítica da região de aceitação.
5. Conclusão do teste de hipóteses
Montando o gráfico que ilustra o teste de hipóteses que acabamos de criar, teremos o seguinte resultado:
Os dados colhidos guiaram nossa interpretação, assim como o uso dos testes escolhidos e das tabelas que se encaixavam. Nesse sentido, o resultado final foi que a nova versão do site reduziu sim o tempo de compra das pessoas para cerca de 5 minutos, com pequenas variações.
Esse foi um exemplo simples, apenas para facilitar a compreensão de como a ferramenta funciona. Dessa forma, os gestores poderiam chegar a uma conclusão parecida apenas olhando o comportamento dos clientes. Entretanto, existem situações mais complexas, envolvendo muitos números e cálculos, que precisam desse tipo de teste para a validar a hipótese.
Leia também: Diagrama de Dispersão: uma poderosa ferramenta de monitoramento
- Teste por intervalo de confiança:
Vamos usar o mesmo exemplo nos testes por intervalo de confiança. Nesse caso, também usaremos a estatística Z para encontrar, que deu –35,46. Como o α=0,05, usamos um intervalo de confiança de 95%. Além disso, o p-valor é muito pequeno, então ele pode ser desconsiderado.
Assim, podemos calcular o erro padrão da média com:
E o intervalo de confiança com:
Tendo um resultado de: 4,724 e 5,276 minutos.
- Teste por valor da prova:
No teste por valor da prova, nós voltamos os nossos olhares para o p-valor. Dessa forma, para o exemplo usado, o p-valor continua sendo muito pequeno, podendo ser desconsiderado. Assim, poderíamos rejeitar a hipótese nula sem levantar uma outra hipótese de “coincidência” sobre a amostra escolhida.
Quais outros testes poderiam ser usados?
No exemplo apresentado, usamos como base o Teste Z, já que a amostra era maior do que 30. Entretanto, existe uma série de outros testes que podem ser usados a depender do objetivo do teste e dos dados coletados. Os principais são:
- Teste T: Utilizado em amostras pequenas (menores de 30) ou quando o desvio padrão é desconhecido.
- Teste de Qui-Quadrado: Aplica-se esse teste quando os dados são categóricos e quando há necessidade de fazer testes de independência.
- Teste de Mann-Whitney: Melhor opção para dados ordinais ou não paramétricos.
- Teste de Wilcoxon: Usa-se quando os dados são pareados e não paramétricos.
- Teste de Kolmogorov-Smirnov: Usado para comparação de distribuições.
- Teste de Friedman: Teste usado em dados repetidos ou não paramétricos.
Monitorar suas estratégias não precisa ser tão difícil!
O teste de hipóteses é, indiscutivelmente, uma ferramenta de alto rendimento. Uma outra característica relevante desse método, que também é indiscutível, está relacionada a sua complexidade: qualquer erro de cálculo pode gerar resultados não precisos e, assim, interferir no no planejamento estratégico.
Mais do que quebrar a cabeça em métodos matemáticos complexos, um planejamento estratégico demanda uma certa preocupação com automatização de processos e diminuição de retrabalho, com intuito de aumentar a produtividade das equipes e reduzir os erros humanos e operacionais. Se esse é o seu desejo, te apresentamos o Módulo Estratégia do Docnix, nosso Software de Gestão da Qualidade.
Em nossa suíte, você poderá elaborar seu planejamento estratégico com o apoio de metodologias mundialmente reconhecidas, como o BSC. Além disso, na própria plataforma, é possível comunicar a estratégia para os envolvidos e acompanhar a execução dos projetos, monitorando seus resultados. Ficou interessado? Clique aqui para uma demonstração gratuita!
Suas estratégias consideram os desejos de seus clientes? Separamos um DocDicas especial para te ajudar a ouvir (e entender) a voz de seu cliente: