Nível de significância (valor P) é banido de revista científica

Por Yuri Motoyama

(Esse artigo foi traduzido do blog na revista Nature, clique aqui e leia o artigo na íntegra)

Um controverso teste estatístico teve finalmente seu encontro com o fim, pelo menos foi o que aconteceu em um periódico. Os editores da revista Basic and Applied Social Psychology (BASP) anunciaram que não irão mais publicar artigos que contenham nível de significância P  (valor P) justificando que essa técnica é frequentemente utilizada para dar suporte em pesquisas de baixa qualidade.

Os autores ainda estão livres para submeter artigos ao periódico utilizando o valor P e outras análises estatísticas que fazem parte dos “testes de significância da hipótese nula”, mas esses números serão removidos antes da publicação.

Muitos pesquisadores já se pronunciaram a respeito dessa decisão, porém o questionamento sobre esse tratamento estatístico dos dados não é de hoje.

O valor é amplamente utilizado na ciência para testar a hipótese nula. Por exemplo, em um estudo médico que quer observar inferências entre o fumo e o câncer. Um valor P próximo de zero , aponta que exista uma grande chance da hipótese nula ser falsa. Muitos periódicos e pesquisadores aceitam que o nível de “significância” dessa medida é aceitável quando esse valor P é menor que 0,05. Entretanto, o valor P é instável e algumas vezes ele desaparece quando experimentos e análises estatísticas são repedidas (veja referência Nature 506, 150–152; 2014).

Como explicação para essa mudança, os editores do periódico David Trafimow e Michael Marks, disseram que o valor vem se tornando uma muleta para cientistas que lidam com dados fracos.
Falando com a Nature, Trafimow disse que seria gratificante se o teste de hipóteses nulas desaparecesse de todas as pesquisas científicas:
“se os cientistas estão dependentes de um processo que é descaradamente inválido, então nós temos que nos livrar dele.”
Admite o editor, entretanto, sem conhecimento de qual tratamento estatístico poderia tomar o lugar do teste de hipóteses. Esse questionamento levanta dúvidas sobre como os cientistas validariam seus trabalhos sem algumas regras estatistificas e a sugestão de se livrar do valor P já causa polêmica nas redes sociais. Sanjay Srivastava, psicólogo da Universidade de Oregon, tweetou  que as conclusões serão os próximos elementos a serem banidos da ciência. Entretanto, aprova a atitude do jornal em experimentar novas mudanças.

Outro autor, De Ruiter, disse que não nutre muito amor pelo nível de significância P pelo fato de na maioria dos casos ele não refletir com acurácia a possibilidade de falsos positivos. Mas o autor diz estar perplexo pelo fato da análise ser totalmente retirada, ele diz: “Eu acredito que isso não vai dar certo, não se pode fazer ciência sem alguns tipos de estatísticas inferenciais”.

O editor, Trafimow, responde que experimentos e testes de hipóteses existiam séculos antes da invenção do nível de significância e ele ainda afirma:

“Eu prefiro não ter nenhuma estatística inferencial do que ter alguns dados que sabemos que não são válidos.”

E o que você você acha?

Clique aqui e siga a fanpage da revista Nature!
Clique aqui se siga o twitter da revista Nature!


  • fernando

    o que é P?

    • Yuri Motoyama

      Olá Fernando! O P valor é um resultado que econtramos em praticamente todos os artigos científicos. Ele é parte de uma das análises estatísticas mais tradicionais. Por exemplo, quanto tentamos comparar dois grupos experimentais, o P nos diz qual a probabilidade desse resultado estar “equivocado”. Digo equivocado no seguinte sentido, imagine que não existe nenhuma interação entre esses dois grupos e nós “afirmamos” que existe interação, precisamos ter uma margem bem baixa para que não aconteça esse erro. Então chegamos (por convenção) a um número de 0,05 ou 5%. Esse número diz que existe uma probabilidade de 5% de errarmos ao falar que houve uma interação entre os dados quando realmente não houve. Abraço mestre e agradecido pelo comentário!