Essa Correlação é Espúria?
Não podemos negar que os seres vivos, não só os humanos, somos geradores de dados. Neste exato momento quantas fotos estão sendo enviadas para os servidores do Google, quantos passos seu Smartwatch registrou hoje, índices financeiros ou quantos quilômetros e stream de vídeos as baleias do projeto Jupiter Research Foundation produziram. No entanto, temos fixação por regras, leis e para isso necessitamos inferir dados. Como colocar todos esses dados na caixola? Não dá. E sabemos que quanto maior a aleatoriedade da informação maior é a sua dimensionalidade, portanto temos que reduzir a dimensionalidade da informação. Irei aplicar uma técnica de redução de dimensionalidade de dados PCA (Principal Component Analysis)? Não dá, novamente. O que nós seres humanos, pelo menos alguns de nós, somos capaz de fazer até agora é apenas resumir as informações. Esquecer algumas informações irrelevantes, dando relevância maior para outros, ou seja, em resumo: iremos simplificar os dados e tornar o nosso mundo mesmo complexo e aleatório de forma inconsciente.
Estatística é a "ferramenta" ideal para essa análise. Percebemos o quão ela é utilizada em nosso dia a dia, nas nossas vidas e em diversas áreas. Se você é um engenheiro de telecomunicações utiliza em modelos de antenas, se é um médico com estudos de diagnósticos e se é políticos brasileiros mente com dados estatística de bodega. Aproveitando do gancho social dos políticos, a estatística foi utilizada em obras clássicas da Sociologia, como em O suicídio de Durkheim.
Nessa obra o autor se utiliza de de dados estatísticos, analisando diferentes meios e tipos individuais para servir de fundamento as suas teses, criou e desenvolveu vários conceitos importantes. Muitos consideram O suicídio um modelo de trabalho científico no campo das ciências sociais, um trabalho essencial para tentar compreender cientificamente a Sociologia como disciplina independente.Ao longo de seu estudo sobre o suicídio, Durkheim tenta através de estatísticas provar sua tese sobre o assunto e "chega a conclusão" que são esses métodos aplicados insuficientes para determinar suas causas. O autor utiliza-se de estatísticas, mapas e comparações, tornam-no mais o tema mais palpável. Porém para dar continuidade a sua tese ele faz muitas deduções e pressuposições. Isso só demostra o quão difícil é "transformar" um conceito de cunho social para uma modelagem matemática.
Sabemos que a melhor forma de se conseguir uma maior aproximação do ideal para a construção de conceitos, de forma clara e distinta, é pela formalização lógica (teoria matemática). Quando tratamos de modelos físicos, químicos (ciências naturais) utilizamos a matemática com ferramenta tanto para análise dos dados (métodos estatísticos) e também para a formulação. Se tratando de ciências sociais a história é bem diferente, chega a ser considerado desrespeitoso tratar da dinâmica e relações sociais por meio de "expressões" matemáticas. Pois, torna a vida determinística, retirando do indivíduo a capacidade de ter controle sobre seu destino, algo que governos e religiões usam muito bem.
As pesquisas quantitativas realizadas sem o suporte das qualitativas são apenas brincadeiras com números. O uso de ferramentas estatísticas (como uma curva de regressão, correlação, testes de significância etc) podem dar a falsa sensação da pesquisa ter sido realizada no alto rigor científico. normalmente em uma pesquisa são coletadas diversas variáveis das quais muitas podem ser irrelevantes, variáveis irrelevantes. Porem não podemos chamá-las de irrelevantes ao nosso bel-prazer. Uma "simples" análise por meio de uma correlação de cada variável com o fenômeno estudado irá resultar na escolha, com base em uma ferramenta estatística, na rejeição do uso de determinadas variáveis. Então, agora sim podemos dizer que ela seja irrelevante para uma determinada hipótese.
Como chamei a correlação de ferramente simples, tentarei explicá-la de forma sucinta para provar que é mesmo. Quando deseja-se avaliar a relação entre duas medidas quantitativas, no qual eu gostaria de investigar tenho três indagações básicas: se os valores estão associados, predizer o valor de uma variável a partir de um valor conhecido da outra ou descrever a relação entre variáveis. Se uma delas for verdadeira você irá usar a correlação (irei tratar do caso mais simples de duas variáveis) .
$\rho_{X,Y}\equiv\mathrm{corr}(x,y)={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E[(X-\mu_X)(Y-\mu_Y)] \over \sigma_X\sigma_Y},$
em que $E$ é o operador do valor esperado, $\mathrm{cov}$ é a covariância e $\mathrm{corr}$ é o coeficiente de correlação. Agora é só fazer conta e interpretar os resultados.
Suponha agora que você encontrou uma associação ou correlação entre duas variáveis X e Y. No qual mudanças em X causam mudanças em Y e mudanças em Y causam mudanças em X. Porém foi observado que mudanças em outras variáveis causam mudanças tanto em X quanto em Y. A relação observada foi somente uma coincidência. A terceira explicação é frequentemente a mais apropriada. É o que podemos associar com as explicações impossíveis de traduzir por conterem erros lógicos de hipótese, apesar de matematicamente serem correlacionados. É extremamente difícil estabelecer relações causais a partir de dados observacionais. Precisamos realizar experimentos para obter mais evidências de um relação causal. O site Spurious Correlation apresenta uma séria divertida de factoides com gráficos interativos que apresentam uma correlação alta porem sem causalidade ou apenas sem sentido algum. É divertido! Se você for curioso pode encontrar algo como um coeficiente de correlação de 0.957087 entre o número de pessoas que morreram ao cair da cama nos Estados Unidos e o número de advogados em Porto Rico.
![]() |
| Correlação Espúria entre o investimento em ciência, tecnologia e missões espaciais com o número de suicídios por estrangulamento. |
No livro I do Tratado da Natureza humana de David Hume, a relação entre causa e efeito (causalidade) é amplamente discutido no contexto filosófico. No qual, a influência que a crença tem na causa e efeito e sua importância para a explicação de muitos fatos relacionando assim os acontecimentos que muitas vezes não tem como serem explicado através da da ciência.
Ao pensarmos a causalidade perante ao mundo vemos que não tem uma causalidade que já venha inserida nas coisas, pois se isso existisse ela teria que existir antes mesmo da causa e isso não seria possível. Então o que temos na verdade é uma crença causal sobre os fatos. Na Engenharia de Controle ou em Sinais e Sistemas diz-se que um sistema é causal se o valor atual do sinal de saída depender somente dos valores presentes e/ou passados do sinal de entrada.Creio que não haverá muita necessidade de provar que essas qualidades produzem uma associação entre ideias e, quando, do aparecimento de uma ideia naturalmente introduzem outra. (HUME ,2009)
$y[n]=\frac{1}{3}(x[n]+x[n-1]+x[n-2]$
e até no Direito a causalidade é utilizada. Na Teoria causal do Direito Penal que surgiu em no século XIX, no Tratado de Franz Von Liszt, e foi intensamente influenciada pelo positivismo jurídico. Teoria segundo a qual verifica-se o vínculo entre a conduta do agente e o resultado do ato ilícito.Porém sabemos da relação que parte da sociedade tem como pesquisas, números, formulas e equações. A percepção de padrões com concentração de dopamina no cérebro. Doses alta de dopamina diminui o ceticismo. Uma injeção de levodopa (usada no tratamento de mal de Parkinson) pode resultar em uma pessoa mais vulnerável a todo tipo de sorte de modismo (astrologia, superstições, tarô e até economia). O maior desafio é formalizar uma teoria com o intuito de de significado e torná-la mais simples do que sua versão discursiva. Pois sabemos que a linguagem humana é ambígua. Mas também não adianta usar ferramentas estatísticas e matemáticas, como o exemplo da correlação, e formalizar algo que não tenha o menor sentido científico. Mas como o próprio autor do livro Spurious Correlation fala você pode brincar de dados, números e encontrar algo ridiculous, e por favor que pelo menos seja engraçado.

Comentários
Postar um comentário