Insight Probabilístico

Ligar o monitor do micro no exato momento em que o antivírus está escaneando o arquivo 33.333 é uma coincidência e tanto. Dizem alguns especialistas (e muitos filósofos precipitados) que isto é apenas uma “ilusão de coincidência”, já que qualquer número de cinco dígitos seria tão improvável de encontrar, ao ligar o monitor, quanto “33.333”. Dito assim, isso é verdade. Mas falha o alvo. O fato é que, em cem mil números possíveis (assumindo que eu liguei o monitor num momento aleatório em relação à duração do antivírus), apenas dez exibem a regularidade perfeita de cinco repetições. Isto nos dá a probabilidade de 1 em 100 mil de encontrar tal padrão ao ligar o monitor. É extremamente improvável!

Agora o insight.

Neste ponto, os críticos insistem que até isso ainda é uma “ilusão de padrão”, já que a suposta “regularidade” só é um padrão para os olhos humanos – ou pior ainda: só é um padrão para mim! Afinal, o símbolo para “3” é mais uma convenção humana, também arbitrária. Se um robô fosse programado para reinterpretar os símbolos a cada rodada, então a mesma seqüência de símbolos não mostraria repetição alguma. O primeiro três seria lido como “3”, mas o segundo “três” (pra nós) seria lido pelo robô como “2”, o terceiro com “4”, e assim por diante – recebi este argumento de Diego (brainstormers), durante o II Encontro Intelectual.

A série de símbolos, segundo Di, seria uma coincidência para mim, mas não para o robô. Ou seja, estaria na minha cabeça apenas, e não significaria nada de real e importante. Seria, como foi dito, uma “ilusão de padrão”. Argumentos assim parecem definitivos, mas eu só conseguia ficar confuso com eles. O Di, por sinal, adora supor que as intuições humanas falham, e adora desmascará-las. Mas não desta vez!

Menti: agora o insight!

Eis que percebo, súbito (isso foi ontem):  a coincidência existe realmente, e está no fato de que a seqüência 33.333 é um padrão para mim, sim, porém fui justamente eu quem ligou o monitor na hora H e, assim, pude observar o padrão. Ou seja: a abordagem do observador deve ser incluída nos cálculos! Outra maneira de dizer isso é que eu trazia comigo um alvo, e o antivírus o acertou bem no centro (sendo que o “centro” é feito de apenas dez números, em meio a cem mil).

Obviamente que o padrão 33.333 seria significativo para qualquer ser humano – embora não para cegos que escutassem cada “3” como um som diferente, mas deixemos as exceções de lado. Mas isso não é necessário, na verdade. Suponhamos, pois, que fosse realmente um padrão exclusivo meu. Isso não é absurdo como parece: o número poderia se tratar do meu aniversário, ou do meu celular. Então, se eu percebesse que o bilhete do primeiro avião que peguei na vida é numerado com 371982 (dia em que nasci), isso seria uma coincidência, não obstante o número só tivesse significado pra mim. Afinal, fui justamente eu quem pegou esse bilhete específico!

Voltando ao robô do Di, o fato de ele reinterpretar os símbolos a cada rodada não muda nada. Como “observador”, esse robô também traz seus alvos consigo: a seqüência 64235 pode ser aleatória pra nós, mas talvez não para o robô, pois ele poderia reinterpretar o seis como “3”, depois o quatro como “3”, e todos os demais como “3”. Para ele, seria notável! E a coincidência seria, então, que a seqüência 64235 ocorresse justamente para o robô. Agora até nós, de fora, podemos ver que seria uma coincidência objetiva!

Não vou entrar em detalhes, mas esse argumento é extremamente importante na defesa do indutivismo e em uma concepção objetiva das próprias probabilidades. Já é tempo de os filósofos insanos, que advogam que as probabilidades têm apenas “valor instrumental” (*), se calarem.

  1. (*) Por “valor instrumental” eles querem dizer, por exemplo, que não é verdade que seja difícil uma moeda cair em pé, pois ninguém pode saber de nada antes de ver como a moeda caiu! Ao invés disso, eles dizem que a “interpretação” segundo a qual a probabilidade de uma moeda cair em pé é proporcional às diversas áreas da moeda (faces e lateral) é uma “hipótese útil”, um “instrumento humano”, para lidar com a imprevisibilidade do mundo. Eles obviamente esquecem que, se a “interpretação humana” não fosse verdade, então o instrumento não serviria para prever nada!

8 Respostas to “Insight Probabilístico”

  1. Alguém Says:

    Lembro de uns certos quadrinhos japoneses, onde o cara que trabalhava numa agência de seguros de vida juntou toda espécie de probabilidades bizarras e colocou tudo num livro. Like, “homens carecas têm mais chance de desenvolver tal sintoma”, e cruzando várias informações ele podia levar uma pessoa até um determinado local, em determinado horário sob determinadas condições, aumentando a porcentagem de risco de vida pra pessoa morrer! Something to think about.

  2. João Lourenço Says:

    Paralelo,

    Para qualquer numero que sair é possivel achar um pequeno conjunto de numeros correlacionados que respeitem uma dada propriedade, assim o nivel de raridade de um numero pode ser convenietemente definido como você preferir. Por exemplo, se cair o numero 1097 – que a principio parece totalmente deinsteressante – é possivel se referir ao grupo dos numeros de 4 digitos que possuem um 1 seguido de um 0 e ao mesmo tempo dos algarismos impares seguidos e isso ia nos dar um seleto grupo de poucos numeros e dai você argumentaria que esse numero é improvavel pois pertence a esse seleto grupo, e assim poderia ser feito para qualquer numero que você tirar. (Se eventualmente você cruzar com um numero que não pode pertencer a nenhum grupo que atenda a uma certa propriedade você pode dizer que ele pertence ao grupo dos numeros que atendem a propriedade de serem desinteressantes) O fato é que independente disso o espaço amostral era, por exemplo, o dos numeros de 1 até 100.000 e qualquer numero tem uma probabilidade de 1/100.000 de sair.

    Abraços

  3. Paralelo Says:

    João,

    falei grego?

    Tudo o que você disse já foi devidamente criticado no próprio post!

    Sim, o número 1097, como quaisquer outros, se enquadrá em algum grupo seleto. Mas você ver um número e, a seguir, encontrar um padrão ad hoc onde ele se enquadre, equivale a lançar o dardo e pintar o alvo depois.

    A essência do meu post é justamente evitar a confusão com essa “pseudo-coincidência retrospectiva” que você falou.

    Se, logo depois de postar aqui, você desse de cara com um número do “grupo dos numeros de 4 digitos que possuem um 1 seguido de um 0 e ao mesmo tempo dois algarismos impares seguidos”, então isso seria uma coincidência. Você carregava um alvo com você, e o acaso o acertou bem no centro.

    Como eu disse, “a abordagem do observador deve ser incluída nos cálculos”…

  4. João Lourenço Says:

    O que eu disse implica que você carrega todos os alvos.

  5. Paralelo Says:

    De forma alguma, João.

    A “co-incidência” só se dá entre dois fatos: 1) o de você estar pensando [ou ser naturalmente inclinado a ver um padrão] em certo número, ou classe de números, que é o alvo que você traz consigo e 2) justamente você deparar com esse número ou padrão, que é a realidade acertar o alvo que você traz consigo.

    Não seria coincidência o robô do Diego deparar com um “33333”, pois pra ele isso não seria regularidade. E não seria coincidência para um ser humano (em geral) deparar com um “94592”.

    Se um ser humano depara com “11111” e, a seguir, “22222” e, a seguir, “33333”, até “99999”, então meu argumento implica que ele – por ser um humano para o qual justo tais séries, e não outras, são padronizadas – está justificado em ver aí um padrão improbabilíssimo e, por conseguinte, inferir uma causa subjacente (que é a única alternativa à mera coincidência).

  6. Carlos Daniel Llosa Says:

    Esse papo tem a ver com um assunto que me veio a interessar. No caso foi um artigo intitulado “Why most published research findings are false” publicado no Public Library of Science Medicine. O argumento se resumia a que ao se estimar a probabilidade do resultado encontrado ser um resultado de fato positivo e não um falso positivo, não se deve considerar meramente a significancia estatística (a probabilidade de que o resultado tenha sido positivo ao acaso) mas também a probabilidade anterior. Em suma, se por exemplo você acha uma relação entre duas variáveis cuja significancia estatística é de 0.05 (significando que há uma probabilidade de 0.05 que a relação seja por um acaso), nos moldes da pesquisa biomédica atual isso seria considerado um achado verdadeiro. No entanto, se ao curso do seu estudo do fenomeno você tentou achar relações entre vários pares de variáveis e só achou um par de variáveis com significancia estatística, o quadro muda. Vale lembrar que uma probabilidade de 0.05 significa que em cada 20 pares de variáveis investigadas, haverá em média um par que devido exclusivamente ao acaso, dará a impressão de que há uma relação entre essas duas variáveis. Caso o exemplo não tenha sido suficientemente claro, pense na diferença entre acertar um alvo de primeira (achar um relação entre as duas e únicas variáveis investigadas) e acertar um alvo depois de 20 tentativas (achar uma relação entre duas variáveis depois de ter estudado 20 pares de variáveis possíveis). Pode-se dizer o mesmo de outra maneira: você tem que dizer seu alvo ANTES de jogar o dardo, e quanto maior seu alvo, mais fácil será que seu acerto tenha sido ao acaso e consequentemente mais difícil que seu resultado seja um verdadeiro achado e não uma coincidência.

    Isso é relevante para o que está sendo discutido aqui pela seguinte razão. Ao se verificar se a tal sequência de numeros é uma coincidência ou se é fruto de um padrão subjacente, não é a única coisa a ser considerada a probabilidade da sequencia em questão ter aparecido ao acaso. Em analogia com o exemplo acima, há outras coisas a serem consideradas. Uma delas seria que sem delinear o alvo antes, não se pode dizer que a sequência encontrada tem alguma propriedade que as outras não tem. Por outro lado, a sequencia “33333” tem propriedades que a diferencia de outras como 1097. Se você olhar a sequência 33333 não com o numero três repetido cinco vezes, mas sim como a repetição 5 vezes do mesmo algarismo, seja lá qual for ele, fica claro a diferença entre essa sequência e a sequência 1097.

    Outra saída, supondo que estivessemos num experimento cujo objeto de estudo é um gerador de numeros. Na eventualidade do achado em questão poder ser fruto do acaso, é possível se verificar isso. Retornando ao exemplo das 20 tentativas, se tentamos achar relaçoes entre vários pares de variáveis e a probabilidade de encontrar ao acaso relações entre variáveis for de 0.05, encotraremos uma relação ao acaso. A questão é que mesmo que a cada rodada encontraremos UMA relação, não será a MESMA relação em todas as rodadas, caso estejamos vendo algo fruto do acaso. Caso encontremos a mesma relação rodada após rodada, pode-se afirmar que o padrão não é ao acaso. Isso acontece pois na primeira rodada uma relação entre quaisquer dos 20 pares de variáveis seria considerado um acerto, já que na segunda rodada somente seria considerado um acerto uma relação entre a mesma relação encontrada na rodada anterior. E pode-se repetir esse experimento inúmeras vezes, até chegar ao ponto de certeza que o investigador desejar. No caso da sequência 33333, o teste bota em evidência a diferença entre essa sequência e 1097. Qualquer algarismo que siga a sequencia 1097 será válido, enquanto que somente o número 3 será considerado válido como próximo algarismo da sequencia 33333.

    A sequência 33333 tem essa propriedade. Não é uma sequência de algarismos, é uma sequência do MESMO algarismo 5 vezes. Essa diferença é crucial. Há muito mais sequências possíveis de algarismos que de algarismos iguais. Além disso, que já reduz a probabilidade da sequencia ser por acaso, a sequencia 33333 faz a previsão de que o próximo algarismo será 3 também, algo que não está presente na sequência 1097 por exemplo.

    Para concluir, vale a pena relembrar os pontos mais importantes. Ao se considerar a probabilidade de que uma sequência, uma relação entre pares de variáveis ou qualquer outra coisa, é necessário se levar em conta fatores além da mera probabilidade do evento em questão ter ocorrido ao acaso. Entre esses fatores está a quantidade de tentativas de encontrar uma relação. Além disso, mesmo que sequências improváveis ocorram ao acaso, a probabilidade de que seja a mesma sequencia é ainda assim baixa. Isso diferencia a sequencia 33333 de outras sequencias, pois ela é uma sequencia de algarismos tão provável quanto qualquer outra mas o fato de ser cinco algarismos iguais e de que se quisermos verificar se a sequência é ao acaso podemos ver o próximo numero da sequência que só poderá ser 3 e não qualquer outro.

  7. Diego Caleiro Says:

    Paralelo.

    Concordo com seu argumento a favor da existência de coincidências.

    Quero fazer a seguinte concessão:
    1 Coincidências (incidências ao mesmo tempo de duas coisas improváveis) ocorrem.
    Ou seja, que um ser humano encontre o número 33333 é sim uma coincidência, afinal, como vc explicou, estamos levando o humano em conta.

    O que não existe é uma coincidência que ultrapassa seus valores probabilísticos só por ser uma coincidência. Ou seja, não é mais provável que dê 33333 do que que dê 32323 só porque 33333 é coincidência.

    Quanto a probabilidade ser subjetiva, lhe coloco a seguinte questão, redirecionada de um professor de Harvard, em sua aula “Fundações da probabilidade” :

    O que é a probabilidade?
    Porque quando lançamos uma moeda um milhão de vezes e ela cai 500 087 para um lado dizemos que a probabilidade de cair para esse lado é 50% e não 50,0087% se a nossa informação empírica não fornece nenhum 50%?

    Faça sua resposta 1 ser compatível com a resposta 2.

  8. Mark Whalberg Says:

    I like targets. I eat brak from straw. I must deny the way it sound, if i unseek a 50% porcente it shows the sook unbeneath the watery slow.

Deixar mensagem para João Lourenço Cancelar resposta