A Lei de Bayes

A Lei de Bayes (ou Teorema de Bayes, ou Regra de Bayes) é um teorema fundamental em Probabilidade e Estatística. Segundo o matemático britânico Sir Harold Jeffreys (1891-1989), a Lei de Bayes “está para a Teoria de Probabilidades assim como o Teorema de Pitágoras está para a Geometria”!

Esta lei matemática permite calcular a probabilidade de um dado acontecimento ocorrer tendo em consideração informação que o condiciona. Por exemplo, sabendo que a prevalência da doença de Alzheimer aumenta com a idade, tal possibilita o uso do Teorema de Bayes para melhor estimar se um dado paciente tem ou não a doença consoante a sua idade. O teorema está na base da inferência bayesiana, que é uma ferramenta estatística crucial em análise de dados de variados géneros. É aplicado em muitas áreas, desde a Medicina, à Engenharia, passando por Economia, Desporto, Lei, entre outros.   

Thomas Bayes (1701-1761) foi um padre e matemático inglês que formulou um caso particular do teorema que hoje tem o seu nome. O trabalho de Bayes só foi publicado após a sua morte, tendo sido editado pelo matemático galês Richard Price (1723-1791). Não é claro o quanto terá Price contribuído para o resultado final. Alguns anos mais tarde, o matemático francês Pierre-Simon Laplace (1749-1827) reproduziu e desenvolveu os resultados de Bayes.

(Antes de prosseguir, talvez lhe seja útil recordar algumas noções básicas sobre probabilidades no artigo onde mostro como calcular a probabilidade de ganhar o euro milhões.)

Tal como acontece com muitos outros resultados importantes da Matemática, também este tem uma formulação bastante simples e concisa, não obstante as suas vastas consequências práticas e filosóficas. Seja P(A|B) a probabilidade condicional de um acontecimento A ocorrer dada a ocorrência passada de um outro acontecimento B. Segundo o Teorema de Bayes, temos que:

onde P(B|A) é a probabilidade de B acontecer dada a ocorrência de A e P(A) e P(B) são as probabilidades de A e B acontecerem de forma independente, isto é, sem estarem condicionados pela ocorrência de outros acontecimentos.

Analisemos um exemplo simples para clarificarmos estas noções. Imagine que tenho quatro moedas em cada mão:  na esquerda tenho uma moeda de 1€ e três moedas de 2€, enquanto que na mão direita tenho duas moedas de 1€ e duas moedas de 2€. Todas as moedas têm uma igual probabilidade de me caírem das mãos. Deixo cair uma moeda de 2€. Qual a probabilidade desta moeda ter-me caído da mão esquerda?

A lógica diz-nos de imediato que a probabilidade da moeda me ter caído da mão esquerda deve ser superior a 50%, visto termos uma maior fracção de moedas de 2€ nesta mão (3/4) em comparação com a mão direita (2/4).

Usando a notação do teorema: A refere-se ao acontecimento de me cair uma moeda da mão esquerda; enquanto que B corresponde à queda de uma moeda de 2€. P(A) é 50%, pois, como disse, a probabilidade de cair uma moeda da mão esquerda é igual à probabilidade dela cair da mão direita. P(B) é a probabilidade de cair uma moeda de 2€, independentemente da mão. Como explicado no artigo supracitadoP(B) calcula-se da seguinte forma:

O primeiro termo refere-se à possibilidade da moeda de 2€ ter caído da mão esquerda (50% de possibilidade de ser a mão esquerda), na qual 75% das moedas eram de 2€; o segundo termo corresponde à mão direita (50%), onde 50% das moedas eram de 2€.

Finalmente, falta-nos P(B|A) que é a probabilidade de cair uma moeda de 2€ sabendo que a moeda caiu da mão esquerda, ou seja, P(B|A) corresponde à fracção de moedas na mão esquerda (0.75). Aplicando o Teorema de Bayes:

Este resultado pode ser confirmado, por exemplo, repetindo muitas vezes a “experiência” e medindo a frequência com que de facto a moeda caiu da mão esquerda ou da mão direita. Como expliquei no artigo sobre a Estatística das Sondagens, a Lei dos Grandes Números garante que a frequência com que um dado evento acontece tende para a probabilidade “teórica” do mesmo acontecer, à medida que aumentamos o número de experiências.

Ainda se lembra do artigo em que lhe falei do Problema de Monty Hall? Convido-o a recordar o problema, pois o mesmo pode ser resolvido usando este teorema! De forma muito sumária: (i) você está num concurso no qual pode escolher uma de três malas fechadas, sendo que só uma delas contém um prémio; (ii) você escolhe uma das malas; (iii) o apresentador do concurso, que sabe onde se encontra o prémio, mostra-lhe que o prémio não está numa das outras duas malas e pergunta-lhe se depois de saber isso, você quer mudar de mala. A resposta contra-intuitiva é sim, é vantajoso mudar, porque a partir do momento em que uma mala é aberta, a outra que ficou fechada, e que você não escolheu no início, passou a ter 2/3 de probabilidade de conter o prémio! Quer tentar provar este resultado usando o Teorema de Bayes?

Se tentou é possível que tenha tropeçado na correcta definição dos acontecimentos A e B. É comum a maioria das pessoas terem dificuldade neste aspecto, portanto não se sinta desmotivado, caso não tenha conseguido chegar à solução.

O acontecimento A corresponde à escolha inicial da mala, na qual tem 1/3 de probabilidade de acertar naquela que tem o prémio (P(A)=1/3). Por sua vez, o acontecimento B refere-se à abertura de uma das outras malas que não contém o prémio. Se as malas estiverem numeradas de 1 a 3, e se você escolheu a mala 1, no acontecimento B temos a probabilidade do apresentador abrir a mala 2 ou a mala 3. O acontecimento B trata-se então da abertura específica de uma das outras malas (digamos a número 2). Existem três cenários possíveis: se o prémio estiver na mala 1, o apresentador irá abrir a mala 2 com 50% de probabilidade; se o prémio estiver na mala 2, a probabilidade do apresentador a abrir é nula; se o prémio estiver na mala 3, tal implica que o apresentador terá que abrir a mala 2. Isto traduz-se na seguinte expressão:

Cada cenário tem 1/3 de probabilidade de ocorrer, e cada um está associado a uma probabilidade diferente da mala 2 ser aberta pelo apresentador.

Finalmente, P(A|B) é a probabilidade do prémio estar na mala que se escolheu inicialmente, atendendo a que não estava numa das outras malas, enquanto que P(B|A) é a probabilidade do apresentador escolher uma das duas malas atendendo que o prémio está na mala escolhida por você (50%). Portanto:

Por sua vez, podemos também calcular a probabilidade do prémio estar na outra mala. Por serem acontecimentos complementares, deduz-se de imediato que esta probabilidade tem que ser 2/3 (isto é, a soma desta probabilidade com P(A|B) tem que ser igual a 1). Este resultado também pode ser obtido usando o Teorema de Bayes:

Seja C o acontecimento em que o prémio está na outra mala. Como deverá ser claro, de forma independente, no início, P(C)=P(A)=1/3. A probabilidade P(B) continua a ser a mesma. P(C|B) é a probabilidade que queremos encontrar, isto é, a probabilidade do prémio estar na “outra mala” (não escolhida), após a abertura de uma das malas pelo apresentador. Por sua vez, P(B|C) é a probabilidade de se abrir uma das “outras” malas atendendo que o prémio está numa delas. Como referido em cima, neste caso o apresentador só tem uma opção, portanto P(B|C)=1.

Como P(C|B) é maior que P(A|B) isto implica que é mais provável acertar-se na mala com o prémio caso alteremos a nossa escolha quando o apresentador nos dá essa opção.

Um outro exemplo da aplicação do teorema pode ser feito para resolver a Falácia do Procurador. Neste caso, a Lei de Bayes permite corrigir a probabilidade de, por exemplo, um dado exame médico dar um resultado positivo, dada a sua dependência com a população no qual é usado (isto é, a probabilidade desta população ter de facto a condição médica em causa). Deixo-lhe o desafio de analisar o problema presente nesse artigo e resolvê-lo usando este teorema.

 

Os exemplos são na verdade inúmeros: à medida que o tempo passa, o futuro possível transforma-se num passado determinado, o que implica que as probabilidades presentes sobre eventos futuros vão-se alterando em função do que de facto vai acontecendo. Assim, a Lei de Bayes estabelece a base matemática para calcular as correcções probabilísticas que ocorrem a todo o momento.

 

stats

“O nosso especialista em estatística virá mais tarde para lhe explicar o porquê de não ter nada com que se preocupar.”

Deixe um comentário

O seu endereço de email não será publicado.

Este site utiliza o Akismet para reduzir spam. Fica a saber como são processados os dados dos comentários.