A Lei de Bayes

A Lei de Bayes (ou Teorema de Bayes, ou Regra de Bayes) é um teorema fundamental em Probabilidade e Estatística. Segundo o matemático britânico Sir Harold Jeffreys (1891-1989), a Lei de Bayes “está para a Teoria de Probabilidades assim como o Teorema de Pitágoras está para a Geometria”!

Esta lei matemática permite calcular a probabilidade de um dado acontecimento ocorrer tendo em consideração informação que o condiciona. Por exemplo, sabendo que a prevalência da doença de Alzheimer aumenta com a idade, tal possibilita o uso do Teorema de Bayes para melhor estimar se um dado paciente tem ou não a doença consoante a sua idade. O teorema está na base da inferência bayesiana, que é uma ferramenta estatística crucial em análise de dados de variados géneros. É aplicado em muitas áreas, desde a Medicina, à Engenharia, passando por Economia, Desporto, Lei, entre outros.   

Thomas Bayes (1701-1761) foi um padre e matemático inglês que formulou um caso particular do teorema que hoje tem o seu nome. O trabalho de Bayes só foi publicado após a sua morte, tendo sido editado pelo matemático galês Richard Price (1723-1791). Não é claro o quanto terá Price contribuído para o resultado final. Alguns anos mais tarde, o matemático francês Pierre-Simon Laplace (1749-1827) reproduziu e desenvolveu os resultados de Bayes.

(Antes de prosseguir, talvez lhe seja útil recordar algumas noções básicas sobre probabilidades no artigo onde mostro como calcular a probabilidade de ganhar o euro milhões.)

Tal como acontece com muitos outros resultados importantes da Matemática, também este tem uma formulação bastante simples e concisa, não obstante as suas vastas consequências práticas e filosóficas. Seja P(A|B) a probabilidade condicional de um acontecimento A ocorrer dada a ocorrência passada de um outro acontecimento B. Segundo o Teorema de Bayes, temos que:

onde P(B|A) é a probabilidade de B acontecer dada a ocorrência de A e P(A) e P(B) são as probabilidades de A e B acontecerem de forma independente, isto é, sem estarem condicionados pela ocorrência de outros acontecimentos.

Analisemos um exemplo simples para clarificarmos estas noções. Imagine que tenho quatro moedas em cada mão:  na esquerda tenho uma moeda de 1€ e três moedas de 2€, enquanto que na mão direita tenho duas moedas de 1€ e duas moedas de 2€. Todas as moedas têm uma igual probabilidade de me caírem das mãos. Deixo cair uma moeda de 2€. Qual a probabilidade desta moeda ter-me caído da mão esquerda?

A lógica diz-nos de imediato que a probabilidade da moeda me ter caído da mão esquerda deve ser superior a 50%, visto termos uma maior fracção de moedas de 2€ nesta mão (3/4) em comparação com a mão direita (2/4).

Usando a notação do teorema: A refere-se ao acontecimento de me cair uma moeda da mão esquerda; enquanto que B corresponde à queda de uma moeda de 2€. P(A) é 50%, pois, como disse, a probabilidade de cair uma moeda da mão esquerda é igual à probabilidade dela cair da mão direita. P(B) é a probabilidade de cair uma moeda de 2€, independentemente da mão. Como explicado no artigo supracitadoP(B) calcula-se da seguinte forma:

O primeiro termo refere-se à possibilidade da moeda de 2€ ter caído da mão esquerda (50% de possibilidade de ser a mão esquerda), na qual 75% das moedas eram de 2€; o segundo termo corresponde à mão direita (50%), onde 50% das moedas eram de 2€.

Finalmente, falta-nos P(B|A) que é a probabilidade de cair uma moeda de 2€ sabendo que a moeda caiu da mão esquerda, ou seja, P(B|A) corresponde à fracção de moedas na mão esquerda (0.75). Aplicando o Teorema de Bayes:

Este resultado pode ser confirmado, por exemplo, repetindo muitas vezes a “experiência” e medindo a frequência com que de facto a moeda caiu da mão esquerda ou da mão direita. Como expliquei no artigo sobre a Estatística das Sondagens, a Lei dos Grandes Números garante que a frequência com que um dado evento acontece tende para a probabilidade “teórica” do mesmo acontecer, à medida que aumentamos o número de experiências.

Ainda se lembra do artigo em que lhe falei do Problema de Monty Hall? Convido-o a recordar o problema, pois o mesmo pode ser resolvido usando este teorema! De forma muito sumária: (i) você está num concurso no qual pode escolher uma de três malas fechadas, sendo que só uma delas contém um prémio; (ii) você escolhe uma das malas; (iii) o apresentador do concurso, que sabe onde se encontra o prémio, mostra-lhe que o prémio não está numa das outras duas malas e pergunta-lhe se depois de saber isso, você quer mudar de mala. A resposta contra-intuitiva é sim, é vantajoso mudar, porque a partir do momento em que uma mala é aberta, a outra que ficou fechada, e que você não escolheu no início, passou a ter 2/3 de probabilidade de conter o prémio! Quer tentar provar este resultado usando o Teorema de Bayes?

Se tentou é possível que tenha tropeçado na correcta definição dos acontecimentos A e B. É comum a maioria das pessoas terem dificuldade neste aspecto, portanto não se sinta desmotivado, caso não tenha conseguido chegar à solução.

O acontecimento A corresponde à escolha inicial da mala, na qual tem 1/3 de probabilidade de acertar naquela que tem o prémio (P(A)=1/3). Por sua vez, o acontecimento B refere-se à abertura de uma das outras malas que não contém o prémio. Se as malas estiverem numeradas de 1 a 3, e se você escolheu a mala 1, no acontecimento B temos a probabilidade do apresentador abrir a mala 2 ou a mala 3. O acontecimento B trata-se então da abertura específica de uma das outras malas (digamos a número 2). Existem três cenários possíveis: se o prémio estiver na mala 1, o apresentador irá abrir a mala 2 com 50% de probabilidade; se o prémio estiver na mala 2, a probabilidade do apresentador a abrir é nula; se o prémio estiver na mala 3, tal implica que o apresentador terá que abrir a mala 2. Isto traduz-se na seguinte expressão:

Cada cenário tem 1/3 de probabilidade de ocorrer, e cada um está associado a uma probabilidade diferente da mala 2 ser aberta pelo apresentador.

Finalmente, P(A|B) é a probabilidade do prémio estar na mala que se escolheu inicialmente, atendendo a que não estava numa das outras malas, enquanto que P(B|A) é a probabilidade do apresentador escolher uma das duas malas atendendo que o prémio está na mala escolhida por você (50%). Portanto:

Por sua vez, podemos também calcular a probabilidade do prémio estar na outra mala. Por serem acontecimentos complementares, deduz-se de imediato que esta probabilidade tem que ser 2/3 (isto é, a soma desta probabilidade com P(A|B) tem que ser igual a 1). Este resultado também pode ser obtido usando o Teorema de Bayes:

Seja C o acontecimento em que o prémio está na outra mala. Como deverá ser claro, de forma independente, no início, P(C)=P(A)=1/3. A probabilidade P(B) continua a ser a mesma. P(C|B) é a probabilidade que queremos encontrar, isto é, a probabilidade do prémio estar na “outra mala” (não escolhida), após a abertura de uma das malas pelo apresentador. Por sua vez, P(B|C) é a probabilidade de se abrir uma das “outras” malas atendendo que o prémio está numa delas. Como referido em cima, neste caso o apresentador só tem uma opção, portanto P(B|C)=1.

Como P(C|B) é maior que P(A|B) isto implica que é mais provável acertar-se na mala com o prémio caso alteremos a nossa escolha quando o apresentador nos dá essa opção.

Um outro exemplo da aplicação do teorema pode ser feito para resolver a Falácia do Procurador. Neste caso, a Lei de Bayes permite corrigir a probabilidade de, por exemplo, um dado exame médico dar um resultado positivo, dada a sua dependência com a população no qual é usado (isto é, a probabilidade desta população ter de facto a condição médica em causa). Deixo-lhe o desafio de analisar o problema presente nesse artigo e resolvê-lo usando este teorema.

 

Os exemplos são na verdade inúmeros: à medida que o tempo passa, o futuro possível transforma-se num passado determinado, o que implica que as probabilidades presentes sobre eventos futuros vão-se alterando em função do que de facto vai acontecendo. Assim, a Lei de Bayes estabelece a base matemática para calcular as correcções probabilísticas que ocorrem a todo o momento.

 

stats

“O nosso especialista em estatística virá mais tarde para lhe explicar o porquê de não ter nada com que se preocupar.”

Deixe um comentário

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.