Explicando probabilidade condicional e o Teorema de Bayes.

Autor

Gilberto Pereira Sassi

Data de Publicação

1 de janeiro de 2024

Neste texto,vamos ver algumas das propriedades das probabilidades começando com probabilidade condicional, e, em seguida, vamos apresentar o Teorema da Probabilidade Total e o Teorema de Bayes.

Probabilidade condicional

Suponha que um camarada descobriu que o resultado do fenômeno aleatório está dentro do evento B, e ele quer saber a probabilidade de um elemento do evento A ser resultado do fenômeno aleatório. Para não ficar repetindo a frase ser resultado do fenômeno aleatório, vamos simplificar: se um elemento do evento A for resultado do fenômeno aleatório, vamos falar que o evento A aconteceu (ou acontece). Neste contexto, a única forma do evento A acontecer é o resultado do fenômeno estar em A e B simultaneamente (AB), conforme ilustrado na .

Diagrama de Venn com intersecção entre os eventos $A$ e $B$. A único jeito de A acontecer é se o resultado do fenômeno aleatório estiver dentro de $A \cap B$.
Figura 1: Diagrama de Venn com intersecção entre os eventos A e B. O único jeito de A acontecer é se o resultado do fenômeno aleatório estiver dentro de AB.

Imagine que estamos no contexto em que podemos aplicar o princípio da equiprobabilidade. Considere que o evento B tem n1 elementos e que o evento AB tem n2 elementos. Além disso, assuma que o espaço amostral tem N elementos. Note que n2n1. Então, temos n1 resultados possíveis do fenômeno aleatório (sabemos que B acontece), e a probabilidade de A acontecer (sabendo que B acontece) é dada por n2n1, Note que n2n1=NNn2n1=n2Nn1N. Observe que estamos no princípio da equiprobabilidade, então P(AB)=n2N e P(B)=n1N. Consequentemente, concluímos que a probabilidade de A acontecer, se sabemos que B acontece, é dada por P(AB)P(B).

Chamamos a probabilidade de A acontecer sabendo que B acontece de probabilidade condicional, e em Estatística, resumimos a sentença a probabilidade de A acontecer sabendo que B acontece por probabilidade de A dado B. Usamos a seguinte notação matemática para a probabilidade de A dado B: P(AB).

Não precisamos nos restringir ao contexto em que podemos aplicar o princípio da equiprobabilidade, e definimos a probabilidade de A dado B por:

  • P(AB)=P(AB)P(B), se P(B)>0;
  • Por convenção e conveniência, estabelecemos que P(AB)=P(A) se P(B)=0.

Com esta definição de probabilidade condicional, temos a seguinte propriedade chamada de regra do produto:

  • P(AB)=P(AB)P(B);
  • P(AB)=P(BA)P(A).

Vamos ilustrar as ideias de probabilidade condicional com um exemplo. Imagine cinquenta estudantes distribuídos em duas turmas (Turma A e Turma B) conforme a tabela abaixo, e queremos escolhê-los por sorteio para formar uma comissão de estudantes.

Gênero Turma A Turma B Total
Masculino 21 16 37
Feminino 5 6 13
Total 26 24 50

Vamos especificar alguns eventos que usaremos em nossa notação matemática. Lembre-se que usamos as letras maiúsculas do alfabeto latino para representar eventos.

  • A=estudante da turma A;
  • B=estudante da turma B;
  • M=estudante se identifica com gênero masculino;
  • F=estudante se identifica com gênero feminino.

Imagine que queremos escolher por sorteio uma aluna para participar de uma comissão. Neste contexto, sabemos que a pessoa selecionada entre os alunos se identificará com o gênero feminino, e temos 13 pessoas que se identificam com o gênero feminino. Entre estudantes que se identificam com o gênero feminino, 5 são da turma A. Então, a probabilidade da aluna ser da turma A é dada por P(AF)=513=0,38.

Se usarmos a definição de probabilidade condicional, vamos chegar no exato mesmo valor 0,38. De fato, vamos calcular a probabilidade de AF e F usando o princípio da equiprobabilidade, e, depois, usaremos a definição de probabilidade condicional para calcular P(AF): P(AF)=550=0,1;P(F)=1350=0,26;P(AF)=P(AF)P(F)=0,10,26=0,38.

Teorema da probabilidade total

A partir de agora, vamos fazer algumas mágicas interessantes usando probabilidade condicional. Imagine que o espaço amostral pode ser dividido em algumas partes C1,,Cn, conforme ilustrado na onde dividimos o espaço amostral em quatro partes.

Teorema da probabilidade total.
Figura 2: Teorema da probabilidade total.

A probabilidade do evento A é a área do quadrado indicada pelo círculo preenchido com a cor azul. Para calcular a probabilidade do evento indicado pelo círculo A, podemos calcular as probabilidades por partes deste círculo

  • P(AC1);
  • P(AC2);
  • P(AC3);
  • P(AC4);

e depois somar essas probabilidades para obter a probabilidade do círculo P(A)=P(AC1)+P(AC2)+P(AC3)+P(AC4), e, então, usando a regra do produto em P(AC1), P(AC2), P(AC3) e P(AC4) temos que P(A)=P(AC1)P(C1)+P(AC2)P(C2)+P(AC3)P(C3)+P(AC4)P(C4). Chamamos a coleção dos conjuntos C1,,C4 de partição do espaço amostral.

Agora vamos enunciar o Teorema de Probabilidade Total de uma forma geral. Suponha que temos uma participação C1,,Cn do espaço amostral e imagine que queremos calcular a probabilidade do evento A. Além disso, imagine que conhecemos as probabilidades:

  • Probabilidade do evento C1: P(C1);
  • Probabilidade do evento A dado C1: P(AC1);
  • Probabilidade do evento C2: P(C2);
  • Probabilidade do evento A dado C2: P(AC2);
  • Probabilidade do evento C3: P(C3);
  • Probabilidade do evento A dado C3: P(AC3);

  • Probabilidade do evento Cn: P(Cn);
  • Probabilidade do evento A dado Cn: P(ACn);

Então, podemos calcular a probabilidade do evento A através da seguinte equação P(A)=P(AC1)P(C1)+P(AC2)P(C2)++P(ACn)P(Cn).

Vamos considerar um exemplo simples para ilustrar o uso do Teorema da Probabilidade Total. Imagine que um produtor artesanal de sorvete compra leite de três fazendas: fazenda pequena, fazenda média e fazenda grande. 20% de todo o leite usado por este produtor vem da fazenda pequena, 30% de todo o leite usado por este produtor vem da fazenda média e 50% de todo o leite usado por este produtor vem da fazenda grande. Uma inspenção surpresa da Ministério da Agricultura, Pecuária e Abastecimento (MAPA) descobriu que 10% do leite vendido pela fazenda pequena estava adulterado, 30% do leite vendido pela fazenda média estava adulterado e 20% do leite vendido pela fazenda grande estava adulterado. E agora vem a pergunta: quanto leite adulterado este pequeno produtor artesanal de sorvete comprou destas fazendas?

Primeiro vamos definir alguns eventos: A={Galão adulterado};P={Galão produzido pela fazenda pequena};M={Galão produzido pela fazenda média};G={Galão produzido pela fazenda grande}; e sabemos que (usamos as informações do MAPA e do produtor artesanal)

P(AP)=0,1; P(P)=0,2
P(AM)=0,3; P(M)=0,3
P(AG)=0,2; P(G)=0,5

então, usando o Teorema de Probabilidade Total, a proporção (ou probabilidade) de galões adulterados comprados pelo pequeno produtor artesanal de sorvete é dada por P(A)=P(AP)P(P)+P(AM)P(M)+P(AG)P(G),=0,10,2+0,30,3+0,20,5,=0,21.

Teorema de Bayes

Finalmente, e não menos importante, temos o Teorema de Bayes, que foi descoberto pelo pastor presbiteriano Thomas Bayes. Apesar de matematicamente simples, as implicações e aplicações do Teorema de Bayes são extremamente relevantes para a Probabilidade, Estatística e o conhecimento científico como um todo. O Teorema de Bayes nos permite atualizar a probabilidade ou crença de que um evento A será o resultado de um fenômeno aleatório ao coletarmos ou descobrirmos novas informações ou evidências sobre o fenômeno aleatório.

Reverendo Thomas Bayes.
Figura 3: Thomas Bayes: matemático, filósofo e pastor presbiteriano.

Vamos considerar um exemplo. Imagine que a prevalência de um doença, que denotaremos por D1, no Brasil é 20. Ou seja, sem examinar um paciente, um médico estima que este paciente tem a doencça D1 com probabilidade 0,2.

Na consulta médica, o paciente descreveu o sintoma S. Da literatura especilizada em medicina, o médico sabe que este sintoma está presente em apenas três doenças: D1, D2 e D3. Além disso, o médico sabe que

  • a probabilidade de um paciente com a doença D1 apresentar o sintoma S é 20, ou seja, P(SD1)=0,2;
  • a probabilidade de um paciente com a doença D2 apresentar o sintoma S é 40, ou seja, P(SD2)=0,4;
  • a probabilidade de um paciente com a doença D3 apresentar o sintoma S é 15, ou seja, P(SD3)=0,15.

No website do Ministério da Saúde, o médico verificou que a prevalência das doenças D2 e D3 no Brasil são: P(D2)=0,4 e P(D3)=0,15.

Agora vem a pergunta mais importante: após o médico descobrir que o paciente tem o sintoma S, qual é a probabilidade do paciente ter a doença D1? Lembre que antes da consulta, o médico diria que a probabilidade deste paciente ter a doença D1 é 20. Ou seja, queremos calcular a seguinte probabilidade P(D1S), usando a definição de probabilidade condicional e a regra do produto temos que P(D1S)=P(D1S)P(S),=P(D1)P(SD1)P(S), e para calcular P(S) usamos o Teorema da Probabilidade Total P(D1S)=P(D1)P(SD1)P(S),=P(D1)P(SD1)P(D1)P(SD1)+P(D2)P(SD2)+P(D3)P(SD3),=0,20,20,20,2+0,40,4+0,40,15,0,02

Ou seja, ao descobrir que o paciente tem o sintoma S, o médico mudou atualizou a probabilidade do paciente ter a doença D1 de 20 para 2.

Agora vamos enunciar o Teorema de Bayes de uma forma geral. Suponha que temos uma participação C1,,Cn do espaço amostral e considere o evento de interesse A. Além disso, imagine que conhecemos as probabilidades:

  • probabilidade do evento C1: P(C1);
  • probabilidade do evento A dado C1: P(AC1);
  • probabilidade do evento C2: P(C2);
  • probabilidade do evento A dado C2: P(AC2);
  • probabilidade do evento C3: P(C3);
  • probabilidade do evento A dado C3: P(AC3);
  • probabilidade do evento Cn: P(Cn);
  • probabilidade do evento A dado Cn: P(ACn);

Então, as probabilidades dos eventos Ci,i=1,,n acontecerem dado que sabemos ou observamos o evento A é dada por P(C1A)=P(C1)P(AC1)P(C1)P(AC1)++P(Cn)P(ACn),P(C2A)=P(C2)P(AC2)P(C1)P(AC1)++P(Cn)P(ACn),P(CnA)=P(Cn)P(ACn)P(C1)P(AC1)++P(Cn1)P(ACn).

Vamos fazer mais um exemplo para ilustração. Imagine que uma planta industrial tem três linhas de produção, L1,L2,L3, que produzem lotes de um mesmo equipamento eletrônico. Um lote é considerado inadequado para venda se mais de 10 dos equipamentos eletrônicos deste lote forem defeituosos. Considere os seguintes eventos

  • L1=lote vem da linha de produção L1
  • L2=lote vem da linha de produção L2
  • L3=lote vem da linha de produção L3
  • D=mais de 10% equipamentos do lote são defeituosos

Os engenheiros que construíram estas três linhas afirmam que:

  • a probabilidade da linha de produção L1 produzir um lote com mais de 10 dos equipamentos defeituosos é 35, ou seja, P(DL1)=0,35;
  • a probabilidade da linha de produção L2 produzir um lote com mais de 10 dos equipamentos defeituosos é 40, ou seja, P(DL2)=0,4;
  • a probabilidade da linha de produção L3 produzir um lote com mais de 10 dos equipamentos defeituosos é 32,5, ou seja, P(DL3)=0,325;
  • 50 dos lotes desta planta industrial são produzidos pela linha de produção L1, ou seja, P(L1)=0,5;
  • 30 dos lotes desta planta industrial são produzidos pela linha de produção L2, ou seja, P(L2)=0,3;
  • 20 dos lotes desta planta industrial são produzidos pela linha de produção L3, ou seja, P(L3)=0,2.

A equipe do controle de qualidade identificou um lote inadequado, e os engenheiros da planta industrial precisam fazer ajustes nas linhas de produção. A melhor estratégia é começar as análises e ajustes na linha de produção com a maior probabilidade de te ter produzido o lote inadequado. Então, vamos usar o Teorema de Bayes para calcular P(L1D),P(L2D) e P(L3D):

P(L1D)=P(L1)P(DL1)P(D)=P(L1)P(DL1)P(L1)P(DL1)+P(L1)P(DL1)+P(L3)P(DL3)=0,350,50,350,5+0,40,3+0,20,325=0,49P(L2D)=P(L2)P(DL2)P(D)=P(L2)P(DL2)P(L1)P(DL1)+P(L1)P(DL1)+P(L3)P(DL3)=0,40,30,350,5+0,40,3+0,20,325=0,33P(L3D)=P(L3)P(DL3)P(D)=P(L3)P(DL3)P(L1)P(DL1)+P(L1)P(DL1)+P(L3)P(DL3)=0,20,3250,350,5+0,40,3+0,20,325=0,18

Ou seja, a linha de produção com maior probabilidade de ter produzido o lote inaquedo é a linha de produção L1, P(L1D)=0,49, e os engenheiros deveriam começar a análise nesta linha de produção.


© 2025 Ciência de Dados