Skip to content

Latest commit

 

History

History
207 lines (180 loc) · 13.2 KB

File metadata and controls

207 lines (180 loc) · 13.2 KB

Programa de Mentoria BSS 2023

Estatística e Ciência de Dados

https://www.youtube.com/watch?v=Ujao0izC4VQ

Estatística e Ciência de Dados - Aula 05


Retrospectiva

  • Todo matemático é maluco... (eita, olha a generalização)
  • Na última aula, tivemos alguns conceitos de medidas centrais (média, mediana, moda)...
  • Hoje vamos falar mais sobre PROPABILIDADES. Não é possível aprender algo novo sem exercitar essa nova habilidade...
  • Nos próximos meses, vamos começar a acelerar um pouco mais, ter um pouco mais de intensidade, exercícios e etc!
  • Todo discurso moralista é Falso! Quanto a pessoa mais critica, pior é... Em italiano, "puritana, putana"

Probabilidade

  • O que é? Parte da matemática que lida com a jogatina, as chances, as oportunidades... A primeira coisa que precisamos pensar é a noção de:
  • ESPAÇO PROBABILÍSTICO
    • Imagine uma situação de uma caixa. Dentro da caixa há 10 bolas. Dessas, 6 são pretas e 4 são brancas. A caixa é opaca (não podemos ver dentro), e podemos colocar a mão e retirar uma bola. Qual é o meu espaço probabilístico? Quais eventos podem acontecer?
    • Podemos pensar na:
      • P(p) = Probabilidade de bola preta
      • P(b) = Probabilidade de bola branca
      • EP = Espaço probabilístico
    • A probabilidade de um evento acontecer podemos definir da seguinte forma: "É o número de oportunidades do evento acontecer, dividido pelo tamanho do Espaço Probabilístico"
    • P(evento-x) = (nº de oportunidades)/(espaço total)
    • Nos nossos exemplos, vamos ter a probabilidade de um evento aleatório retirar a bola preta, ou a bola branca.
      • P(preta) = (nº de oportunidades)/(espaço total) = (6)/(10) = 0,6 ou então 60%
      • P(branca) = (nº de oportunidades)/(espaço total) = (4)/(10) = 0,4 ou então 40%
    • CONCLUSÃO: A soma das probabilidades SEMPRE deve resultar em 1. "A soma de todas as probabilidades envolvidas em um determinado evento ali vai ser sempre 1." Ou seja, 1 = 100%. De fato, a probabilidade de eu colocar a mão na caixa e retirar uma bola é de 100% (seja ela qual for). Porém, P(preta) = 6/10, e a P(branca) = 4/10, então a chance de ser uma bola é de 1/1.
    • image

Ampliando a quantidade de bolas dentro da caixa...

  • Imaginem agora uma caixa com: 12 bolas pretas, 5 bolas vermelhas, 8 bolas verdes. Total de 25 bolas.
  • Qual o tamanho do Espaço Amostral/Probabilístico?
    • 25 bolas = 25/25 = 1/1 = 100%
  • Qual a probabilidade de eu tirar uma bola preta? E vermelha? E verde?
    • P(preta) = 12 / 25 = 0,48
    • P(vermelha) = 5 / 25 = 0,20
    • P(verde) = 8 / 25 = 0,32
    • Soma dos valores será de:
      • (12/25) + (5/25) + (8/25) = (12+5+8)/(25) = 25/25 = 1 = 100%
    • Notem que temos o mesmo denominador (25), então podemos manter o denominador comum e somar os numeradores (12 + 5 + 8).
    • A maior chance é de tirar uma bola preta (12 > 8 > 5). Porém, a chance de tirar verde OU vermelha (8+5) é ligeiramente maior que a de tirar preta (12 < 13).
  • image

Probabilidade do Evento Complementar

  • A Probabilidade do Evento Complementar é o
  • Novo exemplo, imagine uma caixa com 12 bolas pretas, 7 bolas vermelhas, 5 bolas azuis.
    • P(preta) = (12)/(12+7+5) = (12)/(24) = 1/2 = 0,5 = 50%
    • P(vermelha) = (7)/(12+7+5) = (7)/(24) = 7/24 ≅ 0,2916666666666667 ≅ 29%
    • P(azul) = (5)/(12+7+5) = (5)/(24) = 5/24 ≅ 0,2083333333333333 ≅ 21%
    • Qual a probabilidade de tirar uma bola que NÃO SEJA PRETA?
      • 50%! Vamos ver, a Probabilidade de NÃO ser preta é igual a 1 menos a probabilidade de ela ser preta.
        • P(~preta) = (1 - P(preta))
        • Sendo que P(preta) = 12/24 = (1 * 12)/(2 * 12) = 1/2 = 0,5
        • Então teremos que P(~preta) = 1 - (12/24) = [(24/24) - (12/24)] = (24 - 12)/24 = 12/24 = 0,5
        • A probabilidade de não ser preta pode ser expressa de duas maneiras:
          • A soma da P(azul) + P(vermelha) é a chance de NÃO SER PRETA.
          • P(~preta) = P(azul) + P(vermelha) = (5/24) + (7/24) = (5+7)/24 = 12/24 = (1 * 12)/(2 * 12) = 1/2 = 0,5
        • image  
  • Podemos pensar também no EVENTO COMPLEMENTAR (ou seja, de não ser uma bola preta).
  • Qual a probabilidade de NÃO-SER uma bola preta? Temos o conjunto das bolas pretas. E o COMPLEMENTO é o conjunto de todas as possibilidades que NÃO-SÃO bolas pretas.
    - Conjunto Bolas Pretas = { ⚫⚫⚫⚫⚫⚫⚫⚫⚫⚫⚫⚫ }
    - Conjunto Bolas Vermelhas = { 🔴🔴🔴🔴🔴🔴🔴 }
    - Conjunto Bolas Azuis = { 🔵🔵🔵🔵🔵 }
    
  • Vamos lembrar das QUALIFICAÇÕES, onde temos um "conjunto das bolas" e temos também um "conjunto das bolas pretas" (A). Temos também um "conjunto das bolas vermelhas" (B). Temos também um "conjunto das bolas azuis" (C).
  • Observe que a INTERSECÇÃO de A, B, C é vazio: A ∩ B ∩ C = ∅, ou seja, CONJUNTO DISJUNTOS, "uma coisa é uma coisa, outra coisa é outra coisa"
    • Ou seja, uma bola preta não pode ser vermelha nem azul. Uma bola não pode ter uma cor E outra ao mesmo tempo, logo, não existe intersecções (Conjuntos Disjuntos), ou seja, Intersecção = ∅ = { }.
  • A probabilidade de não-ser-preta é justamente a probabilidade de ser um dos conjuntos B e C. Então o COMPLEMENTO de A, é o B + C.
    • Evento Complementar de A = B ∪ C, é aquilo que falta àquilo pra ser um conjunto total.
  • P(~preta) = Complemento do Conjunto das Pretas = Conj.(vermelho) + Conj.(azul).
  • P(~preta) = 1 - P(preta)
  • P(~preta) = P(vermelha) + P(azul)
  • P(~p) = 1 - 0,5 = 0,5
  • image
  • Nesse exemplo, não ficou claro pois temos poucas opções de eventos distintos... Vamos nos aprofundar...

Vamos adicionar complexididade na caixa...

  • Imagine uma caixa com 40 cores diferentes de bolas (como uma piscina de bolas de parquinho infantil). Eu sei a quantidade exata de cada cor de bolas.
  • Qual a probabilidade de NÃO-SER amarela, escolhendo ao acaso?
  • O total do conjunto é de 100 bolas, divididas em 18 cores diferentes. Sei também que temos 12 bolas amarelas.
  • Qual a Probabilidade do Evento Complementar? Temos duas opções de calcular:
    • Somando todas as outras bolas coloridas, sendo 17 frações de cores diferentes. Por exemplo: P(preta) + P(vermelha) + P(azul) + P(rosa) + ... EXCETO a P(amarelo). Um espaço amostral com muitos elementos tornará a soma demasiada longa.
    • Ou, com o Teorema do Evento Complementar, posso apenas trabalhar com: P(~amarela) = 1 - P(amarela)
      • P(amarela) = (12) / (100) = (4 * 3)/(4 * 25) = 3/25 = 0,12
      • P(~amarela) = 1/1 - (3/25) = (25/25)-(3/25) = 22/25 = 0,88  
  • A vantagem do Teorema do Evento Complementar é que eu não preciso me preocupar com todas as outras amostras.
  • Basta saber a probabilidade do que eu quero, que por tabela, saberei a probabilidade daquilo que eu não quero.
  • Se eu sei a probabilidade do SER, eu também sei a probabilidade do ~SER (não-ser).
  • Se houver um espaço amostral de 500 tipos diferentes, fica difícil calcular um evento composto por todos os demais, basta calcular a diferença do que eu sei.
  • image

Probabilidade do Evento Composto

  • Evento composto é quando eu tenho dois eventos em seqüência.
  • No exemplo da caixa, com 10 bolas pretas, 10 bolas amarelas, 10 bolas roxas. Totalizando 30 bolinhas.
    Bolas Pretas = {⚫⚫⚫⚫⚫⚫⚫⚫⚫⚫}
    Bolas Amarelas = {🟡🟡🟡🟡🟡🟡🟡🟡🟡🟡}
    Bolas Roxas = {🟣🟣🟣🟣🟣🟣🟣🟣🟣🟣}
    
    • As probabilidades são iguais, entre as bolas, ao acaso, num primeiro momento.
  • Imaginem o seguinte EVENTO: "Vamos retirar duas bolas em seqüência, e qual seria a probabilidade de ambas serem roxas?"
    • Agora, temos 3 tipos de bolas, mas vamos fazer um passo de cada vez:
    • Qual a probabilidade da primeira bola ser roxa?
      • P(1ª.roxa) = 10/30 = 1/3 ≅ 0,3333333333333333
    • Qual a probabilidade da segunda bola ser roxa? Não é a mesma, pois já tirei uma bola antes (reduz 1 do numerado e 1 do denominador)... Existe uma DEPENDÊNCIA entre os eventos.
      • P(2ª.roxa) = 9/29 ≅ 0,3103448275862069
    • Qual a probabilidade de esse evento acontecer em seqüência (1ª.roxa E 2ª.roxa)? A probabilidade é o produto delas.
      • P(1ª.🟣 ∧ 2ª.🟣) = P(1ª.🟣) * P(2ª.🟣)
        P(1ª.roxa ∧ 2ª.roxa) = (1/3) * (9/29) = 9/87 ≅ 0,103448275862069 ≅ 10%
        
      • Sim, a probabilidade é muito baixa, pois cada produto entre 0 e 1, aumentamos os espaços e tendemos à zero.
    • Qual a probabilidade de tirarmos, nessa seqüência, uma bola preta, uma amarela e uma roxa, nessa ordem?
      • P(preta) = P(⚫) = 10/30 = 1/3 ≅ 0,3333333333333333
      • P(amarela) = P(🟡) = 10/30 = 1/3 ≅ 0,3333333333333333
      • P(roxa) = P(🟣) = 10/30 = 1/3 ≅ 0,3333333333333333
      • P(1ª.preta) ∧ P(2ª.amarela) ∧ P(3ª.roxa) = P(⚫) * P(🟡)' * P(🟣)'' P' exclui o primeiro evento, P'' exclui o primeiro e o segundo evento
      • P(⚫) * P(🟡)' * P(🟣)'' = (10/30) * (10/29) * (10/28)
                                  = (1/3) * (10/29) * [(2*5)/(2*14)]
                                  = (1/3) * (10/29) * (5/14)
                                  ≅ 0,3333333333333333 * 0,3448275862068966 * 0,3571428571428571
                                  ≅ 0,041050903
                                  ≅ 4,105%   
        
      • image

Ayrton Senna

  • Vamos imaginar que eu tenho uma probabilidade, em cada corrida, de morrer de 10% (Evento Principal). Para cada 100 eventos, tenho 10 chances de morrer.
  • O Evento Composto é a chance de TERMINAR A CORRIDA VIVO!
  • Se a probabilidade de morrer é 10%, a probabilidade de viver é de 90%. (Evento Complementar)
  • A probabilidade de chegar Vivo = 0,9. Como os eventos são independentes, um evento anterior não influencia um evento posterior.
  • A probabilidade de chegar Vivo na segunda corrida = (0,90) * (0,90) = 0,81 .
  • A probabilidade de Viver-Viver = 0,81.
  • A probabilidade de Viver-Viver-Viver = 0,9 * 0,9 * 0,9 = 0,729.
  • A probabilidade de Viver-Viver-Viver-Viver = 0,9 * 0,9 * 0,9 * 0,9 = 0,6561
  • A probabilidade de Viver-Viver-Viver-Viver = 0,9 * 0,9 * 0,9 * 0,9 * 0,9 = 0,59049
  • Em outros termos, teremos:
    • P(1ª.viver) = (0,9)¹
    • P(2ª.viver) = (0,9)²
    • P(3ª.viver) = (0,9)³
    • P(4ª.viver) = (0,9)^4
    • P(5ª.viver) = (0,9)^5
  • Assim, sucessivamente... "In the long run, we are all dead!" - Maynard Keynes
  • Senna concluiu que: "Se você correr tempo suficiente, morrer é inevitável!"
  • image

Dúvida

  • DÚVIDA: "A ordem em que as bolas foram retiradas influencia no cálculo se o número de bolas forem distintos?"
    • As quedas (retiradas de bolas) são iguais, logo não influencia e o resutado é o mesmo para o OPERADOR DE MULTIPLICAÇÃO (PRODUTO).
  • Imaginem uma caixa com 10 bolas pretas, 10 bolas amarelas, 10 bolas verdes. Qual a probabilidade de, nessa ordem, retirarmos Preta-Preta-Verde?
    • P(1ª.⚫) ∧ P(2ª.⚫) ∧ P(3ª.🟢) =    
      P(1ª.preta) * P(2ª.preta) * P(3ª.verde) = 
      P(⚫⚫🟢) = (10/30) * (9/29) * (10/28) = (10 * 9 * 10) / (30 * 29 * 28) = (900 / 24360) = (90 / 2436) ≅ 0,0369458128078818
      
    • P(1ª.⚫) ∧ P(2ª.🟢) ∧ P(3ª.⚫) =
      P(1ª.preta) * P(2ª.verde) * P(3ª.preta) = 
      P(⚫🟢⚫) = (10/30) * (10/29) * (9/28) = (10 * 10 * 9) / (30 * 29 * 28) = (900 / 24360) = (90 / 2436) ≅ 0,0369458128078818
      
  • Considerando que a ordem de retirada das cores não influencia esses eventos, temos a mesma proporção de chances...
  • P(⚫⚫🟢) = P(⚫🟢⚫) = P(🟢⚫⚫)  
  • Em outro exemplo, teremos 1 bola preta, 2 bolas amarelas, 3 bolas verdes.
  • Qual a chance de tirar, nessa seqüência, as cores Preta-Verde-Verde?
    • P(⚫), P(🟡🟡), P(🟢🟢🟢) = 6 bolas
    • P(⚫🟢🟢) = ?
    • P(⚫🟢🟢) = (1/6) * (3/5) * (2/4) = 6/120 = (2 * 3)/(2 * 60) = 3/60 = (3 * 1)/(3 * 20) = 1/20 = 0,05
      
    • E agora, qual a probabilidade de tirarmos P(🟢🟢⚫)?
      P(🟢🟢⚫) = (3/6) * (2/5) * (1/4) = 6/120 = (2 * 3)/(2 * 60) = 3/60 = (3 * 1)/(3 * 20) = 1/20 = 0,05
      
    • Ou seja, a ordem não vai alterar, se o sistema permanecer isolado e seqüencial, considerando A MESMA AMOSTRA, probabilidade constante não importando a ordem nesses exemplos.
  • image

FIM!