
Introdução:
--------------

  Macro do ROOT para ilustração do Teorema do Limite Central (Central Limit Theorem- CLT).

  Números aleatórios de diferentes distribuições são adicionados a uma soma, e muitas dessas somas
  são plottet. Como se constatou (e conforme ditado pela CLT), sua distribuição se aproxima de ser uma distribuição gaussiana.
  O exemplo também ilustra como larguras (e, portanto, incertezas) são adicionadas em quadratura, pois é preciso dividir a soma pela raiz quadrada do número de números que entraram na soma, a fim de obter uma distribuição gaussiana de largura unitária (ao usar números aleatórios de largura unitária).

  Para obter mais informações sobre o Teorema do Limite Central, consulte:
   - R. Barlow: página 49
   
   - G. Cowan: página 33: https://www.pp.rhul.ac.uk/%7Ecowan/sda/
   
   - Oguri: página 155
   
   
  - http://en.wikipedia.org/wiki/Central_limit_theorem
  - https://en.wikipedia.org/wiki/Cauchy_distribution
   

  Execute esta macro do ROOT por:
    No prompt:> root -l CentralLimit.c
    Dentro de ROOT:> .x CentralLimit.c
  
  Resultado no arquivo de saída results.root, exibido por:
    No prompt:> root -l results.root
    Seguido por (em ROOT): TBrowser a (use o mouse a partir daí)

  Autor: Troels C. Petersen (NBI / CERN)
 

In [1]:
#include <TFile.h>
#include <TH1F.h>
#include <TRandom3.h>

In [2]:
//---------------------------------------------------------------------------------- 
void CentralLimit()
//---------------------------------------------------------------------------------- 
{
  TRandom3 r;
  const int Nexperiments = 1000;                   // Number of sums produced
  const int Nuniform     = 100;                    // Number of uniform numbers used in sum
  const int Nexponential = 100;                      // Number of exponential numbers used in sum
  const int Ncauchy      = 10;                      // Number of cauchy numbers used in sum

  double pi = 3.14159265358979323846264338328;     // Selfexplanatory!!!

  bool verbose = true;                             // Print some numbers or not?
  int Nverbose = 100;                               // If so, how many?


//----------------------------------------------------------------------------------
// Make histograms (name, title, number of bins, minimum, maximum):

  TH1F *Hist_Sum         = new TH1F("Hist_Sum", "Hist_Sum", 120, -6.0, 6.0);
  TH1F *Hist_Uniform     = new TH1F("Hist_Uniform", "Hist_Uniform", 240, -6.0, 6.0);
  TH1F *Hist_Exponential = new TH1F("Hist_Exponential", "Hist_Exponential", 240, -6.0, 6.0);
  TH1F *Hist_Cauchy      = new TH1F("Hist_Cauchy", "Hist_Cauchy", 240, -6.0, 6.0);


//----------------------------------------------------------------------------------
// Loop over process:
//----------------------------------------------------------------------------------

  for (int iexp = 0; iexp < Nexperiments; iexp++) {
    double sum = 0.0;
    
    // Generating uniform numbers (with mean 0, and RMS of 1):
    for (int i = 0; i < Nuniform; i++) {
      double x = sqrt(12.0) * (r.Uniform() - 0.5);        // Uniform between +-sqrt(3)
      sum += x;
      Hist_Uniform->Fill(x);
      if ((verbose) && (iexp < 1) && (i < Nverbose)) printf("  Uniform:     %7.4f \n", x);
    }

    // Generating exponential numbers (with mean 0, and RMS of 1):
    for (int i = 0; i < Nexponential; i++) {
      double x = -log(r.Uniform()) - 1.0;                // Exponential starting at -1
      sum += x;
      Hist_Exponential->Fill(x);
      if ((verbose) && (iexp < 1) && (i < Nverbose)) printf("  Exponential: %7.4f \n", x);
    }

    // Generating numbers according to a Cauchy distribution (1 / (1 + x^2)):
    for (int i = 0; i < Ncauchy; i++) {
      double x = tan(pi * (r.Uniform() - 0.5));          // Cauchy with mean 0
      sum += x;
      Hist_Cauchy->Fill(x);
      if ((verbose) && (iexp < 1) && (i < Nverbose)) printf("  Cauchy:      %7.4f \n", x);
    }
    
    sum = sum / sqrt(double(Nuniform + Nexponential + Ncauchy));
    Hist_Sum->Fill(sum);
  }


//---------------------------------------------------------------------------------- 
// Write histograms to file:
//---------------------------------------------------------------------------------- 
  TFile *file = new TFile("results.root", "RECREATE", "Histograms");

  Hist_Sum->Write();
  Hist_Uniform->Write();
  Hist_Exponential->Write();
  Hist_Cauchy->Write();

  file->Write();
  file->Close();

}


In [3]:
CentralLimit();

  Uniform:      1.7312 
  Uniform:     -1.1677 
  Uniform:     -0.7530 
  Uniform:      1.5491 
  Uniform:     -0.9296 
  Uniform:     -0.0521 
  Uniform:      1.5847 
  Uniform:      0.8463 
  Uniform:      0.1387 
  Uniform:      0.8312 
  Uniform:      0.9005 
  Uniform:      0.5495 
  Uniform:     -0.6387 
  Uniform:      1.0545 
  Uniform:      0.0681 
  Uniform:     -1.1481 
  Uniform:     -0.0848 
  Uniform:     -0.3730 
  Uniform:     -0.9642 
  Uniform:     -0.9935 
  Uniform:     -1.6270 
  Uniform:     -0.5766 
  Uniform:     -1.0595 
  Uniform:      1.5371 
  Uniform:      0.2769 
  Uniform:      1.3798 
  Uniform:      0.5735 
  Uniform:     -0.0048 
  Uniform:      0.2100 
  Uniform:     -1.1006 
  Uniform:     -0.7049 
  Uniform:     -1.3253 
  Uniform:     -1.5141 
  Uniform:      0.5131 
  Uniform:      0.7809 
  Uniform:      0.4750 
  Uniform:      0.7409 
  Uniform:     -1.3871 
  Uniform:      0.6903 
  Uniform:     -1.3586 
  Uniform:     -1.2843 
  Uniform:      

In [18]:
TBrowser b

(TBrowser &) Name: Browser Title: ROOT Object Browser




Comentários Gerais:
----------
Primeiro familiarize-se com o programa e certifique-se de entender o que
é Teorema do Limite Central. Você entende por que a distribuição uniforme precisa
vá de + -sqrt (3) para dar uma distribuição com uma largura de um (ou seja, unidade) e
por que você subtrai um da distribuição exponencial (e como isso funciona)?

Em seguida, tente ver qual é o resultado da adição de 100 números aleatórios uniformes? Que
distribuição dá (surpresa !!!), e quão bem se assemelha a isso? Tente
exemplo para ajustar esta distribuição com um Gaussiano (em ROOT, clique com o botão direito na linha
da distribuição e selecione "FitPanel" em que você define a função para ser um
"gaus").


Perguntas:
----------
 1) Usando a soma de 10 números aleatórios uniformes com média 0 e largura 1,
    qual é a probabilidade de obter um número além de 3 sigma?
    O que você esperaria de uma distribuição gaussiana verdadeira?
    E a mesma pergunta para 4 sigma?

 2) Por que a distribuição de Cauchy "arruína" a distribuição gaussiana?
    E isso está em conflito com o Teorema do Limite Central?

 3) Se as distribuições originais que são adicionadas a uma soma não tivessem uma média
    de zero e largura unitária, mas em vez disso, cada um tinha uma média e largura diferentes, o que
    seria o resultado ser? O Teorema do Limite Central ainda se aplicaria? E o que
    seria a largura da distribuição resultante?

 4) Qual das três distribuições aleatórias tem uma soma, que converge
    mais rápido para um gaussiano?
    Em geral, qual distribuição convergiria mais rápido?


Questões avançadas:
-------------------
 1) Quantos números aleatórios uniformes precisam ser adicionados, antes da probabilidade
    para a soma seguir uma distribuição gaussiana é maior que 1% (em média)
    ao usar 1000 somas (ou seja, Nexperiments = 1000)?

 2) Tente adicionar um PDF triangular, que novamente tem média 0 e largura 1.
    Por qual (is) método (s) isso é possível?