Introdução:
---------------

Macro do ROOT para ajustar pontos com erros a uma função definida pelo usuário.

   Esta macro do ROOT exemplifica o uso de ${\chi}^2$ como uma medida de adequação, como essa distribuição acontece, e que realmente funciona! Ao mesmo tempo, é também uma ilustração de como fazer um ajuste linear analiticamente, ou seja, sem executar o algoritmo de ajuste (denominado Minuit).
   
   - https://root.cern.ch/doc/master/classTMinuit.html

   Referências:
     - Barlow: Capítulo 6
     - Cowan: Capítulo 2.7, Capítulo 7
     - Bevington: Capítulo 6
     - Oguri : Capítulo 5

   Autor: Troels C. Petersen (CERN)
  

In [6]:
// ----------------------------------------------------------------------------------- //
double sqr(double a) {
// ----------------------------------------------------------------------------------- //
  return a*a;
}


In [7]:
// ----------------------------------------------------------------------------------- //
void ChiSquareTest() {
// ----------------------------------------------------------------------------------- //
  gROOT->Reset();

  // Setting of general plotting style:
  gStyle->SetCanvasColor(0);
  gStyle->SetFillColor(0);

  // Settings for statistics box:
  gStyle->SetOptStat(1111);
  gStyle->SetOptFit(1111);

  // Random numbers from the Mersenne-Twister:
  TRandom3 r;
  // r.SetSeed(0);  // Initializing the random numbers!

  TLatex *text = new TLatex();
  text->SetNDC();
  text->SetTextFont(1);
  text->SetTextColor(1);


  // ------------------------------------------------------------------ //
  // Make Histograms:
  // ------------------------------------------------------------------ //

  TH1F* Hist_alpha0 = new TH1F("Hist_alpha0", "Hist_alpha0", 80,  0.0,  8.0);
  TH1F* Hist_alpha1 = new TH1F("Hist_alpha1", "Hist_alpha1", 80, -0.25, 1.35);

  TH1F* Hist_Chi2   = new TH1F("Hist_Chi2",   "Hist_Chi2",   20,  0.0, 20.0);
  TH1F* Hist_Prob   = new TH1F("Hist_Prob",   "Hist_Prob",   20,  0.0,  1.0);

  TGraphErrors* graph;


  // ------------------------------------------------------------------ //
  // Loop over generating and fitting data:
  // ------------------------------------------------------------------ //

  const int Nexp = 1000;

  const int Npoints = 9;
  double x[Npoints];
  double ex[Npoints];
  double y[Npoints];
  double ey[Npoints];

  double alpha0 = 3.6;
  double alpha1 = 0.3;
  double sigmay = 1.0;

  for (int iexp=0; iexp < Nexp; iexp++) {

    // Generate data:
    // --------------
    for (int i=0; i < Npoints; i++) {
      x[i]  = double(i+1);
      ex[i] = 0.0;
      y[i]  = alpha0 + alpha1 * x[i] + r.Gaus(0.0,sigmay);
      ey[i] = sigmay;
    }

    // Save first example:
    if (iexp == 0) graph = new TGraphErrors(Npoints, x, y, ex, ey);


    // Fit data analytically:
    // ----------------------
    double s   = 0.0;
    double sx  = 0.0;
    double sxx = 0.0;
    double sy  = 0.0;
    double sxy = 0.0;
    for (int i=0; i < Npoints; i++) {
      s   += 1.0;
      sx  += x[i];
      sxx += sqr(x[i]);
      sy  += y[i];
      sxy += x[i] * y[i];
    }
    double Delta = sxx * s - sqr(sx);
    double alpha0_calc = (sy  * sxx - sxy * sx) / Delta;
    double alpha1_calc = (sxy * s   - sy  * sx) / Delta;
    double sigma_alpha0_calc = sigmay * sqrt(sxx / Delta);
    double sigma_alpha1_calc = sigmay * sqrt(s   / Delta);


    // Fit data numerically:
    // ---------------------
    TGraphErrors* graph = new TGraphErrors(Npoints,x,y,ex,ey);
    TF1 *fit = new TF1("fit", "[0] + [1]*x", 0.5, 9.5);
    graph->Fit("fit","rq");

    double alpha0_fit = fit->GetParameter(0);
    double alpha1_fit = fit->GetParameter(1);
    double sigma_alpha0_fit = fit->GetParError(0);
    double sigma_alpha1_fit = fit->GetParError(1);

    double Chi2 = fit->GetChisquare();
    double Ndof = fit->GetNDF();
    double Prob = fit->GetProb();

    if (iexp < 25)
      printf("  Calc:%6.3f+-%5.3f  %5.3f+-%5.3f    Fit:%6.3f+-%5.3f  %5.3f+-%5.3f   Prob=%6.4f \n",alpha0_calc, sigma_alpha0_calc,  alpha1_calc, sigma_alpha1_calc,
alpha0_fit,  sigma_alpha0_fit,   alpha1_fit,  sigma_alpha1_fit, Prob);


    // Fill histograms:
    Hist_alpha0->Fill(alpha0_calc);
    Hist_alpha1->Fill(alpha1_calc);
    
    Hist_Chi2->Fill(Chi2);
    Hist_Prob->Fill(Prob);
  }



  // ------------------------------------------------------------------ //
  // Fit the data and plot the result:
  // ------------------------------------------------------------------ //

  // Make a white canvas and draw the example fit in:
  TCanvas *c0 = new TCanvas("c0","",100,20,600,450);
  c0->SetFillColor(0);

  graph->SetLineWidth(2);
  graph->SetMarkerStyle(20);
  graph->SetMarkerColor(2);
  graph->Draw("AP");


  // Make another white canvas:
  if (Nexp > 1) {
    TCanvas *c1 = new TCanvas("c1","",750,260,600,450);
    c1->SetFillColor(0);
    c1->Divide(2,2);
    
    c1->cd(1);
    Hist_alpha0->Draw();

    c1->cd(2);
    Hist_alpha1->Draw();
    
    c1->cd(3);
    Hist_Chi2->Sumw2();
    Hist_Chi2->DrawNormalized("e");
    TF1 *f1a = new TF1("f1a","ROOT::Math::chisquared_pdf(x,7)", 0, 20);
    f1a->Draw("same");

    // Text:
    text->SetTextSize(0.06);
    text->DrawLatex(0.20, 0.16, "NOTE: This is not a fit!");
    
    c1->cd(4);
    Hist_Prob->SetMinimum(0.0);
    Hist_Prob->Draw("e");

    // Save to file:
    c1->Update();
    c1->SaveAs("FitChi2dist.png");
  }
}


In [8]:
ChiSquareTest();

  Calc: 4.247+-0.726  0.195+-0.129    Fit: 4.247+-0.726  0.195+-0.129   Prob=0.9268 
  Calc: 3.581+-0.726  0.217+-0.129    Fit: 3.581+-0.726  0.217+-0.129   Prob=0.4058 
  Calc: 4.286+-0.726  0.183+-0.129    Fit: 4.286+-0.726  0.183+-0.129   Prob=0.4077 
  Calc: 4.396+-0.726  0.309+-0.129    Fit: 4.396+-0.726  0.309+-0.129   Prob=0.3824 
  Calc: 3.537+-0.726  0.240+-0.129    Fit: 3.537+-0.726  0.240+-0.129   Prob=0.9674 
  Calc: 3.561+-0.726  0.284+-0.129    Fit: 3.561+-0.726  0.284+-0.129   Prob=0.0995 
  Calc: 2.376+-0.726  0.418+-0.129    Fit: 2.376+-0.726  0.418+-0.129   Prob=0.1497 
  Calc: 2.962+-0.726  0.354+-0.129    Fit: 2.962+-0.726  0.354+-0.129   Prob=0.2726 
  Calc: 3.626+-0.726  0.357+-0.129    Fit: 3.626+-0.726  0.357+-0.129   Prob=0.9080 
  Calc: 4.144+-0.726  0.200+-0.129    Fit: 4.144+-0.726  0.200+-0.129   Prob=0.4451 
  Calc: 3.250+-0.726  0.391+-0.129    Fit: 3.250+-0.726  0.391+-0.129   Prob=0.5149 
  Calc: 3.816+-0.726  0.301+-0.129    Fit: 3.816+-0.726  0.301+-0

Info in <TCanvas::Print>: png file FitChi2dist.png has been created


Comentários Gerais
-------------

Certifique-se de ler as referências relevantes e de compreender não apenas o que
o ${\chi}^2$ é, mas também que segue a distribuição ${\chi}^2$, e que o
probabilidade de obter tal ${\chi}^2$ ou pior pode ser calculada a partir dele.

O programa gera um certo número de conjuntos de dados, cada um consistindo de 9 pontos ao longo
uma linha. Estes são então ajustados (analiticamente e numericamente), e o resultado e
o ${\chi}^2$ do ajuste é registrado junto com a probabilidade do ajuste.



Perguntas:
----------
 1) Execute o código de forma que ele faça exatamente um ajuste e dê uma olhada na linha ajustada.
    Isso parece razoável e qual é a chance de que a entrada para os dados possa
    realmente ser de uma distribuição plana?

 2) O ajuste reproduz bem os números de entrada (inclua as incertezas em seu
    responder)? E os resultados analíticos concordam com os numéricos?

 3) Agora aumente o número de experimentos para, por exemplo, 1000 e execute novamente a macro. Figura
    fora o que você vê na janela dividida em 2 por 2, e vá por cada um deles para
    ver, se você entende todos os recursos das distribuições mostradas, e se você está
    feliz com eles!
    Isso, de alguma forma, torna esta a questão "longa" sem quaisquer questões principais, mas
    você já deve estar estatisticamente informado o suficiente para saber o que procurar,
    pelo menos até certo ponto :-)

 4) Investigar se a distribuição de probabilidades é plana, ou se tem algum
    inclinação para ele. Você entende por que a distribuição de probabilidades é plana?

 5) Encontre a linha onde os pontos aleatórios para a linha são gerados e adicione um
    termo quadrático em x com o coeficiente 0,1. Execute o programa novamente com Nexp = 1,
    e comece observando o único ajuste no gráfico. Você pode ver essa mudança?
    Agora execute 1000 experimentos novamente e veja o que mudou nas distribuições
    na janela 2 por 2 ao incluir tal termo, e pense nas consequências
    pode ter como um experimento.


Questões avançadas:
-------------------
 1) Altere o coeficiente da questão 5) para -0,2. Claro que o ajuste linear
    não faz muito bem. Que mudanças são necessárias para que o ajuste volte a funcionar? Faço
    essas alterações e verifique se a condição da questão 4) é atendida novamente.
