# Design de Experimentos 
Medindo Impactos causais


O objetivo da avaliação do programa é avaliar o impacto causal de um programa em um resultado. A maioria das questões políticas envolve relações de causa e efeito: a formação de professores melhora os resultados dos testes dos alunos? Os programas de formação profissional aumentam o rendimento dos formandos? O tamanho da turma afeta os resultados dos testes? 

Embora as perguntas de causa e efeito sejam comuns, não é uma questão direta estabelecer que o relacionamento é causal. Com relação aos resultados dos testes, por exemplo, simplesmente observar que diminuir o tamanho da turma leva a um aumento nos resultados dos testes dos alunos não é suficiente para estabelecer a causalidade. as pontuações dos alunos podem ter aumentado porque seus professores são espertos, ou porque seus pais estudam para eles, ou porque quaisquer outros fatores podem afetar suas pontuações. As avaliações de impacto nos ajudam a superar o desafio de estabelecer a causalidade, estabelecendo empiricamente em que medida um determinado programa - e esse programa sozinho - contribuiu para a mudança no resultado. Isso significa excluir a possibilidade de que qualquer outro fator além do programa explique o impacto observado. 

A resposta à questão básica de avaliação de impacto - qual é o impacto ou efeito causal de um programa P sobre um resultado de interesse Y - é dada pela fórmula básica de avaliação de impacto: 

<img src="img/program impact.png" width="450" />


Esta fórmula diz que o impacto causal do programa P em um resultado (Y) é a diferença entre o resultado (Y) com o programa (em outras palavras, quando P = 1) e o mesmo resultado (Y) sem o programa (em outras palavras, quando P = 0). 

Por exemplo, se P denota um programa de treinamento vocacional e Y denota renda, então o impacto causal do programa de treinamento vocacional é a diferença entre a renda de uma pessoa (Y) após participar do programa de treinamento vocacional e a renda da mesma pessoa (Y). o mesmo ponto de tempo se ele ou ela não tivesse participado do programa. 

## O Contrafactual
Para avaliar o impacto do programa, como discutido acima, precisamos saber qual poderia ter sido o resultado se o programa não existisse. Isso chamado de "contrafactual". É uma estimativa de qual seria o resultado (Y) para um participante do programa na ausência do programa (P). Pense no impacto do programa de treinamento na renda da pessoa. Para estabelecer o impacto causal do programa de treinamento na renda, precisamos calcular a diferença de renda para o mesmo indivíduo com e sem participação no programa de treinamento. No entanto, sabemos que medir a mesma pessoa em dois estados diferentes ao mesmo tempo é impossível. A qualquer momento, uma pessoa participou do programa ou não participou. A pessoa não pode ser observada simultaneamente em dois estados diferentes. Para lidar com este problema, estimamos o contrafactual usando o grupo de controle ou de comparação, conforme será discutido.

## Estimando o contrafactual
Como é impossível determinar qual poderia ter sido o resultado se o programa não existisse, tendemos a estimar o contrafactual. Para fazer isso, normalmente usamos grupos de comparação (algumas vezes chamados de "grupos de controle"). Identificar esses grupos de comparação é o ponto crucial de qualquer avaliação de impacto. O principal desafio, então, é identificar um grupo de comparação válido que tenha as mesmas características do grupo de tratamento. A única diferença entre o tratamento e os grupos de comparação deve ser que os membros do grupo de tratamento receberão o programa, enquanto o membro do grupo de comparação não o receberá.

<img src="img/counter-factual.png" width="450" />


Suponha que queremos estimar o impacto do dinheiro adicional no consumo de doces entre um grupo de crianças. Se você pudesse identificar outro grupo de crianças que é totalmente semelhante, exceto que eles não recebem dinheiro adicional adicional, você estima que o impacto seria a diferença entre os dois grupos no consumo médio de doces. 
Por outro lado, se escolhermos um grupo de comparação inválido que difere do grupo de tratamento de alguma forma diferente da ausência do tratamento, nossa estimativa de impacto é inválida. Ou seja, não estimará o verdadeiro impacto do programa. Em vez disso, estimará o efeito do programa misturado com o efeito dessas outras diferenças.

## Tarefa Aleatória 
A randomização é a maneira mais eficaz de gerar uma forte estimativa do contrafactual. A chave é que, quando selecionamos aleatoriamente as unidades para atribuí-las aos grupos de tratamento e comparação, esse processo de atribuição aleatória produzirá dois grupos com alta probabilidade de serem estatisticamente idênticos, contanto que o número de participantes em potencial seja suficientemente grande. . 
<img src="img/random.png" width="450" />

A figura ilustra o processo de atribuição aleatória. Começa primeiro definindo as unidades de análise; aqueles para os quais você está interessado em conhecer o impacto do programa. Dependendo do programa, uma unidade pode ser uma pessoa, um centro de saúde, uma escola ou até mesmo uma aldeia ou município inteiro. Em seguida, selecione uma amostra de unidades da população. Depois disso, atribua as unidades selecionadas aleatoriamente ao tratamento e aos grupos de comparação.

## Atribuição aleatória vs. Amostragem Aleatória 
Existe uma diferença entre atribuição aleatória e amostragem aleatória. A amostragem aleatória garante representatividade entre uma amostra e a população da qual ela é desenhada. A amostragem aleatória é, portanto, um fator importante na validade externa de um estudo - isto é, até que ponto os resultados de um estudo podem ser generalizados para além da amostra retirada. A alocação aleatória, ao contrário da seleção aleatória, está relacionada à validade interna da avaliação - ou seja, a extensão em que o impacto do programa é atribuído ao tratamento e a nenhum outro fator.


<img src="img/Random selection.png" width="450" />




## Grupo de controle vs. grupo de comparação
Embora algumas pessoas usem os termos “grupo de controle” e “grupo de comparação” de forma intercambiável, elas não são. Grupos de controle verdadeiros são formados pelo processo de atribuição aleatória. Os grupos de comparação são pareados para serem comparáveis ​​em aspectos importantes ao grupo experimental. 

### Variedades do contrafactual
Vários métodos podem ser usados ​​para estimar o contrafactual. Os seguintes são os mais comuns. 

### Grupo de controle / comparação pré-postagem 
Um projeto pré-post com um grupo de comparação / controle tenta estabelecer o impacto de um programa comparando as mudanças nos resultados ao longo do tempo entre o grupo de tratamento e o grupo de comparação. Esse método é chamado de "Diferença-em-diferenças". Calcula o impacto de um programa da seguinte maneira:

1. Calculamos a diferença no resultado entre as situações antes e depois para o grupo de tratamento. (T2 - T1) 

2. Calculamos a diferença no resultado entre as situações antes e depois para o grupo de comparação (C2 - C1)

3. Então calculamos a diferença entre a primeira e a segunda diferença. Diferença-em-diferenças = (T2 - T1) - (C2 - C1)

Intuitivamente falando, o contraste de (T2 - T1) irá capturar todas as mudanças que ocorrem durante o estudo. Incluindo efeitos e tendências do programa. Para capturar tendências, usaremos C2 - C1. Em seguida, remova a tendência da primeira diferença (T2-T1) para isolar os efeitos do programa. 

<img src="img/DD.png" width="450" />




### Comparação antes e depois
Neste tipo de desenho, o impacto do programa é avaliado comparando o resultado dos participantes antes e depois do tratamento (T2 - T1). Uma limitação importante para esse design é que ele não controla nenhum outro fator que possa ter afetado o resultado em vez do tratamento. Em outras palavras, pressupõe-se que, se o programa nunca tivesse existido, o resultado dos participantes teria sido exatamente o mesmo que a situação do pré-programa. Infelizmente, na grande maioria dos casos, essa suposição não é válida.

<img src="img/pre-post..png" width="450" />







## Comparação com e sem (somente postagem) 
Neste tipo de projeto, as unidades que receberam o programa são comparadas às unidades que não o recebem. O impacto do programa é a diferença entre o resultado para os dois grupos. (T2 - C2). O problema é que não podemos ter certeza se os dois grupos são semelhantes ou se existem diferenças significativas entre eles que afetam o resultado. 

<img src="img/post only.png" width="450" />


## Descontinuidade de regressão


## Série de Tempos Interrompida 