# Desenho de experimentos e quase experimentos


## Introdução

As ciências empíricas possuem basicamente dois tipos de instrumentos para possibilitar a avaliação das explicações dadas aos fenômenos observados: estudos experimentais e estudos observacionais.

Experimentos caracterizam pelo fato de buscar a relação de causalidade entre variáveis envolvidas no estudo, tendo para isso basicamente o instrumento de "randomized trials" ao passo que os estudos observacionais procuram apenas avaliar se as explicações teóricas ao menos são compatíveis com as correlações observadas nos dados.

Por isso, o desenho da pesquisa vai determinar quais conclusões podem ser extraídas dos dados bem como estabelecer a melhor forma de armazenar os dados coletados para realização dos estudos.

Aqui trataremos basicamente do processo de desenho do banco de dados da pesquisa, remetendo às referências do Moodle o entendimento dos aspectos metodológicos.


##  Bancos de dados

### Introdução
Um objeto do mundo concreto se descreve por suas características. Por exemplo, uma pessoa tem como características seu nome, sua altura, seu peso, sua idade, seu estado civil, a cor da sua pela, seu sexo etc.  Chama-se dado ao valores observados de uma determinada característica em um determinado objeto do mundo concreto.

Os dados são armazenados em computadores de diferentes formas a dependerem do tipo de operação que se pode fazer com ele.  Por exemplo, efetuando-se a operação de concatenar as letras A, L, B, E, R, T e O, obtém-se o nome ALBERTO, mas não faz sentido, por exemplo, querer somar tais letras.  A cada forma de armazenamento de um dado chama-se tipo de dado simples.

Compondo-se tipos de dados simples obtém-se as chamadas estruturas de dados.  Por exemplo, podemos compor diversos elementos do tipo de dado número real para obter uma estrutura de dados chamada vetor.

Também podemos juntar diversos elementos com tipo de dado caracter formando uma lista de caracteres.  Genericamente, se juntarmos elementos de tipos de dados possivelmente diferentes, obteremos uma estrutura de dados denominada registro. Chamaremos de banco de dados a uma lista de registros.

A fim de que os bancos de dados sejam úteis é necessário que eles disponham de uma organização conhecida pelos seus operadores. Isto significa que é preciso que haja uma definição prévia dos tipos de dados que serão armazenados, das formas de atualização (isto é, inserção, deleção ou modificação dos dados presentes no banco), das possibilidades de consulta ao dados.  Ou seja, bancos de dados precisam ser projetados para que tenham utilidade.  E isto é mais verdade quanto maior for a quantidade e variedade de dados armazenados.

Existem diversas formas de projetar a organização dos registros dentro de um banco de dados, sendo as seguintes asmais usadas:bancos hierárquicos; bancos relacionais; bancos objeto-relacionais.  Aqui nos ateremos aos bancos relacionais.

Com efeito, bancos relacionais são aqueles em que os registros estão organizados em tabelas às quais correspondem a relações matemáticas entre eles e registros em outras tabelas.

Cada tabela é caracterizada por representar entidades e a navegação dentro do banco é feita por meio de uma série de relações previamente estabelecidas na construção do banco.

### Operações em bancos de dados

As seguintes operações podem ser feitas com dados:

1. Definição dos tipos de dados;

2. Manipulação dos dados: inserção, atualização e deleção de dados

3. Busca de dados.

Estas operações podem ser feitas diretamente pelo terminal do sistema operacional, por meio de linguagens de programação ou pelo uso de sistemas gerenciadores de bancos de dados (SGBD).

Os SGBD's disponibilizam uma linguagem para efetuar as operações sobre os dados.  No caso do SGBD's relacionais, a linguagem mais utilizada é chamada de SQL (Structured Query Language).

### SGBD

Os SGBD mais usados são o Oracle, MS-SQL ServeR, PostgreSQL MySQL e Sqlite, sendo este um sistema que se constitui em uma biblioteca de uma linguagem de programação, não sendo necessário instalar nada no computador além da própria linguagem desejada e da correspondente biblioteca.

Python disponibilita o pacote sqlite3.  Na próxima seção, estudaremos a linguagem sql tal como implementada no sqlite3.

## O sqlite3

O SQLite organiza os dados em conjuntos de tabelas que representam as relações entre os dados e fornece uma linguagem (SQL) para trabalhar com os dados armazenados.  Esta linguagem é dividida nas seguintes partes:

1. DDL (data definition language);
2. DML (data manipulation language);
3. DCL (data control language);
4. DTL (data transactions language), e
5. DQL (data query language).




### Instalando o SQLite3

Basta fazer download em [SQLite download](https://www.sqlite.org/download.html) e instalar o programa de acordo com as normativas do seu sistema operacional.  No caso do LINUX, o SQLite já vem instalado por padrão em grande parte das distribuições.

### Entrando no SQLite3

Basta digitar no terminal LINUX o comando:
```sql
sqlite3
```

Uma vez dentro do SQLite tem-se basicamente um interpretador de comandos na linguagem SQL que permitirá organizar nossos dados em bancos de dados relacionais.

## Aprendendo do SQL do SQLite3 

O SGBD que estamos utilizado é o SQLite.  Por isso aprenderemos um pouco da sintaxe do SQL no dialeto do SQLite.  Lembre-se de que SGBD's diferentes "falam" dialetos diferentes de SQL, mas todos costumam ser parecidos e fácil de entender para quem conhece pelo menos um dialeto SQL.  



### A DDL do SQLite3
#### Criando um banco de dados no SQLite3

Para criar um banco de dados chamado agenda no SQLIte basta digitar o comando:

```sql
.open agenda.db

```
O comando "open" abrirá o banco de dados caso ele exista ou o criará em caso contrário.

#### Criando uma tabela

Utilize o comando a seguir:

```sql
create table agenda(nome text, telefone text)

```

#### Apagando uma tabela
Utilize o comando a seguir:

```sql
drop table

```

#### Alterando a estrutura de uma tabela
Utilize o comando a seguir:

```sql
alter table

```
### A DML do SQLite3

#### Inserindo um registro em uma tabela
Utilize o comando a seguir:

```sql
insert into 

```

#### Apagando um registro em uma tabela
Utilize o comando a seguir:

```sql
delete

```
#### Atualizando um registro em uma tabela
Utilize o comando a seguir:

```sql
update

```



### A DQL do SQLite3

Utilize o comando a seguir:


```sql

select * from agenda
```

Para saber mais, veja  o tutorial disponível em [Tutorial de SQLite3 do PythonClub](http://pythonclub.com.br/guia-rapido-comandos-sqlite3.html).

Vamos seguir a partir de agora o tutorial padrão do módulo Python SQLite3 para controlar a partir do interpretador Python um banco de dados SQLite3. Para tal vamos seguir Vamos lá!

### Criando um banco de dados



In [1]:
import sqlite3
conn = sqlite3.connect('exemplo.db')

O código acima estabelece uma conexão entre o Python e o banco de dados "exemplo.db" se o banco existe ou o cria se o banco não existe.

### Criando um cursor para comandar o banco por linha de comando.

In [2]:
# Criação do cursor

c = conn.cursor()


Um cursor funciona como um cursor no shell do linux, permitindo que se escreva comandos.

### Executando alguns comandos no banco de dados criado

In [4]:
# Criando uma tabela
c.execute('CREATE TABLE stocks(date text, trans text, symbol text, qty real, price real)')

# Inserindo uma linha (registro) na tabela criada
c.execute("INSERT INTO stocks VALUES ('2006-01-05','BUY','RHAT',100,35.14)")

# Salvando ("commitando") os dados inseridos no banco de dados
conn.commit()

# Fechando a conexão com o banco de dados.
conn.close()

ProgrammingError: Cannot operate on a closed database.