# Ecotox Data Documentation

Essa é uma documentação inicial sobre a base de dados Ecotox.

Com sua manipulação, é esperado entender mais sobre:

- Quais combinações usadas em testes causam malefícios a determinadas famílias (ou outro ranking taxonomico)
- Prever os efeitos com base nos materias e procedimentos

O objetivo deste estudo é evitar ou minimizar a necessidade de teste em animais.

Fonte dos dados:

https://cfpub.epa.gov/ecotox/


ECOTOX Support

U.S. Environmental Protection Agency

Office of Research and Development

National Health and Environmental Effects Research Laboratory Mid-Continent Ecology Division (MED)

6201 Congdon Boulevard

Duluth, Minnesota 55804

Telephone: 218-529-5225

Fax: 218-529-5003

E-mail: ecotox.support@epa.gov

## Tabela de dados

- TESTS

o Information pertaining to the experimental design.

- CHEMICAL_CARRIERS

o Information pertaining to the carrier and/or positive control chemicals
reported for the test. 

- RESULTS

o Information pertaining to the endpoint or non-endpoint result or dose- response summary (also NR endpoint).

- MEDIA_CHARACTERISTICS

o Water chemistry and media characteristics parameters. 1-1 relation with
RESULTS table. 

- DOSES

o Information pertaining to the dose-response dose. 

- DOSE_RESPONSES

o Parent dose response record containing sample size, effect measurement, response site, observation duration, etc.

- DOSE_RESPONSE_DETAILS

o Detail dose response record, one for each response value by dose.

- DOSE_RESPONSE_LINKS

o Ties dose response to its NR endpoint result summary record.


In [None]:
import pandas as pd
import numpy as np

A tabela ```doses``` é ligada à de testes pelo ```test_id```

In [None]:
df_dose = pd.read_csv("ecotox_ascii_12_13_2018/doses.txt",sep="|", dtype='unicode')
df_dose.loc[:5, ['test_id', 'dose_id', 'dose_conc_unit', 'dose1_mean', 'dose2_mean', 'dose3_mean']]

A tabela de ```dose_respose``` apresenta os efeitos dos testes e os códigos são explicados por ```effect_codes```

In [None]:
df_dose_responses = pd.read_csv("ecotox_ascii_12_13_2018/dose_responses.txt",sep="|",dtype='unicode')
df_dose_responses.loc[:5, ['test_id', 'effect_code']]

In [None]:
df_effect_codes = pd.read_csv("ecotox_ascii_12_13_2018/validation/effect_codes.txt",sep="|",dtype='unicode')
df_effect_codes.loc[:5]

A tabela de ```results``` apresenta os efeitos dos testes de acordo com o ```test_id```, que é a chave principal da base de dados e é ligada a família dos animais por ```tests```

In [None]:
df_results = pd.read_csv("ecotox_ascii_12_13_2018/results.txt",sep="|", dtype='unicode')
df_results.loc[:5, ['test_id', 'effect']]

In [None]:
df_tests = pd.read_csv("ecotox_ascii_12_13_2018/tests.txt",sep="|", dtype='unicode')
df_tests.loc[:5, ['test_id', 'species_number']]

Um exemplo de manipulação simples feita para gerar os dados de forma mais consistente e consica é dado abaixo:

In [None]:
df_ds = pd.read_csv("dataset_dose.csv")
df_ds.loc[:20]