In [81]:
import pandas as pd
import altair as alt

In [82]:
# Leer los archivos por fase

phase1 = pd.read_csv("LINCS_ad_phase1.tsv", sep="\t")
phase2 = pd.read_csv("LINCS_ad_phase2.tsv", sep="\t")

# Fase 1

In [83]:
# Contar el número de perturbaciones por antidepresivo (pert_iname)
num_pert_iname_phase1 = phase1.groupby("pert_iname").size().reset_index(name="count")

# Contar el número de perturbaciones por perturbación específica por antidepresivo (pert_id)
num_pert_id_phase1 = phase1.groupby(['pert_iname', 'pert_id']).size().reset_index(name='count')

# Contar el número de perturbaciones por línea celular
num_cell_id_phase1 = phase1.groupby('cell_id').size().reset_index(name="count")

# Contar el número de perturbaciones por antidepresivo (pert_iname) por línea celular
num_pert_iname_cell_id_phase1 = phase1.groupby(['pert_iname', 'cell_id']).size().reset_index(name='count')

# Contar el número de perturbaciones por perturbación específica por antidepresivo (pert_id) por línea celular
num_pert_id_cell_id_phase1 = phase1.groupby(['pert_iname', 'pert_id', 'cell_id']).size().reset_index(name='count')

In [84]:
base = alt.Chart(num_pert_iname_phase1).encode(
    alt.X('pert_iname:O'),
    alt.Y('count:O', sort='-y'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por antidepresivo (pert_iname) en fase 1',
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 250,
        alt.value('black'),
        alt.value('white')
    )
)

heatmap + text

In [85]:
base = alt.Chart(num_pert_id_phase1).encode(
    alt.X('pert_id:O'),
    alt.Y('pert_iname:O'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['pert_id:N', 'pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por perturbación específica por antidepresivo (pert_id) en fase 1',
) 

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 250,
        alt.value('black'),
        alt.value('white')
    )
)

heatmap + text

In [110]:
base = alt.Chart(num_cell_id_phase1).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',
                alt.value('red'),
                alt.value('black')))
    ),
    alt.Y('count:O', sort='-y'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'count:Q']
).properties(
    title='Número de perturbaciones por línea celular (cell_id) en fase 1',
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 350,
        alt.value('black'),
        alt.value('white')
    )
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(400),
    x=alt.value(280),
    text='label:N'
)

heatmap + text + legend

In [106]:
base = alt.Chart(num_pert_iname_cell_id_phase1).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',
                alt.value('red'),
                alt.value('black')))
    ),
    alt.Y('pert_iname:O'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por antidepresivo (pert_iname) por línea celular (cell_id) en fase 1',
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 40,
        alt.value('black'),
        alt.value('white')
    )
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(640),
    x=alt.value(350),
    text='label:N'
)

heatmap + text + legend

In [103]:
base = alt.Chart(num_pert_id_cell_id_phase1).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',
                alt.value('red'),
                alt.value('black')))
    ),
    alt.Y('pert_id:O'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'pert_id:N', 'pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por perturbación específica por antidepresivo (pert_id) por línea celular (cell_id) en fase 1',
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 40,
        alt.value('black'),
        alt.value('white')
    )
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(885),
    x=alt.value(420),
    text='label:N'
)

heatmap + text + legend

# Fase 2

In [89]:
# Contar el número de perturbaciones por antidepresivo (pert_iname)
num_pert_iname_phase2 = phase2.groupby("pert_iname").size().reset_index(name="count")

# Contar el número de perturbaciones por perturbación específica por antidepresivo (pert_id)
num_pert_id_phase2 = phase2.groupby(['pert_iname', 'pert_id']).size().reset_index(name='count')

# Contar el número de perturbaciones por línea celular
num_cell_id_phase2 = phase2.groupby('cell_id').size().reset_index(name="count")

# Contar el número de perturbaciones por antidepresivo (pert_iname) por línea celular
num_pert_iname_cell_id_phase2 = phase2.groupby(['pert_iname', 'cell_id']).size().reset_index(name='count')

# Contar el número de perturbaciones por perturbación específica por antidepresivo (pert_id) por línea celular
num_pert_id_cell_id_phase2 = phase2.groupby(['pert_iname', 'pert_id', 'cell_id']).size().reset_index(name='count')

In [90]:
base = alt.Chart(num_pert_iname_phase2).encode(
    alt.X('pert_iname:O'),
    alt.Y('count:O', sort='-y'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por antidepresivo (pert_iname) en fase 2',
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 250,
        alt.value('black'),
        alt.value('white')
    )
)

heatmap + text

In [91]:
base = alt.Chart(num_pert_id_phase2).encode(
    alt.X('pert_id:O'),
    alt.Y('pert_iname:O'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['pert_id:N', 'pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por perturbación específica por antidepresivo (pert_id) en fase 2',
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 250,
        alt.value('black'),
        alt.value('white')
    )
)

heatmap + text

In [100]:
base = alt.Chart(num_cell_id_phase2).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',
                alt.value('red'),
                alt.value('black')))
    ),
    alt.Y('count:O', sort='-y'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'count:Q']
).properties(
    title='Número de perturbaciones por línea celular (cell_id) en fase 2',
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 350,
        alt.value('black'),
        alt.value('white')
    )
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(270),
    x=alt.value(380),
    text='label:N'
)

heatmap + text + legend

In [99]:
base = alt.Chart(num_pert_iname_cell_id_phase2).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',
                alt.value('red'),
                alt.value('black')))
    ),
    alt.Y('pert_iname:O'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por antidepresivo (pert_iname) por línea celular (cell_id) en fase 2',
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 20,
        alt.value('black'),
        alt.value('white')
    )
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(630),
    x=alt.value(400),
    text='label:N'
)

heatmap + text + legend

In [97]:
base = alt.Chart(num_pert_id_cell_id_phase2).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',
                alt.value('red'),
                alt.value('black')))
    ),
    alt.Y('pert_id:O'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'pert_id:N', 'pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por perturbación específica por antidepresivo (pert_id) por línea celular (cell_id) en fase 2',
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 20,
        alt.value('black'),
        alt.value('white')
    )
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(630),
    x=alt.value(470),
    text='label:N'
)

heatmap + text + legend