In [76]:
import pandas as pd
import altair as alt

In [77]:
# Leer los archivos por fase

phase1 = pd.read_csv("LINCS_ad_phase1.tsv", sep="\t")
phase2 = pd.read_csv("LINCS_ad_phase2.tsv", sep="\t")

# Fase 1

In [78]:
# Contar el número de perturbaciones por antidepresivo (pert_iname)
num_pert_iname_phase1 = phase1.groupby("pert_iname").size().reset_index(name="count")

# Contar el número de perturbaciones por línea celular
num_cell_id_phase1 = phase1.groupby('cell_id').size().reset_index(name="count")

# Contar el número de perturbaciones por antidepresivo (pert_iname) por línea celular
num_pert_iname_cell_id_phase1 = phase1.groupby(['pert_iname', 'cell_id']).size().reset_index(name='count')

In [79]:
base = alt.Chart(num_pert_iname_phase1).encode(
    alt.X('pert_iname:O'),
    alt.Y('count:O', sort='-y'),
)

bar_chart = base.mark_bar().encode(
    x='pert_iname:N',
    y='count:Q',
    color=alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por antidepresivo (pert_iname) en fase 1',
    width=700,  
    height=600  
)

text = bar_chart.mark_text(
    align='left',
    baseline='bottom',
    dx=-4,
    dy=-3
).encode(
    text='count:Q',
    color=alt.value('black')
)

bar_chart + text

In [80]:
base = alt.Chart(num_cell_id_phase1).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',  
                alt.value('red'),  
                alt.value('black')))
    ),
    alt.Y('count:O', sort='-y'),
)

bar_chart = base.mark_bar().encode(
    x='cell_id:N',
    y='count:Q',
    color=alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'count:Q']
).properties(
    title='Número de perturbaciones por línea celular (cell_id) en fase 1',
    width=700,
    height=600
)

text = bar_chart.mark_text(
    align='left',
    baseline='bottom',
    dx=-4,
    dy=-3
).encode(
    text='count:Q',
    color=alt.value('black')
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(680),
    x=alt.value(650),
    text='label:N'
)

(bar_chart + text + legend).configure_axisX(
    labelColor=alt.condition(
        alt.datum.value == "NPC",
        alt.value("red"),
        alt.value("black")
    )
)

In [81]:
base = alt.Chart(num_pert_iname_cell_id_phase1).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',
                alt.value('red'),
                alt.value('black')))
    ),
    alt.Y('pert_iname:O'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por antidepresivo (pert_iname) por línea celular (cell_id) en fase 1',
    width=700,  
    height=600  
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 40,
        alt.value('black'),
        alt.value('white')
    )
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(680),
    x=alt.value(650),
    text='label:N'
)

heatmap + text + legend

# Fase 2

In [82]:
# Contar el número de perturbaciones por antidepresivo (pert_iname)
num_pert_iname_phase2 = phase2.groupby("pert_iname").size().reset_index(name="count")

# Contar el número de perturbaciones por línea celular
num_cell_id_phase2 = phase2.groupby('cell_id').size().reset_index(name="count")

# Contar el número de perturbaciones por antidepresivo (pert_iname) por línea celular
num_pert_iname_cell_id_phase2 = phase2.groupby(['pert_iname', 'cell_id']).size().reset_index(name='count')

In [83]:
base = alt.Chart(num_pert_iname_phase2).encode(
    alt.X('pert_iname:O'),
    alt.Y('count:O', sort='-y'),
)

bar_chart = base.mark_bar().encode(
    x='pert_iname:N',
    y='count:Q',
    color=alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por antidepresivo (pert_iname) en fase 2',
    width=700,  
    height=600  
)

text = bar_chart.mark_text(
    align='left',
    baseline='bottom',
    dx=-4,
    dy=-3
).encode(
    text='count:Q',
    color=alt.value('black')
)

bar_chart + text

In [84]:
base = alt.Chart(num_cell_id_phase2).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',
                alt.value('red'),
                alt.value('black')))
    ),
    alt.Y('count:O', sort='-y'),
)

bar_chart = base.mark_bar().encode(
    x='cell_id:N',
    y='count:Q',
    color=alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'count:Q']
).properties(
    title='Número de perturbaciones por línea celular (cell_id) en fase 2',
    width=700,  
    height=600  
)

text = bar_chart.mark_text(
    align='left',
    baseline='bottom',
    dx=-4,
    dy=-3
).encode(
    text='count:Q',
    color=alt.value('black')
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(680),
    x=alt.value(650),
    text='label:N'
)

(bar_chart + text + legend).configure_axisX(
    labelColor=alt.condition(
        alt.datum.value == "NPC",
        alt.value("red"),
        alt.value("black")
    )
)

In [85]:
base = alt.Chart(num_pert_iname_cell_id_phase2).encode(
    alt.X('cell_id:O',
        axis=alt.Axis(
            labelColor=alt.condition(
                alt.datum.value == 'NPC',
                alt.value('red'),
                alt.value('black')))
    ),
    alt.Y('pert_iname:O'),
)

heatmap = base.mark_rect().encode(
    alt.Color('count:Q', scale=alt.Scale(scheme='viridis')),
    tooltip=['cell_id:N', 'pert_iname:N', 'count:Q']
).properties(
    title='Número de perturbaciones por antidepresivo (pert_iname) por línea celular (cell_id) en fase 2',
    width=700,  
    height=600  
)    

text = base.mark_text(baseline='middle').encode(
    text='count:Q',
    color=alt.condition(
        alt.datum.count > 40,
        alt.value('black'),
        alt.value('white')
    )
)

legend = alt.Chart(pd.DataFrame({'label': ['*Línea celular neuronal']})).mark_text(
    color='red',
    align='left',
    baseline='middle',
    fontSize=10
).encode(
    y=alt.value(680),
    x=alt.value(650),
    text='label:N'
)

heatmap + text + legend