[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](
https://colab.research.google.com/github/AGENslab/Python_learning-Sesion_1/blob/main/notebooks/python_basics_guide.ipynb
)

# 🐍 Guía rápida de Python básico para biólogos

Este cuaderno es un *cheat‑sheet* práctico con ejemplos y pequeños trucos. Está pensado para acompañar la **Sesión 1** y servir de referencia.


## Cómo usar este cuaderno
- Ejecuta cada celda con **Shift+Enter**.
- Modifica ejemplos y vuelve a ejecutar para experimentar.


## Tipos básicos y literales

In [None]:
entero = 7              # int
flotante = 3.14         # float
texto = 'ADN'           # str (string)
booleano = True         # bool
nada = None             # ausencia de valor

type(entero), type(flotante), type(texto), type(booleano), type(nada)

### Operadores numéricos útiles

In [None]:
a, b = 10, 3
resultado = {
    'suma': a + b,
    'resta': a - b,
    'mult': a * b,
    'division': a / b,     # float
    'division_enteros': a // b,
    'modulo': a % b,
    'potencia': a ** b,
    'abs(-5)': abs(-5),
    'round(3.14159, 2)': round(3.14159, 2),
}
resultado

## Cadenas (str): slicing y métodos comunes

In [None]:
s = 'aCtgaT NNN'
demo = {
    'len': len(s),
    'upper': s.upper(),
    'lower': s.lower(),
    'strip': s.strip(),
    'replace N->': s.replace('N', ''),
    'split': s.split(),     # por espacios
    'join': '-'.join(['A','C','G','T']),
    'slice 0:5': s[0:5],
    'slice ::-1 (reverse)': s[::-1],
    'find GA': s.find('GA'),
    'count A': s.upper().count('A'),
}
demo

### f-strings (formateo moderno)

In [None]:
nombre = 'BRCA1'; gc = 53.2345
f"Gen {nombre}: GC%={gc:.1f}"

## Estructuras de datos

In [None]:
lista = [3, 1, 2, 2]
tupla = (3, 1, 2)
conjunto = set(lista)            # elimina duplicados
dic = {'seq1': 'ATGC', 'seq2': 'GGG'}

ops = {
    'lista_sorted': sorted(lista),
    'set_union': {1,2}|{2,3},
    'set_intersection': {1,2}&{2,3},
    'dic_keys': list(dic.keys()),
    'dic_get_seq3_default': dic.get('seq3', 'NA'),
}
ops

### Mutabilidad y copias

In [None]:
a = [1, 2, 3]
b = a              # misma lista (alias)
c = a.copy()       # copia superficial
a.append(99)
{'b_ve': b, 'c_ve': c}

### Verdaderos/falsos implícitos, `==` vs `is`

In [None]:
valores = [0, 1, '', 'A', [], [1], None]
[bool(v) for v in valores], (None == None), (None is None)

## Control de flujo

In [None]:
n = 5
if n % 2 == 0:
    etiqueta = 'par'
else:
    etiqueta = 'impar'

nums = []
for i in range(1, 6):
    nums.append(i*i)

while len(nums) < 7:
    nums.append(0)

etiqueta, nums

### List/dict/set comprehensions, `enumerate`, `zip`

In [None]:
seqs = {'s1':'ATGC', 's2':'AAA', 's3':'CC'}
longitudes = {k: len(v) for k, v in seqs.items()}
pares = [(i, b) for i, b in enumerate('ACGT', start=1)]
mezcla = list(zip('ACGT', [1,2,3,4]))
longitudes, pares, mezcla

## Funciones: parámetros, valores por defecto, `*args`, `**kwargs`

In [None]:
def gc_percent(seq: str, ignore='N') -> float:
    """Calcula GC% ignorando símbolos en `ignore`."""
    seq = ''.join(b for b in seq.upper() if b in 'ACGT' and b not in ignore)
    if not seq:
        return 0.0
    return 100.0 * (seq.count('G') + seq.count('C')) / len(seq)

def demo_args(a, b=10, *args, scale=1.0, **kwargs):
    return {'a': a, 'b': b, 'args': args, 'scale': scale, 'kwargs': kwargs}

gc_percent('ACGTNNNN'), demo_args(1, 2, 3, 4, scale=0.5, x=99)

### ⚠️ Cuidado con valores por defecto **mutables**

In [None]:
def mala(lista=[]):           # ANTIPATRÓN
    lista.append(1)
    return lista

def buena(lista=None):        # PATRÓN SEGURO
    if lista is None:
        lista = []
    lista.append(1)
    return lista

mala(), mala(), buena(), buena([])

### `lambda` y claves de ordenamiento

In [None]:
genes = ['BRCA1', 'tp53', 'APOE']
orden = sorted(genes, key=lambda g: g.lower())
orden

## Excepciones: `try/except`

In [None]:
def safe_int(x):
    try:
        return int(x)
    except ValueError:
        return None

[safe_int(v) for v in ['10', 'NA', '3']]

## Archivos: lectura/escritura de texto

In [None]:
contenido = 'seq1\tATGC\nseq2\tGGG\n'
with open('mini.tsv', 'w') as f:
    f.write(contenido)

rows = []
with open('mini.tsv') as f:
    for line in f:
        sid, seq = line.strip().split('\t')
        rows.append((sid, seq))
rows

## Mini utilidades bio: complemento reverso

In [None]:
comp = str.maketrans({'A':'T','T':'A','C':'G','G':'C'})
def revcomp(seq):
    s = ''.join(b for b in seq.upper() if b in 'ACGT')
    return s.translate(comp)[::-1]

revcomp('AaCgtN')

### Buenas prácticas al iterar diccionarios

In [None]:
d = {'a':1, 'b':2}
# NO: modificar mientras iteras directamente sobre d
# for k in d: d.pop(k)
# SÍ: iterar sobre copia de las claves
for k in list(d.keys()):
    d[k] += 10
d

## Mini ejercicios

In [None]:
# 1) Implementa contar_kmers(seq, k) ignorando símbolos no ACGT
def contar_kmers(seq, k=3):
    seq = ''.join(b for b in seq.upper() if b in 'ACGT')
    counts = {}
    for i in range(len(seq)-k+1):
        kmer = seq[i:i+k]
        counts[kmer] = counts.get(kmer, 0) + 1
    return counts

assert contar_kmers('AAACAAA', 3).get('AAA', 0) == 3

# 2) Usa list-comprehension para obtener longitudes de varias secuencias
seqs = ['AT', 'ATGC', 'G']
longs = [len(s) for s in seqs]
assert longs == [2,4,1]
longs

## Cierre
- Repasaste tipos, operadores y métodos útiles.
- Viste estructuras, comprensiones y utilidades como `enumerate/zip`.
- Definiste funciones con parámetros por defecto, `*args`, `**kwargs` y evitaste el antipatrón de mutables.
- Manejo básico de excepciones y archivos.

Siguiente paso sugerido: pasar estos snippets a problemas reales (FASTA, GC%, k‑mers, filtros por longitud, etc.).