# Introducción

## Caracter
Un carácter es el elemento mínimo de información usado para representar, controlar, transmitir y visualizar datos. Al conjunto de caracteres usados con este fin se le llama Esquema de codificación. Los esquemas de codificación en general usan un número de bits o bytes fijos.



## Esquemas de codificación - $\mathbb A\mathbb S \mathbb C \mathbb I \mathbb I$

Código Estadounidense Estándar para el Intercambio de Información (American Standard Code for Information Interchange)


*   En su versión original usa 7 bits, definiendo 128 caracteres.
*   En la versión extendida usa 8 bits (esto es 1 byte), definiendo 256 caracteres.
*  Es la base de los archivos de texto plano (o sin formato).
*  Es el esquema base para la escritura de programas en casi todos los
lenguajes de programación (incluido Python).


![ASCII](https://drive.google.com/uc?id=10L0Dtysi06clOJ8oL3voavxbfaz9Lfvl)


## Esquemas de Codificación - Unicode
Esquema de codificación cuyo objetivo es dar a cada carácter usado por cada uno de los lenguajes humanos su propio código, es decir, permitir la “internacionalización” de la computación.



*   UTF − 8 : Definido por ocho (8) bits (un byte). Toma como base el ASCII, ANSI de Windows y el ISO − 8859 − 1. Muy usado en HTML.
*   UTF − 16
: Definido por 16 bits (2 bytes). Usa una representación de longitud variable que permite su optimización en procesos de codificación a texto (usando un subconjunto de ASCII o UTF − 8).
*  UTF - 32: Definido por 32 bits (4 bytes). Es el más simple pues usa una representación de longitud fija.

![UNICODE](https://drive.google.com/uc?id=18julq1rKLC_yFz8_O18igFLkkQGimr-S)


## Usando caracteres en un programa

Dado que Python usa $\mathbb A \mathbb S \mathbb C \mathbb I \mathbb I$ para la escritura de sus programas, se cuenta con un esquema de representación para indicar que se usarán los mismos. El carácter a usar se delimita por el carácter ’ o por el car ́acter " (llamado escape) de caracteres tanto de control o Unicode.



*   'A' : Se refiere al carácter A
*   "3" : Se refiere al carácter 3
*   '"' : Se refiere al carácter "
*   "'" : Se refiere al carácter '

Cuando se requieren caracteres especiales, de control o de Unicode, se puede utilizar la secuencia de escape apropiada.



*   \n : Una nueva línea
*   \t : Una tabulación
*   \ " : Una comilla doble
*   \ ' : Una comilla simple
*   \ \ : El carácter de diagonal invertida (backslash)
*  \u01F4 : El carácter Ǵ




## Cadenas de caracteres (str)

Una cadena de caracteres str es una secuencia de cero o más caracteres. Una cadena de caracteres se delimita por el carácter ' o por el carácter ". Una cadena de caracteres es una estructura de datos inmutable, esto significa que no puede ser cambiada.


*   'ejemplo de cadena'
*   "Cadena con un tabulado \t y una nueva \n línea"
*  'Cadena con un car ́acter unicode \u01F4 y una comilla doble"'
*  "Cadena con una comilla simple \ ', una comilla doble \ "
    y una diagonal invertida \\"
*  La cadena vacía "" o ''



In [2]:
print('ejemplo de cadena')
print("Cadena con un tabulado \t y una nueva \n línea")
print('Cadena con un caraa2cter unicode \u01F4 y una comilla doble"')
print("Cadena con una comilla simple \', una comilla doble \" y una diagonal invertida \\")
print("")
print('')

ejemplo de cadena
Cadena con un tabulado 	 y una nueva 
 línea
Cadena con un caraa2cter unicode Ǵ y una comilla doble"
Cadena con una comilla simple ', una comilla doble " y una diagonal invertida \




# Operadores

## Concatenar +
Concatena (pega) dos cadenas.

In [3]:
nombre = "Minch Yoda"
trabajo = "Stars War"
print(nombre + " el maestro")
print(nombre + trabajo)
print(trabajo + " " + nombre)

Minch Yoda el maestro
Minch YodaStars War
Stars War Minch Yoda


## Comparar
Se usan los operadores convencionales (<, <=, >, >=, ==, !=) para comparar cadenas usando el orden lexicográfico. En el orden lexicográfico, se comparan de izquierda a derecha uno a uno los caracteres, mientras sean iguales. En el caso que no sean iguales, si el carácter de la primera cadena es menor que el de la segunda a la primer cadena se le considera menor, pero si es mayor, a la primer cadena se le considera mayor. Si todos los caracteres son iguales, las cadenas son iguales.


In [4]:
print("Rojas" < "Rosas")
print("Rojas" == "rosas")

True
False


## Subíndice [ ]

Accede los elementos de una cadena, el primer  índice de la cadena es cero (0).

In [5]:
nombre = "Minch Yoda"
print(nombre[0]) # imprime M
print(nombre[6]) # imprime Y
print(nombre[4]) # imprime h

M
Y
h


# Cadenas y estructura de control



## Operador in
Es posible determinar si una subcadena se encuentra en una cadena de caracteres.

In [None]:
text = "cien años de soledad" 
if "años" in text:
  print("yes")
else:
  print("no")

## Iterando una cadena

Es posible iterar una cadena de caracteres usando el ciclo for.


In [6]:
s = "hola amigos mios"
for letra in s: 
  print(letra, end = ", ")

h, o, l, a,  , a, m, i, g, o, s,  , m, i, o, s, 

# Metodos


## Longitud (len)

la función len determina la longitud de una cadena.

In [7]:
nombre = "Minch Yoda"
trabajo = "Stars War"
planeta = "Tatoon \t cinco"
vacia = ""
print(len(nombre))
print(len(trabajo))
print(len(planeta))
print(len(vacia))

10
9
14
0


## Subcadenas (slice)

La función slice obtiene una porci ́on (subcadena) de una cadena. La notaci ́on es similar a la funci ́on range, **[inicio:fin:incremento]**.

In [8]:
nombre = "Minch Yoda"
print(nombre[:5])
print(nombre[0:7])
print(nombre[6:10])
print(nombre[::-1])

Minch
Minch Y
Yoda
adoY hcniM


## Contando (count)
El método count obtiene las veces que una subcadena se encuentra en una cadena (o en una parte de ella). La notación es count(subcadena, inicio, fin).


In [10]:
str1 = "The avengers"
print(str1.count("e"))
print(str1.count("e", 0, 3))
print(str1.count("e", 4, len(str1)))
cad = "abcabcabcabcabc"
print(cad.count("abc"))

3
1
2
5


## Buscando (find, rfind)

Los métodos find y rfind obtienen la primera y última ocurrencia de una subcadena en una cadena (o en una parte de ella), respectivamente. La notación es find/rfind(subcadena, inicio, fin).

In [12]:
str2 = "It is not despair, for despair is " \
        "only for those who see the end " \
        "beyond all doubt. We do not."
print("first:", str2.find("despair"))
print("last:", str2.rfind("despair"))

first: 10
last: 23


## Mayúsculas/Minúsculas

Son varios métodos que operan de acuerdo a mayúsculas y minúsculas.

In [15]:
s = "cien años de soledad en Macondo"
print(s.lower()) # Muestra la cadena en minúsculas 
print(s.upper()) # Muestra la cadena en mayúsculas 
print(s.capitalize()) # Primer letra a mayúscula 
print(s.title()) # Primer letra cada palabra a mayúscula
print(s.swapcase()) # Mayúsculas <-> minúsculas

cien a~nos de soledad en macondo
CIEN A~NOS DE SOLEDAD EN MACONDO
Cien a~nos de soledad en macondo
Cien A~Nos De Soledad En Macondo
CIEN A~NOS DE SOLEDAD EN mACONDO


## Removiendo caracteres (strip, lstrip, rstrip)

El método strip/lstrip/rstrip remueve los caracteres deseados a los dos lados/izquierda/derecha de una cadena. La notación es strip/lstrip/rstrip(caracteres). Si no se dan caracteres como argumento, elimina espacios en blanco (espacios y tabulaciones).

In [14]:
s = "---++---cien a~nos de soledad en Macondo---++---" 
print(s.strip("-+"))
print(s.lstrip("-+"))
print(s.rstrip("-+"))

cien a~nos de soledad en Macondo
cien a~nos de soledad en Macondo---++---
---++---cien a~nos de soledad en Macondo


## Dividiendo cadenas (split)

El método split divide una cadena de acuerdo a una subcadena que sirve como delimitador, dejando las partes separadas en una lista. La notación es split(delimitador).

In [None]:
sdate = "01-06-2021"
sp = sdate.split("-")
print(sp)
print("día:", sp[0], "- mes:", sp[1], "- año:", sp[2])

## Justificación de cadenas

Existen cuatro m ́etodos para justificar cadenas:


*   ljust() : Justificar una cadena a la izquierda
*   rjust() : Justificar una cadena a la derecha
*  center() : Centrar una cadena
*  zfill() : Llenar una cadena con ceros



In [17]:
str1 = "Bogotá" 
print(str1.ljust(15, "#")) 
print(str1.rjust(15, "#")) 
print(str1.center(15, "#")) 
account = "123456789" 
print(account.zfill(15))

Bogotá#########
#########Bogotá
#####Bogotá####
000000123456789


## Reemplazando replace
El método replace reemplazar una subcadena en una cadena por otra. la notación es **replace(anterior, nueva, ocurrencias)**. El parametro ocurrencias es opcional, cuando valor no es especificado, remplaza todas las ocurrencias.

In [20]:
str1 = "cien años de soledad"
print(str1)
rep = str1.replace("cien", "setenta")
print(rep)
rep = rep.replace("años", "días")
print(rep)
rep = rep.replace("soledad", "clases sincrónicas!") 
print(rep)
  

cien años de soledad
setenta años de soledad
setenta días de soledad
setenta días de clases sincrónicas!


## Más métodos



*   endswith: Determinar si una cadena termina con.
*   startswith: Determinar si una cadena empieza con.
*  isalpha: Determinar si una cadena contiene letras únicamente.
*  isalnum: Determinar si una cadena contine números y letras únicamente.
*  isdigit: Determinar si una cadena tiene solo dígitos.
* isspace: Determinar si una cadena tiene solo espacios.
* istitle: Determinar si una cadena es un título
*  islower: Determinar si una cadena contiene todos sus caracteres en minúsculas.
*  isupper: Determinar si una cadena contiene todos sus caracteres en mayúsculas.




# Sugerencia

Se sugiere consultar un manual de Python o de sus librerías para determinar si ya existe un m ́etodo para lo que se quiera realizar con una cadena de caracteres.