# Módulo 2 - Curso Preparacion Certificado Profesional PCAP

## Día 3

### Strings, String and List Methods, Exceptions
• Characters, strings and coding standards <br/>
• Strings vs. lists – similarities and differences <br/>
• Lists methods <br/>
• String methods <br/>
• Python's way of handling runtime errors <br/>
• Controlling the flow of errors using **try** and **except** <br/>
• Hierarchy of exceptions

### I18N
Cada programa debe ser escrito de modo que pueda usarse en diferentes partes del mundo con distintos alfabetos, lenaguajes y culturas. Este sofware I18N es un estándar a día de hoy que se encarga de dicha tarea de internacionalización.

### Code point
Es un número al que se le asocia un caracter. Con 8 bits (ASCII), encontramos 256 posibilidades de las cuales 128 están usadas para el alfabeto latino estándar. Las 128 posibilidades restantes no son suficientes para captar todos los posibles caracteres de los diversos alfabetos y lenguas del mundo. Podemos obtener el 'code point' asignado a un caracter gracias a la función *ord()*. <br/>
Por otro lado, la función *chr()* toma como input un número, el ´code point´, y devuelve el caracter asociado.

In [10]:
# Demonstrating the ord() function.

char_1 = 'a'  # latin letter a
char_2 = ' '  # space
char_3 ='α'   # greek letter alpha

print(ord(char_1))
print(ord(char_2))
print(ord(char_3))

# Demonstrating the chr() function.

print(chr(97))
print(chr(945))

# Podemos entenderlas como funciones inversas la una de la otra.
print(chr(ord('a')) == 'a')
print(ord(chr(97)) == 97)


97
32
945
a
α
True
True


### Code Page
Una 'code page' sirve para almacenar en esas 128 posibilidades unos ciertos carácteres de algunas lenguas del mundo. Será importante saber en que 'code page' nos encontramos. <br/>

*"For example, the code point 200 makes Č (a letter used by some Slavic languages) when utilized by the ISO/IEC 8859-2 code page, and makes Ш (a Cyrillic letter) when used by the ISO/IEC 8859-5 code page."*

### Strings
Strings are **inmutable sequences**.

In [3]:
# Example 1

word = 'by'
print(len(word),word)

# Example 2

empty = ''
print(len(empty))

# Example 3

i_am = 'I\'m'
print(len(i_am),i_am)

2 by
0
3 I'm


#### Multilines
Podemos separar una cadena en varias líneas, mediante tres ´´´string <br/>
continua string´´´. <br/>
Debemos llevar cuidado pues al separar líneas se incluirá un carácter extra **NO VISIBLE**, (\n), que contará al sumar el número de caracteres en una string.

In [4]:
multiline = '''Line #1
Line #2'''

print(len(multiline))

15


#### Operaciones con strings
• *The ability to use the same operator against completely different kinds of data (like numbers vs. strings) is called overloading (as such an operator is overloaded with different duties).* <br/>
• La función **min()** devuelve el mínimo valor de una string o lista. OJO: Las letras mayúsculas tienen un code Point menor en ASCII y por ello **min(['A','a'])** será A. La fución **max()** opera de forma análoga.<br/>
• El método **.index()** busca el índice en el que aparece el elemento (caracter) de interés, por ejemplo,
*print("aAbByYzZaA".index("b"))* dará como resultado 2. <br/>
• La función **list()** aplicada a una string, devuelve una lista con todos los caracteres de la string, cada uno como un elemento único de la lista en cuestión. <br/>
• La función **count()**, cuenta la frecuencia de un elemento en una lista.

In [14]:
str1 = 'a'
str2 = 'b'

print(str1 + str2)
print(str2 + str1)
print(5 * 'a')
print('b' * 4)

ab
ba
aaaaa
bbbb


### Indexing, Iterating and Slices

In [13]:
# Indexing strings.

the_string = 'silly walks'

for ix in range(len(the_string)):
    print(the_string[ix], end=' ')

# Iterating through a string.

the_string = 'silly walks'

for character in the_string:
    print(character, end=' ')

# Slices

alpha = "abdefg"

print(alpha[1:3])
print(alpha[3:])
print(alpha[:3])
print(alpha[3:-2])
print(alpha[3:-1])
print(alpha[-3:4])
print(alpha[::2])
print(alpha[1::2])

s i l l y   w a l k s s i l l y   w a l k s bd
efg
abd
e
ef
e
adf
beg


## Python methods for processing characters
https://docs.python.org/3.4/library/stdtypes.html#string-methods

### capitalize() method

In [2]:
# Demonstrating the capitalize() method:
print('aBcD'.capitalize())
print("Alpha".capitalize())
print('ALPHA'.capitalize())
print(' Alpha'.capitalize())
print('123'.capitalize())
print("βγδ".capitalize())

Abcd
Alpha
Alpha
 alpha
123
Βγδ


### center() method
Hace una copia de la string original tratando de centrarla dentro de un campo de caracteres de determinado ancho (que es el input de center). Si la anchura (numero de caracteres) es menor que el tamaño de la propia string, entonces string.center(a) nos devolverá la string original. <br/>
• **a** : Numero de caracteres de anchura del campo en que debe centrarse la string.

In [4]:
# Demonstrating the center() method:
print('[' + 'alpha'.center(10) + ']')
print('[' + 'Beta'.center(2) + ']')
print('[' + 'Beta'.center(4) + ']')
print('[' + 'Beta'.center(6) + ']')
print('[' + 'gamma'.center(20, '*') + ']')

[  alpha   ]
[Beta]
[Beta]
[ Beta ]
[*******gamma********]


### endswith() method
Comprueba si una string dada termina con el elemento indicado (el input suministrado) y en caso afirmativo devolverá *True* y en caso negativo *False*.

In [6]:
# Demonstrating the endswith() method:
if "epsilon".endswith("on"):
    print("yes")
else:
    print("no")


t = "zeta"
print(t.endswith("a"))
print(t.endswith("A"))
print(t.endswith("et"))
print(t.endswith("eta"))

yes
True
False
False
True


### find(substring,number) method
Es similar al método de index() con la diferencia de que cuando una substring no se encuentra en nuestra string objetivo, devuelve -1. En caso de encontrar la substring proporcionada en la string objetivo, devolverá el primer índice donde comienza dicha substring. <br/>
• number: indica desde que punto de la string principal comenzar a buscar.

In [9]:
# Demonstrating the find() method:
print("Eta".find("ta"))
print("Eta".find("mma"))

t = 'theta'
print(t.find('eta'))
print(t.find('et'))
print(t.find('the'))
print(t.find('ha'))

print('kappa'.find('a', 2))

1
-1
2
2
0
-1
4


In [10]:
# Find all the occurrences in a text
the_text = """A variation of the ordinary lorem ipsum
text has been used in typesetting since the 1960s
or earlier, when it was popularized by advertisements
for Letraset transfer sheets. It was introduced to
the Information Age in the mid-1980s by the Aldus Corporation,
which employed it in graphics and word-processing templates
for its desktop publishing program PageMaker (from Wikipedia)"""

fnd = the_text.find('the')
while fnd != -1:
    print(fnd)
    fnd = the_text.find('the', fnd + 1) #Cuidado esto da el índice, no es un contador

15
80
198
221
238
