# Ficheros

Hasta ahora, hemos aprendido cómo escribir programas y comunicar nuestras intenciones
a la Unidad Central de Procesamiento usando ejecución condicional,
funciones e iteraciones. Hemos aprendido cómo crear y usar estructuras de datos
en la Memoria Principal. La CPU y la memoria son los lugares donde nuestro
software trabaja y funciona. Ahí es donde se desarrolla toda la “inteligencia”.

En este capítulo, comenzaremos a trabajar con la Memoria Secundaria. En primer lugar nos centraremos en leer y escribir ficheros de texto, como los que se crean usando un editor de texto cualquiera. Más tarde veremos cómo trabajar con archivos de bases de datos, que son ficheros binarios diseñados específicamente
para ser leídos y escritos mediante software de manejo de bases de datos.

In [2]:
manf=open('mbox.txt')
print(manf)

<_io.TextIOWrapper name='mbox.txt' mode='r' encoding='cp1252'>


Si la apertura tiene éxito, el sistema operativo nos devuelve un manejador de
fichero (file handle). El manejador de fichero no son los datos que contiene en
realidad el archivo, sino que se trata de un “manejador” (handle) que se puede
utilizar para leer esos datos. Sólo obtendrás el manejador si el fichero especificado
existe y además dispones de los permisos apropiados para poder leerlo.

Si el fichero no existe, open fallará con un traceback, y no obtendrás ningún manejador
para poder acceder a su contenido:

## Lectura de ficheros

A pesar de que el **manejador de fichero** no contiene los datos del archivo, es
bastante fácil construir un bucle for para ir leyendo y contabilizando cada una de
las líneas de un fichero:

In [14]:
manf=open('mbox.txt')
contador=0
for linea in manf:
    contador=contador+1
print('Lineas contabilizadas:',contador)       
    


Lineas contabilizadas: 132045


Cuando el archivo se lee de este modo, usando un bucle for, Python se encarga de
dividir los datos del fichero en líneas independientes, usando el carácter de salto
de línea. Python lee cada línea hasta el salto de línea e incluye el propio salto de
línea como último carácter en la variable linea para cada iteración del bucle for.

Como el bucle for lee los datos línea a línea, puede leer y contar las líneas de forma
eficiente en ficheros muy extensos sin agotar la memoria de almacenamiento
de datos. El programa anterior puede contar las líneas de ficheros de cualquier tamaño
usando muy poca memoria, ya que cada línea es leída, contabilizada y luego
descartada.

Si sabes que el fichero es relativamente pequeño comparado con el tamaño de
tu memoria principal, puedes leer el fichero completo en una cadena usando el
método read sobre el manejador del fichero

In [16]:
manf=open('mbox.txt')
ent=manf.read()
print(len(ent))
print(ent[:20])

6687002
From stephen.marquar


## Busqueda dentro de un fichero

Por ejemplo, si queremos leer un fichero y mostrar unicamente las líneas que comienzan
con el prefijo “From:”, podemos usar el método de cadena **startwith** para
seleccionar solamente aquellas líneas con el prefijo deseado:

In [1]:
manf=open('mbox.txt')
for linea in manf:
    if linea.startswith('From:'):
        print(linea)

From: stephen.marquard@uct.ac.za

From: louis@media.berkeley.edu

From: zqian@umich.edu

From: rjlowe@iupui.edu

From: zqian@umich.edu

From: rjlowe@iupui.edu

From: cwen@iupui.edu

From: cwen@iupui.edu

From: gsilver@umich.edu

From: gsilver@umich.edu

From: zqian@umich.edu

From: gsilver@umich.edu

From: wagnermr@iupui.edu

From: zqian@umich.edu

From: antranig@caret.cam.ac.uk

From: gopal.ramasammycook@gmail.com

From: david.horwitz@uct.ac.za

From: david.horwitz@uct.ac.za

From: david.horwitz@uct.ac.za

From: david.horwitz@uct.ac.za

From: stephen.marquard@uct.ac.za

From: louis@media.berkeley.edu

From: louis@media.berkeley.edu

From: ray@media.berkeley.edu

From: cwen@iupui.edu

From: cwen@iupui.edu

From: cwen@iupui.edu

From: ray@media.berkeley.edu

From: cwen@iupui.edu

From: zqian@umich.edu

From: cwen@iupui.edu

From: zqian@umich.edu

From: zqian@umich.edu

From: zqian@umich.edu

From: mmmay@indiana.edu

From: cwen@iupui.edu

From: zqian@umich.edu

From: zqian@umich.edu

Fro

From: david.horwitz@uct.ac.za

From: antranig@caret.cam.ac.uk

From: ian@caret.cam.ac.uk

From: ian@caret.cam.ac.uk

From: ian@caret.cam.ac.uk

From: antranig@caret.cam.ac.uk

From: ian@caret.cam.ac.uk

From: ian@caret.cam.ac.uk

From: ian@caret.cam.ac.uk

From: david.horwitz@uct.ac.za

From: ian@caret.cam.ac.uk

From: aaronz@vt.edu

From: aaronz@vt.edu

From: rjlowe@iupui.edu

From: rjlowe@iupui.edu

From: rjlowe@iupui.edu

From: ian@caret.cam.ac.uk

From: gopal.ramasammycook@gmail.com

From: ian@caret.cam.ac.uk

From: david.horwitz@uct.ac.za

From: gopal.ramasammycook@gmail.com

From: antranig@caret.cam.ac.uk

From: arwhyte@umich.edu

From: arwhyte@umich.edu

From: arwhyte@umich.edu

From: ian@caret.cam.ac.uk

From: ian@caret.cam.ac.uk

From: ray@media.berkeley.edu

From: ktsao@stanford.edu

From: sgithens@caret.cam.ac.uk

From: zqian@umich.edu

From: cwen@iupui.edu

From: antranig@caret.cam.ac.uk

From: zqian@umich.edu

From: jimeng@umich.edu

From: jimeng@umich.edu

From: antranig@

La salida parece ser correcta, ya que las únicas líneas que vemos son aquellas que
comienzan por “From:”. Pero, ¿por qué estamos viendo líneas extra vacías? Esto
se debe al carácter invisible de salto de línea. Cada una de las líıneas termina con
un salto de línea, de modo que la sentencia print imprime la cadena que está en
la variable linea y que incluye un salto de línea, y a continuación print añade
otro salto de línea, cuyo resultado es el efecto de doble espaciado que podemos
ver.

Podríamos usar rebanado de líneas para imprimir todo menos el último carácter,
pero un enfoque más sencillo consiste en usar el método **rstrip**, que retira los espacios
en blanco de la parte derecha de una cadena, como se muestra a continuación:

In [3]:
data=open('mbox.txt')
for linea in data:
    linea=linea.rstrip()
    if linea.startswith('From:'):
        print(linea)

From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: gsilver@umich.edu
From: gsilver@umich.edu
From: zqian@umich.edu
From: gsilver@umich.edu
From: wagnermr@iupui.edu
From: zqian@umich.edu
From: antranig@caret.cam.ac.uk
From: gopal.ramasammycook@gmail.com
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: louis@media.berkeley.edu
From: ray@media.berkeley.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: ray@media.berkeley.edu
From: cwen@iupui.edu
From: zqian@umich.edu
From: cwen@iupui.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: mmmay@indiana.edu
From: cwen@iupui.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: cwen@iupui.ed

From: ray@media.berkeley.edu
From: chmaurer@iupui.edu
From: gopal.ramasammycook@gmail.com
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: rjlowe@iupui.edu
From: ian@caret.cam.ac.uk
From: gjthomas@iupui.edu
From: gjthomas@iupui.edu
From: gjthomas@iupui.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: chmaurer@iupui.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: aaronz@vt.edu
From: gjthomas@iupui.edu
From: gjthomas@iupui.edu
From: gjthomas@iupui.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: chmaurer@iupui.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: chmaurer@iupui.ed

From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: cwen@iupui.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: kimsooil@bu.edu
From: mmmay@indiana.edu
From: zqian@umich.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: kimsooil@bu.edu
From: aaronz@vt.edu
From: dlhaines@umich.edu
From: zqian@umich.edu
From: mmmay@indiana.edu
From: dlhaines@umich.edu
From: cwen@iupui.edu
From: kimsooil@bu.edu
From: kimsooil@bu.edu
From: kimsooil@bu.edu
From: hu2@iupu

A medida que los programas de procesado de archivos se van volviendo más complejos, tal vez prefieras estructurar los bucles de búsqueda usando **continue**. La idea básica del bucle de búsqueda es que estamos localizando líneas “interesantes”, en realidad saltándonos aquellas que “no nos interesan”. Y a continuación, cuando encontramos una línea interesante, hacemos algo con ella.

In [21]:
data=open('mbox.txt')
for linea in data:
    linea=linea.rstrip()
    if not linea.startswith('From:'):
        continue
    print(linea)

From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: zqian@umich.edu
From: rjlowe@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: gsilver@umich.edu
From: gsilver@umich.edu
From: zqian@umich.edu
From: gsilver@umich.edu
From: wagnermr@iupui.edu
From: zqian@umich.edu
From: antranig@caret.cam.ac.uk
From: gopal.ramasammycook@gmail.com
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: david.horwitz@uct.ac.za
From: stephen.marquard@uct.ac.za
From: louis@media.berkeley.edu
From: louis@media.berkeley.edu
From: ray@media.berkeley.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: ray@media.berkeley.edu
From: cwen@iupui.edu
From: zqian@umich.edu
From: cwen@iupui.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: mmmay@indiana.edu
From: cwen@iupui.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: cwen@iupui.ed

From: josrodri@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: cwen@iupui.edu
From: david.horwitz@uct.ac.za
From: rjlowe@iupui.edu
From: sgithens@caret.cam.ac.uk
From: louis@media.berkeley.edu
From: louis@media.berkeley.edu
From: ktsao@stanford.edu
From: ray@media.berkeley.edu
From: ian@caret.cam.ac.uk
From: ian@caret.cam.ac.uk
From: ian@caret.cam.ac.uk
From: ian@caret.cam.ac.uk
From: cwen@iupui.edu
From: arwhyte@umich.edu
From: arwhyte@umich.edu
From: ostermmg@whitman.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: gsilver@umich.edu
From: gsilver@umich.edu
From: mmmay@indiana.edu
From: mmmay@indiana.edu
From: zqian@umich.edu
From: zqian@umich.edu
From: mmmay@indiana.edu
From: zqian@umich.edu
Fro

From: aaronz@vt.edu
From: aaronz@vt.edu
From: aaronz@vt.edu
From: aaronz@vt.edu
From: rjlowe@iupui.edu
From: rjlowe@iupui.edu
From: rjlowe@iupui.edu
From: ray@media.berkeley.edu
From: ajpoland@iupui.edu
From: rjlowe@iupui.edu
From: ajpoland@iupui.edu
From: rjlowe@iupui.edu
From: rjlowe@iupui.edu
From: rjlowe@iupui.edu
From: cwen@iupui.edu
From: bkirschn@umich.edu
From: gsilver@umich.edu
From: john.ellis@rsmart.com
From: aaronz@vt.edu
From: bkirschn@umich.edu
From: gopal.ramasammycook@gmail.com
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: chmaurer@iupui.edu
From: dlhaines@umich.edu
From: dlhaines@umich.edu
From: ajpoland@iupui.edu
From: aaronz@vt.edu
From: sgithens@caret.cam.ac.uk
From: aaronz@vt.edu
From: jimeng@umich.edu
From: ostermmg@whitman.edu
From: ostermmg@whitman.edu
From: jimeng@umich.edu
From: aaronz@vt.edu
From: aaronz@vt.edu
From: dlhaines@umich.edu
From: dlhaines@umich.edu
From: dlhaines@umich.edu
From: dlhaines@umich.edu
From: dlhaines@umich.edu
From: sgithens@

La salida del programa es la misma. Traduciendo, las líneas que no nos interesan
son aquellas que no comienzan por “From:”, de modo que las saltamos usando
continue. En cambio las líneas “interesantes” (es decir, aquellas que comienzan
por “From:”), procedemos a procesarlas.

Podemos usar el método **find** para simular una búsqueda como la de un editor
que texto, que localice aquellas líneas que contengan la cadena buscada en cualquier
punto de las mismas. Dado que **find** comprueba la aparición de una cadena
dentro de otra y **devuelve la posición de la cadena o -1 si no la ha encontrado**,
podemos escribir el bucle siguiente para mostrar aquellas líneas que contienen la
cadena “@uct.ac.za” (es decir, las que proceden de la Universidad de Cape Town
en Sudáfrica):

In [23]:
data=open('mbox.txt')
for linea in data:
    linea=linea.rstrip()
    if linea.find('@uct.ac.za')== -1:
        continue
    print(linea)

From stephen.marquard@uct.ac.za Sat Jan  5 09:14:16 2008
From: stephen.marquard@uct.ac.za
Author: stephen.marquard@uct.ac.za
From david.horwitz@uct.ac.za Fri Jan  4 07:02:32 2008
From: david.horwitz@uct.ac.za
Author: david.horwitz@uct.ac.za
r39753 | david.horwitz@uct.ac.za | 2008-01-04 13:05:51 +0200 (Fri, 04 Jan 2008) | 1 line
From david.horwitz@uct.ac.za Fri Jan  4 06:08:27 2008
From: david.horwitz@uct.ac.za
Author: david.horwitz@uct.ac.za
From david.horwitz@uct.ac.za Fri Jan  4 04:49:08 2008
From: david.horwitz@uct.ac.za
Author: david.horwitz@uct.ac.za
From david.horwitz@uct.ac.za Fri Jan  4 04:33:44 2008
From: david.horwitz@uct.ac.za
Author: david.horwitz@uct.ac.za
From stephen.marquard@uct.ac.za Fri Jan  4 04:07:34 2008
From: stephen.marquard@uct.ac.za
Author: stephen.marquard@uct.ac.za
r35793 | david.horwitz@uct.ac.za | 2007-09-26 05:26:53 -0400 (Wed, 26 Sep 2007) | 2 lines
r38153 | david.horwitz@uct.ac.za | 2007-11-14 01:53:07 -0500 (Wed, 14 Nov 2007) | 1 line
r39548 | david.hor

From david.horwitz@uct.ac.za Mon Oct 29 06:46:00 2007
From: david.horwitz@uct.ac.za
Author: david.horwitz@uct.ac.za


## Permitiendo al usuario elegir el nombre del fichero

Esto es bastante sencillo de hacer, pidiendo el nombre del fichero al usuario mediante
el uso de **input**, como se muestra a continuación:

In [3]:
filename=input('introduzca el nombre del fichero:')
data=open(filename)
contador=0
for linea in data:
    if linea.startswith('Subject:'):
        contador=contador+1
print('Hay',contador,'lineas Subject en',filename)       

introduzca el nombre del fichero:mbox.txt
Hay 1797 lineas Subject en mbox.txt


Antes de asomarte a la siguiente sección, échale un vistazo al programa anterior y
pregúntate a ti mismo: “¿Qué podría salir mal aquí?”, o “¿Qué podría hacer nuestro simpático usuario que provoque que nuestro bonito programita termine sin gracia,
con un tracebak, haciéndonos parecer menos geniales ante los usuarios?

## Uso de try, except, y open

¿Qué ocurre si nuestro usuario escribe algo que no es un nombre de fichero?

podemos solucionarlo de forma elegante usando la estructura **try/except**. Debemos asumir que la llamada a open puede fallar y añadir código de recuperación para ese fallo, como se muestra a continuación:

In [None]:
filename=input('Introduzca el nombre del fichero:')
try:
    data=open(filename)
except:
    print('No se pudo abrir el fichero', filename)
    exit()
contador=0
for linea in data:
    if linea.startswith('Subject:'):
        contador=contador+1
print('Hay',contador,'lineas Subject en', filename)

In [None]:
filename=input('Introduzca el nombre del fichero:')
try:
    data=open(filename)
    contador=0
    for linea in data:
        if linea.startswith('Subject:'):
            contador=contador+1
    print('Hay',contador,'lineas Subject en', filename)
except:
    print('No se pudo abrir el fichero', filename)
    exit()


La protecciÓn de la llamada a **open** es un buen ejemplo del uso correcto de try y
except en un programa Python. Se utiliza el término “Pythónico” cuando estamos
haciendo algo al “modo Python”. Podríamos decir que el ejemplo de arriba es el
modo Pythónico de abrir un archivo.

## Escritura de ficheros

Para escribir en un fichero, debes abrirlo usando el modo 'w' (de write) como
segundo parámetro:

In [4]:
out=open('salida.txt','w')
print(out)

<_io.TextIOWrapper name='salida.txt' mode='w' encoding='cp1252'>


**Si el fichero ya existe, abrirlo en modo escritura eliminará los datos antiguos y lo
dejará completamente vacío, ¡así que ten cuidado! Si el fichero no existe, se creará
nuevo.**

El método write del objeto manejador del fichero pone datos dentro del archivo.


In [6]:
out=open('salida.txt','w')
linea1='tenemos nuestra primera linea,\n'
out.write(linea1)

31

El objeto fichero también realiza el seguimiento de la posición dentro del fichero,
de modo que si se llama a **write** otra vez, añadirá los datos nuevos al final del
archivo.

Deberemos asegurarnos de gestionar los finales de las líneas mientras escribimos
en el fichero, insertando explícitamente el carácter de salto cuando queramos terminar
una línea. La sentencia print añade un salto de línea automáticamente,
pero el método write no lo hace a menos que se lo especifiquemos.

Cuando hayas terminado de escribir, debes cerrar el fichero para asegurarte de que
hasta el último bit de datos se escriba físicamente en el disco, de modo que no se
pierda si la corriente se interrumpe.

In [7]:
out.close()

También se pueden cerrar los ficheros que se han abierto en modo lectura, pero
no es necesario que seamos muy estrictos con ello si solamente estamos abriendo
unos pocos archivos, ya que Python se asegura de que todos los ficheros queden
cerrados cuando el programa termina. En cambio, en el caso de que estemos escribiendo
ficheros, deberemos cerrarlos explícitamente para no dejar nada al azar.

**Ejercicio 7.1** Escribe un programa que lea un fichero e imprima en pantalla su
contenido (línea a línea), todo en mayúsculas.

In [4]:
data=open('mbox-short.txt')
for linea in data:
    linea=linea.rstrip()
    print(linea.upper())

FROM STEPHEN.MARQUARD@UCT.AC.ZA SAT JAN  5 09:14:16 2008
RETURN-PATH: <POSTMASTER@COLLAB.SAKAIPROJECT.ORG>
RECEIVED: FROM MURDER (MAIL.UMICH.EDU [141.211.14.90])
	 BY FRANKENSTEIN.MAIL.UMICH.EDU (CYRUS V2.3.8) WITH LMTPA;
	 SAT, 05 JAN 2008 09:14:16 -0500
X-SIEVE: CMU SIEVE 2.3
RECEIVED: FROM MURDER ([UNIX SOCKET])
	 BY MAIL.UMICH.EDU (CYRUS V2.2.12) WITH LMTPA;
	 SAT, 05 JAN 2008 09:14:16 -0500
RECEIVED: FROM HOLES.MR.ITD.UMICH.EDU (HOLES.MR.ITD.UMICH.EDU [141.211.14.79])
	BY FLAWLESS.MAIL.UMICH.EDU () WITH ESMTP ID M05EEFR1013674;
	SAT, 5 JAN 2008 09:14:15 -0500
RECEIVED: FROM PAPLOO.UHI.AC.UK (APP1.PROD.COLLAB.UHI.AC.UK [194.35.219.184])
	BY HOLES.MR.ITD.UMICH.EDU ID 477F90B0.2DB2F.12494 ;
	 5 JAN 2008 09:14:10 -0500
RECEIVED: FROM PAPLOO.UHI.AC.UK (LOCALHOST [127.0.0.1])
	BY PAPLOO.UHI.AC.UK (POSTFIX) WITH ESMTP ID 5F919BC2F2;
	SAT,  5 JAN 2008 14:10:05 +0000 (GMT)
MESSAGE-ID: <200801051412.M05ECIAH010327@NAKAMURA.UITS.IUPUI.EDU>
MIME-VERSION: 1.0
CONTENT-TRANSFER-ENCODING: 7BIT
RE

**Ejercicio 7.2** Escribe un programa que pida el nombre de un fichero y después
lea ese fichero, buscando líneas que tengan la forma:
X-DSPAM-Confidence: 0.8475
Cuando encuentres una línea que comience por “X-DSPAM-Confidence:”, separa
esa línea para extraer el número en punto flotante que figure en ella. Cuenta esas
línea y calcula también el total de los valores de probabilidad de spam (spam confidence)
de estas líneas. Cuando alcances el final del archivo, muestra en pantalla
el valor medio de probabilidad de spam.

In [2]:
fichero=input('ingrese fichero: ')
try:
    data_2=open(fichero)
    contador=0
    suma=0
    for linea in data_2:
        if linea.find('X-DSPAM-Confidence:')== -1:
            continue
        linea=linea.rstrip()
        numero=float(linea[20:])
        suma=suma+numero
        contador=contador+1
    print('Valor medio de probabilidad de Spam:',suma/contador)
    
except:
    print('no se pudo abrir el fichero:',fichero)

ingrese fichero: mbox-short.txt
Valor medio de probabilidad de Spam: 0.7507185185185187


**Ejercicio 7.3** Algunas veces, cuando los programadores se aburren o quieren divertirse
un poco, añaden un inofensivo Huevo de Pascua (Easter Egg) en sus
programas [Link](https://es.wikipedia.org/wiki/Huevo_de_pascua_(virtual)). Modifica
el programa que pide al usuario el nombre del fichero para que imprima un
mensaje divertido cuando el usuario escriba el nombre exacto “na na boo boo”.
El programa debe comportarse normalmente con todos los demás ficheros, tanto
los que existan como los que no.

In [1]:
fichero=input('Ingrese el nombre del fichero: ')
contador=0
try:
    data=open(fichero)
    for linea in data:
        if linea.startswith('Subject:'):
            contador=contador+1
    print('hay',contador,'lineas Subject en', fichero)
except:
    if fichero == 'na na boo boo':
        print('na na boo boo tu abuela')
    else:
        print('error al ingresar el fichero')

Ingrese el nombre del fichero: na na boo boo
na na boo boo tu abuela
