## Praca z plikami 

Na ostatnich zajęciach wykorzystaliśmy bibliotekę pandas do otwierania plików CSV. To jednak nie jedyne rozszerzenia z jakim możemy pracować. Warto znać też ogólne metody pracy z plikami.

In [None]:
adres = "C:/Users/jr/OneDrive/Documents/GitHub/Karowa_Python_Introduction/Zajecia 9/"
plik = "pep-0020.txt"
f = open(adres + plik)

print(f.read())

# Plik trzeba zamknąć - inaczej nie mogą korzystać z niego inne osoby bądź inne programy
f.close()

Standardowy zapis ścieżki do pliku różni się od tego jaki możemy skopiować z eksploratora Windows. 

Takie kopiowanie ma jednak zasadniczy efekt uboczny:
* Program najcześciej zwróci błąd - znak \ uznawany jest jako początek wyrażenia specjalnego. Jak te nie będzie zdefiniowane program zakończy działalnie. 
* Nawet jak nie znaki \t zostaną potraktowane jako tabulator, \n - koniec linii etc.

Można jemu zapobiec dodając przed nazwą literę r' (tzw. *raw literal*)

Ewentualnie możliwe jest użycie podwójnego ukośnika (\\)

In [None]:
# To zwróci błąd
adres = 'C:\Users\jr\OneDrive\Documents\GitHub\Karowa_Python_Introduction\Zajecia 9'

In [None]:
# Tak wygląda wersja poprawna
adres = r'C:\Users\jr\OneDrive\Documents\GitHub\Karowa_Python_Introduction\Zajecia 9'

print(adres + '\\' + plik)


### Zapisywanie informacji w plikach
Użycie funkcji *open* bez specyfikacji dodatkowych parametrów otwiera pliki do odczytu. Aby zapisywać będziemy musieli odblokować odpowiedni tryb. Robi to literka "w".

Otwarcie pliku z nową nazwą automatycznie go utworzy. 

In [None]:
adres = r'C:\Users\jr\OneDrive\Documents\GitHub\Karowa_Python_Introduction\Zajecia 9'
plik = "TestWrite.txt"

f = open(adres + '\\' + plik, "w")

f.write("My name is Bond. James Bond\n")

f.close()

Pliki mają także tryb pozwalający dodawać dodatkową treść - wtedy używamy literki a - od *append*

In [None]:
f = open(adres + '\\' + plik, "a")
quotes =  ["Yippee-ki-yay, Motherfucker\n", "Hasta la vista, baby\n"]
f.writelines(quotes)

f.close()

### Przykład praktyczny: Wordcloud
Praca z dłuższymy tekstami zazwyczaj kończy się wizualizacją w postaci chmury słów. Zrobimy takową dla manifestu Pythona. 

In [None]:
adres = "C:/Users/jr/OneDrive/Documents/GitHub/Karowa_Python_Introduction/Zajecia 9/"
plik = "pep-0020.txt"

# Blok with zamknie plik po zakończeniu 
with open (adres + plik) as t:
  tekst = t.read()

Biblioteka wordcloud powinna być w systemie, jakby byo inaczej taka komenda zacznie instalację: 

In [None]:
pip install wordcloud 

In [None]:
# To ustawienie pozwala wyświetlić obrazek w Jupyterze bezpośrednio pod kodem
%matplotlib inline

from wordcloud import WordCloud
import matplotlib.pyplot as plt
wordcloud = WordCloud().generate(tekst)
plt.figure()
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()


## Obsługa wyjątków

Część operacji prowadzonych na plikach czy w usługach sieciowych może nie powieść się z wielorakich przyczyn np.:
* Ktoś równolegle otwiera plik i założył dla niego blokadę. 
* Serwer nie udzielił odpowiedzi w wyznaczonym czasie (timeout)

Programy można pisać tak, aby reagowały na potencjalne błędy. Służy do tego instrukcja *try*. Jej składnie przedstawie na programie z przeliczenime prostego dzielenia:

In [None]:
try:
  a = input("Wpisz numer:")
  b = 8 / int(a)
  print(b)
except:
  print("Wpisałeś zero. Takie dzielenie nie istnieje")

Warto zwrócić uwagę, że program może mieć obsługę kilku różnych rodzajów błędów - w tymp przypadku dzielenie przez zero będzie poowdowało inny tekst niż wpisanie wartości która nie jest liczbą:

In [None]:
try:
  a = input("Wpisz numer:")
  b = 8 / int(a)
  print(b)
except ZeroDivisionError:
  print("Wpisałeś zero. Takie dzielenie nie istnieje")
except ValueError: 
  print("Nie wpisałeś liczby")


Lista dostępnych błędów wbudowanych w język Python opisana jest [tutaj](https://docs.python.org/3/library/exceptions.html)

### Przykład - blok try w pętli while
Wyobraźmy sobie sytuację, gdzie musimy uzyskać połączenie do bazy danych, aby kontynuować wykonanie działań. Za pomocą pętli *while* oraz instrukcji *try* można wykonać mechanizm, który będzie łączył się do skutku bądź określoną liczbę razy.

Przykład poniżej:

In [None]:
import random

isConnected = False
attempt = 0 

while isConnected == False and attempt <= 15: 
  attempt += 1 
  try:
      #Tutaj rolę ryzykownej instrukcji gra sztuczne wygenerowanie dzielenia przez zero
      a = random.randint(0, 10)
      if a <= 8:
        b =  a / 0 
      isConnected = True
  except:
      print("Attempt ", attempt , " - interrupted")

### Problemy z obsługą wyjątków
Przy obsłudze wyjątków trzeba zachować uwagę - łatwo napisać program, który zwraca błędnę wyniki, bo ignoruje błąd. Potem poszukiwanie źródła problemu bywa długotrwałe. 

Przykład takiego problemu poniżej - wszystkie błędy obsługiwane są przez instrukcje *pass*, która robi zupełnie nic. 

In [None]:
import pandas as pd
a = [1,2,3,4,5]
b = ['a','b','c','d',None]

new_a = []
new_b = []
for i in range(0,5):
  try:
      new_a.append(a[i]+5)
      new_b.append(b[i]+"a")
  except:
    pass

try:
  df = pd.DataFrame({"a": new_a, "b": new_b})
  print(df)
except:
  pass
