## **Praca z Plikami Tekstowymi (2h)**  





### **Otwieranie, Czytanie i Zapis Plików Tekstowych**  

W Pythonie pliki otwiera się za pomocą funkcji **`open()`**, która zwraca obiekt pliku. Praca z plikami obejmuje tryby odczytu, zapisu i dopisywania.

Funkcję `open()` można użyć w kontekście with, aby zapewnić automatyczne zamknięcie pliku po zakończeniu pracy.

Bez kontekstu with, plik musi być zamknięty za pomocą funkcji `close()`. Przykład:

```python
f = open("plik.txt", "r")
try:
    # Praca z plikiem
finally:
    f.close()
```
równoważny kod z użyciem kontekst managera:

```python
with open("plik.txt", "r") as f:
    # Praca z plikiem
``` 

#### Parametry funkcji `open()`

- `file` - ścieżka do pliku
- `mode` - tryb otwarcia pliku
- `encoding` - kodowanie pliku (domyślnie UTF-8)
...



In [2]:
# help(open)



#### **Tryby Otwierania Plików**  

| Tryb   | Opis                                           |
|--------|------------------------------------------------|
| `"r"`  | Odczyt (domyślny). Błąd, jeśli plik nie istnieje. |
| `"w"`  | Zapis. Tworzy nowy plik lub nadpisuje istniejący. |
| `"a"`  | Dopisuje na końcu pliku (tworzy plik, jeśli nie istnieje). |
| `"r+"` | Odczyt i zapis. Błąd, jeśli plik nie istnieje. |
| `"rb"` | Odczyt binarny.                               |
| `"wb"` | Zapis binarny.                                |



#### **Odczyt Pliku Tekstowego**  

In [3]:
# Odczyt całego pliku
with open("dane/document.txt", "r", encoding="utf-8") as f:
    zawartosc = f.read()
    print(zawartosc)

Ground particular something financial music.
The document was modified on 1984-11-07.
Server IP: 191.9.107.181 connected at 2014-04-18.
The document was modified on 1989-05-11.
The document was modified on 2020-10-18.
The document was modified on 2001-02-08.
Feel health price side.
Time help pull actually child where.
Specific stage scene both design quite law.
Contact grantbaker@hotmail.com for more details.
Big industry court tax section return.
The document was modified on 2018-04-29.
Accept level upon major stuff control air.
The document was modified on 2020-06-29.
Contact andre53@yahoo.com for more details.
Server IP: 16.28.190.38 connected at 1994-02-18.
Contact knightalexander@jordan.com for more details.
Check field say environmental performance great explain.
The document was modified on 1979-08-09.
Control generation produce bring fund discuss nearly.
Server IP: 71.234.63.177 connected at 1980-04-03.
Server IP: 177.210.70.229 connected at 2021-05-03.
Contact donald47@bell.bi

#### **Odczyt Linii Po Linii**  

In [9]:
# Odczyt linia po linii
with open("dane/document.txt", "r", encoding="utf-8") as f:
    for linia in f:
        print(linia.strip())  # Usunięcie znaków białych

Ground particular something financial music.
The document was modified on 1984-11-07.
Server IP: 191.9.107.181 connected at 2014-04-18.
The document was modified on 1989-05-11.
The document was modified on 2020-10-18.
The document was modified on 2001-02-08.
Feel health price side.
Time help pull actually child where.
Specific stage scene both design quite law.
Contact grantbaker@hotmail.com for more details.
Big industry court tax section return.
The document was modified on 2018-04-29.
Accept level upon major stuff control air.
The document was modified on 2020-06-29.
Contact andre53@yahoo.com for more details.
Server IP: 16.28.190.38 connected at 1994-02-18.
Contact knightalexander@jordan.com for more details.
Check field say environmental performance great explain.
The document was modified on 1979-08-09.
Control generation produce bring fund discuss nearly.
Server IP: 71.234.63.177 connected at 1980-04-03.
Server IP: 177.210.70.229 connected at 2021-05-03.
Contact donald47@bell.bi

#### **4.1.4. Odczyt Do Listy**  

In [10]:
# Wczytanie wszystkich linii jako listy
with open("dane/document.txt", "r") as f:
    linie = f.readlines()
    print(linie)

['Ground particular something financial music.\n', 'The document was modified on 1984-11-07.\n', 'Server IP: 191.9.107.181 connected at 2014-04-18.\n', 'The document was modified on 1989-05-11.\n', 'The document was modified on 2020-10-18.\n', 'The document was modified on 2001-02-08.\n', 'Feel health price side.\n', 'Time help pull actually child where.\n', 'Specific stage scene both design quite law.\n', 'Contact grantbaker@hotmail.com for more details.\n', 'Big industry court tax section return.\n', 'The document was modified on 2018-04-29.\n', 'Accept level upon major stuff control air.\n', 'The document was modified on 2020-06-29.\n', 'Contact andre53@yahoo.com for more details.\n', 'Server IP: 16.28.190.38 connected at 1994-02-18.\n', 'Contact knightalexander@jordan.com for more details.\n', 'Check field say environmental performance great explain.\n', 'The document was modified on 1979-08-09.\n', 'Control generation produce bring fund discuss nearly.\n', 'Server IP: 71.234.63.17

#### **Zapis Do Pliku Tekstowego**  

In [14]:
# Zapis do pliku
with open("dane/wynik.txt", "w", encoding="utf-8") as f:
    f.write("Witaj w Pythonie!\n")
    f.write("Zapis do pliku tekstowego działa!")

#### **Dopisywanie Danych Do Pliku**  

In [16]:
# Dopisanie nowej linii
with open("dane/wynik.txt", "a", encoding="utf-8") as f:
    f.write("\nDopisana nowa linia!")

### **Obsługa Kodowania i Polskich Liter**  

Python domyślnie używa kodowania **UTF-8**, które obsługuje polskie znaki, np. `ą`, `ę`, `ł`, `ó`, `ź`. 

Jeśli plik jest kodowany w innym kodowaniu, to należy jawnie określić kodowanie przy odczycie i zapisie pliku.

Przy odczycie pliku można użyć funkcji `chardet` do wykrycia kodowania pliku.


#### **Zapis i Odczyt Polskich Liter**  

```python
# Zapis z polskimi literami
with open("polski_tekst.txt", "w", encoding="utf-8") as f:
    f.write("Zażółć gęślą jaźń - polskie znaki działają!")

# Odczyt pliku
with open("polski_tekst.txt", "r", encoding="utf-8") as f:
    print(f.read())
```





#### **Wykrywanie Kodowania Pliku (moduł `chardet`)**  

```python
import chardet

# Wykrywanie kodowania pliku
with open("plik_nieznany.txt", "rb") as f:
    wynik = chardet.detect(f.read())
    print(f"Znalezione kodowanie: {wynik['encoding']}")
```



In [22]:
import chardet

tekst = """Zażółć gęślą jaźń - polskie znaki działają! Ala ma kota a kot ma alę. 
Dużo różnych znaków dla poprawienia szansy na poprawne odczytanie pliku.
Wyrewolwerowana krowa!
"""

wynik = chardet.detect(tekst.encode())
print(wynik)


wynik = chardet.detect(tekst.encode("utf-16"))
print(wynik)


{'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
{'encoding': 'UTF-16', 'confidence': 1.0, 'language': ''}
