# Praca z Systemem Plików w Pythonie

## Spis treści:
1. [Moduł os - podstawowe operacje](#os)
2. [Moduł pathlib - obiektowe podejście do ścieżek](#pathlib)
3. [Moduł shutil - operacje na plikach i katalogach](#shutil)
4. [Moduł glob - wyszukiwanie plików](#glob)

## 1. Moduł os <a id='os'></a>

Moduł `os` zapewnia podstawowe funkcje do interakcji z systemem operacyjnym.

In [3]:
import os

print("Bieżący katalog:", os.getcwd())

# zmiana katalogu
os.chdir('/Users/rkorzen/PycharmProjects/szkolenia/alx/2024_12_12_python_dla_inżynierów/przyklady')

# Sprawdzenie bieżącego katalogu
print(f"Bieżący katalog: {os.getcwd()}")


# Listowanie zawartości katalogu
print("\nZawartość katalogu:")
for item in os.listdir():
    print(item)

# Tworzenie katalogu
os.makedirs('test_dir', exist_ok=True)

# Sprawdzanie istnienia pliku/katalogu
print(f"\nCzy 'test_dir' istnieje? {os.path.exists('test_dir')}")

# Informacje o pliku
file_stats = os.stat('test_dir')
print(f"\nInformacje o katalogu:\n{file_stats}")

# usuwanie katalogu
os.rmdir('test_dir')
print(f"\nCzy 'test_dir' istnieje? {os.path.exists('test_dir')}")

print("posprzątane")

Bieżący katalog: /Users/rkorzen/PycharmProjects/szkolenia/alx/2024_12_12_python_dla_inżynierów/przyklady
Bieżący katalog: /Users/rkorzen/PycharmProjects/szkolenia/alx/2024_12_12_python_dla_inżynierów/przyklady

Zawartość katalogu:
zadanie_2_konwersja_jednostek.py
tcpip_server.py
temperatura_wykres.html
zadanie_1_geodezyjne.py
zadanie_3_statystyka_danych.py
tcpip_client.py
zadanie_3_anonimizacja.py
zadanie_1_wyszukiwanie.py
goey_config.json
zadanie_2_licznik_slow.py
temperatura_klient.py
belka_click.py
temperatura_serwer.py
belka_argparse.py
belka_gooey.py

Czy 'test_dir' istnieje? True

Informacje o katalogu:
os.stat_result(st_mode=16877, st_ino=483476175, st_dev=16777220, st_nlink=2, st_uid=501, st_gid=20, st_size=64, st_atime=1733860351, st_mtime=1733860351, st_ctime=1733860351)

Czy 'test_dir' istnieje? False
posprzątane


Funkcja os.stat() zwraca obiekt z różnymi informacjami o pliku. Oto wyjaśnienie poszczególnych atrybutów:

In [7]:
import os

os.chdir('/Users/rkorzen/PycharmProjects/szkolenia/alx/2024_12_12_python_dla_inżynierów')

file_stats = os.stat('requirements.txt')
print(file_stats)


# Atrybuty os.stat:
# st_mode   # Uprawnienia pliku (bity uprawnień)
# st_ino    # Numer i-węzła (inode)
# st_dev    # Identyfikator urządzenia
# st_nlink  # Liczba dowiązań twardych
# st_uid    # ID użytkownika właściciela
# st_gid    # ID grupy właściciela
# st_size   # Rozmiar w bajtach
# st_atime  # Czas ostatniego dostępu (access time)
# st_mtime  # Czas ostatniej modyfikacji (modification time)
# st_ctime  # Czas utworzenia na Windows, czas zmiany metadanych na Unix (creation/change time)

os.stat_result(st_mode=33188, st_ino=483119533, st_dev=16777220, st_nlink=1, st_uid=501, st_gid=20, st_size=239, st_atime=1733825005, st_mtime=1733825002, st_ctime=1733825002)


### Operacje na ścieżkach z os.path

In [8]:
# Operacje na ścieżkach
path = os.path.join('test_dir', 'test_file.txt')
print(f"Pełna ścieżka: {path}")
print(f"Katalog: {os.path.dirname(path)}")
print(f"Nazwa pliku: {os.path.basename(path)}")
print(f"Rozszerzenie: {os.path.splitext(path)[1]}")

Pełna ścieżka: test_dir/test_file.txt
Katalog: test_dir
Nazwa pliku: test_file.txt
Rozszerzenie: .txt


In [16]:
%%writefile przyklady/parent_path.py
# by wejsc poziom wyzej
import os
#     drugi poziom wyzej  pierwszy poziom wyzej  bieżący poziom  bieżąca ścieżka pliku
print(os.path.dirname(    os.path.dirname(       os.path.dirname(os.path.abspath(__file__)))))


Overwriting przyklady/parent_path.py


In [17]:
!python przyklady/parent_path.py

/Users/rkorzen/PycharmProjects/szkolenia/alx


## 2. Moduł pathlib <a id='pathlib'></a>

Moduł `pathlib` wprowadza obiektowe podejście do operacji na ścieżkach.

In [8]:
from pathlib import Path

# Tworzenie obiektu ścieżki
current_dir = Path.cwd()
print(f"Bieżący katalog: {current_dir}")

# tworzenie ścieżki do przyklady
przyklady_dir = current_dir / 'przyklady'

# Sprawdzenie czy katalog przyklady istnieje
print(f"Czy katalog przyklady istnieje? {przyklady_dir.exists()}")


# Tworzenie ścieżki do pliku
test_dir = przyklady_dir / 'test_dir'

# Czy test_dir istnieje?
print(f"Czy test_dir istnieje? {test_dir.exists()}")

# Tworzenie katalogu
test_dir.mkdir(parents=True, exist_ok=True)

# Tworzenie ścieżki do pliku
file_path = test_dir / 'example.txt'
print(f"\nŚcieżka do pliku: {file_path}")

# Tworzenie pliku i zapis
file_path.write_text('Hello from pathlib!')

# Informacje o pliku
print(f"\nInformacje o pliku:")
print(f"Suffix: {file_path.suffix}")
print(f"Stem: {file_path.stem}")
print(f"Parent: {file_path.parent}")

# Iterowanie po plikach w katalogu
print("\nPliki .txt w katalogu:")
for file in test_dir.glob('**/*.txt'):
    print(file)

# usuwanie pliku
file_path.unlink()

# usuwanie katalogu
test_dir.rmdir()

# sprawdzenie czy plik istnieje
print(f"Czy plik istnieje? {file_path.exists()}")

# sprawdzenie czy katalog istnieje
print(f"Czy katalog istnieje? {test_dir.exists()}")


Bieżący katalog: /Users/rkorzen/PycharmProjects/szkolenia/alx/2024_12_12_python_dla_inżynierów
Czy katalog przyklady istnieje? True
Czy test_dir istnieje? False

Ścieżka do pliku: /Users/rkorzen/PycharmProjects/szkolenia/alx/2024_12_12_python_dla_inżynierów/przyklady/test_dir/example.txt

Informacje o pliku:
Suffix: .txt
Stem: example
Parent: /Users/rkorzen/PycharmProjects/szkolenia/alx/2024_12_12_python_dla_inżynierów/przyklady/test_dir

Pliki .txt w katalogu:
/Users/rkorzen/PycharmProjects/szkolenia/alx/2024_12_12_python_dla_inżynierów/przyklady/test_dir/example.txt
Czy plik istnieje? False
Czy katalog istnieje? False


### Zaawansowane operacje z pathlib

In [26]:
# Tworzenie struktury katalogów
new_dir = Path('przyklady/nested/dir/structure')
new_dir.mkdir(parents=True, exist_ok=True)

# tworzenie pliku
file_path = new_dir / 'example.txt'
file_path.write_text('Hello from pathlib!')

# Sprawdzanie typów
print(f"Czy to plik? {file_path.is_file()}")
print(f"Czy to katalog? {file_path.parent.is_dir()}")

# Operacje na zawartości
content = file_path.read_text()
file_path.write_text(content + '\nDodatkowa linia')

# Usuwanie
if file_path.exists():
    file_path.unlink()  # usuwa plik

new_dir.rmdir()

Czy to plik? True
Czy to katalog? True


## 3. Moduł shutil <a id='shutil'></a>

Moduł `shutil` oferuje zaawansowane operacje na plikach i katalogach.



In [33]:

import shutil

# Tworzenie katalogu
os.makedirs('przyklady/test_dir', exist_ok=True)

# Tworzenie pliku testowego w katalogu bieżącym
with open('test.txt', 'w') as f:
    f.write('Test content')

# Kopiowanie pliku
shutil.copy('test.txt', 'przyklady/test_dir/test_copy.txt')

# Kopiowanie katalogu z zawartością
shutil.copytree('przyklady/test_dir', 'przyklady/test_dir_backup', dirs_exist_ok=True)

# Przenoszenie pliku
shutil.move('test.txt', 'przyklady/test_dir/test_moved.txt')

# wyświetlenie zawartości katalogu
print('test_dir:', os.listdir('przyklady/test_dir'))
print('test_dir_backup:', os.listdir('przyklady/test_dir_backup'))

# wyświetlenie zawartości katalogu

# Usuwanie katalogu z zawartością
shutil.rmtree('przyklady/test_dir_backup')
# Usuwanie katalogu z zawartością
shutil.rmtree('przyklady/test_dir')

test_dir: ['test_copy.txt', 'test_moved.txt']
test_dir_backup: ['test_copy.txt']


## 4. Moduł glob <a id='glob'></a>

Moduł `glob` służy do wyszukiwania plików według wzorców.

In [44]:
import glob

# ** oznacza "dowolny poziom katalogów" - przeszukuje rekurencyjnie wszystkie podkatalogi
# *.txt oznacza "dowolna nazwa pliku z rozszerzeniem .txt"
# recursive=True pozwala na przeszukiwanie podkatalogów
print("Pliki .txt w bieżącym katalogu i wszystkich podkatalogach:")
for file in glob.glob('**/*.txt', recursive=True):
    print(file)

# Dwa różne rodzaje plików do wyszukania:
# Sposób 1: Użycie wielu wywołań glob
print("Pliki .jpg i .png (sposób 1):")
for pattern in ['**/*.jpg', '**/*.png']:
    for file in glob.glob(pattern, recursive=True):
        print(file)

print("\nPliki .jpg i .png (sposób 2):")
files = [
    f for ext in ['jpg', 'png']
    for f in glob.glob(f'**/*.{ext}', recursive=True)
]
for file in files:
    print(file)

# Pojedyncza * oznacza "dowolny ciąg znaków" w nazwie pliku
# test* znajdzie wszystkie pliki zaczynające się od "test"
print("\nPliki zaczynające się na '0':")
for file in glob.glob('0*'):
    print(file)

# Przykłady innych wzorców:
# ?.txt - jeden dowolny znak i rozszerzenie .txt
print("\nPliki z jednym znakiem i rozszerzeniem .txt:")
for file in glob.glob('?.txt'):
    print(file)

# [abc]*.txt - pliki zaczynające się na r lub s
print("\nPliki zaczynające się na r lub s:")
for file in glob.glob('[rs]*.txt'):
    print(file)

# **/test/*.py - pliki .py w katalogach o nazwie "dane" na dowolnym poziomie
print("\nPliki .py w katalogach 'przyklady':")
for file in glob.glob('**/przyklady/*.py', recursive=True):
    print(file)

"""
Najważniejsze znaki specjalne w glob:
* - dowolny ciąg znaków
** - dowolna liczba poziomów katalogów (wymaga recursive=True)
? - jeden dowolny znak
[abc] - jeden znak z podanego zakresu
{wzorzec1,wzorzec2} - alternatywa wzorców
"""

Pliki .txt w bieżącym katalogu i wszystkich podkatalogach:
requirements.txt
wynik.txt
text.txt
dane/document.txt
dane/wynik.txt
Pliki .jpg i .png (sposób 1):
dane/nowy.jpg
dane/document.jpg
dane/zlyjpg.jpg
dane/document.png
dane/nowy.png

Pliki .jpg i .png (sposób 2):
dane/nowy.jpg
dane/document.jpg
dane/zlyjpg.jpg
dane/document.png
dane/nowy.png

Pliki zaczynające się na '0':
08_system_plikow.ipynb
05_praca_z_plikami_binarnymi.ipynb
01_wprowadzenie.ipynb
03_obsluga_linii_polecen.ipynb
04_praca_z_plikami.ipynb
06_wyrazenia_regularne.ipynb
02_skladnia_podstawowe_instrukcje.ipynb
07_socket.ipynb

Pliki z jednym znakiem i rozszerzeniem .txt:

Pliki zaczynające się na r lub s:
requirements.txt

Pliki .py w katalogach 'przyklady':
przyklady/zadanie_2_konwersja_jednostek.py
przyklady/tcpip_server.py
przyklady/zadanie_1_geodezyjne.py
przyklady/zadanie_3_statystyka_danych.py
przyklady/tcpip_client.py
przyklady/zadanie_3_anonimizacja.py
przyklady/zadanie_1_wyszukiwanie.py
przyklady/parent_path.

'\nNajważniejsze znaki specjalne w glob:\n* - dowolny ciąg znaków\n** - dowolna liczba poziomów katalogów (wymaga recursive=True)\n? - jeden dowolny znak\n[abc] - jeden znak z podanego zakresu\n{wzorzec1,wzorzec2} - alternatywa wzorców\n'

## Praktyczne przykłady

### 1. Organizowanie plików według rozszerzeń

In [14]:
from pathlib import Path

def prepare_test_structure():
    """
    Przygotowuje strukturę katalogów i plików do testowania organize_files.
    Tworzy różne typy plików w katalogu przyklady/struktura
    """
    # Ścieżka do katalogu testowego
    base_dir = Path('przyklady/struktura')
    
    # Usuń katalog jeśli istnieje i utwórz na nowo
    if base_dir.exists():
        shutil.rmtree(base_dir)
    base_dir.mkdir(parents=True)
    
    # Lista plików do utworzenia (różne rozszerzenia)
    test_files = [
        'dokument1.txt',
        'dokument2.txt',
        'zdjecie1.jpg',
        'zdjecie2.jpg',
        'prezentacja.ppt',
        'arkusz.xlsx',
        'program.py',
        'skrypt.py',
        'strona.html',
        'style.css',
        'dane.json',
        'config.xml',
        'bez_rozszerzenia',
        'README.md'
    ]
    
    # Tworzenie plików testowych
    for file_name in test_files:
        file_path = base_dir / file_name

        if file_name in ["dokument1.txt", "dokument2.txt"]:
            file_path.write_text("Duplicat")
        else:
            file_path.write_text(f'Zawartość pliku {file_name}')
        
def zawartosc_katalogu(base_dir=Path('przyklady/struktura')):
    print(f"Utworzono strukturę testową w {base_dir}")
    print("\nZawartość katalogu przed organizacją:")
    for file in base_dir.iterdir():
        print(f"- {file.name}")

def clean_test_structure(silent=False):
    # zawartość katalogu przed usunięciem
    import subprocess
    
    try:
        if not silent:
            print("\nZawartość katalogu przed usunięciem:")
            subprocess.run(['tree', 'przyklady/struktura'])
        shutil.rmtree('przyklady/struktura')
    except Exception as e:
        print(f"Błąd podczas usuwania katalogu: {e}")


In [83]:


def organize_files(directory):
    """Organizuje pliki w katalogu według ich rozszerzeń."""
    directory = Path(directory)
    
    # Iteracja po wszystkich plikach
    for file_path in directory.glob('*'):
        if file_path.is_file():
            # Utworzenie katalogu dla rozszerzenia
            ext = file_path.suffix.lower()[1:] or 'no_extension'
            ext_dir = directory / ext
            ext_dir.mkdir(exist_ok=True)
            
            # Przeniesienie pliku
            shutil.move(str(file_path), str(ext_dir / file_path.name))



In [84]:
prepare_test_structure()
zawartosc_katalogu()
organize_files('przyklady/struktura')
clean_test_structure()

Utworzono strukturę testową w przyklady/struktura

Zawartość katalogu przed organizacją:
- skrypt.py
- prezentacja.ppt
- dokument1.txt
- dokument2.txt
- dane.json
- arkusz.xlsx
- strona.html
- config.xml
- README.md
- style.css
- program.py
- bez_rozszerzenia
- zdjecie1.jpg
- zdjecie2.jpg

Zawartość katalogu przed usunięciem:
[01;34mprzyklady/struktura[0m
├── [01;34mcss[0m
│   └── [00mstyle.css[0m
├── [01;34mhtml[0m
│   └── [00mstrona.html[0m
├── [01;34mjpg[0m
│   ├── [01;35mzdjecie1.jpg[0m
│   └── [01;35mzdjecie2.jpg[0m
├── [01;34mjson[0m
│   └── [00mdane.json[0m
├── [01;34mmd[0m
│   └── [00mREADME.md[0m
├── [01;34mno_extension[0m
│   └── [00mbez_rozszerzenia[0m
├── [01;34mppt[0m
│   └── [00mprezentacja.ppt[0m
├── [01;34mpy[0m
│   ├── [00mprogram.py[0m
│   └── [00mskrypt.py[0m
├── [01;34mtxt[0m
│   ├── [00mdokument1.txt[0m
│   └── [00mdokument2.txt[0m
├── [01;34mxlsx[0m
│   └── [00markusz.xlsx[0m
└── [01;34mxml[0m
    └── [00mconfig.x

### 2. Wyszukiwanie duplikatów plików

In [85]:
import hashlib

def find_duplicates(directory):
    """Znajduje duplikaty plików w katalogu."""
    hash_dict = {}
    directory = Path(directory)
    
    for file_path in directory.rglob('*'):
        if file_path.is_file():
            # Obliczenie hash'a pliku
            file_hash = hashlib.md5(file_path.read_bytes()).hexdigest()
            
            # Dodanie do słownika
            if file_hash in hash_dict:
                hash_dict[file_hash].append(file_path)
            else:
                hash_dict[file_hash] = [file_path]
    
    # Wyświetlenie duplikatów
    for hash_value, files in hash_dict.items():
        if len(files) > 1:
            print(f"\nDuplikaty:")
            for file in files:
                print(f"- {file}")



In [86]:
# Przykład użycia
prepare_test_structure()
find_duplicates('przyklady/struktura')
clean_test_structure(silent=True)


Duplikaty:
- przyklady/struktura/dokument1.txt
- przyklady/struktura/dokument2.txt


### 3. Monitor zmian w katalogu

In [3]:
%%writefile przyklady/monitor.py
import sys

from pathlib import Path
import time

if len(sys.argv) < 2:
    directory = Path(".")
else:
    directory = Path(sys.argv[1])


def monitor_directory(directory, interval=0.5):
    """Monitoruje zmiany w katalogu."""
    
    previous_state = set(directory.glob('*'))
    print(f"Monitoring {directory.absolute()}")
    try:
        while True:
            
            time.sleep(interval)
            current_state = set(directory.glob('*'))
            
            # Sprawdzenie zmian
            new_files = current_state - previous_state
            deleted_files = previous_state - current_state
            
            if new_files:
                print("\nNowe pliki lub foldery:")
                for file in new_files:
                    print(f"+ {file.name}")
            
            if deleted_files:
                print("\nUsunięte pliki pliki lub foldery:")
                for file in deleted_files:
                    print(f"- {file.name}")
            
            previous_state = current_state
            
    except KeyboardInterrupt:
        print("\nZakończono monitorowanie")

# Przykład użycia (uruchom w osobnym wątku)
monitor_directory(directory)

Writing przyklady/monitor.py


In [1]:
import os
os.getcwd()

'/Users/rkorzen/PycharmProjects/szkolenia/alx/20241212_pi/materialy'

In [10]:
prepare_test_structure()

In [15]:

clean_test_structure()



Zawartość katalogu przed usunięciem:
przyklady/struktura  [error opening dir]

0 directories, 0 files
Błąd podczas usuwania katalogu: [Errno 2] No such file or directory: 'przyklady/struktura'
