<img src='https://upload.wikimedia.org/wikipedia/commons/c/c3/Python-logo-notext.svg' width=50/>
<img src='https://upload.wikimedia.org/wikipedia/commons/d/d0/Google_Colaboratory_SVG_Logo.svg' width=90/>

# <font size=50>Introducere în Python folosind Google Colab</font>
<font color="#e8710a">© Adriana STAN, 2022

Contributor: Gabriel ERDEI</font>

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/adrianastan/python-intro/blob/main/notebooks/ro/T06_Fisiere.ipynb)


#<font color="#e8710a">T06. Intrări-ieșiri (I/O)</font>

În tutorialele anterioare am văzut deja o serie de exemple de citire a datelor din fișiere. În cadrul tutorialului curent vom extinde aceste metode cu metode de scriere, precum și cu metode de prelucrare a unor tipuri de fișiere standard, precum CSV, JSON sau XML.

---
<font color="#1589FF"><b>Timp estimat de parcurgere:</b> 120 min</font>

---



##<font color="#e8710a">Fișiere</font>

Începem tutorialul cu citirea și scrierea fișierelor text simple. Pentru citire/scriere avem la dispoziție funcția built-in `open()` cu formatul complet:


```
f = open(file, mode='r', buffering=- 1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
```

Modul de deschidere al fișierului ne va furniza și operațiile pe care le putem efectua prin intermediul obiectului asociat: citire și/sau scriere.

Pentru a putea testa citirea, vom crea mai întâi un fișier folosind acțiunile magice din Google Colab:

In [None]:
%%writefile input.txt
Salut!
Ce mai faci?

Writing input.txt


Metodele asociate citirii pentru un obiect de tip fișier sunt: 

- `read()` - citește tot conținutul
- `readline()` - citește linie cu linie

Și returnează șirul de caractere citit. 

In [None]:
# Citim întreg fișierul ca string
f = open('input.txt', 'rt')
data = f.read()
data

'Salut!\nCe mai faci?\n'

In [None]:
# E recomandat să folsim manageri de context pentru prelucrarea fișierelor
with open('input.txt', 'rt') as f:
  data = f.read()
print (data)

Salut!
Ce mai faci?



In [None]:
# Nu este nevoie să specificăm explicit modul de citire și cel text
# Acestea sunt implicite pentru funcția open()
with open('input.txt') as f:
  data = f.read()
print (data)

Salut!
Ce mai faci?



In [None]:
# Citim fișierul linie cu line
with open('input.txt') as f:
  for line in f.readlines():
    print (line)

Salut!

Ce mai faci?



In [None]:
# Același rezultat poate fi obținut parcugând obiectul fișier
with open('input.txt') as f:
  for line in f:
    print (line) # Separatorul de rând (\n) e conținut în linia citită

Salut!

Ce mai faci?



Pentru a putea scrie într-un fișier folosim aceeași funcție `open()`, dar specificând modul `w`. Metodele asociate obiectului fișier pentru scriere sunt:

- `write()` - scrie textul ca atare
- `writeline()` - adăugă un rând nou (\n) după scrierea textului

Și iau ca argument de intrare un șir de caractere. 

In [None]:
# Scriem un string într-un fișier
s = "Ana are mere.\nȘi pere."
with open('output.txt', 'wt') as f:
  f.write(s)

In [None]:
# Putem realiza scrierea și cu ajutorul funcției print()
with open('output.txt', 'w') as f:
  print(s, file=f)

Putem verifica scrierea fișierului din zona de fișiere a mediului Colab. Ar trebui să apară un nou fișier denumit `output.txt`.

Dacă dorim să scriem într-un fișier doar dacă acesta nu există, putem folosi modul `x`.
În acest mod, vom primi o eroare de tip `FileExistsError` dacă fișierul există deja.
Implicit, în modul `w` fișierul se crează dacă nu există și se suprascrie dacă există.

Dacă rulați celula de mai jos de 2 ori, veți primi o eroare:

In [None]:
with open('test.txt', 'x') as f:
  f.write('Salut')

**<font color="#1589FF">Fișiere binare</font>**


Pentru fișiere binare avem la dispoziție modul `b` al funcției `open()`:


In [None]:
# Scriem un fisier binar
with open('output.bin', 'wb') as f:
  f.write(b'Salut')

# Citim conținutul său
with open('output.bin', 'rb') as f:
  data = f.read()
data

b'Salut'

**<font color="#1589FF">Date binare (string vs. byte)</font>**

Citirea din fișiere se poate face fie prin date de tip string, fie la nivel de byte, ce poate fi ulterior interpretat ca fiind un caracter (ASCII).

In [None]:
t = 'Pe luni!'
for c in t:
  print(c)

type(c)

P
e
 
l
u
n
i
!


str

In [None]:
# Byte string
b = b'Pe luni!'
for c in b:
  print(c)

type(c)

80
101
32
108
117
110
105
33


int

###<font color="#e8710a">Manipulare căi</font>

În lucrul cu fișiere este necesară și manipularea căilor către acestea. În Python avem la dispoziție modulul `os.path` ce are implementate o serie de metode utile pentru crearea, segmentare, determinarea căilor și a tipului fișierelor sau directoarelor:




In [None]:
# Determinăm numele fișierului din cale
import os
path = '/Users/adriana/Data/data.csv'
os.path.basename(path)

'data.csv'

In [None]:
# Determinăm calea de directoare
os.path.dirname(path)

'/Users/adriana/Data'

In [None]:
# Creăm o nouă cale prin combinarea mai multor directoare și un fișier
os.path.join('tmp', 'data', os.path.basename(path))

'tmp/data/data.csv'

In [None]:
# Determinăm calea completă către directorul utilizatorului
path = '~/Data/data.csv'
os.path.expanduser(path)

'/root/Data/data.csv'

In [None]:
# Deteminăm numele și extensia fișierului
path = 'data.csv'
os.path.splitext(path)

('data', '.csv')

In [None]:
# Verificăm existența unui fișier
os.path.exists('/content/output.txt')

True

In [None]:
# Verificăm existența unui director
os.path.exists('/content/')

True

In [None]:
# Verificăm dacă este fișier
os.path.isfile('/content/output.txt')

True

In [None]:
# Verificăm dacă este director
os.path.isdir('/content/')

True

**<font color="#1589FF">Listare directoare</font>**

Pentru a determina conținutul unei căi ne putem folosi de alte funcții ale pachetului built-in `os`

In [None]:
# Listăm conținutul directorului curent
os.listdir('.')

['.config', 'test.txt', 'output.bin', 'output.txt', 'input.txt', 'sample_data']

In [None]:
# Listăm conținutul unui director oarecare
os.listdir('/content/sample_data')

['anscombe.json',
 'README.md',
 'california_housing_train.csv',
 'california_housing_test.csv',
 'mnist_test.csv',
 'mnist_train_small.csv']

In [None]:
# Creăm o listă cu directoarele din /content/
[name for name in os.listdir('/content/') if os.path.isdir(os.path.join('/content/', name))]

['.config', 'sample_data']

In [None]:
# Creăm o listă cu fișierele cu extensia txt din /content/
[name for name in  os.listdir('/content/') if name.endswith('.txt')]

['test.txt', 'output.txt', 'input.txt']

###<font color="#e8710a">Mutare/copiere fișiere</font>

În cazul în care dorim să manipulăm fizic directoare și fișiere pe disc, putem utiliza pachetul built-in `shutil`:

In [None]:
import shutil
# Copiem un fișier sub un alt nume
shutil.copy('output.txt', 'newtext.txt')
os.listdir()

['.config',
 'newtext.txt',
 'test.txt',
 'output.bin',
 'output.txt',
 'input.txt',
 'sample_data']

In [None]:
# Copiem un director
shutil.copytree('sample_data', 'new_data')
os.listdir()

['.config',
 'new_data',
 'newtext.txt',
 'test.txt',
 'output.bin',
 'output.txt',
 'input.txt',
 'sample_data']

In [None]:
# Mutăm un fișier/director cu suprascriere fără avertisment
# Dacă fișierul output.txt există va fi suprascris
shutil.move('newtext.txt', 'output.txt')
os.listdir()

['.config',
 'new_data',
 'test.txt',
 'output.bin',
 'output.txt',
 'input.txt',
 'sample_data']

###<font color="#e8710a">Fișiere/directoare temporare</font>

În anumite aplicații este util să avem o serie de fișiere și directoare ce există doar atât timp cât aplicația rulează, ele neavând o existență persistentă pe disc. În acest caz putem folosi modulul `tempfile` pentru a le crea și manipula.

**<font color="#1589FF">Fișiere temporare anonime</font>**

In [None]:
# Creăm un fișier temporar anonim în care scriem date
from tempfile import TemporaryFile
with TemporaryFile('w+t') as f:
  # Sciere/citire
  f.write('Salut!\n')
  f.write('Test\n')
  # Revenim la începutul fișierului
  f.seek(0)
  # Citim conținutul
  data = f.read()
  print(data)
  
# La ieșirea din context manager fișierul e distrus

Salut!
Test



**<font color="#1589FF">Fișiere temporare denumite</font>**

In [None]:
# Crăm un fișier temporar denumit
from tempfile import NamedTemporaryFile
with NamedTemporaryFile('w+t') as f:
  # Numele este aleator
  print('Fișierul denumit este:', f.name)

# Fișierul este distrus

Fișierul denumit este: /tmp/tmpk0p9krwt


**<font color="#1589FF">Directoare temporare</font>**



In [None]:
# Creăm un director temporar anonim și un fișer test in interiorul său
from tempfile import TemporaryDirectory
with TemporaryDirectory() as dirname:
  print('Directorul este:', dirname)
  # Creăm un fișier în director, scriem și citim
  with open(os.path.join(dirname,'test'), 'w+') as f:
    f.write("Salut!")
    f.seek(0)
    print(f.read())

# Directorul este distrus

Directorul este: /tmp/tmpwd485g53
Salut!


##<font color="#e8710a">Serializarea obiectelor</font>

Atunci când dorim stocarea persistentă a atributelor/conținutul unor obiecte mai complexe din aplicația noastră, este util ca acestea să poată fi scrise pe disc în mod direct și mai apoi citite. Putem realiza acest lucru în Python, folosind modulul `pickle`. Dar e important de menționat faptul că s-ar putea ca diferitele versiune de serializare să nu fie compatibile, astfel încât e important să reținem și versiunea cu care obiectele au fost serializate.

In [None]:
# Serializarea unei liste
import pickle
obiect = [1,2,3,4,5,6,7,8]

with open('obiect_serializat.pkl', 'wb') as f:
  # Serializăm obiectul
  pickle.dump(obiect, f)

In [None]:
# Citirea obiectului din fișier
with  open('obiect_serializat.pkl', 'rb') as f:
  obiect = pickle.load(f)
obiect

[1, 2, 3, 4, 5, 6, 7, 8]

O alternativă la serializarea către un fișiere, este serializarea către string:

In [None]:
# Serializare către string
s = pickle.dumps(obiect)
print (s)
# Restaurare din string
obiect = pickle.loads(s)
obiect

b'\x80\x03]q\x00(K\x01K\x02K\x03K\x04K\x05K\x06K\x07K\x08e.'


[1, 2, 3, 4, 5, 6, 7, 8]

##<font color="#e8710a">Fișiere speciale</font>

În aplicațiile practice, de cele mai multe ori vom folosi fișiere cu un format predefinit pentru a fi mai ușoară partajarea informațiilor stocate în acestea și în afara aplicației. Cele mai des întâlnite formate de fișiere sunt CSV, JSON și XML, descrise în continuare. 

Pe de altă parte, intern aplicației, dar tot respectând un format predefinit, va trebui să utilizăm și fișiere pentru scrierea log-urilor aplicației sau stocarea informațiilor de configurare a aplicației. Și aceste tipuri de fișiere sunt descrise în secțiunile următoare. 

###<font color="#e8710a">Fișiere CSV</font>

Fișierele CSV - Comma Separated Values sunt de fapt fișiere text ce au un format tabular în care câmpurile sunt separate prin virgulă. Prima linie poate fi utilizată pentru a specifica antetul (en. *header*) tabelului:

In [None]:
%%writefile stocks.csv
Symbol,Price,Date,Time,Change,Volume
"AA",39.48,"6/11/2007","9:36am",-0.18,181800
"AIG",71.38,"6/11/2007","9:36am",-0.15,195500
"AXP",62.58,"6/11/2007","9:36am",-0.46,935000
"BA",98.31,"6/11/2007","9:36am",+0.12,104800
"C",53.08,"6/11/2007","9:36am",-0.25,360900
"CAT",78.29,"6/11/2007","9:36am",-0.23,225400

Writing stocks.csv


Pentru a lucra eficient cu acest tip de fișiere, putem utiliza pachetul built-in `csv`:

In [None]:
# Citim antetul fișierului csv
import csv
f = open('stocks.csv')
f_csv = csv.reader(f)
headers = next(f_csv)
headers

['Symbol', 'Price', 'Date', 'Time', 'Change', 'Volume']

In [None]:
# Citim pe rând liniile din fișier
for row in f_csv:
  print(row)

['AA', '39.48', '6/11/2007', '9:36am', '-0.18', '181800']
['AIG', '71.38', '6/11/2007', '9:36am', '-0.15', '195500']
['AXP', '62.58', '6/11/2007', '9:36am', '-0.46', '935000']
['BA', '98.31', '6/11/2007', '9:36am', '+0.12', '104800']
['C', '53.08', '6/11/2007', '9:36am', '-0.25', '360900']
['CAT', '78.29', '6/11/2007', '9:36am', '-0.23', '225400']


O metodă mai ușoară de a lucra cu datele dintr-un fișier CSV este dacă pentru fiecare rând din tabel putem extrage un anumit câmp în funcție de antetul fișierului. Pentru aceasta avem la dispoziție clasa `DictReader()` a modulului `csv`. Prin intermediul unui obiect de tip `DictReader()` vom putem mai apoi să referim elementele unui rând sub formă de dicționar:

In [None]:
# Creăm un DictReader() din conținutul fișierului
import csv
with open('stocks.csv') as f:
  f_csv = csv.DictReader(f)
  rows = [row for row in f_csv]
  
print(rows[3]['Symbol'], rows[2]['Time'])

BA 9:36am


Scrierea unor date tabulare în fișiere de tip CSV se face în mod similar cu scrierea într-un fișier text simplu:

In [None]:
# Scrierea unui fișier csv
headers = ['Symbol','Price','Date','Time','Change','Volume']
rows = [('AA', 39.48, '6/11/2007', '9:36am', -0.18, 181800),
  ('AIG', 71.38, '6/11/2007', '9:36am', -0.15, 195500),
  ('AXP', 62.58, '6/11/2007', '9:36am', -0.46, 935000),
]

with open('stocks_out.csv','w') as f:
  f_csv = csv.writer(f)
  f_csv.writerow(headers) # Scriem antetul
  f_csv.writerows(rows)   # Scriem rândurile

###<font color="#e8710a">Fișiere JSON</font>

Fișierele [JSON - Java Script Object Notation](https://www.json.org/json-en.html) reprezintă un format de fișier extrem de des utilizat în comunicarea cu API-uri: transmitere de interogări (en. *requests*) și recepție răspuns. Pentru a manipula astfel de fișiere, în Python avem la dispoziție modulul `json`. Formatul fișierelor și modul de lucru cu ele în Python este similară cu lucrul cu dicționare.

In [None]:
%%writefile data.json
{"studenti":[
    {"prenume": "Maria", "nume": "Popescu", "varsta": 19},
    {"prenume": "Ana", "nume": "Ionescu", "varsta": 20}],
  "profesori":[
    {"prenume": "Ion", "nume": "Pop", "varsta": 42},
    {"prenume": "Mihai", "nume": "Vaile", "varsta": 35}]
  
}

Writing data.json


In [None]:
# Citim fișierul json
import json
with open('data.json', 'r') as f:
  data = json.load(f)

data

{'studenti': [{'prenume': 'Maria', 'nume': 'Popescu', 'varsta': 19},
  {'prenume': 'Ana', 'nume': 'Ionescu', 'varsta': 20}],
 'profesori': [{'prenume': 'Ion', 'nume': 'Pop', 'varsta': 42},
  {'prenume': 'Mihai', 'nume': 'Vaile', 'varsta': 35}]}

In [None]:
# Accesăm valoarea elementele din câmpul studenți
data['studenti']

[{'prenume': 'Maria', 'nume': 'Popescu', 'varsta': 19},
 {'prenume': 'Ana', 'nume': 'Ionescu', 'varsta': 20}]

In [None]:
# Accesăm primul element din câmpul studenți
data['studenti'][0]

{'prenume': 'Maria', 'nume': 'Popescu', 'varsta': 19}

In [None]:
# Creare date json dintr-un dicționare
data = {
  'prenume' : 'Maria',
  'nume' : 'Popescu',
  'varsta' : 19
}

# Creăm un json string din dicționarul anterior
json_str = json.dumps(data)

# Scriem în fișier
with open('data_out.json', 'w') as f:
  json.dump(data, f)

**<font color="#1589FF">Apel API</font>**

In [None]:
# Citim datele dintr-un fișier JSON online generat de un API
from urllib.request import urlopen
import json
from pprint import pprint

u = urlopen('https://catfact.ninja/fact')
rasp = json.loads(u.read().decode('utf-8'))
pprint(rasp['fact'])

('Some Siamese cats appear cross-eyed because the nerves from the left side of '
 'the brain go to mostly the right eye and the nerves from the right side of '
 'the brain go mostly to the left eye. This causes some double vision, which '
 'the cat tries to correct by “crossing” its eyes.')


###<font color="#e8710a">Fișiere XML</font>

Fișierele [XML (Extensible Markup Language)](https://developer.mozilla.org/en-US/docs/Web/XML/XML_introduction) sunt din punct de vedere istoric, print primele formate de fișiere cu structură standard, ușor de citit atât de oameni, cât și de calculatoare. Fișierele au o structură ierarhică bazată pe taguri și atribute. 

Pentru a parsa fișiere XML în Python avem la dispoziție mai multe module, precum `xml` sau `beautifulsoup`. Ca în cazul fișierelor JSON, trebuie să cunoaștem structura și tag-urile utilizate de către fișierul XML sau schema fișierului.

In [None]:
# Parsăm un fișier XML online
from urllib.request import urlopen
from xml.etree.ElementTree import parse

u = urlopen('http://planet.python.org/rss20.xml')
doc = parse(u)
# Extragem tag-urile de interes
for item in doc.iterfind('channel/item'):
  title = item.findtext('title')
  date = item.findtext('pubDate')
  print(title, date)

Python for Beginners: Delete Attribute From an Object in Python Wed, 24 Aug 2022 13:00:00 +0000
John Ludhi/nbshare.io: Join or Merge Lists In Python Wed, 24 Aug 2022 10:38:18 +0000
PyCoder’s Weekly: Issue #539 (Aug. 23, 2022) Tue, 23 Aug 2022 19:30:00 +0000
Real Python: Building a URL Shortener With FastAPI and Python Tue, 23 Aug 2022 14:00:00 +0000
The Digital Cat: Data Partitioning and Consistent Hashing Tue, 23 Aug 2022 12:00:00 +0000
Zato Blog: How to invoke REST APIs from Zato services Tue, 23 Aug 2022 06:51:55 +0000
Peter Bengtsson: Join a list with a bitwise or operator in Python Mon, 22 Aug 2022 22:47:45 +0000
Mike Driscoll: How to Convert Images to PDFs with Python and Pillow (Video) Mon, 22 Aug 2022 19:51:16 +0000
Anarcat: Alternative MPD clients to GMPC Mon, 22 Aug 2022 17:17:46 +0000
PyBites: Making plots in your terminal with plotext Mon, 22 Aug 2022 15:15:00 +0000
Real Python: How to Check if a Python String Contains a Substring Mon, 22 Aug 2022 14:00:00 +0000
PyCharm: Py

**<font color="#1589FF">Creare XML din dicționar</font>**

In [None]:
# Creăm un fișier XML pe baza unui dicționar
from xml.etree.ElementTree import Element, tostring
import xml.etree.ElementTree as ET

def dict_to_xml(tag, d):
  elem = Element(tag)
  for key, val in d.items():
    child = Element(key)
    child.text = val
    elem.append(child)
  return elem

s = {'prenume': 'Maria', 'nume': 'Popescu', 'varsta':'19'}
e = dict_to_xml('date', s)

print(tostring(e))

b'<date><prenume>Maria</prenume><nume>Popescu</nume><varsta>19</varsta></date>'


###<font color="#e8710a">Fișiere de logging</font>

Pentru orice aplicație cu utilizatori multipli și care are nevoie să fie disponibilă în mod continuu este important să se salveze log-uri ale acesteia și eventualele erori ce pot să apară. În Python, avem la dispoziție pachetul `logging` pentru această facilitate:

In [None]:
import logging
# Ne asigurăm că nu avem stabilite alte căi pentru loguri
for handler in logging.root.handlers[:]:
    logging.root.removeHandler(handler)

# Configurăm logger-ul pentru a scrie în fișierul app.log
# informația din acest fișier este scrisă în continuare fără a șterge info existent
# și stabilim nivelul de salvare a logurilor la cel mai mic, DEBUG
logging.basicConfig(filename='app.log', level=logging.DEBUG)

In [None]:
# Salvăm logguri
logging.critical('Nu se poate accesa aplicația')
logging.error('Nu am găsit fișierul')
logging.warning('Feature deprecated')
filename = "input.txt"
logging.info('S-a deschis fișierul %s', filename)
logging.debug('Am ajuns aici!')

In [None]:
# Afișăm conținutul 
with open('app.log') as f:
  print(f.read())

CRITICAL:root:Nu se poate accesa aplicația
ERROR:root:Nu am găsit fișierul
INFO:root:S-a deschis fișierul input.txt
DEBUG:root:Am ajuns aici!



Dacă rerulați celulele de mai sus veți observa că se vor scrie mesajele de log unul după altul. 

###<font color="#e8710a">Fișiere de configurare</font>

Fișierele de configurare (.ini) reprezintă fișiere text simple cu o serie de demarcaje standard în interiorul cărora se pot realiza adaptări ale anumitor parametri ai aplicației, fără a fi nevoie de o intervenție în cod. De cele mai multe ori, aceste fișiere sunt modificate automat la instalare cu date privind, de exemplu, calea către aplicație și dependențele acesteia, sistemul de operare, licență, etc. 

Fișierele de configurare nu au alt scop decât să permită aplicației să ruleze cât mai bine pe mașina clientului și sunt citite de obicei la fiecare lansare a aplicației.

Dacă se folosesc astfel de fișiere pentru aplicația dezvoltată, este nevoie ca informația din acestea să fie adusă în cod. Acest lucru se poate face în Python folosind pachetul `configparser`. Creăm mai întâi un astfel de fișier și îl vom parsa ulterior:

In [None]:
%%writefile config.ini
; config.ini
[installation]
library=%(prefix)s/lib
include=%(prefix)s/include
bin=%(prefix)s/bin
prefix=/usr/local
[debug]
log_errors=true
show_warnings=False
[server]
port: 8080
nworkers: 32
pid-file=/tmp/spam.pid
root=/www/root

Writing config.ini


In [None]:
# Parsăm fișierul creat anterior
from configparser import ConfigParser
cfg = ConfigParser()
cfg.read('config.ini')

['config.ini']

In [None]:
# Determinăm secțiunile acestui fișier
cfg.sections()

['installation', 'debug', 'server']

In [None]:
# Extragem din sectiunea installation, valoarea parametrului library
cfg.get('installation','library')

'/usr/local/lib'

In [None]:
# Extragem din sectiunea debug valoarea parametrului log_errors
cfg.getboolean('debug','log_errors')

True

În anumite cazuri este nevoie ca aceste fișiere de configurare să poată fi modificate din aplicație, iar pentru aceasta avem la dispoziția funcția `set()`:

In [None]:
# Modificăm parametrul port din secțiunea server
cfg.set('server','port','9000')

In [None]:
# Modificăm parametrul log_errors din secțiunea debug
cfg.set('debug','log_errors','False')

In [None]:
# Afișăm modificările în stdout
import sys
cfg.write(sys.stdout)

[installation]
library = %(prefix)s/lib
include = %(prefix)s/include
bin = %(prefix)s/bin
prefix = /usr/local

[debug]
log_errors = False

[server]
port = 9000
nworkers = 32
pid-file = /tmp/spam.pid
root = /www/root



##<font color="#e8710a">Lucrul cu baze de date</font>

Deși Python nu este un limbaj recunoscut pentru eficiența lucrului cu baze de date, se pot realiza conexiuni la baze de date de tip [SQLite](https://www.sqlite.org/index.html) folosind pachetul `sqlite3`:

In [None]:
import sqlite3
# Ne conectăm la baza de date și creăm cursorul
db = sqlite3.connect('database.db')
c = db.cursor()
# Creăm un nou tabel
c.execute('create table exemplu (nume, prenume, nota)')
db.commit()

In [None]:
# Definim datele pe care dorim să le introducem în tabel
values = [
  ('Pop', 'Ionut', 10),
  ('Popescu', 'Maria', 9),
  ('Ionescu', 'George', 9),
  ('Ivan', 'Elena', 10),
]

# Introducem valorile în tabel
c.executemany('insert into exemplu values (?,?,?)', values)
db.commit()

In [None]:
# Extragem toate rândurile din tabel
for row in db.execute('select * from exemplu'):
  print(row)

('Pop', 'Ionut', 10)
('Popescu', 'Maria', 9)
('Ionescu', 'George', 9)
('Ivan', 'Elena', 10)


In [None]:
# Extragem rândurile din table în care nota este mai mare decât 9
min_nota = 9
for row in db.execute('select * from exemplu where nota > ?',(min_nota,)):
  print(row)

('Pop', 'Ionut', 10)
('Ivan', 'Elena', 10)


##<font color="#e8710a">Expresii regulare (regex)</font>

Expresiile regulare sunt un mecanism extrem de puternic de identificare a tiparelor în șiruri de caractere. Au o sintaxă specifică prin intermediul căreia se pot specifica de exemplu seturi de caractere, numărul de caractere căutat, moduri de reprezentare a caracterelor, etc. Mai multe informații puteți găsi la [acest link](https://developers.google.com/edu/python/regular-expressions ).

În Python, putem folosi expresii regulare prin pachetul `re`:

In [None]:
import re

# Identificăm secvența "exemplu:" urmată de oricare 3 caractere
str = 'Un exemplu:ana!!'
match = re.search(r'exemplu:\w\w\w', str)
# Dacă s-a găsit secvența va fi disponibilă ca rezultat al metodei group()
if match:
  print('Am găsit:', match.group()) 
else:
  print('Nu am găsit șirul de caractere.')

Am găsit: exemplu:ana


In [None]:
# Identificăm grupul de litere "nnn"
match = re.search(r'nnn', 'annna') 
match.group()

'nnn'

In [None]:
# Identificăm oricare două caractere urmate de litera g
match = re.search(r'..a', 'annna')
match.group()

'nna'

In [None]:
# Identificăm prima cifră din șir (dacă există)
match = re.search(r'[0-9]', 'a123n456a') 
match.group()

'1'

In [None]:
# Identificăm toate cifrele
re.findall(r'[0-9]', 'a123n456a') 

['1', '2', '3', '4', '5', '6']

In [None]:
## Identificăm caracterul a urmat de oricâte litere n consecutive (minim 1)
match = re.search(r'an+', 'annna') 
match.group()

'annn'

In [None]:
# Căutăm adrese de e-mail
str = 'Adresa de e-mail adriana@utcluj.ro '
match = re.search(r'[a-z-]+@[a-z\.]+', str)
match.group()

'adriana@utcluj.ro'

---

##<font color="#e8710a">Concluzii</font>

În acest tutorial am încercat să introducem cât mai multe detalii esențiale ale utilizării instrucțiunilor de bază în limbajul Python. În tutorialul următor vom extinde utilizarea acestor instrucțiuni pentru crearea funcțiilor și a modulelor.

---

##<font color="#1589FF"> Exerciții</font>

1. Creați un fișier ce conține informații legate de vreme sub forma: localitate, temperatură_medie, precipitații_medii. Citiți informațiile din acesta și afișați doar localitățile pentru care temperatura este mai mare decât 20 de grade. Scrieți în alt fișier localitățile pentru care precipitațiile medii sunt mai mici decât 10 l/m2.

In [None]:
## REZOLVARE EX. 1

2. Determinați lista completă de directoare și fișiere din directorul curent. Afișați-o ordonată alfabetic.

In [None]:
## REZOLVARE EX. 2

3. Folosiți un fișier temporar în care să scrieți pe rând valorile șirului Fibonacci. Folosiți o valoare mare pentru numărul de elemente. Citiți fișierul și afișați elementele din șirul Fibonacci în ordine inversă.

In [None]:
## REZOLVARE EX. 3

4. Scrieți o expresie regulară ce identifică adrese web de forma `www.exemplu.com/index.html`.

In [None]:
## REZOLVARE EX. 4

5. În Google Colab, în mașina virtuală curentă există un director `sample_data/` ce conține fișierul `california_housing_train.csv`. Citiți conținutul fișierului și afișați numărul de intrări din acesta.

In [None]:
## REZOLVARE EX. 5

6. Căutați online un API ce răspunde în format JSON. Apelați API-ul și afișați rezultatul parsat.

In [None]:
## REZOLVARE EX. 6

##Referințe suplimentare

1. Modulul `pandas` pentru lucrul cu date tabulare https://pandas.pydata.org/
2. Acces la resurse web prin modulul `urllib`: https://docs.python.org/3/howto/urllib2.html
