# Python kullanarak Dosyalardan Okuma ve Dosyalara Yazma

![](https://i.imgur.com/rv8wZ7l.png)


Bu eğitim serisi, Python programlama dilini kullanarak programlama ve veri analizine yeni başlayanlara uygun bir giriş niteliğindedir. Bu eğitimler, pratik ve kodlama odaklı bir yaklaşım benimsiyor. Materyalleri öğrenmenin en iyi yolu, kodu çalıştırıp kendimizin denemesidir. Serinin tamamına buradan göz atabiliriz:

1. Python ve Jupyter ile İlk Adımlar
2. Değişkenler ve Veri Türleri ile Hızlı Bir Tur
3. Koşullu İfadeler ve Döngüler Kullanarak Dallanma
4. Fonksiyonları Kullanarak Yeniden Kullanılabilir Kod Yazma
5. Dosyalardan Okuma ve Dosyalara Yazma
6. Python ve Numpy ile Sayısal Hesaplama
7. Pandas Kullanarak Tablo Verilerini Analiz Etme
8. Matplotlib & Seaborn kullanarak Veri Görselleştirme
9. Keşifsel Veri Analizi - Bir Vaka Çalışması

Bu eğitim aşağıdaki konuları kapsar:

- `os` modülünü kullanarak dosya sistemi ile etkileşim
- `urllib` modülünü kullanarak internetten dosya indirme
- Metin (text) dosyalarından veri okuma ve işleme
- CSV dosyalarından sözlüklere (dictionaries) ve listelere (lists) veri ayrıştırma
- Biçimlendirilmiş verileri metin dosyalarına geri yazma

## OS (Operating System/İşletim Sistemi) ve dosya sistemi ile etkileşim

Python'daki `os` modülü, os (işletim sistemi) ve dosya sistemi ile etkileşim için birçok fonksiyon sağlar. Şimdi içe aktaralım (import) ve bazı örnekler deneyelim.

In [None]:
import os

`os.getcwd` fonksiyonunu kullanarak mevcut çalışma dizinini kontrol edebiliriz.



In [None]:
os.getcwd()

'/content'

Bir dizindeki dosyaların listesini almak için os.listdir'i kullanılır. Fonksiyona argüman olarak bir dizinin mutlak/kesin veya göreceli yolunu iletiriz.

In [None]:
help(os.listdir)

Help on built-in function listdir in module posix:

listdir(path=None)
    Return a list containing the names of the files in the directory.
    
    path can be specified as either str, bytes, or a path-like object.  If path is bytes,
      the filenames returned will also be bytes; in all other circumstances
      the filenames returned will be str.
    If path is None, uses the path='.'.
    On some platforms, path may also be specified as an open file descriptor;\
      the file descriptor must refer to a directory.
      If this functionality is unavailable, using it raises NotImplementedError.
    
    The list is in arbitrary order.  It does not include the special
    entries '.' and '..' even if they are present in the directory.



In [None]:
os.listdir('.') # göreceli yol (relative path)

['.config', 'sample_data']

In [None]:
os.listdir('/usr') # mutlak/kesin yol (absolute path)

['bin',
 'games',
 'include',
 'local',
 'sbin',
 'lib',
 'share',
 'src',
 'grte',
 'lib32']

`os.makedirs` kullanarak yeni bir dizin (directory) oluşturabiliriz. Daha sonra bazı dosyaları indireceğimiz `data` adında yeni bir dizin (directory) oluşturalım.

In [None]:
os.makedirs('./data', exist_ok=True)

`exist_ok` argümanının ne işe yaradığını anlayabiliyor muyuz? `help` işlevini kullanmayı deneyelim veya [belgeleri okuyalım](https://docs.python.org/3/library/os.html#os.makedirs).

Dizinin (directory) oluşturulduğunu ve şu anda boş olduğunu doğrulayalım.

In [None]:
'data' in os.listdir('.')

True

In [None]:
os.listdir('./data')

[]

`urllib` modülünü kullanarak bazı dosyaları `data` dizinine (directory) indirelim.

In [None]:
url1 = 'https://gist.githubusercontent.com/aakashns/257f6e6c8719c17d0e498ea287d1a386/raw/7def9ef4234ddf0bc82f855ad67dac8b971852ef/loans1.txt'
url2 = 'https://gist.githubusercontent.com/aakashns/257f6e6c8719c17d0e498ea287d1a386/raw/7def9ef4234ddf0bc82f855ad67dac8b971852ef/loans2.txt'
url3 = 'https://gist.githubusercontent.com/aakashns/257f6e6c8719c17d0e498ea287d1a386/raw/7def9ef4234ddf0bc82f855ad67dac8b971852ef/loans3.txt'

In [None]:
from urllib.request import urlretrieve

In [None]:
urlretrieve(url1, './data/loans1.txt')

('./data/loans1.txt', <http.client.HTTPMessage at 0x7fc0413a7550>)

In [None]:
urlretrieve(url2, './data/loans2.txt')

('./data/loans2.txt', <http.client.HTTPMessage at 0x7fc0413ac610>)

In [None]:
urlretrieve(url3, './data/loans3.txt')

('./data/loans3.txt', <http.client.HTTPMessage at 0x7fc0413ace90>)

Dosyaların indirildiğini doğrulayalım.

In [None]:
os.listdir('./data')

['loans3.txt', 'loans2.txt', 'loans1.txt']

URL'leri indirmek için [`requests`](https://docs.python-requests.org/en/master/) kütüphanesini de kullanabiliriz, ancak sayfanın içeriğini bir dosyaya kaydetmek için [bazı ek kodlar yazmamız](https://stackoverflow.com/questions/44699682/how-to-save-a-file-downloaded-from-requests-to-another-directory) gerekecektir.

## Dosyadan okuma

Bir dosyanın içeriğini okumak için, önce yerleşik `open` fonksiyonunu kullanarak dosyayı açmamız gerekir. `open` fonksiyonu bir dosya nesnesi döndürür (return) ve dosyanın içeriğiyle etkileşim için çeşitli yöntemler sağlar.

In [None]:
dosya1 = open('./data/loans1.txt', mode='r')

`open` fonksiyonu, dosyayla nasıl etkileşime geçebileceğimizi belirtmek için bir `mode` argümanını da kabul eder. Aşağıdaki seçenekler desteklenir:

```
    ========= ===============================================================
    Karakter  Anlamı
    --------- ---------------------------------------------------------------
    'r'       okumaya açık (varsayılan)
    'w'       önce dosyayı kes, sonra yazmak için aç
    'x'       yeni bir dosya oluştur ve yazmak için aç
    'a'       yazmak için açın, varsa dosyanın sonuna ekleyin
    'b'       ikili (binary) mod
    't'       metin (text) modu (varsayılan)
    '+'       güncellemek için bir disk dosyası açma (okuma ve yazma)
    'U'       evrensel yeni satır (newline) modu (pek kullanılmıyor)
    ========= ===============================================================
```
Dosyanın içeriğini görüntülemek için dosya nesnesinin `read` yöntemini kullanabiliriz.

In [None]:
dosya1_contents = dosya1.read()

In [None]:
print(dosya1_contents)

amount,duration,rate,down_payment
100000,36,0.08,20000
200000,12,0.1,
628400,120,0.12,100000
4637400,240,0.06,
42900,90,0.07,8900
916000,16,0.13,
45230,48,0.08,4300
991360,99,0.08,
423000,27,0.09,47200


Dosya (file), krediler hakkında bilgi içerir. Virgülle ayrılmış değerler/comma-separated values (CSV) kümesidir.

> **CSV'ler**: Virgülle ayrılmış değerler (CSV) dosyası, değerleri ayırmak için virgül kullanan sınırlandırılmış bir metin dosyasıdır. Dosyanın her satırı bir veri kaydıdır. Her kayıt, virgülle ayrılmış bir veya daha fazla alandan oluşur. Bir CSV dosyası genel olarak tablo verilerini (sayılar ve metin) düz metin olarak depolar; bu durumda her satırda aynı sayıda alan bulunur. (Wikipedia)

Dosyanın ilk satırı, kalan satırlardaki sayıların her birinin neyi temsil ettiğini gösteren başlıktır. Kalan satırların her biri bir kredi hakkında bilgi sağlar. Böylece, ikinci satır `10000,36,0.08,20000` ile bir krediyi temsil eder:

* *tutar*: `$10000`,
* *süre*: `36` ay,
* *faiz oranı*: yıllık `%8`
* *peşinat*: `$20000`

CSV, analiz ve görselleştirme ve verileri paylaşmak için kullanılan standart bir dosya biçimidir. Bu eğitim boyunca, bu CSV dosyalarından verileri okuyacağız, işleyeceğiz ve sonuçları tekrar dosyalara yazacağız. Devam etmeden önce dosyayı `close` yöntemini kullanarak kapatalım. (aksi takdirde Python tüm dosyayı RAM'de tutmaya devam edecektir.)

In [None]:
dosya1.close()

Bir dosya kapatıldığında, artık ondan okuyamayız.

In [None]:
dosya1.read()

ValueError: ignored

## Dosyaları `with` kullanarak otomatik olarak kapatma

Bir dosyayı işledikten (process) sonra otomatik olarak kapatmak için `with` ifadesini kullanarak açabiliriz.

In [None]:
with open('./data/loans2.txt') as dosya2:
    dosya2_contents = dosya2.read()
    print(dosya2_contents)

amount,duration,rate,down_payment
828400,120,0.11,100000
4633400,240,0.06,
42900,90,0.08,8900
983000,16,0.14,
15230,48,0.07,4300


`with` bloğundaki ifadeler yürütüldüğünde (execute), `dosya2` üzerindeki `.close` yöntemi otomatik olarak çağrılır. Dosya nesnesinden tekrar okumayı deneyerek bunu doğrulayalım.

In [None]:
dosya2.read()

ValueError: ignored

## Bir dosyayı satır satır okuma

Dosya nesneleri, bir dosyayı satır satır okumak için bir `readlines` yöntemi sağlar.

In [None]:
with open('./data/loans3.txt', 'r') as dosya3:
    dosya3_lines = dosya3.readlines()

In [None]:
dosya3_lines

['amount,duration,rate,down_payment\n',
 '45230,48,0.07,4300\n',
 '883000,16,0.14,\n',
 '100000,12,0.1,\n',
 '728400,120,0.12,100000\n',
 '3637400,240,0.06,\n',
 '82900,90,0.07,8900\n',
 '316000,16,0.13,\n',
 '15230,48,0.08,4300\n',
 '991360,99,0.08,\n',
 '323000,27,0.09,4720010000,36,0.08,20000\n',
 '528400,120,0.11,100000\n',
 '8633400,240,0.06,\n',
 '12900,90,0.08,8900']

## Dosyalardan veri işleme

Bir dosyada depolanan veriler üzerinde herhangi bir işlem gerçekleştirmeden önce, dosyanın içeriğini büyük bir dizeden (string) Python veri türlerine dönüştürmemiz gerekir. Krediler hakkında CSV formatında bilgi içeren `loans1.txt` dosyası için şunları yapabiliriz:

* Dosyayı satır satır okuyalım.
* Sütun adlarının veya başlıklarının bir listesini almak için ilk satırı ayrıştıralım (parse).
* Kalan her satırı bölelim (split) ve her değeri bir float'a dönüştürelim.
* Başlıkları anahtar olarak kullanarak her kredi (loan) için bir sözlük (dictionary) oluşturalım.
* Tüm kredileri (loans) takip etmek için bir sözlük (dictionary) listesi oluşturalım.

Aynı işlemleri birden fazla dosya için yapacağımız için bir `read_csv` fonksiyonu tanımlamamız faydalı olacaktır. İşlevselliği adım adım oluşturmak için bazı yardımcı fonksiyonlar da tanımlayacağız.

Girdi (input) olarak bir satır al'an ve sütun (column) başlıklarının bir listesini döndüren bir `parse_header` fonksiyonu tanımlayarak başlayalım.

In [None]:
def parse_headers(header_line):
    return header_line.strip().split(',')

`strip` yöntemi, fazladan boşlukları ve yeni satır karakteri `\n`'i kaldırır. `split` yöntemi, verilen ayırıcıyı (bu durumda `,`) kullanarak bir dizeyi (string) listeye (list) böler.

In [None]:
dosya3_lines[0]

'amount,duration,rate,down_payment\n'

In [None]:
basliklar = parse_headers(dosya3_lines[0])

In [None]:
basliklar

['amount', 'duration', 'rate', 'down_payment']

Ardından, bazı veriler içeren bir satır al'an ve float sayıların bir listesini döndüren (return eden) bir `parse_values` fonksiyonunu tanımlayalım.

In [None]:
def parse_values(data_line):
    degerler = []
    for item in data_line.strip().split(','):
        degerler.append(float(item))
    return degerler

In [None]:
dosya3_lines[1]

'45230,48,0.07,4300\n'

In [None]:
parse_values(dosya3_lines[1])

[45230.0, 48.0, 0.07, 4300.0]

Değerler, beklendiği gibi ayrıştırıldı (parse edildi) ve float'a dönüştürüldü. Peşinat için bir değer içermeyen dosyadan başka bir satır için deneyelim.

In [None]:
dosya3_lines[2]

'883000,16,0.14,\n'

In [None]:
parse_values(dosya3_lines[2])

ValueError: ignored

Yukarıdaki kod bir `ValueError`e yol açar çünkü `''` boş string'i float'a dönüştürülemez. Bu *edge case*'i ele almak için `parse_values` fonksiyonunu geliştirebiliriz. Değerin float olmadığı durumu da ele alacağız.

In [None]:
def parse_values(data_line):
    degerler = []
    for item in data_line.strip().split(','):
        if item == '':
            degerler.append(0.0)
        else:
            try:
                degerler.append(float(item))
            except ValueError:
                degerler.append(item)
    return degerler

In [None]:
dosya3_lines[2]

'883000,16,0.14,\n'

In [None]:
parse_values(dosya3_lines[2])

[883000.0, 16.0, 0.14, 0.0]

Daha sonra, girdi (input) olarak bir değerler listesi ve bir başlık (header) listesi alan ve ilgili başlıklarla ilişkili değerlerle anahtar olarak bir sözlük (dictionary) döndüren `create_item_dict` fonksiyonu tanımlayalım.

In [None]:
def create_item_dict(degerler, basliklar):
    sonuc = {}
    for deger, baslik in zip(degerler, basliklar):
        sonuc[baslik] = deger
    return sonuc

Python yerleşik işlevi 'zip'in ne yaptığını bulabilir misiniz? Bir örnek deneyin veya [belgeleri okuyun](https://docs.python.org/3.3/library/functions.html#zip).

In [None]:
for item in zip([1,2,3], ['a', 'b', 'c']):
    print(item)

(1, 'a')
(2, 'b')
(3, 'c')


Birkaç örnekle `create_item_dict`i deneyelim.

In [None]:
dosya3_lines[1]

'45230,48,0.07,4300\n'

In [None]:
degerler1 = parse_values(dosya3_lines[1])
create_item_dict(degerler1, basliklar)

{'amount': 45230.0, 'down_payment': 4300.0, 'duration': 48.0, 'rate': 0.07}

In [None]:
dosya3_lines[2]

'883000,16,0.14,\n'

In [None]:
degerler2 = parse_values(dosya3_lines[2])
create_item_dict(degerler2, basliklar)

{'amount': 883000.0, 'down_payment': 0.0, 'duration': 16.0, 'rate': 0.14}

Beklendiği gibi, değerler (values) ve başlık (header), uygun anahtar-değer çiftleriyle bir sözlük oluşturmak için birleştirilir.

Artık hepsini bir araya getirmeye ve `read_csv` fonksiyonunu tanımlamaya hazırız.

In [None]:
def read_csv(path):
    sonuc = []
    # Dosyayı okuma modunda açalım.
    with open(path, 'r') as f:
        # Satırların bir listesini alalım.
        satirlar = f.readlines()
        # Başlığı ayrıştıralım.
        basliklar = parse_headers(satirlar[0])
        # Kalan satırlar üzerinde döngü
        for data_line in satirlar[1:]:
            # Değerleri ayrıştıralım.
            degerler = parse_values(data_line)
            # Değerleri ve başlıkları kullanarak bir sözlük oluşturalım.
            item_dict = create_item_dict(degerler, basliklar)
            # Sonuca sözlüğü ekleyelim.
            sonuc.append(item_dict)
    return sonuc

Hadi deneyelim!

In [None]:
with open('./data/loans2.txt') as dosya2:
    print(dosya2.read())

amount,duration,rate,down_payment
828400,120,0.11,100000
4633400,240,0.06,
42900,90,0.08,8900
983000,16,0.14,
15230,48,0.07,4300


In [None]:
read_csv('./data/loans2.txt')

[{'amount': 828400.0,
  'down_payment': 100000.0,
  'duration': 120.0,
  'rate': 0.11},
 {'amount': 4633400.0, 'down_payment': 0.0, 'duration': 240.0, 'rate': 0.06},
 {'amount': 42900.0, 'down_payment': 8900.0, 'duration': 90.0, 'rate': 0.08},
 {'amount': 983000.0, 'down_payment': 0.0, 'duration': 16.0, 'rate': 0.14},
 {'amount': 15230.0, 'down_payment': 4300.0, 'duration': 48.0, 'rate': 0.07}]

Dosya, beklendiği gibi okunur ve bir sözlük listesine dönüştürülür. `read_csv` dosyası, herhangi bir sayıda satır veya sütunla CSV biçimindeki herhangi bir dosyayı ayrıştırabilecek kadar geneldir. İşte yardımcı fonksiyonlarla birlikte `read_csv` için tam kod:

In [None]:
def parse_headers(header_line):
    return header_line.strip().split(',')

def parse_values(data_line):
    degerler = []
    for item in data_line.strip().split(','):
        if item == '':
            degerler.append(0.0)
        else:
            try:
                degerler.append(float(item))
            except ValueError:
                degerler.append(item)
    return degerler

def create_item_dict(degerler, basliklar):
    sonuc = {}
    for deger, baslik in zip(degerler, basliklar):
        sonuc[baslik] = deger
    return sonuc

def read_csv(path):
    sonuc = []
    # Dosyayı okuma modunda açalım.
    with open(path, 'r') as f:
        # Satırların bir listesini alalım.
        satirlar = f.readlines()
        # Başlığı ayrıştıralım.
        basliklar = parse_headers(satirlar[0])
        # Kalan satırlar üzerinde döngü
        for data_line in satirlar[1:]:
            # Değerleri ayrıştıralım.
            degerler = parse_values(data_line)
            # Değerleri ve başlıkları kullanarak bir sözlük oluşturalım.
            item_dict = create_item_dict(degerler, basliklar)
            # Sonuca sözlüğü ekleyelim.
            sonuc.append(item_dict)
    return sonuc

Mümkün olduğunda küçük, genel ve yeniden kullanılabilir fonksiyonlar oluşturmaya çalışalım. Muhtemelen eldeki sorunun ötesinde faydalı olacaklar ve gelecekte bizi önemli ölçüde çabadan kurtaracaklar.

[Önceki eğitimde](https://jovian.ml/aakashns/python-functions-and-scope), bir kredinin eşit aylık taksitlerini hesaplamak için bir fonksiyon tanımladık. İşte böyle görünüyordu:

In [None]:
import math

def kredi_esit_aylik_taksit(tutar, sure, oran, pesinat=0):
    """Bir kredi için eşit aylık taksiti (EAT) hesaplar.
    
    Argümanlar:
        tutar - Harcanacak toplam tutar (kredi + peşinat)
        sure - Kredinin süresi (ay olarak)
        oran - Faiz oranı (aylık)
        pesinat (isteğe bağlı) - İsteğe bağlı ilk ödeme (tutardan düşülür)
    """
    kredi_tutari = tutar - pesinat
    try:
        eat = kredi_tutari * oran * ((1+oran)**sure) / (((1+oran)**sure)-1)
    except ZeroDivisionError:
        eat = kredi_tutari / sure
    eat = math.ceil(eat)
    return eat

Bir dosyadaki tüm krediler için Eşit Aylık Taksit'leri hesaplamak için bu fonksiyonu kullanabiliriz.

In [None]:
kredi2 = read_csv('./data/loans2.txt')

In [None]:
kredi2

[{'amount': 828400.0,
  'down_payment': 100000.0,
  'duration': 120.0,
  'rate': 0.11},
 {'amount': 4633400.0, 'down_payment': 0.0, 'duration': 240.0, 'rate': 0.06},
 {'amount': 42900.0, 'down_payment': 8900.0, 'duration': 90.0, 'rate': 0.08},
 {'amount': 983000.0, 'down_payment': 0.0, 'duration': 16.0, 'rate': 0.14},
 {'amount': 15230.0, 'down_payment': 4300.0, 'duration': 48.0, 'rate': 0.07}]

In [None]:
for kredi in kredi2:
    kredi['emi'] = kredi_esit_aylik_taksit(kredi['amount'], 
                           kredi['duration'], 
                           kredi['rate']/12, # the CSV contains yearly rates
                           kredi['down_payment'])

In [None]:
kredi2

[{'amount': 828400.0,
  'down_payment': 100000.0,
  'duration': 120.0,
  'emi': 10034,
  'rate': 0.11},
 {'amount': 4633400.0,
  'down_payment': 0.0,
  'duration': 240.0,
  'emi': 33196,
  'rate': 0.06},
 {'amount': 42900.0,
  'down_payment': 8900.0,
  'duration': 90.0,
  'emi': 504,
  'rate': 0.08},
 {'amount': 983000.0,
  'down_payment': 0.0,
  'duration': 16.0,
  'emi': 67707,
  'rate': 0.14},
 {'amount': 15230.0,
  'down_payment': 4300.0,
  'duration': 48.0,
  'emi': 262,
  'rate': 0.07}]

Şimdi, her kredinin kredi için EMI sağlayan yeni bir `emi` anahtarına sahip olduğunu görebilirsiniz. Bu mantığı başka dosyalar için de kullanabilmemiz için bir fonksiyona çıkartabiliriz.

In [None]:
def compute_emis(krediler):
    for kredi in krediler:
        kredi['emi'] = kredi_esit_aylik_taksit(
            kredi['amount'], 
            kredi['duration'], 
            kredi['rate']/12, # the CSV contains yearly rates
            kredi['down_payment'])

## Dosyalara yazma

Artık veriler üzerinde bazı işlemler gerçekleştirdiğimize göre, sonuçları bir CSV dosyasına geri yazmak iyi olur. `open` kullanarak `w` modunda bir dosya oluşturabilir/açabilir ve `.write` yöntemini kullanarak ona yazabiliriz. String `format` yöntemi burada kullanışlı olacaktır.

In [None]:
kredi2 = read_csv('./data/loans2.txt')

In [None]:
compute_emis(kredi2)

In [None]:
kredi2

[{'amount': 828400.0,
  'down_payment': 100000.0,
  'duration': 120.0,
  'emi': 10034,
  'rate': 0.11},
 {'amount': 4633400.0,
  'down_payment': 0.0,
  'duration': 240.0,
  'emi': 33196,
  'rate': 0.06},
 {'amount': 42900.0,
  'down_payment': 8900.0,
  'duration': 90.0,
  'emi': 504,
  'rate': 0.08},
 {'amount': 983000.0,
  'down_payment': 0.0,
  'duration': 16.0,
  'emi': 67707,
  'rate': 0.14},
 {'amount': 15230.0,
  'down_payment': 4300.0,
  'duration': 48.0,
  'emi': 262,
  'rate': 0.07}]

In [None]:
with open('./data/emis2.txt', 'w') as f:
    for kredi in kredi2:
        f.write('{},{},{},{},{}\n'.format(
            kredi['amount'], 
            kredi['duration'], 
            kredi['rate'], 
            kredi['down_payment'], 
            kredi['emi']))

Dosyanın beklendiği gibi oluşturulduğunu ve yazıldığını doğrulayalım.

In [None]:
os.listdir('data')

['loans3.txt', 'loans2.txt', 'loans1.txt', 'emis2.txt']

In [None]:
with open('./data/emis2.txt', 'r') as f:
    print(f.read())

828400.0,120.0,0.11,100000.0,10034
4633400.0,240.0,0.06,0.0,33196
42900.0,90.0,0.08,8900.0,504
983000.0,16.0,0.14,0.0,67707
15230.0,48.0,0.07,4300.0,262



Harika! Kredi ayrıntıları (hesaplanan Eşit Aylık Taksit'lerle birlikte) dosyaya yazılmış gibi görünüyor.

Sözlüklerin bir listesini alan ve onu CSV formatında bir dosyaya yazan genel bir `write_csv` fonksiyonu tanımlayalım. Sütun başlıklarını da ilk satıra ekleyeceğiz.

In [None]:
def write_csv(items, path):
    # Open the file in write mode
    with open(path, 'w') as f:
        # Return if there's nothing to write
        if len(items) == 0:
            return
        
        # Write the headers in the first line
        basliklar = list(items[0].keys())
        f.write(','.join(basliklar) + '\n')
        
        # Write one item per line
        for item in items:
            degerler = []
            for baslik in basliklar:
                degerler.append(str(item.get(baslik, "")))
            f.write(','.join(degerler) + "\n")

Fonksiyonun nasıl çalıştığını anlıyor muyuz? Şimdiyse, nasıl çalıştığını anlamak için her bir ifadeyi satır satır veya farklı bir hücrede yürütmeyi deneyelim.

Hadi deneyelim!

In [None]:
kredi3 = read_csv('./data/loans3.txt')

In [None]:
compute_emis(kredi3)

In [None]:
write_csv(kredi3, './data/emis3.txt')

In [None]:
with open('./data/emis3.txt', 'r') as f:
    print(f.read())

amount,duration,rate,down_payment,emi
45230.0,48.0,0.07,4300.0,981
883000.0,16.0,0.14,0.0,60819
100000.0,12.0,0.1,0.0,8792
728400.0,120.0,0.12,100000.0,9016
3637400.0,240.0,0.06,0.0,26060
82900.0,90.0,0.07,8900.0,1060
316000.0,16.0,0.13,0.0,21618
15230.0,48.0,0.08,4300.0,267
991360.0,99.0,0.08,0.0,13712
323000.0,27.0,0.09,4720010000.0,-193751447
528400.0,120.0,0.11,100000.0,5902
8633400.0,240.0,0.06,0.0,61853
12900.0,90.0,0.08,8900.0,60



Yalnızca dört satır kodla artık indirilen her dosyayı okuyabilir, Eşit Aylık Taksit'leri hesaplayabilir ve sonuçları yeni dosyalara geri yazabiliriz:

In [None]:
for i in range(1,4):
    krediler = read_csv('./data/loans{}.txt'.format(i))
    compute_emis(krediler)
    write_csv(krediler, './data/emis{}.txt'.format(i))

In [None]:
os.listdir('./data')

['loans3.txt',
 'loans2.txt',
 'loans1.txt',
 'emis3.txt',
 'emis2.txt',
 'emis1.txt']

Bu harika değil mi? Tüm fonksiyonlar tanımlandıktan sonra, sadece birkaç satır kodla birçok dosyada binlerce hatta milyonlarca kredi için EMI'leri saniyeler içinde hesaplayabiliriz. Şimdi verileri işlemek için Python gibi bir programlama dili kullanmanın gerçek gücünü görmeye başlıyoruz!

## CSV'leri Okumak ve Yazmak için Pandas Kullanma

Yukarıda tanımladığımız `read_csv` ve `write_csv` fonksiyonlarında bazı sınırlamalar var:

* CSV dosyalarındaki değerlerden herhangi biri virgül içeriyorsa, `read_csv` fonksiyonu uygun bir sözlük oluşturamaz.

* Yazılacak değerlerden herhangi biri virgül içeriyorsa, `write_csv` fonksiyonu uygun bir CSV oluşturamaz.

CSV dosyasındaki bir değer virgül (`,`) içerdiğinde, değer genellikle çift tırnak içine alınır. Değerlerdeki çift tırnaklar (`"`) iki çift tırnak işaretine (`""`) dönüştürülür. İşte bir örnek:


```
başlık, açıklama
Hızlı ve Öfkeli, "Film, yarış, franchise"
Kara Şövalye, "Gotham, ""Batman"", ve Joker"
Akıl Defteri, Bir adam her 15 dakikada bir her şeyi unutur

```

Hadi deneyelim.

In [None]:
fimler_url = "https://gist.githubusercontent.com/aakashns/afee0a407d44bbc02321993548021af9/raw/6d7473f0ac4c54aca65fc4b06ed831b8a4840190/movies.csv"

In [None]:
urlretrieve(fimler_url, 'data/movies.csv')

('data/movies.csv', <http.client.HTTPMessage at 0x7fc040e7d810>)

In [None]:
fimler = read_csv('data/movies.csv')

In [None]:
fimler

[{'description': '"A movie', 'title': 'Fast & Furious'},
 {'description': '"Gotham', 'title': 'The Dark Knight'},
 {'description': 'A guy forgets everything every 15 minutes',
  'title': 'Memento'}]

Yukarıda da görebileceğiniz gibi, film açıklamaları düzgün bir şekilde ayrıştırılmamış.

Bu CSV'yi düzgün okumak için `pandas` kütüphanesini kullanabiliriz.

In [None]:
from urllib.request import urlretrieve

In [None]:
import pandas as pd

In [None]:
urlretrieve(fimler_url, 'movies.csv')

('movies.csv', <http.client.HTTPMessage at 0x7fc040eb3710>)

`pd.read_csv` fonksiyonu, CSV dosyasını bir pandas veri çerçevesine okumak için kullanılabilir: Verileri analiz etmek ve işlemek için elektronik tablo benzeri bir nesne. Gelecekteki bir derste veri çerçeveleri hakkında daha fazla bilgi edineceğiz.

In [None]:
movies_dataframe = pd.read_csv('movies.csv')

In [None]:
movies_dataframe

Unnamed: 0,title,description
0,Fast & Furious,"A movie, a race, a franchise"
1,The Dark Knight,"Gotham, the ""Batman"", and the Joker"
2,Memento,A guy forgets everything every 15 minutes


Bir veri çerçevesi, `to_dict` yöntemi kullanılarak bir sözlük listesine dönüştürülebilir.

In [None]:
movies = movies_dataframe.to_dict('records')

In [None]:
movies

[{'description': 'A movie, a race, a franchise', 'title': 'Fast & Furious'},
 {'description': 'Gotham, the "Batman", and the Joker',
  'title': 'The Dark Knight'},
 {'description': 'A guy forgets everything every 15 minutes',
  'title': 'Memento'}]

Eğer `records` argümanlarını iletemezseniz, bunun yerine bir listeler sözlüğü alırsınız.

In [None]:
movies_dict = movies_dataframe.to_dict()

In [None]:
movies_dict

{'description': {0: 'A movie, a race, a franchise',
  1: 'Gotham, the "Batman", and the Joker',
  2: 'A guy forgets everything every 15 minutes'},
 'title': {0: 'Fast & Furious', 1: 'The Dark Knight', 2: 'Memento'}}

`movies` verilerini bir CSV dosyasına geri yazmak için `write_csv` fonksiyonunu kullanmayı deneyelim.

In [None]:
write_csv(movies, 'movies2.csv')

In [None]:
!head movies2.csv

title,description
Fast & Furious,A movie, a race, a franchise
The Dark Knight,Gotham, the "Batman", and the Joker
Memento,A guy forgets everything every 15 minutes


Yukarıda görebileceğiniz gibi, CSV dosyası düzgün biçimlendirilmemiş. Bu, dosyayı `pd.read_csv` kullanılarak okumaya çalışılıp doğrulanabilir.

In [None]:
pd.read_csv('movies2.csv')

Unnamed: 0,Unnamed: 1,title,description
Fast & Furious,A movie,a race,a franchise
The Dark Knight,Gotham,"the ""Batman""",and the Joker
Memento,A guy forgets everything every 15 minutes,,


Bir sözlük listesini bir veri çerçevesine dönüştürmek için `pd.DataFrame` yapıcısını kullanabiliriz.

In [None]:
df2 = pd.DataFrame(movies)

In [None]:
df2

Unnamed: 0,title,description
0,Fast & Furious,"A movie, a race, a franchise"
1,The Dark Knight,"Gotham, the ""Batman"", and the Joker"
2,Memento,A guy forgets everything every 15 minutes


Artık bir veri çerçevesinin `.to_csv` yöntemi kullanılarak bir CSV dosyasına yazılabilir.

In [None]:
df2.to_csv('movies3.csv', index=None)

`index=None` argümanının ne işe yaradığını tahmin edebilir miyiz? Kaldırmayı ve çıktıdaki farkı gözlemlemeyi deneyin.

In [None]:
!head movies3.csv

title,description
Fast & Furious,"A movie, a race, a franchise"
The Dark Knight,"Gotham, the ""Batman"", and the Joker"
Memento,A guy forgets everything every 15 minutes


CSV dosyası düzgün biçimlendirilmiş. Bunu tekrar okumaya çalışarak doğrulayabiliriz.

In [None]:
pd.read_csv('movies3.csv')

Unnamed: 0,title,description
0,Fast & Furious,"A movie, a race, a franchise"
1,The Dark Knight,"Gotham, the ""Batman"", and the Joker"
2,Memento,A guy forgets everything every 15 minutes


Dosyayı `pandas` ile düzgün bir şekilde yazıp okuyabiliyoruz.

Genel olarak, CSV dosyalarını okumak ve yazmak için Pandas gibi kütüphaneleri kullanmak her zaman daha iyi bir fikirdir.

## Alıştırma - Bir liste sözlüğü kullanarak CSV dosyalarını işleme

Bir CSV dosyasını sözlük listesine dönüştürmek için yukarıda `read_csv` ve `write_csv` fonksiyonlarını tanımladık ve bunun tersi de geçerlidir. Bu alıştırmada, CSV verilerini dosyadaki her sütun için bir liste ile bunun yerine bir liste sözlüğüne dönüştüreceksiniz.

Örneğin, aşağıdaki CSV dosyasını düşünelim:

```
miktar,süre,oran,peşinat
828400,120,0.11,100000
4633400,240,0.06,
42900,90,0.08,8900
983000,16,0.14,
15230,48,0.07,4300
```

Onu aşağıdaki liste sözlüğüne çevireceğiz:

```
{
  miktar: [828400, 4633400, 42900, 983000, 15230],
  süre: []120, 240, 90, 16, 48],
  oran: [0.11, 0.06, 0.08, 0.14, 0.07],
  peşinat: [100000, 0, 8900, 0, 4300]
}
```

Aşağıdaki boş hücreleri kullanarak görevleri tamamlayalım:

1. Aşağıdaki kod hücresinde listelenen URL'leri kullanarak üç CSV dosyasını `data2` klasörüne indirelim ve indirilen dosyaları doğrulayalım.
2. Bir CSV dosyasını okuyan ve yukarıda gösterilen biçimde bir listeler sözlüğü döndüren bir `read_csv_columnar` fonksiyonu tanımlayalım.
3. Her veri satırı için hesaplanan bir EMI listesiyle sözlüğe başka bir `emi` anahtarı ekleyen bir `compute_emis` fonksiyonu tanımlayalım.
4. Listeler sözlüğündeki verileri doğru biçimlendirilmiş bir CSV dosyasına yazan bir `write_csv_columnar` fonksiyonu tanımlayalım.
5. İndirilen üç dosyayı da işleyelim ve sonuçları `data2` dizinine yeni dosyalar oluşturarak yazalım.

Gerektiğinde yardımcı fonksiyonları tanımlayalım.


In [None]:
url1 = 'https://gist.githubusercontent.com/aakashns/257f6e6c8719c17d0e498ea287d1a386/raw/7def9ef4234ddf0bc82f855ad67dac8b971852ef/loans1.txt'
url2 = 'https://gist.githubusercontent.com/aakashns/257f6e6c8719c17d0e498ea287d1a386/raw/7def9ef4234ddf0bc82f855ad67dac8b971852ef/loans2.txt'
url3 = 'https://gist.githubusercontent.com/aakashns/257f6e6c8719c17d0e498ea287d1a386/raw/7def9ef4234ddf0bc82f855ad67dac8b971852ef/loans3.txt'

## Özet ve İlave Okuma

Bununla, Python'daki dosyalardan okuma ve dosyalara yazma tartışmamızı tamamlıyoruz. Bu eğitimde aşağıdaki konuları ele aldık:

* `os` modülünü kullanarak dosya sistemiyle etkileşim
* `urllib` modülünü kullanarak URL'lerden dosya indirme
* `open` yerleşik fonksiyonunu kullanarak dosyaları açma
* `.read` kullanarak bir dosyanın içeriğini okuma
* `with` kullanarak bir dosyayı otomatik olarak kapatma
* `readlines` kullanarak bir dosyayı satır satır okuma
* Fonksiyonları tanımlayarak bir CSV dosyasından veri işleme
* Daha karmaşık fonksiyonlar oluşturmak için yardımcı fonksiyonlar kullanma
* `.write` kullanarak bir dosyaya veri yazma


Python'da dosyalarla çalışmayla ilgili bu eğitim hiçbir şekilde ayrıntılı değildir. Aşağıda, kontrol etmeniz gereken bazı kaynaklar daha bulunmaktadır:




* W3Schools'da Python Eğitimi: https://www.w3schools.com/python/
* Pratik Python Programlama: https://dabeaz-course.github.io/practical-python/Notes/Contents.html
* Python resmi belgeleri: https://docs.python.org/3/tutorial/index.html

## Gözden Geçirme Soruları

Burada ele alınan konuları ne kadar anladığınızı test etmek için aşağıdaki soruları yanıtlamayı deneyelim:

1. Python'daki `os` modülünün amacı nedir?
2. Bir Jupyter not defterinde mevcut çalışma dizinini nasıl tanımlarız?
3. Python kullanarak bir dizindeki (directory) dosyaların listesini nasıl alırsınız?
4. Python kullanarak bir dizin (directory) nasıl oluşturulur?
5. Dosya sisteminde bir dosya (file) veya dizinin (directory) var olup olmadığını nasıl kontrol edersiniz? İpucu: `os.path.exists`.
6. `os` modülünde bulunan fonksiyonların tam listesini nerede bulabiliriz?
7. `os` ve `os.path` modüllerinden 5 kullanışlı fonksiyona örnekler verelim.
8. Python kullanarak bir URL'den nasıl dosya indirirsiniz?
9. Python kullanarak bir dosya nasıl açılır? Örnek verelim.
10. Python'da dosya açmanın farklı modları nelerdir?
11. Bir dosyayı birden çok modda açabilir miyiz? Bir örnekle açıklayalım.
12. dosya nesnesi (file object) nedir? Nasıl faydalıdır?
13. Bir dosyanın içeriğini bir string'e nasıl okuruz?
14. CSV dosyası nedir? Örnek verelim.
15. Açık bir dosyayı nasıl kapatırız?
16. Bir dosyayı işlendikten sonra kapatmak neden önemlidir?
17. Dosyaların işlendikten sonra otomatik olarak kapanmasını nasıl sağlıyoruz? Örnek verelim.
18. Dosyalarla çalışmak için `with` ifadesi nasıl yararlıdır?
19. Kapalı bir dosyadan okumaya çalışırsak ne olur?
20. Bir dosyanın içeriğini satır satır nasıl okuruz?
21. Bir CSV dosyasının içeriğini bir sözlük listesine (dosyanın her satırı için bir sözlük) dönüştürmek için bir fonksiyon yazalım .
22. Bir CSV dosyasının içeriğini bir liste sözlüğüne (dosyanın her sütunu için bir sözlük) dönüştürmek için bir fonksiyon yazalım.
23. Python kullanarak bir dosyaya nasıl yazarız?
24. CSV formatındaki bir dosyaya veri yazmak için string `.format` yöntemi nasıldır?
25. Bir sözlük listesinden bir CSV dosyasına veri yazmak için bir fonksiyon yazalım.
26. Bir liste sözlüğünden bir CSV dosyasına veri yazmak için bir fonksiyon yazın.
27. Python'da dosya nesnesi tarafından desteklenen yöntemleri nereden öğrenebilirsiniz? 
28. Panda'ları kullanarak CSV dosyalarını nasıl okuyabilir ve CSV dosyalarına yazabilirsiniz?