### Metin Dosyalarını İşleme

Bu derste, kısa ve basit içerikli bir metin dosyası oluşturacağız.

Dosya içeriğini okumak için kullanabileceğiniz bazı temel teknikleri göstereceğiz.

İşlem oldukça basit olacak—dosyanın içeriğini konsola kopyalayacak ve programın okuduğu tüm karakterleri sayacaksınız.

Unutmayın, bizim metin dosyası anlayışımız oldukça katıdır. Bu, yalnızca metin içeren, herhangi bir ek süsleme (formatlama, farklı yazı tipleri vb.) içermeyen düz bir metin dosyasıdır.

Bu nedenle, dosyayı MS Word, LibreOffice Writer gibi gelişmiş metin işleme programlarıyla oluşturmaktan kaçınmalısınız. Bunun yerine, işletim sisteminizin sunduğu temel araçları kullanın: Not Defteri, vim, gedit, vb.

Metin dosyalarınız standart ASCII karakter seti tarafından kapsanmayan bazı ulusal karakterler içeriyorsa, ek bir adım gerekebilir. `open()` fonksiyonunu çağırırken, belirli bir metin kodlamasını belirtmeniz gerekebilir.

Örneğin, sistem genelinde UTF-8 kullanacak şekilde yapılandırılmış bir Unix/Linux işletim sistemi kullanıyorsanız, `open()` fonksiyonu şu şekilde görünebilir:

In [1]:
# tzop.txt dosyasını okuma modunda açma ve dosya nesnesi olarak döndürme:
stream = open("tzop.txt", "rt", encoding="utf-8")

print(stream.read()) # dosyanın içeriğini yazdırma

1
2
3
4
5


Burada, `encoding` argümanı uygun metin kodlamasını temsil eden bir dizeye (bu durumda UTF-8) ayarlanmıştır.

Çevrenize uygun bir kodlama adını bulmak için işletim sistemi belgelerinize başvurun.

**Not**

Bu bölümde dosya işlemleriyle ilgili deneylerimiz için önceden yüklenmiş bir dosya seti (örneğin, tzop.txt veya text.txt dosyaları) kullanacağız. Kendi makinenizde yerel olarak kendi dosyalarınızla çalışmak isterseniz, bunu yapmanızı ve kendi testlerinizi gerçekleştirmek için IDLE (veya tercih ettiğiniz herhangi bir IDE) kullanmanızı şiddetle tavsiye ederiz.

### Bir Metin Dosyasının İçeriğini Okuma

Bir metin dosyasının içeriğini okumak, çeşitli yöntemler kullanılarak gerçekleştirilebilir ve hiçbiri diğerlerinden daha iyi veya kötü değildir. Hangi yöntemi tercih edeceğiniz ve seveceğiniz size bağlıdır.

Bazı yöntemler bazen daha kullanışlı, bazen daha zahmetli olabilir. Esnek olun ve tercihlerinizi değiştirmekten çekinmeyin.

Bu yöntemlerin en temel olanı, önceki derste gördüğünüz `read()` fonksiyonu tarafından sunulan yöntemdir.

Bir metin dosyasına uygulandığında, bu fonksiyon şunları yapabilir:

- Dosyadan istenen sayıda karakteri (sadece bir karakter dahil) okuyabilir ve bunları bir dize olarak döndürebilir.
- Dosyanın tüm içeriğini okuyabilir ve bunları bir dize olarak döndürebilir.
- Okunacak başka bir şey kalmadığında (sanal okuma kafası dosyanın sonuna ulaştığında), fonksiyon boş bir dize döndürür.

En basit varyantla başlayacağız ve `text.txt` adlı bir dosya kullanacağız. Dosya şu içeriğe sahiptir:

```
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
```

Şimdi aşağıdaki koda bakın ve analiz edelim:

In [2]:
from os import strerror

try:
    cnt = 0
    s = open('text.txt', "rt")
    ch = s.read(1)
    while ch != '':
        print(ch, end='')
        cnt += 1
        ch = s.read(1)
    s.close()
    print("\n\nDosyadaki karakterler:", cnt)
except IOError as e:
    print("G/Ç hatası oluştu: ", strerror(e.errno))

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.

Dosyadaki karakterler: 131


Bu işlemler oldukça basittir:

1. `try-except` mekanizmasını kullanarak belirlenen adıyla dosyayı açın (`bizim durumumuzda text.txt`).
2. Dosyadan ilk karakteri okumayı deneyin (`ch = s.read(1)`).
3. Başarılı olursa (bu, `while` koşul kontrolünün pozitif bir sonuç vermesiyle kanıtlanır), karakteri yazdırın (her karakterden sonra yeni bir satıra geçmek istemediğiniz için `end=''` argümanına dikkat edin).
4. Sayacı (`cnt`) güncelleyin.
5. Bir sonraki karakteri okumayı deneyin ve işlemi tekrarlayın.

### Dosyanın Tamamını Bir Kez Okuma

Eğer dosyanın boyutunun güvenli olduğundan ve tamamını belleğe bir kerede okuyabileceğinizden eminseniz, bunu yapabilirsiniz. `read()` fonksiyonu, herhangi bir argüman verilmeden veya `None` olarak değerlendirilen bir argümanla çağrıldığında, tüm dosyayı okuyacaktır.

Unutmayın, bu yöntemle terabayt boyutunda bir dosyayı okumak işletim sisteminizi çökertir. Bilgisayar belleği esnek değildir.

Aşağıdaki koda bir göz atın. Ne düşünüyorsunuz?

In [3]:
from os import strerror

try:
    cnt = 0
    s = open('text.txt', "rt")
    content = s.read()
    for ch in content:
        print(ch, end='')
        cnt += 1
    s.close()
    print("\n\nDosyadaki karakterler:", cnt)
except IOError as e:
    print("G/Ç hatası oluştu: ", strerror(e.errno))

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.

Dosyadaki karakterler: 131


Analiz edelim:

1. Daha önce olduğu gibi dosyayı açın.
2. `read()` fonksiyonunu bir kez çağırarak dosyanın tüm içeriğini okuyun.
3. Metni, sıradan bir `for` döngüsüyle üzerinden geçerek işleyin ve her döngü turunda sayaç değerini güncelleyin.

Sonuç, önceki yöntemle aynı olacaktır.

### Metin Dosyalarını İşleme: `readline()`

Dosyanın içeriğini bir karakter yığını yerine bir dizi satır olarak ele almak istiyorsanız, `readline()` yöntemi bu iş için mükemmeldir.

Bu yöntem, dosyadan tam bir metin satırı okumaya çalışır ve başarılı olursa bir dize olarak döndürür. Aksi takdirde, boş bir dize döndürür.

Bu yöntem, yeni imkanlar sunar—artık yalnızca karakterleri değil, satırları da kolayca sayabilirsiniz.

Bunu kullanarak bir örnek yapalım:

In [4]:
from os import strerror

try:
    ccnt = lcnt = 0
    s = open('text.txt', 'rt')
    line = s.readline()
    while line != '':
        lcnt += 1
        for ch in line:
            print(ch, end='')
            ccnt += 1
        line = s.readline()
    s.close()
    print("\n\nDosyadaki karakterler:", ccnt)
    print("Dosyadaki satırlar:  ", lcnt)
except IOError as e:
    print("G/Ç hatası oluştu:", strerror(e.errno))

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.

Dosyadaki karakterler: 131
Dosyadaki satırlar:   4


Gördüğünüz gibi, genel fikir önceki örneklerle aynıdır:

1. Dosyayı açın.
2. Dosyayı satır satır okumak için `readline()` yöntemini kullanın.
3. Her satır ve karakteri iterasyondan geçirerek karakterleri ve satırları sayın.
4. Dosya işlendiğinde sonuçları yazdırın.

### Metin Dosyalarını İşleme: `readlines()`

Metin dosyasını karakterlerden ziyade satırlar olarak ele alan bir diğer yöntem de `readlines()` yöntemidir.

`readlines()` yöntemi, argümansız olarak çağrıldığında, dosyanın tüm içeriğini okur ve dosyadaki her bir satırı bir eleman olarak içeren bir dizi döndürür.

Dosya boyutunun yeterince küçük olduğundan emin değilseniz ve işletim sistemi sınırlarını test etmek istemiyorsanız, `readlines()` yöntemini bir seferde belirli bir bayt sayısından fazla okumaması için yönlendirebilirsiniz. Döndürülen değer yine bir dize listesi olacaktır.

`readlines()` yönteminin nasıl çalıştığını anlamak için aşağıdaki örnek kod ile denemeler yapın:

In [5]:
s = open("text.txt")
print(s.readlines(20))
print(s.readlines(20))
print(s.readlines(20))
print(s.readlines(20))
s.close()

['Beautiful is better than ugly.\n']
['Explicit is better than implicit.\n']
['Simple is better than complex.\n']
['Complex is better than complicated.']


Yönteme argüman olarak maksimum kabul edilen giriş tamponu boyutu verilir.

`readlines()` yönteminin, `readline()` yöntemine göre daha az sayıda çağrılmaya ihtiyaç duyduğu için dosya içeriğini daha verimli bir şekilde işleyebileceğini düşünebilirsiniz.

**Not:** Dosyadan okunacak bir şey kalmadığında, yöntem boş bir liste döndürür. Bunu dosyanın sonunu tespit etmek için kullanın.

Tampon boyutu sınırında, artırılması giriş performansını iyileştirebilir, ancak bunun için altın bir kural yoktur—en iyi değerleri kendiniz deneyerek bulun.

Aşağıdaki koda bakın. `readlines()` yöntemini nasıl kullanacağınızı göstermek için kodu değiştirdik:

In [6]:
from os import strerror

try:
    ccnt = lcnt = 0
    s = open('text.txt', 'rt')
    lines = s.readlines(20)
    while len(lines) != 0:
        for line in lines:
            lcnt += 1
            for ch in line:
                print(ch, end='')
                ccnt += 1
        lines = s.readlines(10)
    s.close()
    print("\n\nDosyadaki karakterler:", ccnt)
    print("Dosyadaki satırlar:  ", lcnt)
except IOError as e:
    print("G/Ç hatası oluştu:", strerror(e.errno))

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.

Dosyadaki karakterler: 131
Dosyadaki satırlar:   4


15 bayt uzunluğunda bir tampon kullanmaya karar verdik. Bu, bir öneri olarak düşünülmemelidir.

İlk `readlines()` çağrısının tüm dosyayı tüketmesini önlemek için bu değeri kullandık. Yöntemin daha fazla çalışmaya zorlanmasını ve yeteneklerini göstermesini istiyoruz.

Kodda iki iç içe döngü vardır: dış döngü `readlines()` yönteminin sonucunu kullanarak iterasyon yapar, iç döngü ise satırları karakter karakter yazdırır.

### Metin Dosyalarını İşleme: Yinelemeli Nesneler

Sunmak istediğimiz son örnek, `open()` fonksiyonunun metin modunda döndürdüğü nesnenin çok ilginç bir özelliğini göstermektedir.

Bu özellik sizi şaşırtabilir—nesne, yinelenebilir bir sınıfın bir örneğidir.

Garip mi? Hiç de değil. Kullanışlı mı? Kesinlikle.

Dosya nesnesi için tanımlanan yineleme protokolü çok basittir—`__next__` metodu sadece dosyadan okunan bir sonraki satırı döndürür.

Dahası, dosyadaki herhangi bir okuma işlemi dosyanın sonuna ulaştığında, nesnenin otomatik olarak `close()` metodunu çağırmasını bekleyebilirsiniz.

Aşağıdaki koda bakın ve kodun ne kadar basit ve anlaşılır hale geldiğini görün:

In [7]:
from os import strerror

try:
    ccnt = lcnt = 0
    for line in open('text.txt', 'rt'):
        lcnt += 1
        for ch in line:
            print(ch, end='')
            ccnt += 1
    print("\n\nDosyadaki karakterler:", ccnt)
    print("Dosyadaki satırlar:  ", lcnt)
except IOError as e:
    print("G/Ç hatası oluştu: ", strerror(e.errno))

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.

Dosyadaki karakterler: 131
Dosyadaki satırlar:   4


Bu örnek, bir dosya nesnesi üzerinde yinelenmenin satırları okuma ve karakterleri sayma sürecini nasıl basitleştirdiğini göstermektedir.

### Metin Dosyalarıyla Çalışmak: `write()`

Metin dosyalarına yazmak oldukça basittir, çünkü bu görevi gerçekleştirmek için kullanılan temel bir yöntem vardır: `write()`.

`write()` yöntemi, tek bir argüman bekler—açık bir dosyaya yazılacak olan bir dize. Unutmayın, açık modu verilerin nasıl aktarılacağını yansıtmalıdır—okuma modunda açılmış bir dosyaya yazma işlemi başarısız olur.

`write()` yöntemine verilen argümana otomatik olarak yeni satır karakteri eklenmez, bu yüzden dosyanın birden fazla satır içermesini istiyorsanız bunu kendiniz eklemelisiniz.

Aşağıdaki örnek, `newtext.txt` adlı bir dosya oluşturan basit bir kodu göstermektedir (not: `w` modu dosyanın sıfırdan oluşturulmasını sağlar, hatta mevcutsa ve veri içeriyorsa bile) ve ardından dosyaya on satır yazar.

Yazılacak dize, "line" kelimesi ve ardından satır numarasından oluşur. Dizenin içeriğini karakter karakter yazmayı seçtik (iç döngü `for` kullanarak), ancak bunu bu şekilde yapmak zorunda değilsiniz.

`write()` yönteminin tek tek karakterler üzerinde çalışabileceğini göstermek istedik.

In [8]:
from os import strerror

try:
    fo = open('newtext.txt', 'wt') # Yeni bir dosya (newtext.txt) oluşturulur.
    for i in range(10):
        s = "line #" + str(i+1) + "\n"
        for ch in s:
            fo.write(ch)
    fo.close()
except IOError as e:
    print("G/Ç hatası oluştu: ", strerror(e.errno))

Kod, aşağıdaki metinle dolu bir dosya oluşturur:

```
line #1
line #2
line #3
line #4
line #5
line #6
line #7
line #8
line #9
line #10
```

Dosyanın içeriğini konsola yazdırabilir misiniz?

`write()` yönteminin davranışını kendi makinenizde yerel olarak test etmenizi öneririz.

### Metin Dosyalarıyla Çalışmak: Devamı

Aşağıdaki örneğe bakın. Önceki kodu, metin dosyasına tüm satırları yazacak şekilde değiştirdik.

```python
from os import strerror

try:
    fo = open('newtext.txt', 'wt')
    for i in range(10):
        fo.write("line #" + str(i+1) + "\n")
    fo.close()
except IOError as e:
    print("G/Ç hatası oluştu: ", strerror(e.errno))
```

Yeni oluşturulan dosyanın içeriği aynı olacaktır.

**Not:** Aynı yöntemi `stderr` akışına yazmak için de kullanabilirsiniz, ancak `stderr` akışını açmaya çalışmayın, çünkü bu akış her zaman örtük olarak açıktır.

Örneğin, normal program çıktısından ayırt etmek için bir hata mesajı dizesini `stderr` akışına göndermek isterseniz, şu şekilde görünebilir:

```python
import sys
sys.stderr.write("Hata mesajı\n")
```

Bu yöntem, hata mesajlarının `stderr` akışına gönderilmesini ve standart program çıktısından ayrılmasını sağlar.

### Metin Dosyalarıyla Çalışmak: Devamı

Aşağıdaki örneğe bakın. Önceki kodu, metin dosyasına tüm satırları yazacak şekilde değiştirdik.

In [9]:
from os import strerror

try:
    fo = open('newtext.txt', 'wt')
    for i in range(10):
        fo.write("line #" + str(i+1) + "\n")
    fo.close()
except IOError as e:
    print("G/Ç hatası oluştu: ", strerror(e.errno))

Yeni oluşturulan dosyanın içeriği aynı olacaktır.

**Not:** Aynı yöntemi `stderr` akışına yazmak için de kullanabilirsiniz, ancak `stderr` akışını açmaya çalışmayın, çünkü bu akış her zaman örtük olarak açıktır.

Örneğin, normal program çıktısından ayırt etmek için bir hata mesajı dizesini `stderr` akışına göndermek isterseniz, şu şekilde görünebilir:

```python
import sys
sys.stderr.write("Hata mesajı\n")
```

Bu yöntem, hata mesajlarının `stderr` akışına gönderilmesini ve standart program çıktısından ayrılmasını sağlar.

### Bytearray Nedir?

İkili dosyalar hakkında konuşmaya başlamadan önce, Python'ın amorf verileri depolamak için kullandığı özel sınıflardan birini tanıtmalıyız.

Amorf veri, belirli bir şekil veya forma sahip olmayan veridir; sadece bir dizi bayttan oluşur.

Bu, bu baytların kendi anlamlarının olamayacağı veya herhangi bir kullanışlı nesneyi (örneğin, bitmap grafikler) temsil edemeyeceği anlamına gelmez. Buradaki en önemli nokta, bu verilerle ilgilendiğimizde, ya bunların belirli doğasını bilmememiz ya da bilmek istemememizdir.

Amorf veriler, daha önce sunulan yöntemlerden herhangi biriyle depolanamaz; ne dizedirler ne de listedirler. Bu tür verileri işleyebilecek özel bir konteyner gereklidir.

Python, bu tür veriler için birden fazla konteyner sunar ve bunlardan biri `bytearray` adlı özel bir sınıftır. Adından da anlaşılacağı gibi, bu sınıf (amorf) baytları içeren bir dizidir.

Örneğin, bir bitmap resmi okumak ve işlemden geçirmek istiyorsanız, bu tür bir konteyneri oluşturmak için kullanılabilir kuruculardan birini kullanarak açıkça oluşturmanız gerekir.

Şu örneği göz önünde bulundurun:

In [10]:
data = bytearray(10)

Bu çağrı, on bayt depolayabilen bir `bytearray` nesnesi oluşturur.

Not: Bu tür bir kurucu, tüm diziyi sıfırlarla doldurur.

### Bytearray'ler Hakkında

Bytearray'ler birçok açıdan listelere benzer. Örneğin, değiştirilebilirler, `len()` fonksiyonuyla kullanılabilirler ve geleneksel indeksleme kullanarak herhangi bir elemanına erişebilirsiniz.

Ancak, önemli kısıtlamalar vardır:
- Byte array elemanlarını bir tamsayı olmayan bir değerle ayarlayamazsınız (bu kuralı ihlal etmek bir `TypeError` istisnasına neden olur).
- 0 ile 255 aralığı dışında bir değer atayamazsınız (bu kuralı ihlal etmek bir `ValueError` istisnasına neden olur).

Aşağıdaki örnekte gösterildiği gibi, byte array elemanlarını tamsayı değerler olarak ele alabilirsiniz:

In [11]:
data = bytearray(10)

for i in range(len(data)):
    data[i] = 10 - i

for b in data:
    print(hex(b))

0xa
0x9
0x8
0x7
0x6
0x5
0x4
0x3
0x2
0x1


Not: Byte array'ler üzerinde yineleme yapmak için iki yöntem kullandık ve elemanları onaltılık değerler olarak görmek için `hex()` fonksiyonunu kullandık.

Şimdi, bir byte array'i ikili bir dosyaya nasıl yazacağınızı göstereceğiz. Okunabilir bir temsilini kaydetmek yerine, fiziksel bellek içeriğinin bire bir kopyasını, bayt bayt yazmak istiyoruz.

In [12]:
# Bir byte array'i ikili bir dosyaya yazma örneği
from os import strerror

try:
    data = bytearray(10)
    for i in range(len(data)):
        data[i] = 10 - i

    with open('binaryfile.bin', 'wb') as bf:
        bf.write(data)
except IOError as e:
    print("G/Ç hatası oluştu:", strerror(e.errno))

### Byte Array'i İkili Dosyaya Yazmak

Bir byte array'i ikili dosyaya nasıl yazacağımıza bir bakalım:

In [13]:
from os import strerror

try:
    # Bytearray'i 10'dan başlayarak değerlerle başlatma
    data = bytearray(10)
    for i in range(len(data)):
        data[i] = 10 - i

    # İkili dosya oluşturma ve byte array'i dosyaya yazma
    with open('binaryfile.bin', 'wb') as bf:
        bf.write(data)
except IOError as e:
    print("G/Ç hatası oluştu:", strerror(e.errno))

### Analiz:
- **Başlatma:** `bytearray`'i 10'dan başlayan ardışık değerlerle başlatıyoruz. Dosya içeriğinin daha okunabilir olmasını istiyorsanız, `10` yerine `ord('a')` gibi bir değer kullanabilirsiniz. Bu, ASCII kodunun alfabetik kısmına karşılık gelen baytlar üretir. Ancak, dosya `wb` bayrağı ile oluşturulduğu için hala ikili bir dosya olarak kalır.
- **Dosya Oluşturma:** `open()` fonksiyonunu `wb` (ikili yazma) moduyla kullanarak dosyayı oluşturuyoruz.
- **Veri Yazma:** `write()` yöntemi, `bytearray`'i alır ve dosyaya bir bütün olarak yazar.
- **Akışı Kapatma:** Akış rutin bir şekilde kapatılır.
- **Dönen Değer:** `write()` yöntemi, başarıyla yazılan baytların sayısını döndürür. Bu değer, `bytearray`'in uzunluğundan farklıysa, bir yazma hatasını gösterir.

Kodu çalıştırın ve yeni oluşturulan dosyanın içeriğini analiz edin. Bir sonraki adımda bu dosyayı kullanacaksınız.

### Akıştan Bayt Okuma

Bir ikili dosyadan okumak için `readinto()` yöntemini kullanmalısınız. Bu yöntem, yeni bir byte array nesnesi oluşturmaz, bunun yerine önceden oluşturulmuş bir byte array'i dosyadan alınan değerlerle doldurur.

**Not:**
- Yöntem, başarıyla okunan baytların sayısını döndürür.
- Yöntem, argümanında mevcut olan tüm alanı doldurmaya çalışır. Dosyada, argümandaki alandan daha fazla veri varsa, okuma işlemi dosyanın sonundan önce durur. Dosyada daha az veri varsa, sonuç byte array'in yalnızca kısmen doldurulduğunu gösterir. Kullanılmayan kısım değişmeden kalır.

İşte tam kod:

In [14]:
from os import strerror

data = bytearray(10)

try:
    # Dosyayı ikili okuma modunda açma
    bf = open('binaryfile.bin', 'rb')
    bf.readinto(data)
    bf.close()

    # Byte array'in içeriğini yazdırma
    for b in data:
        print(hex(b), end=' ')
except IOError as e:
    print("G/Ç hatası oluştu:", strerror(e.errno))

0xa 0x9 0x8 0x7 0x6 0x5 0x4 0x3 0x2 0x1 

### Analiz:
- **Dosyayı Açma:** Önceki adımda oluşturulan dosyayı `rb` modunda açıyoruz.
- **Veri Okuma:** Dosyanın içeriğini, boyutu on bayt olan `data` adlı byte array'e okuyoruz.
- **Veri Yazdırma:** Son olarak, byte array'in içeriğini yazdırıyoruz. İçeriğin beklentilerinize uyup uymadığını kontrol edin.

Kodu çalıştırarak çalışıp çalışmadığını kontrol edin.

### Bir Akıştan Bayt Okuma

Bir ikili dosyanın içeriğini okumanın alternatif bir yolu, `read()` adlı yöntemdir.

Bu yöntem, argümansız olarak çağrıldığında, dosyanın tüm içeriğini belleğe okumaya çalışır ve bunları yeni oluşturulan bir `bytes` sınıfı nesnesinin parçası haline getirir.

Bu sınıf, önemli bir fark dışında `bytearray` sınıfına benzer: `bytes` sınıfı değiştirilemezdir (immutable).

Neyse ki, `bytes` nesnesinden doğrudan başlangıç değerini alarak bir `bytearray` oluşturmak için hiçbir engel yoktur, tıpkı burada gösterildiği gibi:

In [15]:
from os import strerror

try:
    bf = open('file.bin', 'rb')
    data = bytearray(bf.read())
    bf.close()

    for b in data:
        print(hex(b), end=' ')

except IOError as e:
    print("G/Ç hatası oluştu:", strerror(e.errno))

G/Ç hatası oluştu: No such file or directory


Dikkatli olun—dosyanın içeriğinin mevcut belleğe sığacağından emin değilseniz bu tür bir okumayı kullanmayın.

### Bir Akıştan Bayt Okuma: Devamı

Eğer `read()` yöntemi bir argümanla çağrılırsa, bu argüman okunacak maksimum bayt sayısını belirtir.

Yöntem, dosyadan istenen sayıda bayt okumaya çalışır ve döndürülen nesnenin uzunluğu, aslında kaç bayt okunduğunu belirlemek için kullanılabilir.

Yöntemi şu şekilde kullanabilirsiniz:

In [16]:
try:
    bf = open('file.bin', 'rb')
    data = bytearray(bf.read(5))
    bf.close()

    for b in data:
        print(hex(b), end=' ')

except IOError as e:
    print("G/Ç hatası oluştu:", strerror(e.errno))

G/Ç hatası oluştu: No such file or directory


**Not:** Kod, dosyanın ilk beş baytını okudu; sonraki beş bayt hala işlenmeyi bekliyor.

In [17]:
from os import strerror

data = bytearray(10)

for i in range(len(data)):
    data[i] = 10 + i

try:
    bf = open('file.bin', 'wb')
    bf.write(data)
    bf.close()
except IOError as e:
    print("I/O error occurred:", strerror(e.errno))

# Your code that reads bytes from the stream should go here.


### Dosya Kopyalama - Basit ve İşlevsel Bir Araç

Şimdi, bu yeni bilgileri bir araya getirecek, bazı yeni öğeler ekleyecek ve bir dosyanın içeriğini gerçekten kopyalayabilen bir kod yazmak için kullanacaksınız.

Amaç, `copy` (MS Windows) veya `cp` (Unix/Linux) gibi komutların yerine daha iyi bir şey yapmak değil, kimse kullanmasa bile çalışan bir araç oluşturmanın mümkün yollarını görmek.

Aşağıdaki koda bakın ve birlikte inceleyelim:

In [None]:
from os import strerror  # 1

srcname = input("Kaynak dosya adını girin: ")  # 3
try:  # 4
    src = open(srcname, 'rb')  # 5
except IOError as e:  # 6
    print("Kaynak dosya açılamıyor: ", strerror(e.errno))  # 7
    exit(e.errno)  # 8

dstname = input("Hedef dosya adını girin: ")  # 10
try:  # 11
    dst = open(dstname, 'wb')  # 12
except Exception as e:  # 13
    print("Hedef dosya oluşturulamıyor: ", strerror(e.errno))  # 14
    src.close()  # 15
    exit(e.errno)  # 16

buffer = bytearray(65536)  # 18
total = 0  # 19
try:  # 20
    readin = src.readinto(buffer)  # 21
    while readin > 0:  # 22
        written = dst.write(buffer[:readin])  # 23
        total += written  # 24
        readin = src.readinto(buffer)  # 25
except IOError as e:  # 26
    print("Hedef dosya oluşturulamıyor: ", strerror(e.errno))  # 27
    exit(e.errno)  # 28

print(total, 'bayt başarıyla yazıldı')  # 30
src.close()  # 31
dst.close()  # 32


### Kod Analizi:

- **Satır 3-8:** Kullanıcıdan kopyalanacak dosyanın adını isteyin ve okuma amacıyla açmaya çalışın. Açma işlemi başarısız olursa, `exit()` fonksiyonunu kullanarak programın çalışmasını sonlandırın ve tamamlanma kodunu işletim sistemine iletin. 0 dışındaki herhangi bir kod, bir sorunun olduğunu belirtir. Sorunun niteliğini belirtmek için `errno` değerini kullanın.

- **Satır 10-16:** Çıktı dosyası için benzer bir işlem gerçekleştirin.

- **Satır 18:** Kaynak dosyadan hedef dosyaya veri aktarımı için bir bellek parçası ayırın, bu tampon olarak adlandırılır. Burada tampon boyutu 64 kilobayt olarak belirlenmiştir. Daha büyük bir tampon, daha az I/O işlemi nedeniyle genellikle daha hızlı kopyalama anlamına gelir, ancak belirli bir sınırın ötesinde daha fazla artış iyileştirme sağlamaz.

- **Satır 19:** Kopyalanan baytları izlemek için bir sayaç başlatın.

- **Satır 21:** Tamponu ilk kez doldurun.

- **Satır 22:** Sıfırdan farklı bir bayt sayısı okuduğunuz sürece döngüye devam edin.

- **Satır 23:** Tamponun içeriğini çıktı dosyasına yazın. `write()` fonksiyonunun tüm tamponu yazmayı tercih ettiği için, yazılacak bayt sayısını sınırlamak için bir dilim kullanılmıştır.

- **Satır 24:** Yazılan bayt sayısıyla sayacı güncelleyin.

- **Satır 25:** Dosyanın bir sonraki parçasını okuyun.

- **Satır 30-32:** Kopyalama işlemi tamamlandıktan sonra kaynak ve hedef dosyaları kapatarak son temizlik işlemlerini gerçekleştirin.

Bu kod, Python kullanarak dosya kopyalamanın pratik bir yolunu gösterir ve dosya işleme, istisna yönetimi ve bellek yönetimi bilgilerini bir araya getirir.

### Temel Bilgiler

1. **Bir Dosyanın İçeriğini Okuma:**
   - `read(number)`: Dosyadan belirtilen sayıda karakter/bayt okur ve bunları bir dize olarak döndürür. Bir sayı belirtilmezse tüm dosyayı bir kerede okuyabilir.
   - `readline()`: Metin dosyasından tek bir satır okur.
   - `readlines(number)`: Metin dosyasından belirtilen sayıda satır okur. Bir sayı belirtilmezse tüm satırları bir kerede okuyabilir.
   - `readinto(bytearray)`: Dosyadan baytları okur ve bunları `bytearray` içine doldurur.

2. **Bir Dosyaya Yeni İçerik Yazma:**
   - `write(string)`: Bir dizeyi metin dosyasına yazar.
   - `write(bytearray)`: `bytearray` içindeki tüm baytları dosyaya yazar.

3. **`open()` Yöntemini Kullanma:**
   - `open()` yöntemi, dosyanın tüm satırları boyunca yineleme yapmak için kullanılabilecek bir iterable nesne döndürür. Örneğin:


In [None]:
for line in open("file", "rt"):
    print(line, end='')



Bu kod, dosyanın içeriğini satır satır konsola kopyalar. Not: Akış, dosyanın sonuna ulaştığında otomatik olarak kapanır.