# Итераторы

## Порядок сдачи домашнего

Под каждое домашнее вы создаете отдельную ветку куда вносите все изменения в рамках домашнего. Как только домашнее готово - создаете пулл реквест (обратите внимание что в пулл реквесте должны быть отражены все изменения в рамках домашнего). Ревьювера назначаете из таблицы - https://docs.google.com/spreadsheets/d/1vK6IgEqaqXniUJAQOOspiL_tx3EYTSXW1cUrMHAZFr8/edit?gid=0#gid=0
Перед сдачей проверьте код, напишите тесты. Не забудьте про PEP8, например, с помощью flake8. Задание нужно делать в jupyter notebook.

**Дедлайн - 11 ноября 10:00**

## Итератор по цифрам

Реализуйте класс-итератор `DigitIterator`, который принимает на вход целое число и позволяет итерироваться по его цифрам слева направо. На каждой итерации должна возвращаться следующая цифра числа.

**Условия:**
1.	Число может быть как положительным, так и отрицательным.
2.	Итератор должен возвращать только цифры числа, без знака - для отрицательных чисел.
3.	Итерация должна быть возможна с помощью цикла for или функции next().

**Пример использования:**

```python
iterator = DigitIterator(12345)
for digit in iterator:
    print(digit)
# 1
# 2
# 3
# 4
# 5

iterator = DigitIterator(-6789)
for digit in iterator:
    print(digit)

# 6
# 7
# 8
# 9
```

In [1]:
class DigitIterator:
    def __init__(self, num):
        self.num = str(abs(num))
        self.start = -1
        self.stop = len(self.num)-1
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.start >= self.stop:
            raise StopIteration
        self.start += 1
        return self.num[self.start]

In [None]:
# example
iterator = DigitIterator(12345)
for digit in iterator:
    print(digit)

1
2
3
4
5


In [8]:
def all_test_1():
    # test 1
    iterator = DigitIterator(12345)
    result = [digit for digit in iterator]
    assert result == ['1', '2', '3', '4', '5'], f"Expected ['1', '2', '3', '4', '5'], but got {result}"

    # test 2
    iterator = DigitIterator(0)
    result = [digit for digit in iterator]
    assert result == ['0'], f"Expected ['0'], but got {result}"

    # test 3
    iterator = DigitIterator(-987)
    result = [digit for digit in iterator]
    assert result == ['9', '8', '7'], f"Expected ['9', '8', '7'], but got {result}"


    # test 4
    iterator = DigitIterator(56)
    assert next(iterator) == '5', "Expected '5' as the first digit"
    assert next(iterator) == '6', "Expected '6' as the second digit"
    try:
        next(iterator)
        assert False, "Expected StopIteration, but got no exception"
    except StopIteration:
        pass  # Ожидаем StopIteration, тест пройден

    # test 5
    iterator = DigitIterator(1234567890)
    result = [digit for digit in iterator]
    expected = ['1', '2', '3', '4', '5', '6', '7', '8', '9', '0']
    assert result == expected, f"Expected {expected}, but got {result}"

    return "everything is working fine!"

print(all_test_1())


everything is working fine!


# Итератор по файлу чанками

Реализуйте класс-итератор `FileChunkIterator`, который принимает на вход путь к файлу и количество байт для чтения. Итератор должен открывать файл и считывать его содержимое блоками фиксированного размера (количества байт), переданного в качестве параметра. При каждой итерации возвращается следующий блок байт, пока не будет достигнут конец файла.

**Условия:**
1.	Итератор должен открывать файл в режиме чтения бинарных данных (rb).
2.	Размер блока (количество байт) передаётся при создании итератора.
3.	Если в конце файла остаётся блок меньшего размера, итератор должен вернуть оставшиеся байты.
4.	При достижении конца файла итератор должен завершить работу, поднимая StopIteration.

**Пример использования:**
```python
with open("example.txt", "w") as file:
    file.write("Hello world!!")
    
iterator = FileChunkIterator("example.txt", 2)
for chunk in iterator:
    print(chunk)
# He
# ll
# o 
# wo
# rl
# d!
# !
```

In [10]:
class FileChunkIterator:
    def __init__(self, filename, chunk_length):
        self.file = open(filename, mode='rb')
        self.chunk_length = chunk_length
    
    def __iter__(self):
        return self
    
    def __next__(self):
        chunk = self.file.read(self.chunk_length)
        if not chunk:
            self.file.close()
            raise StopIteration
        return chunk.decode('utf-8')

In [None]:
# example
with open("example.txt", "w") as file:
    file.write("Hello world!!")

iterator = FileChunkIterator("example.txt", 2)
for chunk in iterator:
    print(chunk)

He
ll
o 
wo
rl
d!
!


In [13]:
import os

def all_test_2():
    filename = "test_example.txt"
    with open(filename, "w") as file:
        file.write("Hello world!!")

    try:
        # test 1
        iterator = FileChunkIterator(filename, 2)
        result = [chunk for chunk in iterator]
        assert result == ["He", "ll", "o ", "wo", "rl", "d!", "!"], f"Expected ['He', 'll', 'o ', 'wo', 'rl', 'd!', '!'], but got {result}"

        # test 2
        iterator = FileChunkIterator(filename, 5)
        result = [chunk for chunk in iterator]
        assert result == ["Hello", " worl", "d!!"], f"Expected ['Hello', ' worl', 'd!!'], but got {result}"

        # test 3 -- empty file
        with open(filename, "w") as file:
            file.write("")
        iterator = FileChunkIterator(filename, 2)
        result = [chunk for chunk in iterator]
        assert result == [], "Expected empty list for empty file, but got some chunks"

        # test 4
        with open(filename, "w") as file:
            file.write("Hello")
        iterator = FileChunkIterator(filename, 2)
        assert next(iterator) == "He", "Expected 'He' as the first chunk"
        assert next(iterator) == "ll", "Expected 'll' as the second chunk"
        assert next(iterator) == "o", "Expected 'o' as the third chunk"
        try:
            next(iterator)
            assert False, "Expected StopIteration, but got no exception"
        except StopIteration:
            pass  # waiting for StopIteration --> test completed

        # test 5: Проверка закрытия файла после завершения итерации
        iterator = FileChunkIterator(filename, 1)
        try:
            while True:
                next(iterator)
        except StopIteration:
            pass
        assert iterator.file.closed, "Expected file to be closed after StopIteration, but it is open"
    
    finally:
        # clear file after testing
        if os.path.exists(filename):
            os.remove(filename)

    return "everything is working fine!"

print(all_test_2())


everything is working fine!


# Итератор по подматрицам

Реализуйте класс-итератор `SubmatrixIterator`, который принимает на вход матрицу и размер подматрицы (квадратного блока). Итератор должен проходить по всем возможным подматрицам указанного размера и возвращать их одну за другой.

**Пример использования:**

```python
matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
    [13, 14, 15, 16]
]
iterator = SubmatrixIterator(matrix, 2)
for submatrix in iterator:
    print(submatrix)
    
# [[1, 2], [5, 6]]
# [[2, 3], [6, 7]]
# [[3, 4], [7, 8]]
# [[5, 6], [9, 10]]
# [[6, 7], [10, 11]]
# [[7, 8], [11, 12]]
# [[9, 10], [13, 14]]
# [[10, 11], [14, 15]]
# [[11, 12], [15, 16]]
```

In [14]:
class SubmatrixIterator:
    def __init__(self, matrix, submatrix_size):
        self.matrix = matrix
        self.matrix_size = len(matrix)
        self.submatrix_size = submatrix_size
        self.row_index, self.col_index = 0, 0


    def __iter__(self):
        return self
        
    def __next__(self):
        if self.row_index  + self.submatrix_size > self.matrix_size:
            raise StopIteration

        submatrix = [[self.matrix[i][j] for j in range(self.col_index, self.col_index + self.submatrix_size)]
                    for i in range(self.row_index, self.row_index + self.submatrix_size)]  # submatrix creation
        
        self.col_index += 1
        if self.col_index + self.submatrix_size > self.matrix_size:  # go to the new row
            self.col_index = 0
            self.row_index += 1

        return submatrix

In [None]:
# example
matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
    [13, 14, 15, 16]
]

iterator = SubmatrixIterator(matrix, 2)
for submatrix in iterator:
    print(submatrix)

[[1, 2], [5, 6]]
[[2, 3], [6, 7]]
[[3, 4], [7, 8]]
[[5, 6], [9, 10]]
[[6, 7], [10, 11]]
[[7, 8], [11, 12]]
[[9, 10], [13, 14]]
[[10, 11], [14, 15]]
[[11, 12], [15, 16]]


In [20]:
def all_test_3():
    matrix = [
        [1, 2, 3, 4],
        [5, 6, 7, 8],
        [9, 10, 11, 12],
        [13, 14, 15, 16]
    ]

    # test 1
    iterator = SubmatrixIterator(matrix, 4)
    result = [submatrix for submatrix in iterator]
    expected = [[
        [1, 2, 3, 4],
        [5, 6, 7, 8],
        [9, 10, 11, 12],
        [13, 14, 15, 16]
    ]]
    assert result == expected, f"Expected {expected}, but got {result}"

    # test 2
    iterator = SubmatrixIterator(matrix, 2)
    result = [submatrix for submatrix in iterator]
    expected = [
        [[1, 2], [5, 6]],
        [[2, 3], [6, 7]],
        [[3, 4], [7, 8]],
        [[5, 6], [9, 10]],
        [[6, 7], [10, 11]],
        [[7, 8], [11, 12]],
        [[9, 10], [13, 14]],
        [[10, 11], [14, 15]],
        [[11, 12], [15, 16]]
    ]
    assert result == expected, f"Expected {expected}, but got {result}"

    # test 3
    iterator = SubmatrixIterator(matrix, 3)
    result = [submatrix for submatrix in iterator]
    expected = [
        [[1, 2, 3], [5, 6, 7], [9, 10, 11]],
        [[2, 3, 4], [6, 7, 8], [10, 11, 12]],
        [[5, 6, 7], [9, 10, 11], [13, 14, 15]],
        [[6, 7, 8], [10, 11, 12], [14, 15, 16]]
    ]
    assert result == expected, f"Expected {expected}, but got {result}"

    # test 4
    iterator = SubmatrixIterator(matrix, 1)
    result = [submatrix for submatrix in iterator]
    expected = [
        [[1]], [[2]], [[3]], [[4]],
        [[5]], [[6]], [[7]], [[8]],
        [[9]], [[10]], [[11]], [[12]],
        [[13]], [[14]], [[15]], [[16]]
    ]
    assert result == expected, f"Expected {expected}, but got {result}"

    # test 5
    iterator = SubmatrixIterator(matrix, 5)
    result = [submatrix for submatrix in iterator]
    assert result == [], "Expected empty list for oversized submatrix, but got some submatrices"

    return "everything is working fine!"

print(all_test_3())


everything is working fine!


# Построчного чтение всех файлов в директории

Реализуйте класс-итератор  `RecursiveFileLineIteratorNoHidden`, который принимает на вход путь к директории и рекурсивно проходит по всем файлам, включая файлы во вложенных директориях. Итератор должен возвращать строки из каждого файла построчно, игнорируя файлы и директории, названия которых начинаются с точки (.), т.е. скрытые файлы и папки.

**Условия:**
1.	Итератор должен проходить по всем файлам в указанной директории и всех её поддиректориях, кроме тех, что начинаются с точки (.).
2.	Итератор должен возвращать строки из каждого файла поочерёдно, построчно.
3.	Поддерживаются только текстовые файлы.
4.	После завершения чтения всех файлов итератор должен завершить работу, поднимая StopIteration.
5.	Обработайте ситуацию, если файл не может быть открыт (например, из-за ошибок доступа).

**Пример использования:**

```python
iterator = RecursiveFileLineIteratorNoHidden("./test")
for line in iterator:
    print(line)
    
# Example 1
# Example 2
# Example 3
# Example 4
# Subfolder Example 1
# Subfolder Example 2
# Subfolder Example 3
# Subfolder Example 4    
```

Для выполнения задания потребуются несколько методов из модуля os, которые позволяют работать с файловой системой в Python. Давайте подробно рассмотрим их.


`os.walk(top, topdown=True, onerror=None, followlinks=False)` — это генератор, который рекурсивно обходит директории и поддиректории, начиная с указанного пути top. На каждом шаге возвращается кортеж, содержащий текущую директорию, список поддиректорий и список файлов.

Возвращаемые значения:
* root: Текущая директория, в которой находимся в данный момент обхода.
* dirs: Список поддиректорий в текущей root директории.
* files: Список файлов в текущей root директории.

`os.path.join(path, *paths)` объединяет один или несколько компонентов пути, возвращая корректный путь, соответствующий операционной системе. Это полезно для построения путей к файлам и директориям в кросс-платформенном формате.

```python
root = "/path/to/directory"
file_name = "example.txt"
full_path = os.path.join(root, file_name)
print(full_path)  # Вывод: "/path/to/directory/example.txt"
```

`os.path.isfile(path)` проверяет, является ли указанный путь файлом. Возвращает True, если path указывает на файл, и False, если это директория или объект другого типа.

```python
file_path = "/path/to/file.txt"
if os.path.isfile(file_path):
    print("Это файл.")
else:
    print("Это не файл.")
```

`os.path.basename(path)` возвращает базовое имя файла или директории из пути. Это полезно, если нужно получить только имя файла или папки, без остальных компонентов пути.

```python
file_path = "/path/to/file.txt"
print(os.path.basename(file_path))  # Вывод: "file.txt"
```

`os.path.isdir(path)` проверяет, является ли указанный путь директорией. Возвращает True, если path указывает на директорию, и False, если это файл или объект другого типа.

```python
dir_path = "/path/to/directory"
if os.path.isdir(dir_path):
    print("Это директория.")
else:
    print("Это не директория.")
```

In [8]:
import os

In [33]:
class RecursiveFileLineIteratorNoHidden:
    def __init__(self, path):
        self.files = self.get_files(path)
        self.current_file = None
        self.current_iterator = None


    def __iter__(self):
        return self
    
    def get_files(self, dir):
        for root, dirs, files in os.walk(dir, topdown=True, onerror=None, followlinks=False):
            dirs[:] = [dir for dir in dirs if not dir.startswith('.')]  # skip hidden dirs
            yield from (
                os.path.join(root, file)
                for file in files
                if not file.startswith('.') and os.path.isfile(os.path.join(root, file))
            )  # yield from for all files in certain dir


    def __next__(self):
        if self.current_iterator is None:  # if the current file isn't opened then open next one 
            try:
                self.current_file = next(self.files)
                try:
                    self.current_iterator = open(self.current_file, "r", encoding="utf-8")
                except OSError:  # if we couldn't open the file
                    self.current_iterator = None
                    return self.__next__()
            except StopIteration:
                raise StopIteration

        try:
            return next(self.current_iterator).rstrip('\n')  # read the line from the file
        except StopIteration:  # close the file
            self.current_iterator.close()
            self.current_iterator = None
            return self.__next__()

In [34]:
# example
iterator = RecursiveFileLineIteratorNoHidden("../folder_for_tests")
for line in iterator:
    print(line)

Example 1
Example 2
Example 3
Example 4
Subfolder Example 1
Subfolder Example 2
Subfolder Example 3
Subfolder Example 4


In [None]:
import shutil

def all_test_4():
    # create test dir
    test_dir = "./test_folder"
    os.makedirs(test_dir, exist_ok=True)
    
    # make content of files in root dir -- step 1
    files_content = {
        "file_01.txt": "Line 1 in file1\nLine 2 in file1",
        "file_02.txt": "Line 1 in file2\nLine 2 in file2",
        ".hidden_file.txt": "Line 1 in hidden_file\nLine 2 in hidden_file",
    }

    # write content in files
    for filename, content in files_content.items():
        with open(os.path.join(test_dir, filename), "w") as file:
            file.write(content)

    # make content of files in subdir -- step 2
    subfolder_content = {
        "file_03.txt": "Line 1 in file3\nLine 2 in file3",
        ".hidden_file_in_subfolder.txt": "This line should also be hidden"
    }

    # create subdir and write content in files
    subfolder = os.path.join(test_dir, "subfolder")
    os.makedirs(subfolder, exist_ok=True)
    for filename, content in subfolder_content.items():
        with open(os.path.join(subfolder, filename), "w") as file:
            file.write(content)

    # create hidden dir -- step 3
    os.makedirs(os.path.join(test_dir, ".hidden_folder"), exist_ok=True)

    
    try:
        # test 1
        iterator = RecursiveFileLineIteratorNoHidden(test_dir)
        result = [line for line in iterator]
        expected = [
            "Line 1 in file1", "Line 2 in file1",
            "Line 1 in file2", "Line 2 in file2",
            "Line 1 in file3", "Line 2 in file3"
        ]
        assert result == expected, f"Expected {expected}, but got {result}"

        # test 2
        hidden_files = [".hidden_file.txt", ".hidden_file_in_subfolder.txt"]
        for hidden_file in hidden_files:
            assert hidden_file not in result, f"Hidden file {hidden_file} should not appear in results"

    finally:
        # delete test dir
        shutil.rmtree(test_dir)
    
    return "everything is working fine!"

print(all_test_4())


everything is working fine!
