In [14]:
import requests
import csv
import logging

# Настройка логирования
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

In [8]:

# Ваш OAuth-токен Яндекс Диска
OAUTH_TOKEN = 'y0_AgAAAAAAVtKZAAykGAAAAAEVS4ljAADxRJXH2c9ISbj80DIgMYXg-8Zhxg'

# URL для запроса списка всех файлов
FILES_URL = 'https://cloud-api.yandex.net/v1/disk/resources/files'

# Заголовки для запроса
headers = {
    'Authorization': f'OAuth {OAUTH_TOKEN}'
}


In [15]:

# Функция для получения всех файлов с Яндекс Диска
def get_all_files(url, headers):
    files = []
    params = {'limit': 1000000}
    while True:
        response = requests.get(url, headers=headers, params=params)
        response.raise_for_status()
        data = response.json()
        files.extend(data['items'])
        if 'next' in data:
            params['offset'] = data['next']
        else:
            break
    return files

# Функция для поиска дубликатов файлов
def find_duplicates(files):
    duplicates = {}
    for file in files:
        name = file['name']
        size = file['size']
        path = file['path']
        folder_name = path.rsplit('/', 1)[0]
        if name in duplicates:
            duplicates[name].append((path, folder_name, size))
        else:
            duplicates[name] = [(path, folder_name, size)]
    return {name: paths for name, paths in duplicates.items() if len(paths) > 1}

In [16]:

# Функция для сохранения результатов в CSV-файл
def save_to_csv(duplicates, filename='duplicates.csv'):
    with open(filename, 'w', newline='', encoding='utf-8') as csvfile:
        fieldnames = ['File Name', 'Full Path', 'Folder Name', 'File Size']
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
        writer.writeheader()
        for name, paths in duplicates.items():
            for path, folder_name, size in paths:
                writer.writerow({
                    'File Name': name,
                    'Full Path': path,
                    'Folder Name': folder_name,
                    'File Size': size
                })

In [None]:

# Основная функция
def main():
    files = get_all_files(FILES_URL, headers)
    duplicates = find_duplicates(files)
    save_to_csv(duplicates)
    print(f"Дубликаты файлов сохранены в файл 'duplicates.csv'")

if __name__ == "__main__":
    main()






