# labTOPFilesInDir
Создать выборки.
- По заданной папке:
  - показать ТОП самых больших файлов (по размеру)
  - показать ТОП самых маленьких файлов (по размеру)
  - показать ТОП самых длинных имён файлов
  - показать ТОП самых коротких имён файлов
  - показать ТОП самых часто используемых имён файлов и процентов (т.е. название, кол-во, процент)
  - показать ТОП самых длинных расширений файлов
  - показать ТОП самых коротких расширений файлов
  - показать ТОП самых часто используемых расширений файлов и процентов (т.е. расширение, кол-во, процент)
  - показать ТОП самых длинных полных путей к файлам
  - придумать и реализовать свои выборки
  - показать ТОП самых длинных путей к каталогам (например, с:\windows\help\fgf\...\...)
  - показать ТОП каталогов, где больше всего файлов (т.е. полный путь, кол-во файлов)
  - показать ТОП каталогов, где больше всего подкаталогов (т.е. полный путь, кол-во подкаталогов)
  - придумать и реализовать свои выборки


In [3]:
import os
from collections import Counter

directory =os.getcwd() 

# ТОП каталогов, где больше всего подкаталогов
directories_with_most_subdirectories = {}
for root, dirs, _ in os.walk(directory):
    directories_with_most_subdirectories[root] = len(dirs)
top_directories_with_most_subdirectories = sorted(directories_with_most_subdirectories.items(), key=lambda x: x[1], reverse=True)[:5]
print(top_directories_with_most_subdirectories)

[('c:\\Users\\артем\\Desktop\\CreatingPro\\Лабораторные\\DZ_2024_03_26', 0)]


In [4]:
# ТОП самых больших файлов
top_largest_files = [(f, os.path.getsize(os.path.join(directory, f))) for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f))]
top_largest_files = sorted(top_largest_files, key=lambda x: x[1], reverse=True)[:5]
print(top_largest_files)

[('labPrintFileTree.ipynb', 14349), ('labTOPFilesInDir.ipynb', 12302), ('labGenComprehesion0.ipynb', 9762)]


In [5]:
# ТОП самых маленьких файлов
top_smallest_files = [(f, os.path.getsize(os.path.join(directory, f))) for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f))]
top_smallest_files = sorted(top_smallest_files, key=lambda x: x[1])[:5]
print(top_smallest_files)

[('labGenComprehesion0.ipynb', 9762), ('labTOPFilesInDir.ipynb', 12302), ('labPrintFileTree.ipynb', 14349)]


In [6]:
# ТОП самых длинных имён файлов
top_longest_file_names = [(f, len(f)) for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f))]
top_longest_file_names = sorted(top_longest_file_names, key=lambda x: x[1], reverse=True)[:5]
print(top_longest_file_names)

[('labGenComprehesion0.ipynb', 25), ('labPrintFileTree.ipynb', 22), ('labTOPFilesInDir.ipynb', 22)]


In [7]:
# ТОП самых коротких имён файлов
top_shortest_file_names = [(f, len(f)) for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f))]
top_shortest_file_names = sorted(top_shortest_file_names, key=lambda x: x[1])[:5]
print(top_shortest_file_names)


[('labPrintFileTree.ipynb', 22), ('labTOPFilesInDir.ipynb', 22), ('labGenComprehesion0.ipynb', 25)]


In [8]:
# ТОП самых часто используемых имён файлов и процентов
files = [f for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f))]
file_names = [os.path.splitext(f)[0] for f in files]
counter = Counter(file_names)
total_files = len(file_names)
top_most_common_file_names = counter.most_common(5)
top_most_common_file_names_percent = [(name, count, count / total_files * 100) for name, count in top_most_common_file_names]
print(top_most_common_file_names_percent)


[('labGenComprehesion0', 1, 33.33333333333333), ('labPrintFileTree', 1, 33.33333333333333), ('labTOPFilesInDir', 1, 33.33333333333333)]


In [9]:
# ТОП самых длинных расширений файлов
top_longest_extensions = [(f, len(os.path.splitext(f)[1])) for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f))]
top_longest_extensions = sorted(top_longest_extensions, key=lambda x: x[1], reverse=True)[:5]
print(top_longest_extensions)

[('labGenComprehesion0.ipynb', 6), ('labPrintFileTree.ipynb', 6), ('labTOPFilesInDir.ipynb', 6)]


In [10]:
# ТОП самых коротких расширений файлов
top_shortest_extensions = [(f, len(os.path.splitext(f)[1])) for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f))]
top_shortest_extensions = sorted(top_shortest_extensions, key=lambda x: x[1])[:5]
print(top_shortest_extensions)

[('labGenComprehesion0.ipynb', 6), ('labPrintFileTree.ipynb', 6), ('labTOPFilesInDir.ipynb', 6)]


In [11]:
# ТОП самых часто используемых расширений файлов и процентов
files = [(os.path.splitext(f)[1], 1) for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f))]
counter = Counter(ext for ext, _ in files)
total_files = sum(count for _, count in files)
top_most_common_extensions = counter.most_common(5)
top_most_common_extensions_percent = [(ext, count, count / total_files * 100) for ext, count in top_most_common_extensions]
print(top_most_common_extensions_percent)

[('.ipynb', 3, 100.0)]


In [12]:
# ТОП самых длинных полных путей к файлам
top_longest_paths = [(os.path.join(directory, f), len(os.path.join(directory, f))) for f in os.listdir(directory) if os.path.isfile(os.path.join(directory, f))]
top_longest_paths = sorted(top_longest_paths, key=lambda x: x[1], reverse=True)[:5]
print(top_longest_paths)

[('c:\\Users\\артем\\Desktop\\CreatingPro\\Лабораторные\\DZ_2024_03_26\\labGenComprehesion0.ipynb', 87), ('c:\\Users\\артем\\Desktop\\CreatingPro\\Лабораторные\\DZ_2024_03_26\\labPrintFileTree.ipynb', 84), ('c:\\Users\\артем\\Desktop\\CreatingPro\\Лабораторные\\DZ_2024_03_26\\labTOPFilesInDir.ipynb', 84)]


In [13]:
# ТОП каталогов, где больше всего файлов
directories_with_most_files = {}
for root, _, files in os.walk(directory):
    directories_with_most_files[root] = len(files)
top_directories_with_most_files = sorted(directories_with_most_files.items(), key=lambda x: x[1], reverse=True)[:5]
print(top_directories_with_most_files)

[('c:\\Users\\артем\\Desktop\\CreatingPro\\Лабораторные\\DZ_2024_03_26', 3)]
