In [1]:
import re
import random

In [2]:
def erase_text_randomly(text: str, percent: float = 30.0) -> str:
    """
    'Стирает' случайные слова в тексте, заменяя их на '...'
    примерно на указанное процентное соотношение (percent%).
    Возвращает изменённую строку.
    """

    # Уберём лишние переносы строк, если хотите
    # text = text.replace('\n', ' ')

    # Посчитаем общее число символов
    total_chars = len(text)
    if total_chars == 0:
        return text  # пустой текст "затирать" не нужно

    # Сколько символов хотим удалить
    chars_to_remove = int(total_chars * (percent / 100.0))
    if chars_to_remove <= 0:
        return text  # если процент очень мал или текст слишком короткий

    # Разобьём текст на 'токены': слова, пробелы и знаки препинания
    # Чтобы при обратной склейке вернуть исходную структуру, используем split с захватом разделителей
    tokens = re.split(r'(\s+|\W+)', text)
    # Пример: "Сегодня солнечный день!" ->
    # ["Сегодня", " ", "солнечный", " ", "день", "!", ""]

    # Выделим индексы "слов" — туда, где re.match(r'\w+', token) (буквы/цифры)
    word_indices = []
    for i, token in enumerate(tokens):
        if re.match(r'^\w+$', token, flags=re.UNICODE):
            word_indices.append(i)

    # Перемешаем индексы слов (случайный порядок)
    random.shuffle(word_indices)

    # Накопим, сколько символов уже "стёрли"
    removed_count = 0

    # Бежим по случайным словам, пока не достигнем нужного "количества стёртых символов"
    for idx in word_indices:
        word_len = len(tokens[idx])
        # Если стираем это слово, заменим на '...'
        tokens[idx] = '...'
        removed_count += word_len  # считаем, что "стёрли" столько-то символов

        if removed_count >= chars_to_remove:
            break

    # Склеиваем обратно
    new_text = "".join(tokens)
    return new_text


In [3]:
if __name__ == "__main__":
    # Пример входного текста
    original_text = (
        "Сегодня солнечный день, и я собираюсь гулять в парке с моими друзьями."
    )
    print("Исходный текст:")
    print(original_text)

    # Удаляем ~30% случайным образом
    result = erase_text_randomly(original_text, percent=30.0)

    print("\nРезультат (~30% удалено):")
    print(result)

Исходный текст:
Сегодня солнечный день, и я собираюсь гулять в парке с моими друзьями.

Результат (~30% удалено):
... солнечный ..., и я собираюсь ... ... парке ... ... друзьями.
