In [None]:
import pandas as pd

# Limit how much is printed
pd.set_option("display.max_colwidth", 120)
pd.set_option("display.max_rows", 6)

# Read Excel (no header, first row is data)
df = pd.read_excel("99_texts.xlsx", header=None)

# Rename columns
df.columns = ["author", "title", "text", "word_count", "extra"]

# Shift index to start from 1 instead of 0
df.index = df.index + 1

df.info(verbose=False, memory_usage=False)
print("\nColumns:", list(df.columns))
print("Shape:", df.shape)
print("\nHead (2 rows):")
print(df.head(2))
print("\nTail (2 rows):")
print(df.tail(2))
print("\nMissing values:")
print(df.isnull().sum())


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 99 entries, 1 to 99
Columns: 5 entries, author to extra
dtypes: int64(1), object(4)
Columns: ['author', 'title', 'text', 'word_count', 'extra']
Shape: (99, 5)

Head (2 rows):
             author                title  \
1    Фрейдкин, Марк        Гойка и хайка   
2  Улицкая, Людмила  Бедные родственники   

                                                                                                                      text  \
1  Когда мама умерла, отец оставался еще вполне себе нестарым сорокашести-летним мужчиной, и года через три у него появ...   
2     Двадцать первого числа, если оно не приходилось на воскресенье, в пустоватом проеме между обедом и чаем, к Анне М...   

   word_count extra  
1       11507   NaN  
2       11039   NaN  

Tail (2 rows):
            author                   title  \
98   Хармс, Даниил  Вываливающиеся старухи   
99  Тестовый текст             Метаморфозы   

                                          

In [5]:
import pandas as pd

# Indices of texts to include in the prompt
text_indices = [1, 2, 3, 5, 6, 7, 8, 10, 11, 13, 14, 15, 16, 17, 18, 20, 22, 23, 24, 25, 26, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44, 91]



# Attempt to load the Excel file without header
try:
    df_texts = pd.read_excel("99_texts.xlsx", header=None)
except FileNotFoundError:
    print("Error: 99_texts.xlsx not found in the current directory.")
    raise SystemExit
except pd.errors.EmptyDataError:
    print("Error: 99_texts.xlsx is empty or corrupted.")
    raise SystemExit
except (pd.errors.ParserError, PermissionError) as e:
    print(f"Error reading Excel file: {e}")
    raise SystemExit

# Extract text from the third column (index=2)
texts = df_texts[2].tolist()

prompt = (
    "Найди в текстах ниже \"нетривиальные\" интертекстуальные связи. "
    "\"Нетривиальные\" означают, что они специфические, небанальные, "
    "поразительные, как будто бы один переписывал у другого, они должны выглядеть уникальными. Однако будь не очень строг, главное, не потерять интересное."
    "От тебя не требуются интерпретации, пояснения. Ты должен только очень четко, с деталями "
    "(совпадающие или очень похожие слова, образы, ситуации) показывать, в чем состоит связь. "
    "Если есть одинаковые, похожие слова, приводи соответствующие цитаты. "
    "Если связь более общая, очень четко определи, в чем она состоит. Повторяю, эта связь должна быть "
    "настолько близкой, нетривиальной, небанальной, что таких связей между текстами разных авторов обычно не бывает. Хотя повторяю, будь не очень строг."
    "Если такую же связь можно провести и с многими другими текстами, на которых ты проходил обучение, о которых ты знаешь, "
    "то эту связь мы считаем тривиальной и приводить ее здесь не надо. Для каждой связи укажи также "
    "\"уровень преднамеренности\" (от 0 до 100). Если такая связь могла у авторов получиться случайно, то значение должно быть "
    "около 0 (если в литературе такие ходы встречаются довольно часто). Если же детали настолько хорошо соответствуют друг другу, "
    "и они сами по себе достаточно специфические, поэтому почти наверняка один автор держит в голове текст другого автора, "
    "когда это пишет, или даже ссылается, то тогда значение должно быть ближе к 100.\n"
    "Ничего не выдумывай и перепроверяй. Запрещается использовать какие-либо ссылки или упоминания авторов, их известные произведения, "
    "цитаты и философские идеи, если они не присутствуют прямо в тексте. Связи должны быть строго выведены из содержания данных текстов.\n"
    "Не будь очень строг, если \"уровень преднамеренности\" не очень высокий, но связь интересная, все равно приводи ее.\n"
    "Мне очень важно, чтобы ты выдал мне все интересные связи, ничего не потеряй.\n"
)

for text_number in text_indices:
    text_content = texts[text_number - 1]
    prompt += f"\n\n<Текст №{text_number} Начало>\n{text_content}\n<Текст №{text_number} Конец>"

output_filename = "my_prompt.txt"
with open(output_filename, "w", encoding="utf-8") as f:
    f.write(prompt)

print(f"File with prompt created: {output_filename}")


File with prompt created: my_prompt.txt
