In [None]:
!pip install pandas openpyxl gspread oauth2client


Collecting gspread
  Downloading gspread-6.2.0-py3-none-any.whl.metadata (11 kB)
Collecting oauth2client
  Downloading oauth2client-4.1.3-py2.py3-none-any.whl.metadata (1.2 kB)
Collecting google-auth>=1.12.0 (from gspread)
  Downloading google_auth-2.39.0-py2.py3-none-any.whl.metadata (6.2 kB)
Collecting google-auth-oauthlib>=0.4.1 (from gspread)
  Downloading google_auth_oauthlib-1.2.1-py2.py3-none-any.whl.metadata (2.7 kB)
Collecting httplib2>=0.9.1 (from oauth2client)
  Downloading httplib2-0.22.0-py3-none-any.whl.metadata (2.6 kB)
Collecting rsa>=3.1.4 (from oauth2client)
  Downloading rsa-4.9.1-py3-none-any.whl.metadata (5.6 kB)
Collecting requests-oauthlib>=0.7.0 (from google-auth-oauthlib>=0.4.1->gspread)
  Downloading requests_oauthlib-2.0.0-py2.py3-none-any.whl.metadata (11 kB)
Collecting oauthlib>=3.0.0 (from requests-oauthlib>=0.7.0->google-auth-oauthlib>=0.4.1->gspread)
  Downloading oauthlib-3.2.2-py3-none-any.whl.metadata (7.5 kB)
Downloading gspread-6.2.0-py3-none-any.wh

In [5]:
import pandas as pd
import gspread
from oauth2client.service_account import ServiceAccountCredentials

# 1. Прочитаем основной файл (statement) и файл фильтра (filterl)
data_df = pd.read_excel('statement.xlsx')
filter_df = pd.read_excel('filterl.xlsx')

# 2. Получаем список значений для фильтрации из 4-го столбца файла filterl
filter_values = filter_df.iloc[:, 0].tolist()

# 3. Фильтруем данные: исключаем строки, где 4-й столбец есть в списке фильтра
filtered_df = data_df[~data_df.iloc[:, 3].isin(filter_values)]

# 4. Оставляем только строки, где во 2-м столбце значение больше 0
filtered_df.iloc[:, 1] = pd.to_numeric(filtered_df.iloc[:, 1], errors='coerce')
filtered_df = filtered_df[filtered_df.iloc[:, 1] > 0]

# 5. Преобразуем дату в формат ДД.ММ.ГГГГ
filtered_df.iloc[:, 0] = pd.to_datetime(filtered_df.iloc[:, 0], errors='coerce').dt.strftime('%d.%m.%Y')

# 6. Остальные колонки (кроме суммы) — в строки
for col in range(2, filtered_df.shape[1]):
    filtered_df.iloc[:, col] = filtered_df.iloc[:, col].astype(str)

# *** ДОБАВИМ ПРОВЕРКУ ***
print("Размер filtered_df:", filtered_df.shape)
print("Первые строки filtered_df:")
print(filtered_df.head())

# 7. Авторизация для доступа к Google Sheets
scope = ["https://spreadsheets.google.com/feeds", "https://www.googleapis.com/auth/drive"]
credentials = ServiceAccountCredentials.from_json_keyfile_name('creds.json', scope)
client = gspread.authorize(credentials)

# 8. Открываем нужный лист в Google Sheets
spreadsheet = client.open('Priut')
worksheet = spreadsheet.worksheet('Income')

# 9. Очищаем диапазон A5:F (если нужно)
worksheet.batch_clear([f"A5:F{worksheet.row_count}"])

# 10. Загружаем отфильтрованные данные с заголовками (начиная с 5-й строки)
worksheet.update(filtered_df.values.tolist(), 'A5')


print("Данные успешно обновлены!")


Размер filtered_df: (481, 4)
Первые строки filtered_df:
    Unnamed: 0 Unnamed: 1            Unnamed: 2            Unnamed: 3
7   01.01.2025     1000.0            Пополнение             Мадина И.
22  04.01.2025      500.0            Пополнение             Мадина И.
41  07.01.2025     5000.0  Поступление перевода  Поступление перевода
54  09.01.2025     5000.0            Пополнение            Меруерт К.
57  09.01.2025     2000.0            Пополнение             Мадина И.
Данные успешно обновлены!
