# Python для анализа данных

*Алла Тамбовцева, НИУ ВШЭ*

дополнения: *Ян Пиле, НИУ ВШЭ*

Посмотрим на другие примеры использования `selenium`. 

**Пример.** Зайдем на сайт книжного магазина и найдем все книги про Python. Загрузим библиотеку, веб-драйвер и откроем страницу в браузере через Python.

In [1]:
from webdriver_manager.chrome import By

ImportError: cannot import name 'By' from 'webdriver_manager.chrome' (C:\ProgramData\Anaconda3\lib\site-packages\webdriver_manager\chrome.py)

In [2]:
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager

br = webdriver.Chrome(ChromeDriverManager().install())

# открываем страницу в Chrome в автоматическом режиме
br.get("http://www.biblio-globus.ru/")

  br = webdriver.Chrome(ChromeDriverManager().install())


Найдем с помощью CSS Selector'а (*SelectorGadget*) поле для ввода названия книги или автора. 

In [3]:
from selenium.webdriver.common.by import By

In [4]:
field = br.find_element(By.CSS_SELECTOR, "input")

Сохраним запрос:

In [5]:
author = "Python"  # переменная author - условность

Введем запрос в поле для поиска (`.send_keys`) и подождем чуть-чуть:

In [9]:
field.send_keys(author)
br.implicitly_wait(2)  # подождем пару секунд

Теперь найдем кнопку для поиска (значок *лупа* рядом со строкой поиска) через CSS Selector:

In [None]:
#search-btn > i

In [10]:
submit = br.find_element(By.CSS_SELECTOR, "#search-btn > i")

Кликнем на нее:

In [11]:
submit.click()

In [12]:
type(br)

selenium.webdriver.chrome.webdriver.WebDriver

Сохраним первую страницу с результатами в переменную `page1`.

In [13]:
page1 = br.page_source #разметка сайта

In [14]:
page1



Теперь обработаем эту страницу через `BeautifulSoup`:

In [15]:
from bs4 import BeautifulSoup

In [16]:
soup1 = BeautifulSoup(page1, 'lxml') #library XML

Найдем все названия книг на этой странице. По исходному коду можно увидеть, что они имеют тэг `a` с атрибутом `class`, равным `name`:

In [18]:
soup1.find_all('a', {'style':'color:#444;'})

[<a href="/product/10727655" style="color:#444;">Компьютерное зрение на Python. Первые шаги</a>,
 <a href="/product/10483871" style="color:#444;">Глубокое обучение на Python</a>,
 <a href="/product/10839595" style="color:#444;">Python для юных программистов</a>,
 <a href="/product/10776656" style="color:#444;">Справочник PYTHON.  Кратко, быстро, под...</a>,
 <a href="/product/10532193" style="color:#444;">Python. Экспресс-курс</a>,
 <a href="/product/10473444" style="color:#444;">HTML, CSS, SCRATCH, PYTHON. Моя первая ...</a>,
 <a href="/product/10224348" style="color:#444;">Программирование на Python для начинающих</a>,
 <a href="/product/10831874" style="color:#444;">Глубокое обучение с подкреплением: теор...</a>,
 <a href="/product/10713630" style="color:#444;">Python и наука о данных для чайников, 2...</a>,
 <a href="/product/10645085" style="color:#444;">Легкий способ выучить Python 3 еще глубже</a>,
 <a href="/product/10627655" style="color:#444;">Байесовский анализ на Python</a>

In [21]:
for i in soup1.find_all('div', {'class' : "details_1"}):
    print(i.find('a', {'style':'color:#444;'}).text)

С помощью списковых включений выберем из ссылок с тэгом `<a>` текст (так мы уже делали, и не раз).

In [22]:
books1 = [b.text for b in soup1.find_all('a', {'style':'color:#444;'})]

In [23]:
books1

['Компьютерное зрение на Python. Первые шаги',
 'Глубокое обучение на Python',
 'Python для юных программистов',
 'Справочник PYTHON.  Кратко, быстро, под...',
 'Python. Экспресс-курс',
 'HTML, CSS, SCRATCH, PYTHON. Моя первая ...',
 'Программирование на Python для начинающих',
 'Глубокое обучение с подкреплением: теор...',
 'Python и наука о данных для чайников, 2...',
 'Легкий способ выучить Python 3 еще глубже',
 'Байесовский анализ на Python',
 'Вероятностное программирование на Pytho...',
 'Python : Карманный справочник',
 'Искусственный интеллект с примерами на ...',
 'Стандартная библиотека Python 3',
 'Python для сложных задач: наука о данны...',
 'Объяснимые модели искусственного интелл...',
 'PYTHON. К вершинам мастерства. ',
 'Python.Создаем программы и игры',
 'Начинаем программировать на Python']

Теперь аналогичным образом сгрузим информацию об авторах:

In [27]:
authors1 = []
for book in soup1.find_all('a', {'style':'color:#444;'}):
    link = 'https://www.biblio-globus.ru' + book.get('href')
    br.get(link)
    br.implicitly_wait(1)
    page1 = br.page_source
    soup1 = BeautifulSoup(page1, 'lxml')
    authors1.append(soup1.find('hl', {'class': 'card-title'}))
    print(authors1)

[None]
[None, None]
[None, None, None]
[None, None, None, None]
[None, None, None, None, None]
[None, None, None, None, None, None]
[None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None, None]
[None, None, None, None, None, None, None, None, None, None, None

KeyboardInterrupt: 

In [30]:
authors1 = []
for book in soup1.find_all('a', {'style':'color:#444;'}):
    link = 'https://www.biblio-globus.ru' + book.get('href')
    br.get(link)
    br.implicitly_wait(1)
    page1 = br.page_source
    soup1 = BeautifulSoup(page1, 'lxml')
    authors1.append(soup1.find('h1', {'class' : 'card-title'}).text.split('|')[1].strip())

In [31]:
print(authors1)

['Гифт Н.', 'Уатт Дж.', 'Персиваль Г.', 'Майков К. А.', 'Пэйн  Б.', 'Кайзер С.', 'Свейгарт Э.', 'Хапке  Х.', 'Уэйд Р.', 'Лейси Н.', 'Кольцов Д. М.', 'Постолит А. В.', 'Постолит А. В.', 'Яворски М.', 'Васильев Ю.', 'Бровкин А. А.', 'Рамальо Л.', 'Стейпл Д.', 'Кольцов Д. М.', 'Ферлитш Э.', 'Голиков Д. В.', 'Свейгарт Э.', 'Грессер Л.', 'Кольцов Д. М.', 'Харенслак  Б.', 'Щерба А. В.', '', 'Корягин А.', 'Майер К.', 'Зейтц Д.', 'Гифт Н.', 'Уатт Дж.', 'Персиваль Г.', 'Майков К. А.', 'Пэйн  Б.', 'Кайзер С.', 'Свейгарт Э.', 'Хапке  Х.', 'Уэйд Р.', 'Лейси Н.', 'Кольцов Д. М.', 'Постолит А. В.', 'Постолит А. В.', 'Яворски М.', 'Васильев Ю.', 'Бровкин А. А.', 'Рамальо Л.', 'Стейпл Д.', 'Кольцов Д. М.', 'Ферлитш Э.', 'Голиков Д. В.', 'Свейгарт Э.', 'Грессер Л.', 'Кольцов Д. М.', 'Харенслак  Б.', 'Щерба А. В.', '', 'Корягин А.', 'Майер К.', 'Зейтц Д.', 'Грессер Л.', 'Мюллер , Массарон Дж. П. , Л.', 'Шоу  З.', 'Мартин О.', 'Дэвидсон-Пайлон К.', 'Лутц М.', 'Джоши П.', 'Хеллман Д.', 'Плас Дж. В.', 'Миш

In [31]:
# [a.text for a in soup1.find_all('div', {'class': 'author'})]
# то же самое что и
authors1 = []
for a in soup1.find_all('div', {'class': 'author'}):
    authors1.append(a.text)

In [32]:
for p in range(1, 3):
    link = f'https://www.biblio-globus.ru/search?q=Python&pagenumber={p}'
    try:
        soup = BeautifulSoup(page1, 'lxml')
        books.extend([b.text for b in soup.find_all('a', {'style':'color:#444;'})])
        for book in soup1.find_all('a', {'style':'color:#444;'}):
            link = 'https://www.biblio-globus.ru' + book.get('href')
            br.get(link)
            br.implicitly_wait(1)
            page = br.page_source
            soup = BeautifulSoup(page, 'lxml')
            authors.append(soup.find('h1', {'class' : 'card-title'}).text.split('|')[1].strip())
    except:
        break

In [36]:
soup1.find_all('div', {'class': 'author'})

[<div class="author">Н. М. Ершов</div>,
 <div class="author">Э. Свейгарт</div>,
 <div class="author">Н. Нисчал</div>,
 <div class="author">Д. М. Кольцов </div>,
 <div class="author">А. В. Протодьяконов, П. А. Пылов, В. Е. Садовников</div>,
 <div class="author">М. Доусон</div>,
 <div class="author">Дж. Бриггс</div>,
 <div class="author">Т. Гэддис </div>,
 <div class="author">М. Харрисон</div>,
 <div class="author">П. Бэрри</div>]

In [32]:
authors1

['Н. М. Ершов',
 'Э. Свейгарт',
 'Н. Нисчал',
 'Д. М. Кольцов ',
 'А. В. Протодьяконов, П. А. Пылов, В. Е. Садовников',
 'М. Доусон',
 'Дж. Бриггс',
 'Т. Гэддис ',
 'М. Харрисон',
 'П. Бэрри']

In [37]:
authors1 = [a.text for a in soup1.find_all('div', {'class': 'author'})]

Сгрузим расположение:

In [33]:
#place1 = [p.text for p in soup1.find_all('div', {'class':'placement'})]

place1 = []
for p in soup1.find_all('div', {'class': 'details_1'}):
    if 'Расположение' in p.text:
        place1.append(p.find('div', {'class': 'placement'}).text)
        #place1 = p.find('div', {'class': 'placement'}).append(p.text)
    else:
        place1.append(None)

In [34]:
place1

[]

И, конечно, цену:

In [35]:
price1 = [p.text for p in soup1.find_all('div', 
                                         {'class':'title_data price'})]

In [36]:
price1

[]

Осталось пройтись по всем страницам, которые были выданы в результате поиска. Для примера перейдем на страницу 2 и на этом остановимся.

In [47]:
next_p = br.find_element(By.CSS_SELECTOR, '.next_page')

In [48]:
next_p.click()

Проделаем то же самое, что и с первой страницей. По-хорошему нужно написать функцию, которая будет искать на странице названия книг, их расположение и цену. Но оставим это в качестве задания читателю :)

In [54]:
page2 = br.page_source
soup2 = BeautifulSoup(page2, 'lxml')
books2 = [b.text for b in soup2.find_all('a', {'class':'name'})]
author2 = [a.text for a in soup2.find_all('div', {'class': 'author'})]
place2 = [p.text for p in soup2.find_all('div', {'class':'placement'})]
price2 = [p.text for p in soup2.find_all('div', {'class':'title_data price'})]

Расширим списки результатов с первой страницы данными, полученными со второй страницы, используя метод `.extend()`.

In [55]:
books1.extend(books2) # books1 + books2
authors1.extend(books2)
place1.extend(place2)
price1.extend(price2)

Осталось импортировать библиотеку `pandas` и создать датафрейм.

In [49]:
import pandas as pd

In [56]:
len(books1)

20

In [57]:
len(authors1)

20

In [58]:
len(place1)

20

In [59]:
len(price1)

20

Для разнообразия создадим датафрейм не из списка списков, а из словаря. Ключами словаря будут названия столбцов в таблице, а значениями – списки с сохраненной информацией (названия книг, цены и проч.).

In [60]:
df = pd.DataFrame({'book': books1, 'author': authors1,
                   'placement': place1, 'price': price1})

In [61]:
df.head(10)

Unnamed: 0,book,author,placement,price
0,Практическое введение в решение дифференциальн...,Н. М. Ершов,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 2619,00 руб."
1,Python. Чистый код для продолжающих,Э. Свейгарт,,"Цена: 2239,00 руб."
2,Python - это просто. Пошаговое руководство по ...,Н. Нисчал,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 1189,00 руб."
3,Python.Создаем программы и игры,Д. М. Кольцов,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 679,00 руб."
4,Алгоритмы Data Science и их практическая реали...,"А. В. Протодьяконов, П. А. Пылов, В. Е. Садовн...","Расположение в торговом зале: Уровень 1, зал №...","Цена: 3459,00 руб."
5,Программируем на Python,М. Доусон,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 1359,00 руб."
6,Python для детей : самоучитель по программиров...,Дж. Бриггс,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 1569,00 руб."
7,Начинаем программировать на Python,Т. Гэддис,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 2619,00 руб."
8,Машинное обучение: карманный справочник. Кратк...,М. Харрисон,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 939,00 руб."
9,Изучаем программирование на Python,П. Бэрри,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 1859,00 руб."


In [62]:
df.info() #object ~ string

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 4 columns):
 #   Column     Non-Null Count  Dtype 
---  ------     --------------  ----- 
 0   book       20 non-null     object
 1   author     20 non-null     object
 2   placement  19 non-null     object
 3   price      20 non-null     object
dtypes: object(4)
memory usage: 768.0+ bytes


Давайте приведем столбец с ценой к числовому типу. Уберем слова *Цена* и *руб*, а потом сконвертируем строки в числа с плавающей точкой. Напишем функцию `get_price()`,

In [None]:
#iloc = index location

In [74]:
df.iloc[1:4]

Unnamed: 0,book,author,placement,price
1,Python. Чистый код для продолжающих,Э. Свейгарт,,"Цена: 2239,00 руб."
2,Python - это просто. Пошаговое руководство по ...,Н. Нисчал,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 1189,00 руб."
3,Python.Создаем программы и игры,Д. М. Кольцов,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 679,00 руб."


In [73]:
df.iloc[1:4, 3]

1    Цена: 2239,00 руб.
2    Цена: 1189,00 руб.
3     Цена: 679,00 руб.
Name: price, dtype: object

In [64]:
df.iloc[1, -1] #срез - первое значение номер строки 
        #по конкретному индесу, 2е – номер колонки

'Цена: 2239,00 руб.'

In [66]:
df.iloc[1, 3].split()

['Цена:', '2239,00', 'руб.']

In [67]:
df.iloc[1, 3].split()[1]

'2239,00'

In [68]:
df.iloc[1, 3].split()[1].replace(',','.')

'2239.00'

In [75]:
float(df.iloc[1, 3].split()[1].replace(',', '.'))

2239.0

In [76]:
import re

In [79]:
'.'.join(re.findall(r'\d+', df.iloc[1, 3]))

'2239.00'

In [80]:
float('.'.join(re.findall(r'\d+', df.iloc[1, 3])))

2239.0

In [None]:
re.findall(r'\d+', df.iloc[1, 3])

In [None]:
float(df.iloc[1, 3].split()[1].replace(',', '.'))

In [81]:
def get_price(price):
    book_price = price.split(' ')[1]  # разобьем строку по пробелу и возьмем второй элемент
    book_price = book_price.replace(',', '.')  # заменим запятую на точку
    price_num = float(book_price)  # сконвертируем в float
    return price_num

In [82]:
def price(x):
    return float('.'.join(re.findall(r'\d+',x)))

In [83]:
# проверка
get_price(df.price[0])

2619.0

In [84]:
price(df.price[0])

2619.0

Всё отлично работает! Применим функцию к столбцу *price* и создадим новый столбец *nprice*.

In [85]:
df.head(2)

Unnamed: 0,book,author,placement,price
0,Практическое введение в решение дифференциальн...,Н. М. Ершов,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 2619,00 руб."
1,Python. Чистый код для продолжающих,Э. Свейгарт,,"Цена: 2239,00 руб."


In [88]:
df['nprice'] = df.price.apply(get_price)

In [89]:
df.head()

Unnamed: 0,book,author,placement,price,nprice
0,Практическое введение в решение дифференциальн...,Н. М. Ершов,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 2619,00 руб.",2619.0
1,Python. Чистый код для продолжающих,Э. Свейгарт,,"Цена: 2239,00 руб.",2239.0
2,Python - это просто. Пошаговое руководство по ...,Н. Нисчал,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 1189,00 руб.",1189.0
3,Python.Создаем программы и игры,Д. М. Кольцов,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 679,00 руб.",679.0
4,Алгоритмы Data Science и их практическая реали...,"А. В. Протодьяконов, П. А. Пылов, В. Е. Садовн...","Расположение в торговом зале: Уровень 1, зал №...","Цена: 3459,00 руб.",3459.0


In [90]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 5 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   book       20 non-null     object 
 1   author     20 non-null     object 
 2   placement  19 non-null     object 
 3   price      20 non-null     object 
 4   nprice     20 non-null     float64
dtypes: float64(1), object(4)
memory usage: 928.0+ bytes


In [91]:
df.describe() #для количеств признаков возвращает статистики

Unnamed: 0,nprice
count,20.0
mean,1846.5
std,1113.561735
min,499.0
25%,1046.5
50%,1514.0
75%,2334.0
max,4459.0


Теперь можем расположить книги по цене в порядке возрастания:

In [93]:
df.sort_values('nprice', ascending=False)

Unnamed: 0,book,author,placement,price,nprice
14,"Изучаем Python, том 1","Изучаем Python, том 1","Расположение в торговом зале: Уровень 1, зал №...","Цена: 4459,00 руб.",4459.0
17,Стандартная библиотека Python 3,Стандартная библиотека Python 3,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 4109,00 руб.",4109.0
4,Алгоритмы Data Science и их практическая реали...,"А. В. Протодьяконов, П. А. Пылов, В. Е. Садовн...","Расположение в торговом зале: Уровень 1, зал №...","Цена: 3459,00 руб.",3459.0
0,Практическое введение в решение дифференциальн...,Н. М. Ершов,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 2619,00 руб.",2619.0
7,Начинаем программировать на Python,Т. Гэддис,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 2619,00 руб.",2619.0
1,Python. Чистый код для продолжающих,Э. Свейгарт,,"Цена: 2239,00 руб.",2239.0
13,Простой Python. Современный стиль программиров...,Простой Python. Современный стиль программиров...,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 2019,00 руб.",2019.0
9,Изучаем программирование на Python,П. Бэрри,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 1859,00 руб.",1859.0
19,Большая книга проектов Python,Большая книга проектов Python,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 1669,00 руб.",1669.0
6,Python для детей : самоучитель по программиров...,Дж. Бриггс,"Расположение в торговом зале: Уровень 1, зал №...","Цена: 1569,00 руб.",1569.0


И сохраним всю таблицу в csv-файл:

In [94]:
df.to_csv("books.csv", index=False)

In [95]:
df.to_excel("books.xlsx", index=False)

In [96]:
br.close()

In [None]:
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager

br = webdriver.Chrome(ChromeDriverManager().install())

# открываем страницу в Chrome в автоматическом режиме
br.get("http://www.biblio-globus.ru/")

In [None]:
books = '//*[@id="TableMRight"]/tbody/tr/td/table/tbody/tr[2]/td[2]/a'

In [None]:
books_el = br.find_element_by_xpath(books)

In [None]:
books_el.click()

In [None]:
det_css = 'body > table > tbody > tr:nth-child(2) > td.column_right > div > div.card-columns > div:nth-child(1) > div > ul > li > ul > li:nth-child(2) > ul > li:nth-child(2) > a'

In [None]:
det_el = br.find_element_by_css_selector(det_css)

In [None]:
det_el.click()

In [None]:
page1 = BeautifulSoup(br.page_source)

In [None]:
books_p1 = page1.find_all('div', {'class': 'details_1'})

In [None]:
len(books_p1)

In [None]:
books_p1[0]

In [None]:
books_p1[0].div is not None

In [None]:
books_p1[0].find('div', {'class': 'author'}).text

In [None]:
books_p1[0].a.text

In [None]:
books_p1[0].find('div', {'class': 'placement'}).text

In [None]:
books_p1[0].find('div', {'class': 'title_data price'}).text

In [None]:
books_p1[0].find('div', {'class': 'title_data pricee'}) is None

In [None]:
titles = []
authors = []
places = []
prices = []
for book in books_p1:
    if book.find('div', {'class': 'author'}) is not None:
        authors.append(book.find('div', {'class': 'author'}).text)
    else:
        authors.append('')
        
    if book.a is not None:
        titles.append(book.a.text)
    else:
        titles.append('')
        
    if book.find('div', {'class': 'placement'}) is not None:
        places.append(book.find('div', {'class': 'placement'}).text)
    else:
        places.append('')
        
    if book.find('div', {'class': 'title_data price'}) is not None:
        prices.append(book.find('div', {'class': 'title_data price'}).text)
    else:
        prices.append('')

In [None]:
titles

In [None]:
def get_page_info(books_p):
    titles = []
    authors = []
    places = []
    prices = []
    for book in books_p:
        if book.div is not None:
            authors.append(book.div.text)
        else:
            authors.append('')

        if book.a is not None:
            titles.append(book.a.text)
        else:
            titles.append('')

        if book.find('div', {'class': 'placement'}) is not None:
            places.append(book.find('div', {'class': 'placement'}).text)
        else:
            places.append('')

        if book.find('div', {'class': 'title_data price'}) is not None:
            prices.append(book.find('div', {'class': 'title_data price'}).text)
        else:
            prices.append('')
            
    return titles, authors, places, prices

In [None]:
next_page = '//*[@id="main_wrapper"]/ul/li[4]/a'

In [None]:
page2 = br.find_element_by_xpath(next_page)

In [None]:
page2.click()

In [None]:
# next_page_2 = '//*[@id="main_wrapper"]/ul/li[8]/a'
# next_page_2 = br.find_element_by_xpath(next_page_2)
# next_page_2.click()

In [None]:
from time import sleep

In [None]:
np_xpath = '//*[@id="main_wrapper"]/ul/li[8]/a/span[1]'

In [None]:
for _ in range(3):
    try:
        page = BeautifulSoup(br.page_source)
        books = page.find_all('div', {'class': 'details_1'})
        t, a, pl, pr = get_page_info(books)
        titles.extend(t)
        authors.extend(a)
        places.extend(pl)
        prices.extend(pr)
        np = br.find_element_by_xpath(np_xpath)
        sleep(3)
        np.click()
    except:
        print('all pages parsed')
        break

In [None]:
df = pd.DataFrame({'book': titles, 'author': authors,
                   'placement': places, 'price': prices})

In [None]:
df.head()

In [None]:
df.shape

In [None]:
br.close()