# Selenium-01: Introduction

## 1. Why Do We Learn Selenium?

Many modern applications run inside **web browsers**.
Sometimes we want Python to:

* Automatically open a website
* Click buttons and links
* Fill in forms
* Extract information from web pages
* Test whether a web system works correctly

**Selenium** allows Python to **control a real browser**, just like a human user.

---

## 2. What Is Selenium?

**Selenium** is:

* A browser automation tool
* Commonly used for **web testing**, **web automation**, and **simple scraping**
* Able to control browsers such as Chrome, Edge, and Firefox
* Compatible with multiple programming languages (Python, Java, etc.)

> In simple words:
> **Selenium = Python controlling a web browser**

---

## 3. When Should (and Should Not) Use Selenium?

### Suitable Use Cases

* Automating repetitive browser actions
* Testing web applications
* Handling websites that rely heavily on JavaScript
* Simulating real user behavior (click, scroll, input)

### Not Recommended For

* High-speed large-scale crawling
* Simple static HTML pages (use `requests + BeautifulSoup` instead)

---

## 4. Prerequisites

Before learning Selenium, students should know:

* Basic Python syntax
* What HTML elements are (`<div>`, `<input>`, `<a>`)
* Very basic understanding of web pages

You also need:

* A web browser (Chrome is recommended)
* Internet access

---

## 5. Installing Selenium

Install Selenium using `pip`:

```bash
pip install selenium
```

Check installation:

In [1]:
import selenium
print(selenium.__version__)

4.39.0


## 6. WebDriver: The Key Concept

Selenium works by using a **WebDriver**.

* WebDriver is a bridge between Python and the browser
* Different browsers require different drivers

Examples:

| Browser | Driver       |
| ------- | ------------ |
| Chrome  | [ChromeDriver](https://googlechromelabs.github.io/chrome-for-testing/#stable) |
| Edge    | EdgeDriver   |
| Firefox | GeckoDriver  |

> Modern Selenium can automatically manage drivers, which is recommended for beginners.

---

## 7. Your First Selenium Program

### Example: Open a Website

```python
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options

options = Options()
options.add_argument("--start-maximized")

driver = webdriver.Chrome(options=options)

driver.get("https://www.example.com")
```

In [2]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By

chrome_service = Service(executable_path='./driver/chromedriver')
options = Options()
options.add_experimental_option('detach', True)
options.add_argument("--start-maximized")

driver = webdriver.Chrome(service=chrome_service, options=options)

driver.get("https://www.baidu.com")

This code will:

1. Open Chrome
2. Navigate to the given URL

---

## 8. Finding Elements on a Web Page

To interact with a page, Selenium must **locate elements**.

### Common Locating Methods

```python
from selenium.webdriver.common.by import By
```

| Method            | Description          |
| ----------------- | -------------------- |
| `By.ID`           | Find by id           |
| `By.NAME`         | Find by name         |
| `By.CLASS_NAME`   | Find by class        |
| `By.TAG_NAME`     | Find by tag          |
| `By.CSS_SELECTOR` | Find by CSS selector |
| `By.XPATH`        | Find by XPath        |

### Example

```python
element = driver.find_element(By.TAG_NAME, "h1")
print(element.text)
```

---

## 9. Clicking and Typing

### Clicking a Button or Link

### Typing into an Input Box

In [3]:
search_box = driver.find_element(By.ID, 'chat-textarea')
search_box.send_keys("热搜")

### Clicking a Button or Link

In [4]:
search_btn = driver.find_element(By.ID, 'chat-submit-button')
search_btn.click()

## 10. Waiting for Elements (Very Important)

Web pages often load **asynchronously**.
If Selenium acts too early, it may fail.

### Explicit Wait (Recommended)

```python
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

wait = WebDriverWait(driver, 10)

element = wait.until(
    EC.presence_of_element_located((By.ID, "content"))
)
```

This means:

* Wait up to 10 seconds
* Continue only when the element appears

### Version 1

In [5]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

chrome_service = Service(executable_path='./driver/chromedriver')
options = Options()
options.add_experimental_option('detach', True)
options.add_argument("--start-maximized")

driver = webdriver.Chrome(service=chrome_service, options=options)
driver.get("https://101.qq.com/#/hero")

try:
    wait = WebDriverWait(driver, 10)
    ul = wait.until(
        EC.presence_of_element_located((By.XPATH, "//ul[@class='hero-list']"))
    )
    for p in ul.find_elements(By.XPATH, ".//p[@class='hero-name']"):
        print(p.text)
except Exception as e:
    print(e)

黑暗之女
狂战士
正义巨像
卡牌大师
德邦总管
无畏战车
诡术妖姬
猩红收割者
远古恐惧
正义天使
无极剑圣
牛头酋长
符文法师
亡灵战神
战争女神
众星之子
迅捷斥候
麦林炮手
祖安怒兽
雪原双子
赏金猎人
寒冰射手
蛮族之王
武器大师
堕落天使
时光守护者
炼金术士
痛苦之拥
瘟疫之源
死亡颂唱者
虚空恐惧
殇之木乃伊
披甲龙龟
冰晶凤凰
恶魔小丑
祖安狂人
琴瑟仙女
虚空行者
刀锋舞者
风暴之怒
海洋之灾
英勇投弹手
天启者
瓦洛兰之盾
邪恶小法师
巨魔之王
诺克萨斯统领
皮城女警
蒸汽机器人
熔岩巨兽
不祥之刃
永恒梦魇
扭曲树精
荒漠屠夫
德玛西亚皇子
蜘蛛女皇
发条魔灵
齐天大圣
复仇焰魂
盲僧
暗夜猎手
机械公敌
魔蛇之拥
上古领主
大发明家
沙漠死神
狂野女猎手
兽灵行者
圣锤之毅
酒桶
不屈之枪
探险家
铁铠冥魂
牧魂人
离群之刺
狂暴之心
德玛西亚之力
曙光女神
虚空先知
刀锋之影
放逐之刃
深渊巨口
暮光之眼
光辉女郎
远古巫灵
龙血武姬
九尾妖狐
法外狂徒
潮汐海灵
不灭狂雷
傲之追猎者
惩戒之箭
深海泰坦
奥术先驱
北地之怒
无双剑姬
爆破鬼才
仙灵女巫
荣耀行刑官
战争之影
虚空掠夺者
诺克萨斯之手
未来守护者
冰霜女巫
皎月女神
德玛西亚之翼
暗黑元首
铸星龙王
影流之镰
暮光星灵
荆棘之兴
虚空之女
星籁歌姬
迷失之牙
生化魔人
疾风剑豪
虚空之眼
岩雀
青钢影
影哨
虚空女皇
弗雷尔卓德之心
戏命师
永猎双子
祖安花火
暴走萝莉
河流之王
狂厄蔷薇
破败之王
涤魂圣枪
圣枪游侠
影流之主
暴怒骑士
时间刺客
元素女皇
皮城执法官
暗裔剑魔
唤潮鲛姬
沙漠皇帝
魔法猫咪
沙漠玫瑰
魂锁典狱长
海兽祭司
虚空遁地兽
翠神
复仇之矛
星界游神
幻翎
逆羽
山隐之焰
解脱者
万花通灵
残月之肃
镕铁少女
血港鬼影
愁云使者
封魔剑魂
铁血狼母
流光镜影
不破之誓
腕豪
含羞蓓蕾
灵罗娃娃
炼金男爵
双界灵兔
不羁之悦
纳祖芒荣耀
炽炎雏龙
明烛
不落魔锋
异画师
百裂冥犬


### Version 2

In [6]:
import time

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service as ChromeService
from selenium.webdriver.support.wait import WebDriverWait

chrome_service = ChromeService(executable_path='./driver/chromedriver')
# options = webdriver.ChromeOptions()
# options.add_experimental_option('detach', True)
driver = webdriver.Chrome(service=chrome_service)

driver.get("https://101.qq.com/#/hero")
# time.sleep(5)
try:
    ul = WebDriverWait(driver, 10).until(lambda d:d.find_element(By.XPATH, "//ul[@class='hero-list']"))
    for p in ul.find_elements(By.XPATH, ".//p[@class='hero-name']"):
        print(p.text)
except Exception as e:
    print(e)

黑暗之女
狂战士
正义巨像
卡牌大师
德邦总管
无畏战车
诡术妖姬
猩红收割者
远古恐惧
正义天使
无极剑圣
牛头酋长
符文法师
亡灵战神
战争女神
众星之子
迅捷斥候
麦林炮手
祖安怒兽
雪原双子
赏金猎人
寒冰射手
蛮族之王
武器大师
堕落天使
时光守护者
炼金术士
痛苦之拥
瘟疫之源
死亡颂唱者
虚空恐惧
殇之木乃伊
披甲龙龟
冰晶凤凰
恶魔小丑
祖安狂人
琴瑟仙女
虚空行者
刀锋舞者
风暴之怒
海洋之灾
英勇投弹手
天启者
瓦洛兰之盾
邪恶小法师
巨魔之王
诺克萨斯统领
皮城女警
蒸汽机器人
熔岩巨兽
不祥之刃
永恒梦魇
扭曲树精
荒漠屠夫
德玛西亚皇子
蜘蛛女皇
发条魔灵
齐天大圣
复仇焰魂
盲僧
暗夜猎手
机械公敌
魔蛇之拥
上古领主
大发明家
沙漠死神
狂野女猎手
兽灵行者
圣锤之毅
酒桶
不屈之枪
探险家
铁铠冥魂
牧魂人
离群之刺
狂暴之心
德玛西亚之力
曙光女神
虚空先知
刀锋之影
放逐之刃
深渊巨口
暮光之眼
光辉女郎
远古巫灵
龙血武姬
九尾妖狐
法外狂徒
潮汐海灵
不灭狂雷
傲之追猎者
惩戒之箭
深海泰坦
奥术先驱
北地之怒
无双剑姬
爆破鬼才
仙灵女巫
荣耀行刑官
战争之影
虚空掠夺者
诺克萨斯之手
未来守护者
冰霜女巫
皎月女神
德玛西亚之翼
暗黑元首
铸星龙王
影流之镰
暮光星灵
荆棘之兴
虚空之女
星籁歌姬
迷失之牙
生化魔人
疾风剑豪
虚空之眼
岩雀
青钢影
影哨
虚空女皇
弗雷尔卓德之心
戏命师
永猎双子
祖安花火
暴走萝莉
河流之王
狂厄蔷薇
破败之王
涤魂圣枪
圣枪游侠
影流之主
暴怒骑士
时间刺客
元素女皇
皮城执法官
暗裔剑魔
唤潮鲛姬
沙漠皇帝
魔法猫咪
沙漠玫瑰
魂锁典狱长
海兽祭司
虚空遁地兽
翠神
复仇之矛
星界游神
幻翎
逆羽
山隐之焰
解脱者
万花通灵
残月之肃
镕铁少女
血港鬼影
愁云使者
封魔剑魂
铁血狼母
流光镜影
不破之誓
腕豪
含羞蓓蕾
灵罗娃娃
炼金男爵
双界灵兔
不羁之悦
纳祖芒荣耀
炽炎雏龙
明烛
不落魔锋
异画师
百裂冥犬


## 11. Getting Page Information

### Page Title and URL

In [7]:
print(driver.title)
print(driver.current_url)

攻略中心-英雄联盟官方网站-腾讯游戏
https://101.qq.com/#/hero


### Page Source

In [8]:
html = driver.page_source

## 12. Handling Multiple Pages and Tabs

### Open a New Tab

In [9]:
driver.execute_script("window.open('https://www.python.org')")

### Switch Tabs

In [10]:
driver.switch_to.window(driver.window_handles[0])

## 13. Closing the Browser

Always close the browser when finished:

In [11]:
driver.quit()

This will:

* Close all tabs
* Release system resources

---

## 14. Common Beginner Mistakes

| Mistake             | Explanation           |
| ------------------- | --------------------- |
| No waiting          | Page not fully loaded |
| Wrong locator       | Element not found     |
| Overusing XPath     | Hard to maintain      |
| Forgetting `quit()` | Browser stays open    |

---

## 15. Good Practices for Students

* Prefer `ID` or `CSS_SELECTOR` over XPath
* Use explicit waits instead of `time.sleep`
* Write small test scripts first
* Observe the page structure using browser DevTools

---

## 16. Typical Learning Path

1. Open and close browser
2. Locate elements
3. Click and input
4. Handle waits
5. Work with multiple pages
6. Combine Selenium with data processing

---

## 17. Summary

* Selenium controls real browsers
* Suitable for automation and testing
* Slower but more powerful than simple HTTP requests
* Requires understanding of web structure

> If PyMySQL connects Python to databases,
> **Selenium connects Python to browsers.**

---

## 18. Next Steps

After this introduction, students can learn:

* Form submission automation
* Login automation
* Screenshot capturing
* Combining Selenium with `BeautifulSoup`
* Writing automated test cases