Claude 3.5 Sonnet
CSS_selector trong Selenium được sử dụng để định vị các phần tử trên trang web. Nó cho phép bạn chọn các phần tử dựa trên các thuộc tính CSS của chúng. Trong trường hợp này:

"label.address.truncate" chọn phần tử có cả hai lớp CSS là "address" và "truncate".

"div.tooltip" chọn phần tử có lớp CSS là "tooltip".

"div.box-item-value[data-original-title^='\d+ năm']" chọn phần tử có lớp CSS là "box-item-value" và thuộc tính data-original-title bắt đầu bằng một số theo sau là từ "năm".

CSS_selector rất mạnh mẽ và linh hoạt, cho phép bạn chọn chính xác các phần tử bạn cần trên trang web để tương tác hoặc trích xuất thông tin.

Để phân biệt rõ hơn giữa các kiểu copy trong Developer Tools, mình sẽ cung cấp một ví dụ cụ thể với một đoạn mã HTML mẫu và giải thích kết quả của mỗi kiểu copy.

### Ví dụ HTML:

```html
<div id="menu">
  <ul class="item-list">
    <li class="item">Home</li>
    <li class="item">About</li>
    <li class="item">Contact</li>
  </ul>
</div>
```

Bây giờ giả sử bạn đang chọn phần tử `<li class="item">Contact</li>` trong Developer Tools, đây là cách mỗi loại copy sẽ hoạt động:

### 1. **Copy element**:
   - **Kết quả**:
     ```html
     <li class="item">Contact</li>
     ```
   - **Giải thích**: Sao chép toàn bộ phần tử HTML đã chọn cùng với nội dung của nó, bao gồm thẻ mở và đóng cũng như nội dung văn bản bên trong.

### 2. **Copy outerHTML**:
   - **Kết quả**:
     ```html
     <li class="item">Contact</li>
     ```
   - **Giải thích**: Tương tự như **Copy element**, nhưng nó tập trung vào phần tử cụ thể bạn đã chọn. Nếu bạn chọn toàn bộ phần tử (như trong ví dụ), thì kết quả sẽ giống nhau. Tuy nhiên, **Copy outerHTML** sẽ không bao gồm các thẻ bên ngoài nếu phần tử được lồng trong thẻ cha khác.

### 3. **Copy selector**:
   - **Kết quả**:
     ```css
     #menu .item-list .item:nth-child(3)
     ```
   - **Giải thích**: Sao chép selector CSS chính xác để chọn phần tử `<li>` thứ ba trong danh sách. Selector này có thể được dùng trong CSS hoặc JavaScript để tìm và áp dụng style cho phần tử.

### 4. **Copy JS path**:
   - **Kết quả**:
     ```javascript
     document.querySelector("#menu > ul > li:nth-child(3)")
     ```
   - **Giải thích**: Sao chép đường dẫn JavaScript chính xác để truy cập phần tử trong cây DOM. Điều này hữu ích nếu bạn cần truy cập phần tử cụ thể này trong JavaScript.

### 5. **Copy styles**:
   - **Kết quả**:
     ```css
     display: list-item;
     margin: 0px;
     padding: 0px;
     color: black;
     font-size: 16px;
     ```
   - **Giải thích**: Sao chép tất cả các thuộc tính CSS được áp dụng lên phần tử đó, nhưng không bao gồm HTML. Các thuộc tính này có thể bao gồm các giá trị được định nghĩa trong CSS hoặc giá trị mặc định của trình duyệt.

### 6. **Copy XPath**:
   - **Kết quả**:
     ```xpath
     //*[@id="menu"]/ul/li[3]
     ```
   - **Giải thích**: Sao chép đường dẫn XPath từ cây DOM đến phần tử đã chọn. XPath được sử dụng để xác định vị trí phần tử trong tài liệu XML/HTML, thường được sử dụng trong tự động hóa kiểm thử hoặc phân tích dữ liệu trang web.

### 7. **Copy full XPath**:
   - **Kết quả**:
     ```xpath
     /html/body/div/ul/li[3]
     ```
   - **Giải thích**: Sao chép XPath đầy đủ từ gốc tài liệu HTML đến phần tử đã chọn. Nó chứa toàn bộ đường dẫn từ thẻ gốc (`<html>`) qua từng thẻ đến phần tử cuối cùng.

---

### Tổng kết sự khác biệt:
- **Copy element** và **Copy outerHTML**: Cả hai đều sao chép toàn bộ phần tử HTML đã chọn, nhưng **Copy element** chỉ lấy phần tử hiện tại, còn **Copy outerHTML** có thể bao gồm các phần tử bên ngoài nếu bạn chọn một phần tử con.
- **Copy selector**: Sao chép đường dẫn CSS để xác định chính xác phần tử, giúp áp dụng style hoặc truy cập phần tử qua JavaScript.
- **Copy JS path**: Sao chép đường dẫn JavaScript để truy cập phần tử cụ thể trong DOM.
- **Copy styles**: Sao chép các thuộc tính CSS của phần tử, hữu ích cho việc debug giao diện.
- **Copy XPath** và **Copy full XPath**: Sao chép đường dẫn XPath của phần tử trong DOM, với **full XPath** chứa toàn bộ đường dẫn từ gốc tài liệu.

Hy vọng các ví dụ trên đã giúp bạn hiểu rõ hơn về sự khác biệt giữa các tùy chọn copy trong Developer Tools!

Để làm rõ sự khác biệt giữa **Copy element** và **Copy outerHTML**, mình sẽ sử dụng một ví dụ phức tạp hơn với các phần tử lồng nhau. 

### Ví dụ HTML phức tạp hơn:

```html
<div id="container">
  <div id="content">
    <h1>Title</h1>
    <div class="article">
      <p>This is a paragraph.</p>
      <p>Another paragraph.</p>
    </div>
  </div>
</div>
```

#### Khi bạn chọn phần tử `<div class="article">`, đây là kết quả của từng loại copy:

### 1. **Copy element**:
   - **Kết quả**:
     ```html
     <div class="article">
       <p>This is a paragraph.</p>
       <p>Another paragraph.</p>
     </div>
     ```
   - **Giải thích**: **Copy element** sao chép toàn bộ phần tử `div` có class là `article` cùng với tất cả nội dung và các phần tử con bên trong (các thẻ `<p>`). **Nó không bao gồm các phần tử bên ngoài như `div id="content"` hoặc `div id="container"`.**
   
   Kết quả này chỉ là nội dung của phần tử `<div class="article">`.

---

### 2. **Copy outerHTML**:
   - **Kết quả**:
     ```html
     <div class="article">
       <p>This is a paragraph.</p>
       <p>Another paragraph.</p>
     </div>
     ```
   - **Giải thích**: **Copy outerHTML** cũng sao chép toàn bộ thẻ `div` có class là `article` cùng với tất cả các thẻ con và nội dung bên trong. Tuy nhiên, điểm khác biệt lớn giữa **Copy outerHTML** và **Copy element** xuất hiện khi bạn chỉ chọn một **phần nội dung cụ thể hoặc chỉ một phần tử con** thay vì toàn bộ phần tử.
   
   Kết quả của **outerHTML** trong trường hợp này giống với **Copy element**, vì cả hai đều sao chép toàn bộ phần tử `<div class="article">` và các thẻ con bên trong nó. Tuy nhiên, sự khác biệt sẽ rõ hơn khi bạn làm việc với một phần nhỏ hơn của phần tử.

---

### Phân biệt khi chọn nội dung bên trong:

Giả sử bạn chỉ chọn đoạn văn bản "This is a paragraph." trong thẻ `<p>`. Dưới đây là sự khác biệt:

#### **Copy element** (khi chọn "This is a paragraph."):
   - **Kết quả**:
     ```html
     This is a paragraph.
     ```
   - **Giải thích**: **Copy element** chỉ sao chép nội dung mà bạn đã chọn. Trong trường hợp này, nó chỉ sao chép đoạn văn bản "This is a paragraph." và không bao gồm các thẻ HTML bao ngoài như thẻ `<p>`.

#### **Copy outerHTML** (khi chọn "This is a paragraph."):
   - **Kết quả**:
     ```html
     <p>This is a paragraph.</p>
     ```
   - **Giải thích**: **Copy outerHTML** sẽ sao chép cả nội dung đã chọn **cùng với các thẻ HTML bao quanh**. Ở đây, nó sẽ sao chép cả thẻ `<p>` và nội dung "This is a paragraph." bên trong.

---

### Tổng kết sự khác biệt:

- **Copy element**: Chỉ sao chép nội dung của phần tử đã chọn mà **không bao gồm các thẻ HTML bao quanh**, nhất là khi bạn chỉ chọn một đoạn nội dung cụ thể. Nếu bạn chọn cả phần tử thì nó sẽ sao chép toàn bộ phần tử và các thẻ con, nhưng không bao gồm các thẻ cha bên ngoài.
  
- **Copy outerHTML**: Sao chép toàn bộ **phần tử được bao ngoài**, bao gồm cả thẻ mở và thẻ đóng của phần tử HTML đó. Dù bạn chỉ chọn một đoạn nội dung, **outerHTML** vẫn sao chép cả thẻ bao quanh đoạn nội dung đó.

Trong trường hợp này, sự khác biệt giữa **Copy element** và **Copy outerHTML** trở nên rõ ràng hơn khi bạn làm việc với **nội dung cụ thể hoặc phần tử con**.

### Tóm tắt sự khác biệt giữa các kiểu copy trong Developer Tools:

1. **Copy element**:
   - Sao chép toàn bộ phần tử HTML đã chọn cùng với nội dung bên trong, bao gồm các thẻ con. Nó chỉ lấy phần tử bạn chọn mà không bao gồm các phần tử cha bên ngoài.
   - **Ví dụ**: Sao chép toàn bộ nội dung của phần tử `<li class="item">Contact</li>`.

2. **Copy outerHTML**:
   - Sao chép phần tử HTML bạn chọn, bao gồm cả thẻ mở và thẻ đóng. **Khác với Copy element**, nó chỉ tập trung vào phần tử bạn chọn và không bao gồm bất kỳ phần tử cha nào bên ngoài.
   - **Ví dụ**: Kết quả giống với **Copy element** nếu bạn chọn toàn bộ phần tử, nhưng khi bạn chỉ chọn một đoạn nội dung bên trong, **Copy outerHTML** sẽ sao chép cả thẻ bao quanh nó.

3. **Copy selector**:
   - Sao chép đường dẫn CSS để xác định chính xác phần tử HTML được chọn, giúp áp dụng style hoặc truy cập phần tử trong JavaScript.
   - **Ví dụ**: `#menu .item-list .item:nth-child(3)` sẽ chỉ rõ phần tử thứ ba trong danh sách.

4. **Copy JS path**:
   - Sao chép đường dẫn JavaScript giúp truy cập phần tử cụ thể trong DOM qua JavaScript.
   - **Ví dụ**: `document.querySelector("#menu > ul > li:nth-child(3)")` sẽ truy cập phần tử `<li>` thứ ba trong danh sách.

5. **Copy styles**:
   - Sao chép các thuộc tính CSS được áp dụng cho phần tử HTML đã chọn, không bao gồm HTML.
   - **Ví dụ**: Sao chép các thuộc tính như `color`, `margin`, `font-size` của phần tử.

6. **Copy XPath**:
   - Sao chép đường dẫn XPath, giúp xác định vị trí phần tử trong cấu trúc DOM (Document Object Model). XPath thường được sử dụng trong kiểm thử tự động.
   - **Ví dụ**: `//*[@id="menu"]/ul/li[3]` là đường dẫn XPath đến phần tử thứ ba.

7. **Copy full XPath**:
   - Sao chép toàn bộ đường dẫn XPath từ gốc tài liệu HTML đến phần tử đã chọn, không bỏ qua bất kỳ bước nào.
   - **Ví dụ**: `/html/body/div/ul/li[3]` sẽ chứa toàn bộ đường dẫn từ thẻ gốc `<html>` qua tất cả các thẻ con đến phần tử cuối cùng.

### Tổng kết nhanh:
- **Copy element**: Sao chép toàn bộ nội dung của phần tử được chọn, bao gồm các phần tử con.
- **Copy outerHTML**: Sao chép cả phần tử được chọn cùng với thẻ HTML bao quanh.
- **Copy selector**, **Copy JS path**, **Copy XPath**, **Copy full XPath**: Sao chép đường dẫn giúp truy cập hoặc xác định phần tử bằng CSS, JavaScript, hoặc XPath.
- **Copy styles**: Sao chép các thuộc tính CSS áp dụng cho phần tử được chọn.

Hy vọng phần tóm tắt này giúp bạn hiểu rõ hơn sự khác biệt giữa các kiểu copy trong Developer Tools!

Bạn đã tổng hợp rất tốt. Tuy nhiên, để làm cho danh sách này hoàn chỉnh và chính xác hơn, tôi sẽ bổ sung và điều chỉnh một chút:

1. Phương pháp tìm kiếm phần tử:
   - ID: `driver.find_element(By.ID, "elementId")`  - `<div id="unique-identifier">Đây là một phần tử với id</div>`

   - Name: `driver.find_element(By.NAME, "elementName")` - `<input name="username" type="text">`

   - Class name: `driver.find_element(By.CLASS_NAME, "className")` - `<div class="common-style">Đây là một phần tử với class</div>`

   - Tag name: `driver.find_element(By.TAG_NAME, "tagName")` - `<p>Đây là một đoạn văn bản</p>`

   - Link text: `driver.find_element(By.LINK_TEXT, "linkText")` - `<a href="https://example.com">Nhấp vào đây</a>`

   - Partial link text: `driver.find_element(By.PARTIAL_LINK_TEXT, "partialText")` - `<a href="https://example.com">Nhấp vào đây để xem thêm</a>`

   - CSS Selector: `driver.find_element(By.CSS_SELECTOR, "cssSelector")` - `<div class="container"><span>Phần tử con</span></div>`

   - XPath: `driver.find_element(By.XPATH, "xpathExpression")` - `<div><span>Phần tử con thứ nhất</span><span>Phần tử con thứ hai</span></div>`

2. Hướng dẫn chọn phương pháp:
   - ID: Ưu tiên nhất nếu phần tử có id duy nhất.
   - Name: Tốt cho các phần tử form như input, select.
   - Class name: Hữu ích khi phần tử có class duy nhất hoặc khi muốn tìm nhiều phần tử cùng class.
   - Tag name: Khi cần tìm tất cả các phần tử của một loại tag cụ thể.
   - Link text & Partial link text: Đặc biệt hữu ích cho các liên kết.
   - CSS Selector: Tốt cho phần tử có class hoặc cấu trúc CSS đơn giản, nhanh hơn XPath.
   - XPath: Khi cần tìm phần tử dựa trên text hoặc cấu trúc phức tạp.

3. Các phương pháp nâng cao:
   - JavaScript Executor với CSS Selector: 
     ```python
     element = driver.execute_script("return document.querySelector('.className');")
     ```
   - Full XPath: Sử dụng đường dẫn tuyệt đối từ gốc DOM.
   - Relative XPath: Sử dụng đường dẫn tương đối, linh hoạt hơn Full XPath.
   - Custom JavaScript functions: Để xử lý các trường hợp phức tạp hoặc động.

4. Lưu ý bổ sung:
   - Kết hợp các phương pháp: Ví dụ, sử dụng CSS Selector kết hợp với XPath để tạo ra locator mạnh mẽ và linh hoạt.
   - Sử dụng các thuộc tính data-* tùy chỉnh: Nếu có thể, thêm các thuộc tính data-* vào HTML để dễ dàng định vị phần tử.
   - Xem xét sử dụng các framework hỗ trợ như Page Object Model để quản lý locator hiệu quả hơn.

Bằng cách hiểu và sử dụng đúng các phương pháp này, bạn có thể tối ưu hóa quá trình tìm kiếm và tương tác với các phần tử trên trang web, làm cho script crawl của bạn mạnh mẽ và linh hoạt hơn.

-----------
Sau khi xem xét kỹ code của bạn, tôi nhận thấy rằng code này đã sử dụng hầu hết các phương pháp chính mà chúng ta đã thảo luận. Tuy nhiên, có một số điểm đáng chú ý:

3. Phương pháp ngoài danh sách ban đầu:
   - ActionChains: Được sử dụng để thực hiện các hành động phức tạp như di chuyển đến phần tử và click.
     ```python
     ActionChains(driver).move_to_element(element).click().perform()
     ```
   - BeautifulSoup: Không phải là một phương pháp của Selenium, nhưng được sử dụng để phân tích HTML và trích xuất thông tin.
     ```python
     soup = BeautifulSoup(text_element.get_attribute('outerHTML'), 'html.parser')
     ```

4. Kỹ thuật đặc biệt:
   - Sử dụng `driver.execute_script()` để scroll đến phần tử:
     ```python
     driver.execute_script("arguments[0].scrollIntoView(true);", element)
     ```
   - Sử dụng `WebDriverWait` kết hợp với `expected_conditions` để đợi phần tử xuất hiện và có thể tương tác:
     ```python
     WebDriverWait(driver, 20).until(EC.element_to_be_clickable((By.CSS_SELECTOR, "div.gemini-vote-card-glow")))
     ```

Tóm lại, code của bạn đã sử dụng một tổ hợp các phương pháp và kỹ thuật, bao gồm cả những phương pháp nằm ngoài danh sách ban đầu. Việc kết hợp này giúp script của bạn linh hoạt và có khả năng xử lý nhiều tình huống khác nhau trong quá trình crawl. Đặc biệt, việc sử dụng ActionChains và BeautifulSoup là những điểm đáng chú ý, mở rộng khả năng của script beyond các phương pháp cơ bản của Selenium.

### Ver 1.1

```
# B1: Mở web: https://www.topcv.vn/viec-lam trong Microsoft Edge
# B2: Tìm kiếm vị trí công việc: "AI Engineer"
# B3: Thu thập dữ liệu: vị trí, tên công ty, mức lương, địa điểm
-------------------
Chỉ mỗi như này là run mượt luôn với CursorAI rồi
```

Tắt nút survey ngáng đường bằng `element`
```
Tắt: <label for="dont-show-popup-survey-recruitment-trend">
                            <span>
                                Không hiển thị lại
                                <span>
                        </span></span></label>

và tắt 
<div class="modal-header">
                <button type="button" class="close" data-dismiss="modal" aria-label="Close">
                    <span aria-hidden="true">
                        <i class="fa-solid fa-xmark"></i>
                    </span>
                </button>
            </div>
```

element: 

```
<div class="job-item-search-result
                                 job-ta
                                                " data-job-id="1466998" data-job-position="1" data-u-sr-id="5GEpyUlNbgWfxF3sd6UtCMWtpeahsJ1luyGF4sOq_1726044623" data-box="BoxSearchResult">
                                <div class="avatar">
                    <a target="_blank" href="https://www.topcv.vn/viec-lam/ai-engineer-computer-vision/1466998.html?ta_source=JobSearchList_LinkDetail&amp;u_sr_id=5GEpyUlNbgWfxF3sd6UtCMWtpeahsJ1luyGF4sOq_1726044623" rel="nooppener noreferrer">
                        <img data-src="https://cdn-new.topcv.vn/unsafe/150x/https://static.topcv.vn/company_logos/YdpwedZRj70lKiFxMUdRYu9XhyfFYOw3_1716447351____530ba80de9433ad6a984f8581396207f.jpg" class="w-100 lazy entered loaded" alt="CÔNG TY TNHH MỘT THÀNH VIÊN GIẢI PHÁP CÔNG NGHỆ HTI" title="AI Engineer (Computer Vision)" data-ll-status="loaded" src="https://cdn-new.topcv.vn/unsafe/150x/https://static.topcv.vn/company_logos/YdpwedZRj70lKiFxMUdRYu9XhyfFYOw3_1716447351____530ba80de9433ad6a984f8581396207f.jpg">
                    </a>
                                    </div>
                <div class="body">
                    <div class="body-content">
                        <div class="title-block">
                            <div>
                                <h3 class="title ">
                                    <div class="box-label-top">
                                        
                                        
                                        
                                                                            </div>

                                    <a target="_blank" href="https://www.topcv.vn/viec-lam/ai-engineer-computer-vision/1466998.html?ta_source=JobSearchList_LinkDetail&amp;u_sr_id=5GEpyUlNbgWfxF3sd6UtCMWtpeahsJ1luyGF4sOq_1726044623" rel="nooppener noreferrer">
                                        <span data-toggle="tooltip" data-container="body" data-placement="top" title="" data-original-title="AI Engineer (Computer Vision)">AI Engineer (Computer Vision)</span>
                                                                            </a>
                                </h3>
                                <a class="company" href="https://www.topcv.vn/cong-ty/cong-ty-tnhh-mot-thanh-vien-giai-phap-cong-nghe-hti/162580.html" data-toggle="tooltip" title="" data-placement="top" target="_blank" rel="nooppener noreferrer" data-original-title="CÔNG TY TNHH MỘT THÀNH VIÊN GIẢI PHÁP CÔNG NGHỆ HTI">CÔNG TY TNHH MỘT THÀNH VIÊN GIẢI PHÁP CÔNG NGHỆ HTI</a>

                                                                    <div class="box-job-relevance-job">
                                        <i class="fa-solid fa-star"></i>
                                        <i style="display: none;" class="fa-regular fa-star"></i>
                                        <span class="box-job-relevance-job_text"></span>
                                    </div>
                                                            </div>


                            <div class="box-right">
                                <label class="title-salary">
                                                                            <i class="fa-solid fa-circle-dollar"></i>
                                                                        Thoả thuận
                                </label>
                                                                    <p class="quick-view-job-detail">Xem <span class="speed">nhanh</span> <i class="fa-solid fa-chevrons-right"></i></p>
                                                            </div>
                        </div>

                                            </div>


                    <div class="info">
                        <div class="label-content">
                                                            <label class="address truncate" data-toggle="tooltip" data-html="true" title="" data-placement="top" data-original-title="<p style='text-align: left'>Hà Nội: Nam Từ Liêm</p>">
                                                                            Hà Nội
                                                                    </label>
                                                                                        <label class="address mobile-hidden label-update" data-custom-class="custom-tooltip" data-toggle="tooltip" title="" data-placement="top" data-original-title="Cập nhật 1 giờ trước">
                                    <span class="hidden-on-quick-view">Cập nhật</span> 1 giờ trước

                                </label>
                                                    </div>

                        <div class="icon">

                                                            
                                <button data-job-id="1466998" data-apply-url="" data-redirect-to="https://www.topcv.vn/viec-lam/ai-engineer-computer-vision/1466998.html?ta_source=JobSearchList_ButtonApplyFormCard&amp;u_sr_id=5GEpyUlNbgWfxF3sd6UtCMWtpeahsJ1luyGF4sOq_1726044623" class="btn btn-apply-now">
                                    <span>Ứng tuyển</span>
                                </button>
                                                                                                                            <a data-job-id="1466998" class="btn btn-ignore-job-search" href="javascript:showLoginPopup('https://www.topcv.vn/tim-viec-lam-ai-engineer', 'Đăng nhập hoặc Đăng ký để lưu tin tuyển dụng')" data-title="Ẩn tin tuyển dụng này" data-toggle="tooltip" data-placement="top" data-container="body" data-original-title="" title="">
                                        <i class="fa-sharp fa-regular fa-eye-slash"></i>
                                    </a>
                                                                                                                        <div class="box-save-job">
                                    <a data-id="1466998" href="javascript:showLoginPopup('https://www.topcv.vn/tim-viec-lam-ai-engineer', 'Đăng nhập hoặc Đăng ký để lưu tin tuyển dụng')" class="save box-save-job-hover" data-toggle="tooltip" title="" data-original-title="Bạn phải đăng nhập để lưu tin"><i class="fa-regular fa-heart"></i></a>
                                </div>
                                                    </div>
                    </div>
                    <div class="undo-ignore">
                        <div class="undo-ignore__title">
                            Bạn sẽ không nhìn thấy tin tuyển dụng này trên trang tìm kiếm
                        </div>
                        <div class="undo-ignore__btn-undo" data-job-id="1466998">
                            <i class="fa-solid fa-rotate-left"></i>
                            Hoàn tác
                        </div>
                    </div>
                </div>



                                    <div class="overlay-ignore">

                </div>
            </div><div class="job-item-search-result
                                 job-ta
                                                " data-job-id="1466998" data-job-position="1" data-u-sr-id="5GEpyUlNbgWfxF3sd6UtCMWtpeahsJ1luyGF4sOq_1726044623" data-box="BoxSearchResult">
                                <div class="avatar">
                    <a target="_blank" href="https://www.topcv.vn/viec-lam/ai-engineer-computer-vision/1466998.html?ta_source=JobSearchList_LinkDetail&amp;u_sr_id=5GEpyUlNbgWfxF3sd6UtCMWtpeahsJ1luyGF4sOq_1726044623" rel="nooppener noreferrer">
                        <img data-src="https://cdn-new.topcv.vn/unsafe/150x/https://static.topcv.vn/company_logos/YdpwedZRj70lKiFxMUdRYu9XhyfFYOw3_1716447351____530ba80de9433ad6a984f8581396207f.jpg" class="w-100 lazy entered loaded" alt="CÔNG TY TNHH MỘT THÀNH VIÊN GIẢI PHÁP CÔNG NGHỆ HTI" title="AI Engineer (Computer Vision)" data-ll-status="loaded" src="https://cdn-new.topcv.vn/unsafe/150x/https://static.topcv.vn/company_logos/YdpwedZRj70lKiFxMUdRYu9XhyfFYOw3_1716447351____530ba80de9433ad6a984f8581396207f.jpg">
                    </a>
                                    </div>
                <div class="body">
                    <div class="body-content">
                        <div class="title-block">
                            <div>
                                <h3 class="title ">
                                    <div class="box-label-top">
                                        
                                        
                                        
                                                                            </div>

                                    <a target="_blank" href="https://www.topcv.vn/viec-lam/ai-engineer-computer-vision/1466998.html?ta_source=JobSearchList_LinkDetail&amp;u_sr_id=5GEpyUlNbgWfxF3sd6UtCMWtpeahsJ1luyGF4sOq_1726044623" rel="nooppener noreferrer">
                                        <span data-toggle="tooltip" data-container="body" data-placement="top" title="" data-original-title="AI Engineer (Computer Vision)">AI Engineer (Computer Vision)</span>
                                                                            </a>
                                </h3>
                                <a class="company" href="https://www.topcv.vn/cong-ty/cong-ty-tnhh-mot-thanh-vien-giai-phap-cong-nghe-hti/162580.html" data-toggle="tooltip" title="" data-placement="top" target="_blank" rel="nooppener noreferrer" data-original-title="CÔNG TY TNHH MỘT THÀNH VIÊN GIẢI PHÁP CÔNG NGHỆ HTI">CÔNG TY TNHH MỘT THÀNH VIÊN GIẢI PHÁP CÔNG NGHỆ HTI</a>

                                                                    <div class="box-job-relevance-job">
                                        <i class="fa-solid fa-star"></i>
                                        <i style="display: none;" class="fa-regular fa-star"></i>
                                        <span class="box-job-relevance-job_text"></span>
                                    </div>
                                                            </div>


                            <div class="box-right">
                                <label class="title-salary">
                                                                            <i class="fa-solid fa-circle-dollar"></i>
                                                                        Thoả thuận
                                </label>
                                                                    <p class="quick-view-job-detail">Xem <span class="speed">nhanh</span> <i class="fa-solid fa-chevrons-right"></i></p>
                                                            </div>
                        </div>

                                            </div>


                    <div class="info">
                        <div class="label-content">
                                                            <label class="address truncate" data-toggle="tooltip" data-html="true" title="" data-placement="top" data-original-title="<p style='text-align: left'>Hà Nội: Nam Từ Liêm</p>">
                                                                            Hà Nội
                                                                    </label>
                                                                                        <label class="address mobile-hidden label-update" data-custom-class="custom-tooltip" data-toggle="tooltip" title="" data-placement="top" data-original-title="Cập nhật 1 giờ trước">
                                    <span class="hidden-on-quick-view">Cập nhật</span> 1 giờ trước

                                </label>
                                                    </div>

                        <div class="icon">

                                                            
                                <button data-job-id="1466998" data-apply-url="" data-redirect-to="https://www.topcv.vn/viec-lam/ai-engineer-computer-vision/1466998.html?ta_source=JobSearchList_ButtonApplyFormCard&amp;u_sr_id=5GEpyUlNbgWfxF3sd6UtCMWtpeahsJ1luyGF4sOq_1726044623" class="btn btn-apply-now">
                                    <span>Ứng tuyển</span>
                                </button>
                                                                                                                            <a data-job-id="1466998" class="btn btn-ignore-job-search" href="javascript:showLoginPopup('https://www.topcv.vn/tim-viec-lam-ai-engineer', 'Đăng nhập hoặc Đăng ký để lưu tin tuyển dụng')" data-title="Ẩn tin tuyển dụng này" data-toggle="tooltip" data-placement="top" data-container="body" data-original-title="" title="">
                                        <i class="fa-sharp fa-regular fa-eye-slash"></i>
                                    </a>
                                                                                                                        <div class="box-save-job">
                                    <a data-id="1466998" href="javascript:showLoginPopup('https://www.topcv.vn/tim-viec-lam-ai-engineer', 'Đăng nhập hoặc Đăng ký để lưu tin tuyển dụng')" class="save box-save-job-hover" data-toggle="tooltip" title="" data-original-title="Bạn phải đăng nhập để lưu tin"><i class="fa-regular fa-heart"></i></a>
                                </div>
                                                    </div>
                    </div>
                    <div class="undo-ignore">
                        <div class="undo-ignore__title">
                            Bạn sẽ không nhìn thấy tin tuyển dụng này trên trang tìm kiếm
                        </div>
                        <div class="undo-ignore__btn-undo" data-job-id="1466998">
                            <i class="fa-solid fa-rotate-left"></i>
                            Hoàn tác
                        </div>
                    </div>
                </div>



                                    <div class="overlay-ignore">

                </div>
            </div>
```

In [None]:
# # B1: Mở web: https://www.topcv.vn/viec-lam trong Microsoft Edge - ko bật tab ẩn danh mà vào tab bình thường. 
# # B2: Tìm kiếm vị trí công việc: "AI Engineer" 
# # B3: Tắt pop up survey
# # B4: Thu thập dữ liệu: vị trí, tên công ty, mức lương, địa điểm


# # Code 
# from selenium import webdriver
# from selenium.webdriver.common.by import By
# from selenium.webdriver.common.keys import Keys
# from selenium.webdriver.support.ui import WebDriverWait
# from selenium.webdriver.support import expected_conditions as EC
# from selenium.common.exceptions import TimeoutException

# def scrape_topcv():
#     # Khởi tạo trình duyệt Microsoft Edge
#     driver = webdriver.Edge()

#     try:
#         # B1: Mở web
#         driver.get("https://www.topcv.vn/tim-viec-lam-ai-engineer")

#         # B4: Thu thập dữ liệu
#         job_listings = driver.find_elements(By.CLASS_NAME, "job-item-search-result")
        
#         job_count = len(job_listings)
#         print(f"Số lượng công việc tìm thấy: {job_count}")
        
#         for index, job in enumerate(job_listings, 1):
#             position = job.find_element(By.CSS_SELECTOR, "h3.title a span").get_attribute("data-original-title")
#             company = job.find_element(By.CSS_SELECTOR, "a.company").text
#             salary = job.find_element(By.CLASS_NAME, "title-salary").text
#             location = job.find_element(By.CSS_SELECTOR, "label.address.truncate").get_attribute("data-original-title")
            
#             print(f"Công việc {index}/{job_count}:")
#             print(f"Vị trí: {position}")
#             print(f"Công ty: {company}")
#             print(f"Mức lương: {salary}")
#             print(f"Địa điểm: {location}")
#             print("---")

#     finally:
#         driver.quit()

# if __name__ == "__main__":
#     scrape_topcv()

### Ver 1.2

```
# B1: Mở web: https://www.topcv.vn/tim-viec-lam-product-owner trong Microsoft Edge
# B2: Thu thập dữ liệu: vị trí, tên công ty, mức lương, địa điểm từ element được cấp ở trên
# B3: Ấn vào từng job và thu thập
-------------------
Chỉ mỗi như này là run mượt luôn với CursorAI rồi
```

selector: #main > div.search-job > div:nth-child(4) > div.result-job-search > div > div > div.job-body.wrapper-main > div.col-md-12 > div > div.job-list-detail > div > div.box-scroll > div.job-detail__company

element: <div class="job-detail__company">
    <div class="job-detail__company--information">
        <div rel="nofollow" class="job-detail__company--information-item company-name">
            <a class="company-logo" href="https://www.topcv.vn/cong-ty/cong-ty-co-phan-giai-phap-cong-nghe-ttc-viet-nam/18143.html" target="_blank" data-toggle="tooltip" data-container="body" title="" data-placement="top" data-original-title="Công ty Cổ phần Giải pháp Công nghệ TTC Việt Nam">
                <img src="https://cdn-new.topcv.vn/unsafe/80x/https://static.topcv.vn/company_logos/cong-ty-co-phan-giai-phap-cong-nghe-ttc-viet-nam-f291f6095175b0c91cdc9e25d5740f61-5da687c07f7b3.jpg" alt="Công ty Cổ phần Giải pháp Công nghệ TTC Việt Nam" class="img-responsive">
            </a>
            <div class="box-main">
                <h2 class="company-name-label">
                    <a rel="nofollow" class="name" href="https://www.topcv.vn/cong-ty/cong-ty-co-phan-giai-phap-cong-nghe-ttc-viet-nam/18143.html" target="_blank" data-container="body" data-toggle="tooltip" title="" data-placement="top" data-original-title="Công ty Cổ phần Giải pháp Công nghệ TTC Việt Nam">Công ty Cổ phần Giải pháp Công nghệ TTC Việt Nam</a>
                                                        </h2>
                <div class="job-detail__company--information-item company-scale">
                <div class="company-title">
                    <svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" viewBox="0 0 16 16" fill="none">
                        <path d="M5.99998 1.33334C4.25331 1.33334 2.83331 2.75334 2.83331 4.5C2.83331 6.21334 4.17331 7.6 5.91998 7.66C5.97331 7.65334 6.02665 7.65334 6.06665 7.66C6.07998 7.66 6.08665 7.66 6.09998 7.66C6.10665 7.66 6.10665 7.66 6.11331 7.66C7.81998 7.6 9.15998 6.21334 9.16665 4.5C9.16665 2.75334 7.74665 1.33334 5.99998 1.33334Z" fill="#7F878F"></path>
                        <path d="M9.38664 9.43333C7.52664 8.19333 4.49331 8.19333 2.61997 9.43333C1.77331 10 1.30664 10.7667 1.30664 11.5867C1.30664 12.4067 1.77331 13.1667 2.61331 13.7267C3.54664 14.3533 4.77331 14.6667 5.99997 14.6667C7.22664 14.6667 8.45331 14.3533 9.38664 13.7267C10.2266 13.16 10.6933 12.4 10.6933 11.5733C10.6866 10.7533 10.2266 9.99333 9.38664 9.43333Z" fill="#7F878F"></path>
                        <path d="M13.3267 4.89333C13.4333 6.18667 12.5133 7.32 11.24 7.47333C11.2333 7.47333 11.2333 7.47333 11.2267 7.47333H11.2067C11.1667 7.47333 11.1267 7.47333 11.0933 7.48667C10.4467 7.52 9.85334 7.31333 9.40668 6.93333C10.0933 6.32 10.4867 5.4 10.4067 4.4C10.36 3.86 10.1733 3.36667 9.89334 2.94667C10.1467 2.82 10.44 2.74 10.74 2.71333C12.0467 2.6 13.2133 3.57333 13.3267 4.89333Z" fill="#7F878F"></path>
                        <path d="M14.66 11.06C14.6067 11.7067 14.1933 12.2667 13.5 12.6467C12.8333 13.0133 11.9933 13.1867 11.16 13.1667C11.64 12.7333 11.92 12.1933 11.9733 11.62C12.04 10.7933 11.6467 10 10.86 9.36667C10.4133 9.01333 9.89333 8.73333 9.32666 8.52667C10.8 8.1 12.6533 8.38667 13.7933 9.30667C14.4067 9.8 14.72 10.42 14.66 11.06Z" fill="#7F878F"></path>
                    </svg>
                </div>
                <div class="company-value">100-499 nhân viên</div>
            </div>
            <div class="job-detail__company--information-item company-address">
                <div class="company-title">
                    <svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" viewBox="0 0 16 16" fill="none">
                        <path d="M13.7467 5.63334C13.0467 2.55334 10.36 1.16667 8 1.16667C8 1.16667 8 1.16667 7.99334 1.16667C5.64 1.16667 2.94667 2.54667 2.24667 5.62667C1.46667 9.06667 3.57334 11.98 5.48 13.8133C6.18667 14.4933 7.09334 14.8333 8 14.8333C8.90667 14.8333 9.81334 14.4933 10.5133 13.8133C12.42 11.98 14.5267 9.07334 13.7467 5.63334ZM8 8.97334C6.84 8.97334 5.9 8.03334 5.9 6.87334C5.9 5.71334 6.84 4.77334 8 4.77334C9.16 4.77334 10.1 5.71334 10.1 6.87334C10.1 8.03334 9.16 8.97334 8 8.97334Z" fill="#7F878F"></path>
                    </svg>
                </div>
                <div class="company-value" data-toggle="tooltip" title="" data-placement="top" data-original-title="Tầng 20, Tòa nhà Charmvit Tower, 117 Trần Duy Hưng, Cầu Giấy, Hà Nội">
                    Tầng 20, Tòa nhà Charmvit Tower, 117 Trần Duy Hưng, Cầu Giấy, Hà Nội
                </div>
            </div>
            </div>
        </div>

    </div>
    <div class="job-detail__company--link">
        <a rel="nofollow" href="https://www.topcv.vn/cong-ty/cong-ty-co-phan-giai-phap-cong-nghe-ttc-viet-nam/18143.html" target="_blank">Xem trang công ty</a>
        <i class="fa-solid fa-arrow-up-right-from-square"></i>
    </div>
</div>


- Bạn dựa vào element hay selector 

Tôi dựa vào cả element và selector để xác định cách trích xuất thông tin từ trang web.
Cách tôi sử dụng:
Element:
Tôi xem xét cấu trúc HTML mà bạn đã cung cấp, bao gồm các thẻ và lớp (class) cụ thể. Điều này giúp tôi hiểu rõ cách mà thông tin được tổ chức trong DOM (Document Object Model).
Ví dụ, tôi đã xác định rằng tên công ty nằm trong thẻ <a> với lớp name, quy mô công ty nằm trong company-scale, và địa chỉ nằm trong company-address.
Selector:
Tôi sử dụng các bộ chọn CSS (CSS selectors) để truy cập các phần tử cụ thể trong HTML. Bộ chọn này cho phép tôi lấy thông tin một cách chính xác từ các phần tử mà tôi đã xác định trong cấu trúc HTML.
Ví dụ, bộ chọn div.job-detail__company--information .company-name a.name được sử dụng để lấy tên công ty.
Kết luận:
Element cung cấp thông tin về cấu trúc và vị trí của dữ liệu trong HTML.
Selector cho phép tôi truy cập và trích xuất dữ liệu từ các phần tử đó một cách chính xác.
Nếu bạn cần thêm thông tin hoặc có câu hỏi khác, hãy cho tôi biết!

Dựa trên cấu trúc HTML và các bộ chọn mà tôi đã phân tích, tôi đã viết mã Python sử dụng Selenium để trích xuất thông tin công ty. Dưới đây là cách tôi đã viết mã:
Mã Python để Trích Xuất Thông Tin Công Ty
t

```
try:
    # Trích xuất tên công ty
    company_name = wait.until(EC.presence_of_element_located(
        (By.CSS_SELECTOR, "div.job-detail__company--information .company-name a.name"))
    ).text
    print(f"Tên công ty: {company_name}")

    # Trích xuất quy mô công ty
    company_scale = wait.until(EC.presence_of_element_located(
        (By.CSS_SELECTOR, "div.job-detail__company--information .company-scale .company-value"))
    ).text
    print(f"Quy mô công ty: {company_scale}")

    # Trích xuất địa chỉ công ty
    company_address = wait.until(EC.presence_of_element_located(
        (By.CSS_SELECTOR, "div.job-detail__company--information .company-address .company-value"))
    ).text
    print(f"Địa chỉ công ty: {company_address}")

    # Trích xuất liên kết đến trang công ty
    company_link = wait.until(EC.presence_of_element_located(
        (By.CSS_SELECTOR, "div.job-detail__company--link a"))
    ).get_attribute("href")
    print(f"Trang công ty: {company_link}")

except Exception as e:
    print(f"Không thể trích xuất thông tin công ty: {e}")
```
Giải Thích Mã:
Sử dụng wait.until: Để đảm bảo rằng các phần tử đã xuất hiện trên trang trước khi cố gắng truy cập chúng.
2. Bộ chọn CSS: Sử dụng các bộ chọn CSS đã xác định để lấy thông tin cụ thể từ các phần tử HTML.
In ra thông tin: Sau khi trích xuất, thông tin được in ra để kiểm tra.
Xử lý ngoại lệ: Nếu có lỗi xảy ra trong quá trình trích xuất, thông báo lỗi sẽ được in ra.
Kết Luận:
Mã này cho phép bạn trích xuất thông tin công ty từ trang web một cách chính xác dựa trên cấu trúc HTML mà bạn đã cung cấp. Nếu bạn cần thêm thông tin hoặc có câu hỏi khác, hãy cho tôi biết!

In [None]:
# from selenium import webdriver
# from selenium.webdriver.common.by import By
# from selenium.webdriver.support.ui import WebDriverWait
# from selenium.webdriver.support import expected_conditions as EC
# from selenium.common.exceptions import TimeoutException, NoSuchElementException, WebDriverException
# import time

# def scrape_topcv():
#     driver = webdriver.Edge()
#     wait = WebDriverWait(driver, 20)

#     try:
#         driver.get("https://www.topcv.vn/tim-viec-lam-ai-engineer")

#         job_listings = wait.until(EC.presence_of_all_elements_located((By.CLASS_NAME, "job-item-search-result")))
       
#         print(f"Số lượng công việc tìm thấy: {len(job_listings)}")
       
#         for index, job in enumerate(job_listings, 1):
#             try:
#                 posting_time = job.find_element(By.CSS_SELECTOR, "label.address.mobile-hidden.label-update").get_attribute("data-original-title")
#                 posting_time = posting_time.replace("Cập nhật ", "")
#                 print(f"Thời gian đăng: {posting_time}")
               
#                 quick_view_element = job.find_element(By.CLASS_NAME, "quick-view-job-detail")
#                 driver.execute_script("arguments[0].click();", quick_view_element)
               
#                 try:
#                     experience = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "div.box-item-value[data-original-title$='năm']"))).text
#                     print(f"Số năm kinh nghiệm: {experience}")
#                 except:
#                     print("Không tìm thấy thông tin về số năm kinh nghiệm.")
               
#                 for section in ['Mô tả công việc', 'Yêu cầu ứng viên', 'Quyền lợi', 'Địa điểm làm việc', 'Thời gian làm việc']:
#                     try:
#                         content = wait.until(EC.presence_of_element_located((By.XPATH, f"//h3[contains(text(), '{section}')]/following-sibling::div[1]"))).text
#                         print(f"{section}: {content}")
#                     except:
#                         print(f"Không tìm thấy thông tin về {section}.")
               
#                 close_button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, "button.btn-close-job-detail")))
#                 driver.execute_script("arguments[0].click();", close_button)
               
#                 # Extract company information
#                 try:
#                     # Update selectors based on the new HTML structure
#                     company_name = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "div.job-detail__company--information .company-name a.name"))).text
#                     print(f"Tên công ty: {company_name}")

#                     company_scale = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "div.job-detail__company--information .company-scale .company-value"))).text
#                     print(f"Quy mô công ty: {company_scale}")

#                     company_address = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "div.job-detail__company--information .company-address .company-value"))).text
#                     print(f"Địa chỉ công ty: {company_address}")

#                     company_link = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "div.job-detail__company--link a"))).get_attribute("href")
#                     print(f"Trang công ty: {company_link}")
#                 except Exception as e:
#                     print(f"Không thể trích xuất thông tin công ty: {e}")

#             except (NoSuchElementException, TimeoutException) as e:
#                 print(f"Error processing job {index}: {str(e)}")
           
#             print("---")

#     except WebDriverException:
#         print("Trình duyệt đã đóng, đang khởi động lại...")
#         driver = webdriver.Edge()
#         wait = WebDriverWait(driver, 20)
#         # Tiếp tục từ đây
#     except Exception as e:
#         print(f"Đã xảy ra lỗi: {e}")
#     finally:
#         driver.quit()

# if __name__ == "__main__":
#     scrape_topcv()


In [None]:
# from selenium import webdriver
# from selenium.webdriver.common.by import By
# from selenium.webdriver.support.ui import WebDriverWait
# from selenium.webdriver.support import expected_conditions as EC
# from selenium.common.exceptions import TimeoutException, NoSuchElementException, WebDriverException
# import time
# import openpyxl
# import os

# def scrape_topcv():
#     driver = webdriver.Edge()
#     wait = WebDriverWait(driver, 20)

#     # Load the workbook or create a new one if it doesn't exist
#     try:
#         wb = openpyxl.load_workbook('topcv_jobs.xlsx')
#     except FileNotFoundError:
#         wb = openpyxl.Workbook()
    
#     ws = wb.active

#     # Add headers to the Excel sheet
#     headers = ['Thời gian đăng', 'Kinh nghiệm', 'Mức lương', 'Tên công ty', 'Quy mô công ty', 'Địa chỉ công ty', 'Trang công ty']
#     ws.append(headers)  # Add headers to the first row


#     try:
#         driver.get("https://www.topcv.vn/tim-viec-lam-ai-engineer")

#         job_listings = wait.until(EC.presence_of_all_elements_located((By.CLASS_NAME, "job-item-search-result")))
       
#         print(f"Số lượng công việc tìm thấy: {len(job_listings)}")
       
#         for index, job in enumerate(job_listings, 1):
#             try:
#                 print(f"Processing job {index}/{len(job_listings)}")
#                 posting_time = job.find_element(By.CSS_SELECTOR, "label.address.mobile-hidden.label-update").get_attribute("data-original-title")
#                 posting_time = posting_time.replace("Cập nhật ", "")
#                 print(f"Thời gian đăng: {posting_time}")
#                 ws[f'A{index}'] = posting_time  # Fill posting time into Excel
                
#                 # Attempt to click the quick view element
#                 try:
#                     quick_view_element = job.find_element(By.CLASS_NAME, "quick-view-job-detail")
#                     driver.execute_script("arguments[0].click();", quick_view_element)
#                 except NoSuchElementException:
#                     print("Không tìm thấy nút xem nhanh.")
               
               
#                         # Extract salary information
#                 try:
#                     salary = job.find_element(By.CSS_SELECTOR, "div.box-item-value[data-original-title$='triệu']").text
#                     print(f"Mức lương: {salary}")
#                     ws[f'H{index}'] = salary  # Fill salary into Excel
#                 except NoSuchElementException:
#                     print("Không tìm thấy thông tin về mức lương.")
#                     ws[f'H{index}'] = "Không có thông tin"  # Fill default value into Excel
               
#                 try:
#                     experience = job.find_element(By.CSS_SELECTOR, "div.box-item-value[data-original-title$='năm']").text
#                     print(f"Số năm kinh nghiệm: {experience}")
#                     ws[f'B{index}'] = experience  # Fill experience into Excel
#                 except NoSuchElementException:
#                     print("Không tìm thấy thông tin về số năm kinh nghiệm.")
#                     ws[f'B{index}'] = "Không có thông tin"  # Fill default value into Excel
                
#                 for section in ['Mô tả công việc', 'Yêu cầu ứng viên', 'Quyền lợi', 'Địa điểm làm việc', 'Thời gian làm việc']:
#                     try:
#                         content = wait.until(EC.presence_of_element_located((By.XPATH, f"//h3[contains(text(), '{section}')]/following-sibling::div[1]"))).text
#                         print(f"{section}: {content}")
#                         ws[f'C{index}'] = content  # Fill content into Excel
#                     except:
#                         print(f"Không tìm thấy thông tin về {section}.")
#                         ws[f'C{index}'] = "Không có thông tin"  # Fill default value into Excel
                

#                 # Extract company information
#                 try:
#                     # Update selectors based on the new HTML structure
#                     company_name = wait.until(EC.visibility_of_element_located((By.CSS_SELECTOR, "div.job-detail__company--information .company-name a.name"))).text
#                     print(f"Tên công ty: {company_name}")
#                     ws[f'D{index}'] = company_name  # Fill company name into Excel
 
#                     company_scale = wait.until(EC.visibility_of_element_located((By.CSS_SELECTOR, "div.job-detail__company--information .company-scale .company-value"))).text
#                     print(f"Quy mô công ty: {company_scale}")
#                     ws[f'E{index}'] = company_scale  # Fill company scale into Excel
 
#                     company_address = wait.until(EC.visibility_of_element_located((By.CSS_SELECTOR, "div.job-detail__company--information .company-address .company-value"))).text
#                     print(f"Địa chỉ công ty: {company_address}")
#                     ws[f'F{index}'] = company_address  # Fill company address into Excel
 
#                     company_link = wait.until(EC.visibility_of_element_located((By.CSS_SELECTOR, "div.job-detail__company--link a"))).get_attribute("href")
#                     print(f"Trang công ty: {company_link}")
#                     ws[f'G{index}'] = company_link  # Fill company link into Excel
#                 except NoSuchElementException as e:
#                     print(f"Không thể trích xuất thông tin công ty: Không tìm thấy phần tử - {e}")
#                     ws[f'D{index}'] = "Không có thông tin"  # Fill default value into Excel
#                 except TimeoutException as e:
#                     print(f"Không thể trích xuất thông tin công ty: Thời gian chờ đã hết - {e}")
#                     ws[f'D{index}'] = "Không có thông tin"  # Fill default value into Excel
#                 except Exception as e:
#                     print(f"Không thể trích xuất thông tin công ty: {e}")
#                     ws[f'D{index}'] = "Không có thông tin"  # Fill default value into Excel
                    
#                 close_button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, "button.btn-close-job-detail")))
#                 driver.execute_script("arguments[0].click();", close_button)  # Ensure the close button is clicked
                        
#             except (NoSuchElementException, TimeoutException) as e:
#                 print(f"Error processing job {index}: {str(e)}")
#                 ws[f'A{index}'] = "Không có thông tin"  # Fill default value into Excel

#             print("---")

#     except WebDriverException:
#         print("Trình duyệt đã đóng, đang khởi động lại...")
#         driver = webdriver.Edge()
#         wait = WebDriverWait(driver, 20)
#         # Tiếp tục từ đây
#     except Exception as e:
#         print(f"Đã xảy ra lỗi: {e}")
#     finally:
#         driver.quit()
#         try:
#             wb.save('topcv_jobs.xlsx')  # Attempt to save the workbook
#         except PermissionError:
#             print("Permission denied: The file is open. Please close it and try again.")
# if __name__ == "__main__":
#     scrape_topcv()




2 NÚT NÀY KO HOẠT ĐỘNG


<div class="box-info-header">
                    <div class="box-item-header">
                        <div class="box-item-value" data-container="body" data-toggle="tooltip" title="" data-placement="top" data-original-title="20 - 26 triệu">
                            20 - 26 triệu
                        </div>
                    </div>

                                            <div class="box-item-header">
                            <div class="box-item-value" data-container="body" data-toggle="tooltip" data-html="true" title="" data-placement="top" data-original-title="<p style='text-align: left'>Hà Nội: Cầu Giấy</p>">
                                Hà Nội
                            </div>
                        </div>
                    

                    <div class="box-item-header">
                        <div class="box-item-value" data-container="body" data-toggle="tooltip" title="" data-placement="top" data-original-title="2 năm">
                            2 năm
                        </div>
                    </div>
                </div>


#main > div.search-job > div:nth-child(4) > div.result-job-search > div > div > div.job-body.wrapper-main > div.col-md-12 > div > div.job-list-detail > div > div.box-header > div.header-normal-default > div.box-info-job > div.box-info-header > div:nth-child(1) > div

#main > div.search-job > div:nth-child(4) > div.result-job-search > div > div > div.job-body.wrapper-main > div.col-md-12 > div > div.job-list-detail > div > div.box-header > div.header-normal-default > div.box-info-job > div.box-info-header > div:nth-child(2) > div

#main > div.search-job > div:nth-child(4) > div.result-job-search > div > div > div.job-body.wrapper-main > div.col-md-12 > div > div.job-list-detail > div > div.box-header > div.header-normal-default > div.box-info-job > div.box-info-header > div:nth-child(3) > div