写一个爬取女神姐姐电影的的程序

爬取思路

我们需要一个磁力链接，可以搜索关键字的网址，比如说（磁力猪）
根据搜索结果页取出特殊标签所包函的字段
爬出的数据整理成一个种子文件
关闭程序

爬取效果

主要代码，爬取数据

def getMianUrl(receiveUrl):
    global findResult
    findResult = False
    browser.get(receiveUrl)
    time.sleep(1.5)

    try:
        zhongZiObj = BeautifulSoup(browser.page_source, 'lxml')
        # print(zhongZiObj)
        torroentDiv = zhongZiObj.find('div', class_='btsowlist')

        if not torroentDiv is None:
            findResult = True
            print("****************", len(torroentDiv))
            allDivs = torroentDiv.find_all("div", class_='row')
            for div in allDivs:
                if not div is None:
                    global result
                    torroentUrl = div.find('a')['href']
                    print('find url ', torroentUrl)
                    torroent = "magnet:?xt=urn:btih:%s" % (torroentUrl[len("http://www.cilizhu2.com/magnet/"):])[:-5]
                    print('find torroent ', torroent)
                    result = result + torroent + "\n"
                    # tkinter.Label(top, text=torroent).pack()
                    # finalTorroent(torroent)
        else:
            print("没有找到相关信息!请重试！！！")
    except:
        print("出现异常")
    finally:
        browser.close()

主要代码，文件写入

def writeDown():
    if findResult == True:
        print('name', str(searchName))
        fileName = str(searchName) + '.js'
        fo = open(fileName, 'a+')
        fo.write(result + '\n')
        fo.close()

友情提示，需要自己安装依赖库环境

也就两个，BeautifulSoup, webdriver

from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.idea		.idea
020913-260.js		020913-260.js
021017_003.js		021017_003.js
032312-302.js		032312-302.js
040613-307.js		040613-307.js
051013-334.js		051013-334.js
061315_01.js		061315_01.js
071815-923.js		071815-923.js
081117-477.js		081117-477.js
091915-974.js		091915-974.js
102115-004.js		102115-004.js
110315-014.js		110315-014.js
111512-184.js		111512-184.js
259LUXU-603.js		259LUXU-603.js
259LUXU-831.js		259LUXU-831.js
259LUXU-891.js		259LUXU-891.js
4017-175.js		4017-175.js
ABP-171.js		ABP-171.js
ABP-174.js		ABP-174.js
ABP-228.js		ABP-228.js
ABP-408.js		ABP-408.js
ABP-440.js		ABP-440.js
ABP-505.js		ABP-505.js
ABP-521.js		ABP-521.js
ABP-601.js		ABP-601.js
ABP041.js		ABP041.js
ABS-100.js		ABS-100.js
ABS-128.js		ABS-128.js
ABS-147.js		ABS-147.js
ABS-206.js		ABS-206.js
ADN-014.js		ADN-014.js
ADN-104.js		ADN-104.js
ADN-131.js		ADN-131.js
ADN-134.js		ADN-134.js
ADZ-294.js		ADZ-294.js
AKA-038.js		AKA-038.js
AP-066.js		AP-066.js
APNS-031.js		APNS-031.js
AQSH-010.js		AQSH-010.js
AVOP-039.js		AVOP-039.js
AVOP-354.js		AVOP-354.js
AVOP-370.js		AVOP-370.js
BBI-163.js		BBI-163.js
BEB-017.js		BEB-017.js
BEB-076.js		BEB-076.js
CESD-507.js		CESD-507.js
CWM-224.js		CWM-224.js
CWPBD-165.js		CWPBD-165.js
DANDY-386.js		DANDY-386.js
DASD-394.js		DASD-394.js
DDK-134.js		DDK-134.js
DKDN-034.js		DKDN-034.js
DVAJ-300.js		DVAJ-300.js
EBOD-339.js		EBOD-339.js
EBOD-431.js		EBOD-431.js
EBOD-481.js		EBOD-481.js
EBOD-597.js		EBOD-597.js
EYAN-046.js		EYAN-046.js
FSET-339.js		FSET-339.js
FSET-416.js		FSET-416.js
FSET-459.js		FSET-459.js
FSET-609.js		FSET-609.js
FSET-633.js		FSET-633.js
FSET-708.js		FSET-708.js
GG-240.js		GG-240.js
GRGR-027.js		GRGR-027.js
GVG-122.js		GVG-122.js
GVG-126.js		GVG-126.js
GVG-168.js		GVG-168.js
HAR-073.js		HAR-073.js
HAVD-925.js		HAVD-925.js
HAWA-049.js		HAWA-049.js
HEYZO-0922.js		HEYZO-0922.js
HEYZO-1245.js		HEYZO-1245.js
HEYZO-1293.js		HEYZO-1293.js
HEYZO0922.js		HEYZO0922.js
HEYZO0923.js		HEYZO0923.js
HODV-21033.js		HODV-21033.js
HUNTA-116.js		HUNTA-116.js
HUNTA-309.js		HUNTA-309.js
IPX-017.js		IPX-017.js
IPX-055.js		IPX-055.js
IPX-075.js		IPX-075.js
IPZ-462.js		IPZ-462.js
IPZ-742.js		IPZ-742.js
IPZ-754.js		IPZ-754.js
IPZ-771.js		IPZ-771.js
IPZ-808.js		IPZ-808.js
IPZ-854.js		IPZ-854.js
IPZ-891.js		IPZ-891.js
IPZ-985.js		IPZ-985.js
IPZ-986.js		IPZ-986.js
IPZ-990.js		IPZ-990.js
IPZ293.js		IPZ293.js
IPZ959.js		IPZ959.js
JAN-023.js		JAN-023.js
JUFD-409.js		JUFD-409.js
JUFD-716.js		JUFD-716.js
JUX-188.js		JUX-188.js
JUX-565.js		JUX-565.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

写一个爬取女神姐姐电影的的程序

爬取思路

爬取效果

主要代码，爬取数据

主要代码，文件写入

友情提示，需要自己安装依赖库环境

About

Releases

Packages

Languages

mrjlovetian/SearchChili

Folders and files

Latest commit

History

Repository files navigation

写一个爬取女神姐姐电影的的程序

爬取思路

爬取效果

主要代码，爬取数据

主要代码，文件写入

友情提示，需要自己安装依赖库环境

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages