In [1]:
#!/usr/bin/env python
# -*- coding: UTF-8 -*-

import codecs
import csv
import os
import random
import re
import sys
import traceback
from datetime import datetime, timedelta
from time import sleep

import requests
from lxml import etree
from tqdm import tqdm


class Weibo:
    cookie = {"Cookie": "_T_WM=34550083112; ALF=1562152263; SCF=AnGyG-CPJOu0E8mQC7DKMw6sWTk4PepmbaZnhQVHU-UopRZpG6la_nAxZbe02hrJgoeohB0seMHdWhQSbhAxGRI.; SUB=_2A25x8XAYDeRhGeBI41IZ8izEyTmIHXVTGhBQrDV6PUNbktAKLUf4kW1NRmUjrqDxphVR7MAYn2B39cke9M2iHZRM; SUBP=0033WrSXqPxfM725Ws9jqgMF55529P9D9WFfExMGUmnLny1Q6fiahGQn5JpX5KzhUgL.Foqc1h5ReozReo-2dJLoIpqpSEH8SCHFeC-RBK.7i--fiK.7iKy8; SUHB=04WePn5yU8hTpy; SSOLoginState=1559560264; MLOGIN=1; M_WEIBOCN_PARAMS=lfid%3D102803_ctg1_4288_-_ctg1_4288%26luicode%3D20000174"}  # 将your cookie替换成自己的cookie

    def __init__(self, user_id, filter=0):
        """Weibo类初始化"""
        self.user_id = 1669879400  # 用户id，即需要我们输入的数字，如昵称为“Dear-迪丽热巴”的id为1669879400
        self.filter = filter  # 取值范围为0、1，程序默认值为0，代表要爬取用户的全部微博，1代表只爬取用户的原创微博
        self.nickname = ""  # 用户昵称，如“Dear-迪丽热巴”
        self.weibo_num = 0  # 用户全部微博数
        self.got_num = 0  # 爬取到的微博数
        self.following = 0  # 用户关注数
        self.followers = 0  # 用户粉丝数
        self.weibo_id = []  # 微博id
        self.weibo_content = []  # 微博内容
        self.weibo_place = []  # 微博位置
        self.publish_time = []  # 微博发布时间
        self.up_num = []  # 微博对应的点赞数
        self.retweet_num = []  # 微博对应的转发数
        self.comment_num = []  # 微博对应的评论数
        self.publish_tool = []  # 微博发布工具

    def deal_html(self, url):
        """处理html"""
        try:
            html = requests.get(url, cookies=self.cookie).content
            selector = etree.HTML(html)
            return selector
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def deal_garbled(self, info):
        """处理乱码"""
        try:
            info = (info.xpath("string(.)").replace(u"\u200b", "").encode(
                sys.stdout.encoding, "ignore").decode(sys.stdout.encoding))
            return info
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_nickname(self):
        """获取用户昵称"""
        try:
            url = "https://weibo.cn/%d/info" % (self.user_id)
            selector = self.deal_html(url)
            nickname = selector.xpath("//title/text()")[0]
            self.nickname = nickname[:-3]
            if self.nickname == u"登录 - 新":
                sys.exit(u"cookie错误或已过期,请按照README中方法重新获取")
            print(u"用户昵称: " + self.nickname)
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_user_info(self, selector):
        """获取用户昵称、微博数、关注数、粉丝数"""
        try:
            self.get_nickname()  # 获取用户昵称
            user_info = selector.xpath("//div[@class='tip2']/*/text()")

            self.weibo_num = int(user_info[0][3:-1])
            print(u"微博数: " + str(self.weibo_num))

            self.following = int(user_info[1][3:-1])
            print(u"关注数: " + str(self.following))

            self.followers = int(user_info[2][3:-1])
            print(u"粉丝数: " + str(self.followers))
            print("*" * 100)
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_page_num(self, selector):
        """获取微博总页数"""
        try:
            if selector.xpath("//input[@name='mp']") == []:
                page_num = 1
            else:
                page_num = (int)(
                    selector.xpath("//input[@name='mp']")[0].attrib["value"])
            return page_num
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_long_weibo(self, weibo_link):
        """获取长原创微博"""
        try:
            selector = self.deal_html(weibo_link)
            info = selector.xpath("//div[@class='c']")[1]
            wb_content = self.deal_garbled(info)
            wb_time = info.xpath("//span[@class='ct']/text()")[0]
            wb_content = wb_content[wb_content.find(":") +
                                    1:wb_content.rfind(wb_time)]
            return wb_content
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_original_weibo(self, info, weibo_id):
        """获取原创微博"""
        try:
            weibo_content = self.deal_garbled(info)
            weibo_content = weibo_content[:weibo_content.rfind(u"赞")]
            a_text = info.xpath("div//a/text()")
            if u"全文" in a_text:
                weibo_link = "https://weibo.cn/comment/" + weibo_id
                wb_content = self.get_long_weibo(weibo_link)
                if wb_content:
                    weibo_content = wb_content
            return weibo_content
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_long_retweet(self, weibo_link):
        """获取长转发微博"""
        try:
            wb_content = self.get_long_weibo(weibo_link)
            wb_content = wb_content[:wb_content.rfind(u"原文转发")]
            return wb_content
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_retweet(self, info, weibo_id):
        """获取转发微博"""
        try:
            original_user = info.xpath("div/span[@class='cmt']/a/text()")
            if not original_user:
                wb_content = u"转发微博已被删除"
                return wb_content
            else:
                original_user = original_user[0]
            wb_content = self.deal_garbled(info)
            wb_content = wb_content[wb_content.find(":") +
                                    1:wb_content.rfind(u"赞")]
            wb_content = wb_content[:wb_content.rfind(u"赞")]
            a_text = info.xpath("div//a/text()")
            if u"全文" in a_text:
                weibo_link = "https://weibo.cn/comment/" + weibo_id
                weibo_content = self.get_long_retweet(weibo_link)
                if weibo_content:
                    wb_content = weibo_content
            retweet_reason = self.deal_garbled(info.xpath("div")[-1])
            retweet_reason = retweet_reason[:retweet_reason.rindex(u"赞")]
            wb_content = (retweet_reason + "\n" + u"原始用户: " + original_user +
                          "\n" + u"转发内容: " + wb_content)
            return wb_content
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_weibo_content(self, info):
        """获取微博内容"""
        try:
            weibo_id = info.xpath("@id")[0][2:]
            self.weibo_id.append(weibo_id)
            is_retweet = info.xpath("div/span[@class='cmt']")
            if is_retweet:
                weibo_content = self.get_retweet(info, weibo_id)
            else:
                weibo_content = self.get_original_weibo(info, weibo_id)
            self.weibo_content.append(weibo_content)
            print(weibo_content)
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_weibo_place(self, info):
        """获取微博发布位置"""
        try:
            div_first = info.xpath("div")[0]
            a_list = div_first.xpath("a")
            weibo_place = u"无"
            for a in a_list:
                if ("place.weibo.com" in a.xpath("@href")[0]
                        and a.xpath("text()")[0] == u"显示地图"):
                    weibo_a = div_first.xpath("span[@class='ctt']/a")
                    if len(weibo_a) >= 1:
                        weibo_place = weibo_a[-1]
                        if (u"视频" == div_first.xpath(
                                "span[@class='ctt']/a/text()")[-1][-2:]):
                            if len(weibo_a) >= 2:
                                weibo_place = weibo_a[-2]
                            else:
                                weibo_place = u"无"
                        weibo_place = self.deal_garbled(weibo_place)
                        break
            self.weibo_place.append(weibo_place)
            print(u"微博位置: " + weibo_place)
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_publish_time(self, info):
        """获取微博发布时间"""
        try:
            str_time = info.xpath("div/span[@class='ct']")
            str_time = self.deal_garbled(str_time[0])
            publish_time = str_time.split(u"来自")[0]
            if u"刚刚" in publish_time:
                publish_time = datetime.now().strftime("%Y-%m-%d %H:%M")
            elif u"分钟" in publish_time:
                minute = publish_time[:publish_time.find(u"分钟")]
                minute = timedelta(minutes=int(minute))
                publish_time = (datetime.now() -
                                minute).strftime("%Y-%m-%d %H:%M")
            elif u"今天" in publish_time:
                today = datetime.now().strftime("%Y-%m-%d")
                time = publish_time[3:]
                publish_time = today + " " + time
            elif u"月" in publish_time:
                year = datetime.now().strftime("%Y")
                month = publish_time[0:2]
                day = publish_time[3:5]
                time = publish_time[7:12]
                publish_time = year + "-" + month + "-" + day + " " + time
            else:
                publish_time = publish_time[:16]
            self.publish_time.append(publish_time)
            print(u"微博发布时间: " + publish_time)
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_publish_tool(self, info):
        """获取微博发布工具"""
        try:
            str_time = info.xpath("div/span[@class='ct']")
            str_time = self.deal_garbled(str_time[0])
            if len(str_time.split(u"来自")) > 1:
                publish_tool = str_time.split(u"来自")[1]
            else:
                publish_tool = u"无"
            self.publish_tool.append(publish_tool)
            print(u"微博发布工具: " + publish_tool)
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_weibo_footer(self, info):
        """获取微博点赞数、转发数、评论数"""
        try:
            pattern = r"\d+"
            str_footer = info.xpath("div")[-1]
            str_footer = self.deal_garbled(str_footer)
            str_footer = str_footer[str_footer.rfind(u"赞"):]
            weibo_footer = re.findall(pattern, str_footer, re.M)

            up_num = int(weibo_footer[0])
            self.up_num.append(up_num)
            print(u"点赞数: " + str(up_num))

            retweet_num = int(weibo_footer[1])
            self.retweet_num.append(retweet_num)
            print(u"转发数: " + str(retweet_num))

            comment_num = int(weibo_footer[2])
            self.comment_num.append(comment_num)
            print(u"评论数: " + str(comment_num))
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_one_page(self, page):
        """获取第page页的全部微博"""
        try:
            url = "https://weibo.cn/u/%d?page=%d" % (self.user_id, page)
            selector = self.deal_html(url)
            info = selector.xpath("//div[@class='c']")
            is_empty = info[0].xpath("div/span[@class='ctt']")
            if is_empty:
                for i in range(0, len(info) - 2):
                    is_retweet = info[i].xpath("div/span[@class='cmt']")
                    if (not self.filter) or (not is_retweet):
                        self.get_weibo_content(info[i])  # 微博内容
                        self.get_weibo_place(info[i])  # 微博位置
                        self.get_publish_time(info[i])  # 微博发布时间
                        self.get_publish_tool(info[i])  # 微博发布工具
                        self.get_weibo_footer(info[i])  # 微博点赞数、转发数、评论数
                        self.got_num += 1
                        print("-" * 100)
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def get_filepath(self, type):
        """获取结果文件路径"""
        try:
            file_dir = os.path.split(
                os.path.realpath(__file__))[0] + os.sep + "weibo"
            if not os.path.isdir(file_dir):
                os.mkdir(file_dir)
            file_path = file_dir + os.sep + "%d" % self.user_id + "." + type
            return file_path
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def write_csv(self, wrote_num):
        """将爬取的信息写入csv文件"""
        try:
            result_headers = [
                "微博id",
                "微博正文",
                "发布位置",
                "发布时间",
                "发布工具",
                "点赞数",
                "转发数",
                "评论数",
            ]
            result_data = zip(
                self.weibo_id[wrote_num:],
                self.weibo_content[wrote_num:],
                self.weibo_place[wrote_num:],
                self.publish_time[wrote_num:],
                self.publish_tool[wrote_num:],
                self.up_num[wrote_num:],
                self.retweet_num[wrote_num:],
                self.comment_num[wrote_num:],
            )
            if sys.version < "3":  # python2.x
                reload(sys)
                sys.setdefaultencoding("utf-8")
                with open(self.get_filepath("csv"), "ab") as f:
                    f.write(codecs.BOM_UTF8)
                    writer = csv.writer(f)
                    if wrote_num == 0:
                        writer.writerows([result_headers])
                    writer.writerows(result_data)
            else:  # python3.x
                with open(self.get_filepath("csv"),
                          "a",
                          encoding="utf-8-sig",
                          newline="") as f:
                    writer = csv.writer(f)
                    if wrote_num == 0:
                        writer.writerows([result_headers])
                    writer.writerows(result_data)
            print(u"%d条微博写入csv文件完毕,保存路径:" % self.got_num)
            print(self.get_filepath("csv"))
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def write_txt(self, wrote_num):
        """将爬取的信息写入txt文件"""
        try:
            temp_result = []
            if wrote_num == 0:
                if self.filter:
                    result_header = u"\n\n原创微博内容: \n"
                else:
                    result_header = u"\n\n微博内容: \n"
                result_header = (u"用户信息\n用户昵称：" + self.nickname + u"\n用户id: " +
                                 str(self.user_id) + u"\n微博数: " +
                                 str(self.weibo_num) + u"\n关注数: " +
                                 str(self.following) + u"\n粉丝数: " +
                                 str(self.followers) + result_header)
                temp_result.append(result_header)
            for i in range(wrote_num, self.got_num):
                temp_result.append(
                    str(i + 1) + ":" + self.weibo_content[i] + "\n" +
                    u"微博位置: " + self.weibo_place[i] + "\n" + u"发布时间: " +
                    self.publish_time[i] + "\n" + u"点赞数: " +
                    str(self.up_num[i]) + u"   转发数: " +
                    str(self.retweet_num[i]) + u"   评论数: " +
                    str(self.comment_num[i]) + "\n" + u"发布工具: " +
                    self.publish_tool[i] + "\n\n")
            result = "".join(temp_result)
            with open(self.get_filepath("txt"), "ab") as f:
                f.write(result.encode(sys.stdout.encoding))
            print(u"%d条微博写入txt文件完毕,保存路径:" % self.got_num)
            print(self.get_filepath("txt"))
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def write_file(self, wrote_num):
        """写文件"""
        if self.got_num > wrote_num:
            self.write_csv(wrote_num)
            self.write_txt(wrote_num)

    def get_weibo_info(self):
        """获取微博信息"""
        try:
            url = "https://weibo.cn/u/%d" % (self.user_id)
            selector = self.deal_html(url)
            self.get_user_info(selector)  # 获取用户昵称、微博数、关注数、粉丝数
            page_num = self.get_page_num(selector)  # 获取微博总页数
            wrote_num = 0
            page1 = 0
            random_pages = random.randint(1, 5)
            for page in tqdm(range(1, page_num + 1), desc=u"进度"):
                self.get_one_page(page)  # 获取第page页的全部微博

                if page % 20 == 0:  # 每爬20页写入一次文件
                    self.write_file(wrote_num)
                    wrote_num = self.got_num

                # 通过加入随机等待避免被限制。爬虫速度过快容易被系统限制(一段时间后限
                # 制会自动解除)，加入随机等待模拟人的操作，可降低被系统限制的风险。默
                # 认是每爬取1到5页随机等待6到10秒，如果仍然被限，可适当增加sleep时间
                if page - page1 == random_pages:
                    sleep(random.randint(6, 10))
                    page1 = page
                    random_pages = random.randint(1, 5)

            self.write_file(wrote_num)  # 将剩余不足20页的微博写入文件
            if not self.filter:
                print(u"共爬取" + str(self.got_num) + u"条微博")
            else:
                print(u"共爬取" + str(self.got_num) + u"条原创微博")
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()

    def start(self):
        """运行爬虫"""
        try:
            self.get_weibo_info()
            print(u"信息抓取完毕")
            print("*" * 100)
        except Exception as e:
            print("Error: ", e)
            traceback.print_exc()


def main():
    try:
        # 使用实例,输入一个用户id，所有信息都会存储在wb实例中
        user_id = 1669879400  # 可以改成任意合法的用户id（爬虫的微博id除外）
        filter = 1  # 值为0表示爬取全部微博（原创微博+转发微博），值为1表示只爬取原创微博
        wb = Weibo(user_id, filter)  # 调用Weibo类，创建微博实例wb
        wb.start()  # 爬取微博信息
        print(u"用户昵称: " + wb.nickname)
        print(u"全部微博数: " + str(wb.weibo_num))
        print(u"关注数: " + str(wb.following))
        print(u"粉丝数: " + str(wb.followers))
        if wb.weibo_content:
            print(u"最新/置顶 微博为: " + wb.weibo_content[0])
            print(u"最新/置顶 微博位置: " + wb.weibo_place[0])
            print(u"最新/置顶 微博发布时间: " + wb.publish_time[0])
            print(u"最新/置顶 微博获得赞数: " + str(wb.up_num[0]))
            print(u"最新/置顶 微博获得转发数: " + str(wb.retweet_num[0]))
            print(u"最新/置顶 微博获得评论数: " + str(wb.comment_num[0]))
            print(u"最新/置顶 微博发布工具: " + wb.publish_tool[0])
    except Exception as e:
        print("Error: ", e)
        traceback.print_exc()


if __name__ == "__main__":
    main()

用户昵称: Dear-迪丽热巴
微博数: 1001
关注数: 222
粉丝数: 63192328
****************************************************************************************************


进度:   0%|                                                                                      | 0/101 [00:00<?, ?it/s]

这一年，做自己。不要停下努力的步伐。  原图 
微博位置: 无
微博发布时间: 2019-06-03 20:04
微博发布工具: 无
点赞数: 481129
转发数: 984013
评论数: 117614
----------------------------------------------------------------------------------------------------
今天是我的生日，来祝福我吧！  
微博位置: 无
微博发布时间: 2019-06-03 00:30
微博发布工具: 生日动态
点赞数: 378741
转发数: 215923
评论数: 93123
----------------------------------------------------------------------------------------------------
27岁[红桃]️第一次有这么多人陪我一起过生日我真的特别特别感谢台前幕后的所有工作人员，还有你们我的阿丝儿，有人问为啥27岁要办生日会，因为2.7～只有87你们会懂[红桃]️  [组图共6张] 原图 
微博位置: 无
微博发布时间: 2019-06-01 23:23
微博发布工具: 无
点赞数: 579819
转发数: 664567
评论数: 169946
----------------------------------------------------------------------------------------------------
#迪丽热巴生日会# 热·爱️终于实现了承诺，紧张～（来自@Dear-迪丽热巴 的一直播）APP下载地址：http://t.cn/RDUuslr  
微博位置: 无
微博发布时间: 2019-06-01 18:00
微博发布工具: 一直播Yi
点赞数: 189720
转发数: 13644
评论数: 58582
----------------------------------------------------------------------------------------------------
看到你们在乖乖排队偷拍了一下一会儿见阿丝儿们  原图 
微博位置: 无
微博发布时间: 2019-06-01 16:25

进度:   1%|▊                                                                             | 1/101 [00:01<02:47,  1.68s/it]

终于完成了26岁的愿望了哦 Dear-迪丽热巴的微博视频  
微博位置: 无
微博发布时间: 2019-05-19 22:22
微博发布工具: 无
点赞数: 349469
转发数: 1000000
评论数: 203103
----------------------------------------------------------------------------------------------------
爱丽丝们行行好 别再催了好不好  原图 
微博位置: 无
微博发布时间: 2019-05-19 18:58
微博发布工具: 无
点赞数: 386111
转发数: 1000000
评论数: 213281
----------------------------------------------------------------------------------------------------
等你来我的生日会  Dear-迪丽热巴的秒拍视频  
微博位置: 无
微博发布时间: 2019-05-16 10:25
微博发布工具: 无
点赞数: 416471
转发数: 1000000
评论数: 353645
----------------------------------------------------------------------------------------------------
#极限挑战# 让我们相约在明日的东方卫视，让我们看起那些令迪头大的瞬间，只是捡完这袋垃圾，我不一定会娶你。  [组图共4张] 原图 
微博位置: 无
微博发布时间: 2019-05-11 18:34
微博发布工具: 无
点赞数: 389271
转发数: 1000000
评论数: 308381
----------------------------------------------------------------------------------------------------
Pick全新#YSL反转巴黎#花溢香水，可甜可酷，敢来接受这次反转挑战吗？  [组图共4张] 原图 
微博位置: 无
微博发布时间: 2019-05-02 08:05
微博发布工具: 无
点赞数: 478053
转发数: 1000000
评论数: 370273

进度:   2%|█▌                                                                            | 2/101 [00:02<02:10,  1.32s/it]

收工[蓝心]🖤想吃拉面[面条]  原图 
微博位置: 无
微博发布时间: 2019-05-01 23:29
微博发布工具: 无
点赞数: 495485
转发数: 1000000
评论数: 314843
----------------------------------------------------------------------------------------------------
时尚并非遥远星河触不可及你每天的样子，都是特别存在！@Mytheresa 为你pick#每日时尚甜心# ，让你成为最时尚的#MY女孩#http://t.cn/ESLC4vf  原图 
微博位置: 无
微博发布时间: 2019-04-29 12:43
微博发布工具: 无
点赞数: 342081
转发数: 1000000
评论数: 204949
----------------------------------------------------------------------------------------------------
#新青年耀青春##我宣誓你接力#激荡未来，壮志在我；青春万岁，强国有我！ @中国青年报 @中国青年网 @湖南卫视 Dear-迪丽热巴的秒拍视频  
微博位置: 无
微博发布时间: 2019-04-26 20:32
微博发布工具: 无
点赞数: 235700
转发数: 1000000
评论数: 314481
----------------------------------------------------------------------------------------------------
感谢@angelica张宇 @VogueMe 的邀请，祝VogueMe三周年快乐！今晚我们都是CoolPeople！  [组图共4张] 原图 
微博位置: 无
微博发布时间: 2019-04-19 23:47
微博发布工具: 无
点赞数: 359435
转发数: 1000000
评论数: 243133
----------------------------------------------------------------------------------------------------
快来#走进香奈儿展览# 打卡拍美照

进度:   3%|██▎                                                                           | 3/101 [00:08<04:38,  2.85s/it]

祝@VogueMe  三周年生日快乐！#年轻就是不惧##VogueMeCoolPeople酷枇杷# 4月19日，一起酷玩～  @angelica张宇  原图 
微博位置: 无
微博发布时间: 2019-04-16 16:55
微博发布工具: 无
点赞数: 232110
转发数: 711389
评论数: 113992
----------------------------------------------------------------------------------------------------
赤诚壮志在我胸，奋斗争先锋，幸运是努力到拼就开始起作用，看少年多英雄！我是#创造营2019#男团发起人迪丽热巴，我宣布创造营2019主题曲#喊出我的名字挑战赛#正式开始，不服来战，call me call my name！第一次挑战男团舞，真的不简单快来接受本发起人的挑战吧 迪丽热巴版主题曲《喊出我的名字》，发起人太帅了！  
微博位置: 无
微博发布时间: 2019-04-12 10:03
微博发布工具: 无
点赞数: 442490
转发数: 1000000
评论数: 148677
----------------------------------------------------------------------------------------------------
旋转跳跃 我闭着眼  [组图共7张] 原图 
微博位置: 无
微博发布时间: 2019-04-11 12:05
微博发布工具: 无
点赞数: 524954
转发数: 1000000
评论数: 277745
----------------------------------------------------------------------------------------------------
托个腮都是爱你们的形状[红桃]️  [组图共2张] 原图 
微博位置: 无
微博发布时间: 2019-04-06 15:04
微博发布工具: 无
点赞数: 749051
转发数: 1000000
评论数: 367020
--------------------------------------------------------------------------------

进度:   4%|███                                                                           | 4/101 [00:09<03:34,  2.22s/it]

和我一起热血助威#2019FE电动方程式#[加油][加油][加油]  原图 
微博位置: 无
微博发布时间: 2019-03-23 13:57
微博发布工具: 无
点赞数: 248163
转发数: 1000000
评论数: 353906
----------------------------------------------------------------------------------------------------
哇！！谢谢红雷哥 @孙红雷 ！！！！我打的字超出太多只能发图片了我会努力的[加油][加油][加油]  原图 
微博位置: 无
微博发布时间: 2019-03-15 22:14
微博发布工具: 无
点赞数: 552422
转发数: 1000000
评论数: 571393
----------------------------------------------------------------------------------------------------
今天是#世界野生动植物日# ，大海是无数可爱生物的家，也养育着全球数十亿的人口。珍存海洋生物的独特魅力，需要大家的共同关注。每行动一小步，便离我们憧憬的世界更近一步——野生生物在健康的陆地上和海洋中生生不息，人类崇尚和热爱地球生命的多样性及完整性，并受益其中。@WCS野生生物保护学会  原图 
微博位置: 无
微博发布时间: 2019-03-03 10:56
微博发布工具: OPPO随光而变R17 Pro
点赞数: 268609
转发数: 1000000
评论数: 280922
----------------------------------------------------------------------------------------------------
#OPEN UP打开真我#  努力改变，只是不想输给自己；努力出发，只是想饱览终点前的精彩；现在，我要和@Garmin官方微博  一起去挑战，去冒险，去探索未知的自己。#热巴与Garmin带你型动#  [组图共6张] 原图 
微博位置: 无
微博发布时间: 2019-03-01 12:03
微博发布工具: OPPO随光而变R17 Pro
点赞数: 381986
转发数: 1000000
评论数: 4

进度:   5%|███▊                                                                          | 5/101 [00:10<02:49,  1.76s/it]

快跟我一起精彩#起.范儿#，秘诀都在@QINA亓那眼镜 Dear-迪丽热巴的秒拍视频  
微博位置: 无
微博发布时间: 2019-02-21 10:49
微博发布工具: OPPO随光而变R17 Pro
点赞数: 444763
转发数: 1000000
评论数: 1000000
----------------------------------------------------------------------------------------------------
#情人节这样过#大家情人节快乐，请快乐女孩独自美丽，莫要安排，谢谢大家！  [组图共6张] 原图 
微博位置: 无
微博发布时间: 2019-02-14 17:49
微博发布工具: OPPO随光而变R17 Pro
点赞数: 1137327
转发数: 1000000
评论数: 1000000
----------------------------------------------------------------------------------------------------
#新年心祝福#祝大家新年快乐！！！2019我们继续朝着梦想的方向加油哇！！！[强壮][强壮][强壮]  [组图共3张] 原图 
微博位置: 无
微博发布时间: 2019-02-05 08:55
微博发布工具: OPPO随光而变R17 Pro
点赞数: 595857
转发数: 1000000
评论数: 1000000
----------------------------------------------------------------------------------------------------
明星动态  
微博位置: 无
微博发布时间: 2019-02-04 21:00
微博发布工具: 明星动态
点赞数: 253306
转发数: 60905
评论数: 300886
----------------------------------------------------------------------------------------------------
本胖迪的2019祝福来啦～请大家接收新年祝大家事事顺心，开心每一天～我与@让红包飞 也给大家的准备了一份#新春锦鲤#红包哦～关

进度:   6%|████▋                                                                         | 6/101 [00:10<02:12,  1.40s/it]

  [组图共4张] 原图 
微博位置: 无
微博发布时间: 2019-01-23 18:25
微博发布工具: OPPO随光而变R17 Pro
点赞数: 659278
转发数: 1000000
评论数: 1000000
----------------------------------------------------------------------------------------------------
答应我要用新造型来迎接新年鸭出镜率很高的YEEZY小白鞋是我搭配的秘密武器#新年YEEZY搭新衣# @adidasOriginals[向右]http://t.cn/E5VnM0f  [组图共3张] 原图 
微博位置: 无
微博发布时间: 2019-01-20 10:02
微博发布工具: OPPO随光而变R17 Pro
点赞数: 390185
转发数: 1000000
评论数: 500677
----------------------------------------------------------------------------------------------------
#良品铺子迪丽热巴#这是一条很好吃的微博大大的坚果、鲜嫩的海味还有自然的果干果脯，哪个是你们的最爱呢？今天下午五点，关注@良品铺子  微博直播，邀请大家和我一起探秘高端零食箱！等你们来哦～  原图 
微博位置: 无
微博发布时间: 2019-01-19 09:00
微博发布工具: OPPO随光而变R17 Pro
点赞数: 205296
转发数: 348320
评论数: 128556
----------------------------------------------------------------------------------------------------
清晨午后黄昏的巴黎，一直是我记忆中最美的瞬间，#YSL反转巴黎# 想要抓住我吗？ #CatchMyHeart#  [组图共4张] 原图 
微博位置: 无
微博发布时间: 2019-01-17 09:30
微博发布工具: OPPO随光而变R17 Pro
点赞数: 530714
转发数: 1000000
评论数: 597923
-----------------------------------

进度:   7%|█████▍                                                                        | 7/101 [00:19<05:37,  3.59s/it]

送走2018，喜提2019！新的一年，我们要为自己#2019家满活力#，认准梦的方向，热情浓厚绽放光芒！大家快去转发@活力伊利 置顶微博，把你们的成长心愿告诉我们吧！2019，冲鸭！  原图 
微博位置: 无
微博发布时间: 2019-01-04 10:07
微博发布工具: OPPO随光而变R17 Pro
点赞数: 211669
转发数: 82991
评论数: 271446
----------------------------------------------------------------------------------------------------
给2019一个眼神，希望能懂我～ 微博视频  
微博位置: 无
微博发布时间: 2019-01-02 18:59
微博发布工具: 微博视频
点赞数: 286570
转发数: 1000000
评论数: 380384
----------------------------------------------------------------------------------------------------
2019年，6000万位我的我们一起努力鸭 #你好2019##2019新年好#  [组图共3张] 原图 
微博位置: 无
微博发布时间: 2019-01-01 11:00
微博发布工具: OPPO随光而变R17 Pro
点赞数: 664941
转发数: 1000000
评论数: 1000000
----------------------------------------------------------------------------------------------------
想要肌肤紧致保持年轻，究竟要不要听从各种不成“纹”规定呢？不用纠结，欧莱雅紫熨斗全脸眼霜就是有让我肌肤不成“纹”的实力，让我们一起#挑战不成纹# Dear-迪丽热巴的微博视频  
微博位置: 无
微博发布时间: 2018-12-30 15:38
微博发布工具: OPPO随光而变R17 Pro
点赞数: 188720
转发数: 43192
评论数: 59749
------------------------------------------------------------------------

进度:   8%|██████▏                                                                       | 8/101 [00:19<04:05,  2.64s/it]

#大V现场# #爱豆锦鲤月# 给爱丽丝们的直播[爱心]  微博直播  
微博位置: 无
微博发布时间: 2018-12-18 18:59
微博发布工具: OPPO随光而变R17 Pro
点赞数: 165134
转发数: 12317
评论数: 183129
----------------------------------------------------------------------------------------------------
2018快过去咯 还有啥今年想做的事情没有做完哦#爱豆锦鲤月#  [组图共2张] 原图 
微博位置: 无
微博发布时间: 2018-12-17 19:41
微博发布工具: OPPO随光而变R17 Pro
点赞数: 318162
转发数: 1000000
评论数: 270937
----------------------------------------------------------------------------------------------------
#卓诗尼20周年#妮妮20周岁生日趴，我们给大家准备了小礼物，大家快去掏妮妮的兜！  原图 
微博位置: 无
微博发布时间: 2018-12-11 16:28
微博发布工具: OPPO随光而变R17 Pro
点赞数: 209554
转发数: 190830
评论数: 52906
----------------------------------------------------------------------------------------------------
好了 以后自拍都是这种了  原图 
微博位置: 无
微博发布时间: 2018-12-09 10:33
微博发布工具: OPPO随光而变R17 Pro
点赞数: 402138
转发数: 1000000
评论数: 163430
----------------------------------------------------------------------------------------------------
分享图片  原图 
微博位置: 无
微博发布时间: 2018-12-07 17:14
微博发布工具: OPPO随光而变R17 Pro
点赞数: 420057

进度:   9%|██████▉                                                                       | 9/101 [00:20<03:02,  1.99s/it]

爱你，我们最好的祖国[爱心]️[中国]  
微博位置: 无
微博发布时间: 2018-11-21 13:50
微博发布工具: OPPO随光而变R17 Pro
点赞数: 733297
转发数: 341702
评论数: 646862
----------------------------------------------------------------------------------------------------
162天的拍摄，每一天都开心并创造着关于凤九的一切，我的小九，你要被人宠着爱着才行啊#电视剧三生三世枕上书#  [组图共2张] 原图 
微博位置: 无
微博发布时间: 2018-11-19 19:59
微博发布工具: OPPO随光而变R17 Pro
点赞数: 478565
转发数: 1000000
评论数: 872414
----------------------------------------------------------------------------------------------------
想知道我都有哪些贪心装备么来陪我逛贪心市集啊@adidasneo  市集入口[向右]http://t.cn/E2hyYrm#生来好动#adidas_neo的秒拍视频  
微博位置: 无
微博发布时间: 2018-11-16 10:00
微博发布工具: OPPO随光而变R17 Pro
点赞数: 189471
转发数: 1000000
评论数: 320892
----------------------------------------------------------------------------------------------------
#冷巴ACTION# 吸猫不易~  原图 
微博位置: 无
微博发布时间: 2018-11-15 09:58
微博发布工具: OPPO随光而变R17 Pro
点赞数: 193321
转发数: 705900
评论数: 346727
----------------------------------------------------------------------------------------------------
#疆遇四十年##中国有我# 小迪崽崽变成老迪了  

进度:  10%|███████▌                                                                     | 10/101 [00:20<02:26,  1.61s/it]

前几天逛街来着 刺不刺激 微博视频  
微博位置: 无
微博发布时间: 2018-11-13 19:55
微博发布工具: 微博视频
点赞数: 286805
转发数: 1000000
评论数: 188425
----------------------------------------------------------------------------------------------------
天气冷了，大家除了要多穿一点保暖以外，记得也要给我们的肌肤加点呵护哦，欧莱雅#7天安瓶#让你换季也不用担心干燥和细纹～  原图 
微博位置: 无
微博发布时间: 2018-11-10 20:21
微博发布工具: OPPO随光而变R17 Pro
点赞数: 216247
转发数: 1000000
评论数: 141012
----------------------------------------------------------------------------------------------------
@黑人牙膏官方微博 的两款限量版牙膏来啦，上面有两个“我”，大家更喜欢哪一个？ Dear-迪丽热巴的秒拍视频  
微博位置: 无
微博发布时间: 2018-11-09 10:13
微博发布工具: OPPO随光而变R17 Pro
点赞数: 126424
转发数: 1000000
评论数: 127283
----------------------------------------------------------------------------------------------------
咋不动呢O_o 微博视频  
微博位置: 无
微博发布时间: 2018-11-08 13:44
微博发布工具: 微博视频
点赞数: 170561
转发数: 123183
评论数: 127321
----------------------------------------------------------------------------------------------------
我和@adidasneo 联名款的星动少女限定系列上线啦，你“星动”了吗？#生来好动#  [组图共3张] 原图 
微博位置: 无
微博发布时间: 2018-11-06 10

KeyboardInterrupt: 

In [2]:
user_id = 1669879400
filter = 1
wb = Weibo(user_id,filter) #调用Weibo类，创建微博实例wb
wb.start()  #爬取微博信息

用户昵称: Dear-迪丽热巴
微博数: 1001
关注数: 222
粉丝数: 63192337
****************************************************************************************************



进度:   0%|                                                                                      | 0/101 [00:00<?, ?it/s]

这一年，做自己。不要停下努力的步伐。  原图 
微博位置: 无
微博发布时间: 2019-06-03 20:04
微博发布工具: 无
点赞数: 481184
转发数: 984343
评论数: 117616
----------------------------------------------------------------------------------------------------
今天是我的生日，来祝福我吧！  
微博位置: 无
微博发布时间: 2019-06-03 00:30
微博发布工具: 生日动态
点赞数: 378758
转发数: 215923
评论数: 93124
----------------------------------------------------------------------------------------------------
27岁[红桃]️第一次有这么多人陪我一起过生日我真的特别特别感谢台前幕后的所有工作人员，还有你们我的阿丝儿，有人问为啥27岁要办生日会，因为2.7～只有87你们会懂[红桃]️  [组图共6张] 原图 
微博位置: 无
微博发布时间: 2019-06-01 23:23
微博发布工具: 无
点赞数: 579833
转发数: 664567
评论数: 169947
----------------------------------------------------------------------------------------------------
#迪丽热巴生日会# 热·爱️终于实现了承诺，紧张～（来自@Dear-迪丽热巴 的一直播）APP下载地址：http://t.cn/RDUuslr  
微博位置: 无
微博发布时间: 2019-06-01 18:00
微博发布工具: 一直播Yi
点赞数: 189724
转发数: 13644
评论数: 58582
----------------------------------------------------------------------------------------------------
看到你们在乖乖排队偷拍了一下一会儿见阿丝儿们  原图 
微博位置: 无
微博发布时间: 2019-06-01 16:25


进度:   1%|▊                                                                             | 1/101 [00:00<01:01,  1.62it/s]

终于完成了26岁的愿望了哦 Dear-迪丽热巴的微博视频  
微博位置: 无
微博发布时间: 2019-05-19 22:22
微博发布工具: 无
点赞数: 349470
转发数: 1000000
评论数: 203103
----------------------------------------------------------------------------------------------------
爱丽丝们行行好 别再催了好不好  原图 
微博位置: 无
微博发布时间: 2019-05-19 18:58
微博发布工具: 无
点赞数: 386113
转发数: 1000000
评论数: 213281
----------------------------------------------------------------------------------------------------
等你来我的生日会  Dear-迪丽热巴的秒拍视频  
微博位置: 无
微博发布时间: 2019-05-16 10:25
微博发布工具: 无
点赞数: 416472
转发数: 1000000
评论数: 353645
----------------------------------------------------------------------------------------------------
#极限挑战# 让我们相约在明日的东方卫视，让我们看起那些令迪头大的瞬间，只是捡完这袋垃圾，我不一定会娶你。  [组图共4张] 原图 
微博位置: 无
微博发布时间: 2019-05-11 18:34
微博发布工具: 无
点赞数: 389271
转发数: 1000000
评论数: 308381
----------------------------------------------------------------------------------------------------
Pick全新#YSL反转巴黎#花溢香水，可甜可酷，敢来接受这次反转挑战吗？  [组图共4张] 原图 
微博位置: 无
微博发布时间: 2019-05-02 08:05
微博发布工具: 无
点赞数: 478054
转发数: 1000000
评论数: 370273

KeyboardInterrupt: 