Skip to content

数据库表字段说明

thekingofcity edited this page Nov 9, 2018 · 9 revisions

鉴于部分同学对于数据库表结构理解比较吃力,所以添加表字段信息说明。

login_info

该表主要管理微博账号和密码

id name password enable
主键,自增长,不用用户管理 登陆账号 登陆密码 账号是否有效,1表示有效,0表示无效,在程序运行的时候,如果账号被封,该字段会被程序置为0,如果账号密码不对,那么程序会把该字段设置为2

keywords

该表主要是配合做微博话题搜索使用,请在搜索话题之前向该表中插入关键词

id keyword enable
主键,自增长,不用用户管理 搜索关键词 关键词是否有效,1表示有效,0表示无效

seed_ids

该表主要存储种子用户,根据该表可抓取种子用户信息、种子用户的主页所有原创微博及其相关粉丝和关注

id uid is_crawled other_crawled home_crawled
主键,自增长,不用用户管理 种子用户id 是否抓取过该用户信息,1表示已成功抓取,0表示未抓取,2表示抓取出错 是否抓取过该用户粉丝和关注,1表示是,0表示否 是否抓取过该用户主页微博,1表示是,0表示否

user_relation

该表主要存储用户关系

id user_id follow_or_fans_id type crawl_time from_where
主键,自增长,不用用户管理 当前用户id 用户的关注或者粉丝id 1表示粉丝,2表示关注 爬取时间 通过何种方式关注

wbuser

该表主要存储用户个人信息

id uid name gender birthday location description register_time verify_type verify_info follows_num fans_num wb_num level tags work_info contact_info education_info head_img isFan
主键 用户id 昵称 性别,0表示未知,1表示男,2表示女 生日 位置 简介 注册时间 认证类型,0表示未认证,1表示个人认证,2表示企业认证 认证信息 关注数 粉丝数 微博数 等级 标签 工作信息 联系方式 教育信息 头像url 已废弃

weibo_data

该表主要存储微博信息,目前微博信息有两个来源:1.通过抓取种子用户主页所有原创微博获取 2.通过搜索指定话题获取

id weibo_id weibo_cont weibo_img weibo_img_path weibo_vedio repost_num comment_num praise_num uid is_origin device weibo_url create_time comment_crawled repost_crawled dialogue_crawled praise_crawled
主键 微博id 微博内容 微博图片url 微博图片保存路径 微博视频url 转发数 评论数 点赞数 博主id 是否是原创,1表示是,0表示否 发布设备 微博url 发布时间 该微博评论是否已经抓取,1表示已经抓取,0表示未抓取 该微博的转发是否已经抓取,1表示已经抓取,0表示未抓取 该微博的对话是否已经抓取,1表示已经抓取,0表示未抓取 该微博的点赞是否已经抓取,1表示已经抓取,0表示未抓取

keywords_wbdata

关键词--微博中间表,通过联结查询获取特定关键词相关微博

id keyword_id wb_id
主键 关键词主键 微博id(不是微博主键)

weibo_comment

微博评论表,存储微博id和其相关评论

id comment_id comment_cont weibo_id user_id create_time
主键 评论id 评论内容 微博id 评论用户id 评论时间

weibo_repost

微博转发表,存储转发相关层级信息

id user_id user_name weibo_id parent_user_id repost_time repost_cont weibo_url parent_user_name root_weibo_id
主键 当前转发用户id 用户名 转发微博id 上层用户id 转发时间 转发内容 转发微博url 上层用户名 源微博id

weibo_praise

微博点赞表,存储用户和微博id

id user_id weibo_id crawl_time
主键 点赞用户id 微博id 抓取点赞时间
You can’t perform that action at this time.