Skip to content
View 0ingYJ's full-sized avatar

Block or report 0ingYJ

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Showing results

一些非常有趣的python爬虫例子,对新手比较友好,主要爬取淘宝、天猫、微信、微信读书、豆瓣、QQ等网站。(Some interesting examples of python crawlers that are friendly to beginners. )

Python 14,091 3,826 Updated Dec 25, 2023

scrapy爬虫天猫(淘宝)店铺店名、月销售量、价格等详细信息。涉及分类大类30多个,小类数百个。总爬取结果50万+条

Python 57 12 Updated Jan 6, 2018

淘宝模拟登录,销售数据,评论数据,商品评分数据爬取(学数据分析的可以用于获取淘宝电商的销售数据,学爬虫的可以参考一下思路和方法),由于评论数据比较大,暂时没办法上传,大家也可以直接用下面的代码爬取

Python 42 6 Updated Jun 11, 2020

国务院政策文件爬虫

Python 5 Updated Jul 26, 2024

利用高德地图web服务API获取坐标串,生成行政区和aoi的shp文件

Python 32 13 Updated May 22, 2021

高德地图api调用

Python 7 4 Updated Nov 14, 2020

包括百度地图,高德地图,谷歌地图的POI抓取

Python 45 22 Updated Jan 31, 2018

县级行政区方言所属数据及根据语言树算得的方言距离。Linguistic distances between Chinese dialects.

Jupyter Notebook 30 6 Updated Dec 11, 2022

爬取最新全国行政区划和城乡划分代码 :省份、城市、区县、乡镇(街道) 

JavaScript 30 11 Updated Nov 27, 2017

为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件 / Words learning and English muscle memory training software designed for keyboard workers

TypeScript 18,062 1,828 Updated Mar 13, 2025

An advanced guide to learn English which might benefit you a lot 🎉 . 离谱的英语学习指南/英语学习教程。

HTML 38,127 4,189 Updated Jul 13, 2024

Scrapt mongo 专利数据

Python 4 5 Updated Sep 18, 2016

📗 Score text readability using a number of formulas: Flesch-Kincaid Grade Level, Gunning Fog, ARI, Dale Chall, SMOG, and more

Python 373 65 Updated Sep 15, 2024

中文文本分析库,可对文本进行词频统计、词典扩充、情绪分析、相似度、可读性等

Python 55 16 Updated Nov 8, 2021

pytorch word2vec Four implementations : skip gram / CBOW on hierarchical softmax / negative sampling

Python 64 20 Updated Oct 19, 2018

Self complemented word embedding methods using CBOW,skip-Gram,word2doc matrix , word2word matrix ,基于CBOW、skip-gram、词-文档矩阵、词-词矩阵四种方法的词向量生成

Python 184 76 Updated Apr 26, 2018

用gensim训练LDA模型,进行新闻文本主题分析

Jupyter Notebook 77 31 Updated May 17, 2019

🧑‍🏫 60+ Implementations/tutorials of deep learning papers with side-by-side notes 📝; including transformers (original, xl, switch, feedback, vit, ...), optimizers (adam, adabelief, sophia, ...), ga…

Python 59,490 6,019 Updated Aug 24, 2024

最全数据分析资料汇总(含python、爬虫、数据库、大数据、tableau、统计学等)

2,253 387 Updated May 11, 2021

🎨 Python Echarts Plotting Library

Python 15,194 2,861 Updated Mar 10, 2025

欢迎来到电子书下载宝库,一个汇聚了各类电子书下载链接的地方。无论你是喜欢阅读经典文学、经管励志、终身学习、职场创业、技术手册还是其他类型的书籍,这里都能满足你的需求。 该库涵盖了帆书app(原樊登读书)、微信读书、京东读书、喜马拉雅等读书app的大部分电子书。

152 32 Updated Oct 31, 2024

博客配套视频链接: https://space.bilibili.com/383551518?spm_id_from=333.1007.0.0 b 站直接看 配套 github 链接:https://github.com/nickchen121/Pre-training-language-model 配套博客链接:https://www.cnblogs.com/nickchen121/p/1…

409 92 Updated Jul 12, 2022

特征提取/数据降维:PCA、LDA、MDS、LLE、TSNE等降维算法的python实现

Python 2,330 622 Updated May 10, 2023

中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、…

Python 71,981 14,764 Updated May 10, 2024

Topic Modelling for Humans

Python 15,929 4,389 Updated Feb 14, 2025

结巴中文分词

Python 33,894 6,733 Updated Aug 21, 2024

Python 开源项目之「自学编程之路」,保姆级教程:AI实验室、宝藏视频、数据结构、学习指南、机器学习实战、深度学习实战、网络爬虫、大厂面经、程序人生、资源分享。

Python 10,014 1,635 Updated Nov 26, 2024

Python入门网络爬虫之精华版

Python 7,120 2,173 Updated Jun 21, 2021

python爬虫教程系列、从0到1学习python爬虫,包括浏览器抓包,手机APP抓包,如 fiddler、mitmproxy,各种爬虫涉及的模块的使用,如:requests、beautifulSoup、selenium、appium、scrapy等,以及IP代理,验证码识别,Mysql,MongoDB数据库的python使用,多线程多进程爬虫的使用,css 爬虫加密逆向破解,JS爬虫逆向,…

Python 19,411 3,821 Updated Jul 29, 2024
Showing results