Skip to content

EdisonLeeeee/Awesome-Learning-Resource

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 

Repository files navigation

Awesome Learning Resources ❤️😎

Awesome Contributions Welcome

👉 Table of Contents 👈

Git 👬

💨 Back to Top

  • Git:Git官方教程
  • Git Book:Git 官方教程电子书。中文版Git Book链接
  • Learn Git Branching:一个用于学习 Git 的交互式学习网站,GitHub上收获了:star:10k+
  • Githug :它其实是一个命令行工具,但更多的人喜欢称它为一个 Git 游戏,被设计出来的目的是用来练习我们的 git 技能。但是Githug 是运行在 ruby 上的,所以你要装完Git再安装个 ruby通关攻略
  • Flight rules for Git:Flight rules for Git,翻译过来是 Git 飞行规则,而飞行规则是记录在手册上来之不易的一系列知识,记录了某个事情发生的原因,以及怎样一步步进行处理。因此该项目用于补足你解决问题的能力。除此以外,对一些学习 Git 方面比较好的书籍、教程等都有所推荐。GitHub:star:33.3k。推荐等级::heart::heart::heart::heart:!
  • 猴子老师Git教程:号称猴子都能懂的Git入门教程
  • 廖雪峰Git教程:廖雪峰Git教程,号称史上最浅显易懂的Git教程
  • Pro Git 第二版:这本书被誉为 Git 学习的圣经,作者是 Scott Chacon 和 Ben Straub。Scott Chacon 在 GitHub 工作,自称 Git 的布道者。你可以在网站上免费阅读这本书,也可以下载他们提供的电子版本
  • git-recipes:童仲毅 (geeeeeeeeek@github) 对很多英文资料进行翻译、整理的集合教程。包含入门基础、进阶知识和应用范例。这些英文资料主要包括 GitHub 竞争者 Bitbucket 的 Git 教程
  • Udacity Git 课程:谷歌无人车之父 Sebastian Thrun 创办的 优达学城(Udacity)上面的 免费 Git 课程。这门课程由优达学城与 GitHub 共同制作,介绍进行版本控制的基础知识,重点讲解 Git 版本控制系统以及 GitHub 协作平台
  • happypeter1983 的 Git 视频教程:这份教程就更进阶了一些。讲到了一些高级命令的用法。当然还有其他学习资源。
  • Oh shit, git!:这个网站整理了一些 Git 新手在使用 Git 时常会遇到的各种突发状况,并贴心的给出了应对方案。
  • Gitignore:GitHub 官方开源的一个项目,这个项目为开发者编写好特定的 .gitignore 规则,做成了模板。开发者只需选择好自己的项目类别,将文件内容复制粘贴放到自己项目里面就可以用了,在上面,你可以找到目前所有主流语言的 .gitignore 模板。在线生成网站
  • Readme Md Generator:一名来自法国的小哥因为饱受重复编写 README 文档的折磨,在 GitHub 上开源了 readme-md-generator 这个工具。从项目名字便可以知道,它一个 README 文档生成器。其主要作用是通过命令行抓取项目的 package.json 和 git 配置信息,自动完成 README 文档的编写操作,Github上已获:star:5k+
  • Repository Templates:为了避免开发者做一些无用的重复性工作,GitHub 发布的一个新功能 - 模板仓库(repository templates)。这个功能可以将以往创建过的仓库标记成模板(template),这样在你下一次创建仓库的时候,就可以使用这个模板功能,快速生成具有和原仓库一样的目录与文件内容,每个模板仓库在 URL 末端带上 /generate 后,还可以将模板仓库通过链接分享给其他人,其它人在打开链接之后,便可以快速通过这个模板来创建新仓库
  • Standard Readme:由 RichardLitt 发起的项目,简单直白的告诉读者README 应该写哪些内容,应该如何排版等,GitHub:star:2.8k
  • 《Beginning Git and GitHub》:Git与Github学习使用指南(Beginning Git and GitHub),GitHub
  • CS Visualized: Useful Git Commands:git merge、git rebase、git reset、git revert、git fetch、git pull、git reflog……你知道这些 git 命令执行的究竟是什么任务吗?如果你还有些分不清楚,那千万不能错过这篇文章。在本文中,熟知 JavaScript、TypeScript、GraphQL、Serverless、AWS、Docker 和 Golang 的 21 岁年轻软件顾问 Lydia Hallie 通过动图形式直观地介绍了这些常用 git 命令的工作过程,包你过目不忘。
  • Git Draw:允许自定义绘制 github热图的项目,GitHub:star:2k​
  • Gitfiti:自定义GitHub热图,GitHub:star:5.8k​
  • Git Commit emoji:执行 git commit 时使用 emoji 为本次提交打上一个 "标签", 使得此次 commit 的主要工作得以凸现,也能够使得其在整个提交历史中易于区分与查找。GitHub:star:1.5k
  • Gitqlite:通过为 GitHub 项目创建一张虚拟的 SQLite 数据库表,进而达到能直接用数据库查询语句,快速检索 Git 仓库中的内容,其中包括 Git 提交记录、作者名称、邮箱、文件历史记录等内容。开发者可根据自己的开发需求编写数据库查询语句,快速从 Git 仓库中提取精准信息。GitHub:star:1.3k

GitHub :octocat:

💨 Back to Top

  • Gitstar Ranking:GitHub顶级项目排行榜

  • GitHub Chinese Top Charts:Github中文项目排行榜,帮助你发现高分优秀中文项目、更高效地吸收国人的优秀经验成果;榜单每周更新一次。

  • Lib4dev:一个超赞的在线网站,里面汇集了包含所有编程语言的开源项目和库,并可以链接到相对应的 GitHub 上。使用 lib4dev 可以查找任何编程语言的最佳库,它界面简单,基本上所有编程语言的库和开源项目都可以在上面找得到。推荐等级::heart::heart::heart:!

  • HelloGithub:分享GitHub上有趣,入门级的开源项目

  • GitHubDaily :每日不定时推送一批 GitHub 上优秀的开源项目给开发者, 帮助开发者们发现当下最火的开源项目

  • PyHubWeekly:PyHubWeekly是一个精选Github上优质Python小工具的项目,宗旨:每周更新一次;精选GitHub上优质Python项目

  • Github trending repos:GitHub上不同语言的每日趋势总结

  • onedev:OneDev 是一个开源的一体化的 DevOps 平台,一款简单易用的 GitLab 替代品。GitHub:star:3.2k​

  • GitHub漫游指南:关于如何在Github上如何构建一个好的项目。、研究用户的行为、找到一些感兴趣项目的指南。推荐等级::heart::heart::heart:!

  • Github Trending Repos:通过GitHub本地通知,跟踪你喜欢的编程语言的GitHub趋势库,GitHub:star:2k。推荐等级::heart::heart::heart:!

  • GitHub 帮助:GitHub官方中文帮助文档,全球最大的开源网站GitHub是每个程序员必须接触的,学习它的使用百利而无一害,同时也适合学习Git

  • GitHub Help:GitHub官方英文帮助文档,由于中文文档是从英文文档翻译而来,可能有些内容不是最新,英语好的人应该看英文文档,才能实时获取最新内容

  • GitHub README

    • Building a self-updating profile README for GitHub:GitHub 发布的新特性,用户可直接在 GitHub 个人页中添加 README 介绍,用于展示更加详细的个人信息。Django 与 Datasette 的作者 Simon Willison 就用了短短 150 行代码,来实时更新其个人页的 README 信息。每次运行脚本时,会将项目的最新发行版、博客文章、Datasette API 等内容更新到个人主页上,这样别人就可以第一时间了解他的最新工作近态。
    • Sorxrob:使用了类似 Friendster 的社交模板,从关注者中随机选出 8 个用户,每个一小时更新一次个人页的 README 信息。
    • EliteDaMyth:作者是印度那边一个 17 岁的学生,在他的 GitHub 页面中,用递归的方式在 README 中层层嵌套自己的个人页,效果让人眼前一亮!
    • waka-readme:每周在 README 中更新各种编程语言在工作中的具体占比时间。你的技术堆栈、常用语言、编码状态让人一目了然。
    • Github Readme Stats:自动给你的 GitHub 信息生成统计报告,其中包括项目 Star 数、代码提交次数、项目贡献次数、PR 数、Issue 数等数据。
    • Awesome Profiles:里面收集了非常多能让人眼前一亮的 README 模板,有很多是无需配合 GitHub Action,直接把 Markdown 复制粘贴一下就能用。GitHub:star:1.6k​
  • emoji markup:GitHub emoji 表情大全,GitHub:star:7.5k

  • Super Linter:GitHub Services DevOps Engineering 团队正式开源了一个代码库:Super Linter。当你把这个代码库搭配 GitHub Actions 一同使用后,便可保证代码风格与文档的一致性。如此一来,就能极大降低代码审查成本,顺带提升整个项目的代码质量。这款插件主要具备以下几项核心功能:防止将破坏性代码上传到主分支;构建多种语言的编码最佳实践;构建代码布局与代码格式指南;自动化流程,简化代码审查工作。GitHub:star:3.2k​

  • GitHub Protips: Tips, tricks, hacks, and secrets from Lee Reilly:GitHub 使用提示、技巧、黑科技和秘密

  • MkDocs:可用于快速创建项目文档的开源神器:MkDocs。该项目创建自 2014 年,目前 GitHub 上参与维护开发,给项目提交贡献的开发者,共有 100 多名,这款工具希望能帮助开发者以更加快速、便捷的方式来创建项目文档,并为其生成更加简洁直观的静态站点。开发者还贴心的针对国内开发者提供了中文文档。GitHub:star:10.1k。推荐等级::heart::heart::heart::heart:!

  • GitHub Cli:GitHub 官方新发布了新命令行工具「GitHub CLI」,该工具能无缝对接 GitHub,把 GitHub 的操作体验,都搬到命令行中。开源地址,目前GitHub:star:5k+。

  • Codespaces:Github 最新推出的 Codespaces ,可以实现基于 VS Code 的云端代码编译和实时开发。

  • FastText by FacebookResearch:GitHub上:star:20k,fastText是Facebook团队的一个开源和免费库,用于有效学习单词表示。它是轻量级的,允许用户学习文本表示和句子分类器。它适用于标准的通用硬件。模型可以减小尺寸,甚至适合移动设备。

  • Logoly:不正经 Logo 生成器。这是一个在线的 PornHub 风格 Logo 生成工具,可以帮助你快速生成类似 PornHub 风格的 Logo。在线体验地址

  • 坦克大战:GitHub 上实现的这个开源版本,可在 Web 上直接玩,还原度非常之高,并支持单台电脑,双人组队。

  • 俄罗斯方块:这个项目不仅好玩,技术实现原理也讲解非常到位。它通过响应式与数据持久化,使得游戏体验的效果更佳,也让你可以直接在手机端上进行操作。

  • Gameboy 模拟器:如果我说你能在终端上用 Gameboy 来玩游戏,你可能会大吃一惊。但,生命不息,折腾不止,这玩意确实被重庆大学的一位大二学生给整出来了。

  • 扫雷:作为一款在当年霸屏 Windows 机器的小游戏,相信不少人都不会感到陌生。这款结合了当下比较新颖的 emoji 表情元素,重现了当年的经典。

  • 在线玩中文 DOS:国内一位老玩家,出于对 DOS 游戏的怀念,在 GitHub 上开源了这个项目。

  • Navi:一个神奇的命令行备忘录,GitHub上已获:star:3k+

  • Checkm8:一位名为Axi0mx的开发人员发布的一个名为Checkm8的iPhone破解程序,而且是开源的。Github 上已经获:star:5k+。

  • Lazynlp:英伟达工程师小姐姐Chip Huyen,在GitHub上开源了一个名为“lazynlp”的工具库。爬网页、清洗数据、创建数据集都可以搞定。她说,使用这个库,你应该能创建一个比大于40G的文本数据集,比OpenAI训练GPT-2时使用的还要大。开源仅一天,项目在GitHub上就获得了300多星,Twitter上获得上千次点赞。fast.ai创始人Jeremy Howard等人也转发推荐。而且,用这个工具库创建数据集的过程,也并不麻烦。

  • Leon Sans:GitHub:star:6k+,一种字体,变成千姿百态艺术字,可尖可圆可开花,隔壁设计师馋哭了。GitHub传送门

  • BullshitGenerator:狗屁不通文章生成器,GitHub上,这个富有灵魂的项目名吸引了众人的目光。项目诞生一周,便冲上了趋势榜榜首。并且,不止名字被注入灵魂,生成的文字也有一股不可抗拒的力量。只要输入一句话,系统就会给你一篇狗屁不通的万字长文,网页版

  • Spleeter:来自法国的音乐流媒体公司 Deezer 开源了一个音轨分离软件 spleeter,只需输入一段命令就可以将音乐的人声和各种乐器声分离,支持 mp3、wav、ogg 等常见音频格式。GitHub:star:7k+。

  • 996.ICU:996.ICU 是指 “工作 996, 生病 ICU” 。这是中国程序员之间的一种自嘲说法,意思是如果按照 996 的模式工作,那以后就得进 ICU 了。这个项目最早是某个中国程序员发起的,然后就火遍全网,甚至火到了全世界很多其他国家,其网站被翻译成了多种语言,GitHub获:star:250k+。网站地址

  • You-Get:可以通过一个命令下载网上的在线视频,GitHub获:star:28k。

  • Postwoman:和 postman 一样,它能提供一些 API 的请求测试功能,HTTP 的请求方式和自定义 Header 都可以使用,而且它可以直接在线上就能运行,坊间有称它是 postman 的老婆。GitHub 获:star:10k+,体验地址

  • FastAPI:FastAPI 是一个基于 Python3.6+ 构建的高性能 web 框架,使用它可以很快的简单写一些 API 接口,GitHub 获:star:6k+。

  • Fiora:你是否是社交软件的重度用户,并喜欢在网上与陌生人交流分享自己的观点呢?如果是的话,或许你可以考虑自己搭建一个多用户在线的实时聊天平台。要做到这一点并不难,借助一款叫 fiora 的开源软件便可以做到。fiora 是一款有趣的在线聊天应用。基于 node.js, mongodb, socket.io和 react 编写。GitHub 地址

  • 微信排版编辑器:这是一个专为微信公众号排版而生的前端编辑器,可直接在 Web 端打开写文章,在编辑完成后,可将其生成的富文本内容一键复制到公众号上,自动化完成排版操作,很是方便。

  • AI Dungeon:15亿参数的终极版GPT-2,就是OpenAI那只编故事成瘾的AI,都能拿来做些什么?有人用它做了个文字冒险游戏,并赐以优美的名字,叫“AI地牢 (AI Dungeon) ”。大概是在说,你一旦进去就出不来了,里面的故事太迷人。现在,这座地牢进化出了2.0版本。有网友盛情安利,表示不可错过,推特11小时已有1600赞!游戏传送门博客传送门

  • Sorry:sorry 是一个很有意思的表情包斗图项目,源自"sorry,有钱事真的能为所欲为"这梗...

  • Chinese Poetry:最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。GitHub ⭐26.7k。

  • WechatMomentScreenshot:朋友圈转发截图生成工具 已获得微信“绿色网站”认证(滑稽)

  • Demucs《Music Source Separation in the Waveform Domain》论文代码,Facebook人工智能研究院提出的弱监督训练模型,基于受Wave-U-Net和SING启发的U-Net卷积架构。GitHub:star:1.1k。

  • CatDCGAN :利用DCGAN生成猫的图片,由tf1.x实现。

  • Nativefier:一条命令将网页转成电脑 App,GitHub:star:22.3k。

  • PySimpleGUI:PySimpleGUI,它完全基于Python语言,能非常方便地开发GUI界面,代码量相比现有框架减少50%到90%。并且,它提供了极为友好的Python风格的接口,大大提升开发效率。GitHub:star:3.3k。

  • DeepFaceLab:DeepFaceLab是一种利用机器学习来替换视频中的面部的工具。包括预先准备好的独立Windows 7,8,10二进制文件。GitHub:star:12.4k。

  • Facewap:deepfake 的深度学习技术,这款工具本来的用途是用来识别和交换图片、视频中人物脸部图像的工具。GitHub:star:1.4k。

  • Httpie:命令行调试接口的工具,相比 curl 来说,更加直观一点,对新手友好。GitHub:star:45.7k。

  • thefuck:这个工具很有意思,当你在命令行敲错命令的时候,一定会心里默念一句: fuck. 现在你可以直 接再敲一遍 fuck,他会帮你猜出来你刚刚应该输入的正确命令。GitHub:star:52k。

  • hacker-scripts:一个黑客的一些脚本,比如说如果九点之后还在开发机上登录的话就给老婆发个短信解释一下。GitHub:star:37.4k。

  • Discourse:一个开源的论坛,GitHub:star:30k。

  • EverydayWechat:微信助手:1.每日定时给好友(女友)发送定制消息。2.机器人自动回复好友。3.群助手功能(例如:查询垃圾分类、天气、日历、电影实时票房、快递物流、PM2.5等)。GitHub:star:7k。

  • Google Cloud Vision:Google的VisionAPI,可以用来自己构建一个搜索引擎。

  • Markdeep:Markdeep 是一个用来写纯文本的插件,它能以 Markdown 的语法与渲染方式纯文本,并在网页上展示。同时,除了 Markdown 语法,Markdeep 还额外支持图表、数学方程等扩展能力。只要你有纯文本编辑器,加上一条语句,瞬间它就可以成为 Markdown 编辑器。

  • Real Time Person Removal:实时人物去除项目,这个项目的神奇之处在于,只需要在网络浏览器中使用 JavaScript,用 200 多行 TensorFlow.js 代码,就可以实时让视频画面中的人物对象从复杂的背景中凭空消失!GitHub:star:2.5k。Demo地址,只需要一台能上网的电脑和一个网络摄像头就能体验它。

  • Generative Inpainting:自己的照片有路人甲入镜是常有的事,但有些未免太过抢镜,甚至盖过了主角的风头。P 图高手往往选择自己手动去掉背景里不相干的人,但开发者不想那么麻烦,于是开发了该项目来一键消掉路人甲。GitHub:star:1.6k。​

  • MNIST Clock:MNIST 是计算机视觉中不老的经典,GitHub 作者 Dheera Venkatraman 做了一面钟,里面的数字都是从 MNIST 数据集中采样的。24 小时随机抽万张不同的手写数字,每天都不带重样。

  • streamlit:这是一款专为机器学习工程师创建的免费、开源 app 构建框架。这款工具可以在你写 Python 代码的时候,实时更新你的应用。GitHub⭐7.2k。

  • The book of secret knowledge:该存储库是程序开发工作中用得到的材料和工具的集合,它包含了许多有用的信息,每个人都可以在这份清单里找到适合你的工具,它面向系统和网络管理员、DevOps、渗透测试人员和安全研究人员。GitHub:star:31.4k,推荐等级::heart::heart::heart:!

  • Joplin:一个免费的,开源的笔记和待办事项的应用程序,可以处理笔记本组织成的大量笔记。笔记是可搜索的,可以直接从应用程序复制,标记和修改,也可以从自己的文本编辑器进行修改。笔记采用Markdown格式。通过.enex文件从Evernote导出的Notes 可以导入到 Joplin 中,包括格式化内容(转换为Markdown),资源(图像,附件等)和完整的元数据(地理位置,更新时间,创建时间等)。GitHub:star:14.1k

  • System Design Primer:该项目是关于如何设计大型系统,以及如何应对系统设计面试。系统设计是一个很宽泛的话题。在互联网上,关于系统设计原则的资源也是多如牛毛。这个仓库就是这些资源的组织收集,它可以帮助你学习如何构建可扩展的系统。GitHub:star:85.2k,推荐等级:❤️❤️❤️❤️!

  • Realworld:RealWorld应用程序是对Medium.com的完整克隆,已经通过各种各样的前端和后端技术实现。它可以对13个框架进行比较,并且比较的是比其他基准测试更大、更复杂的应用程序的实现。GitHub:star:38.3k

  • Google research:Google Research是谷歌内部进行各种研究的部门,不过随着AI技术的广泛应用和高重要性,他们决定把两个主要部门结合,致力于解决当今和未来技术的计算机科学问题,该存储库包含Google AI Research发布的代码。GitHub:star:8.5k​

  • FALdetector:Adobe发布的“反向PS”利器,知道你修过哪里,还帮你修回去,让你一秒回到P图前。GitHub:star:788

  • Godot:Godot是一个全新开发的游戏引擎,其功能集类似知名的跨平台游戏引擎Unity,可用于开发PC、主机、移动和Web游戏。GitHub:star:28.6k​

  • Cxxmatrix:4行代码在终端再现《黑客帝国》数字雨,还有众多其他语言实现的版本,例如Python实现

  • COVID-19:在约翰霍普金斯大学,两位中国博士生和他们的导师一起,开发了一个可视化、可交互的全球疫情地图。这个项目已经发在了《柳叶刀》上,GitHub:star:8.3k​

  • Primg:用质数生成任意ASCII艺术

  • Self-Driving-Car-in-Video-Games:一个使用深层神经网络并运用监督学习实现在 Grand Theft Auto V 中自动驾驶的开源项目。项目使用 PyTorch 编写,并使用了 Nvidia 的 Apex 扩展库,支持混合精度训练与推断,最多大约有两倍的速度提升。

  • Pelican:基于Python,支持Markdown和reST语法的静态站点生成器。GitHub:star:9.7k​

  • Faker:快速生成虚假数据,GitHub:star:9.7k。 ​

  • Text to Handwriting:一个名叫 Saurabh Daware 的印度大学生只花了 3 个小时就编写了一款自动化工具,能够将文本转换成手写文字,并用这个工具来应付需要手写的大学作业。

  • Handwriting Synthesis:基于 RNN 手写笔迹合成项目,该模型主要基于 2013 年一篇关于手写笔迹合成的论文。从项目作者的 Github 进程来看,该项目实现已于 2018 年就完成,近日新推出的 Demo 所演示的交互模式下的网页版本为最新版,基于 TensorFlow.js 实现。网页版 Demo

  • Pose Animator:Pose Animator 会使用拍摄的 2D 矢量图,并基于 PoseNet 和 FaceMesh 的识别结果,实时对结果及包含的曲线进行动画处理。Pose Animator 从计算机图形学中借鉴了「基于骨骼」的动画思想,并将其应用于矢量字符。GitHub:star:4.5k​

  • AR Cut & Paste:AR Cut & Paste 工具是一个 AR+ML 原型(prototype),借助它你可以从周围环境中拷贝固定对象,并粘贴在图像编辑软件中(Photoshop)。需要特别注意的是,这款工具只适用于 Adobe Photoshop 软件,未来可能支持处理不同的输出。GitHub:star:8.7k​

  • Scarpet nn:来自印度小哥开发的新玩法,在《我的世界》里搭建神经网络,运行过程清晰可见。源代码

  • Photo2cartoon:人像卡通化探索项目,GitHub:star:1k​

  • QRcp:在不离开终端的情况下,通过Wi-Fi扫描二维码,将文件从电脑传输到移动设备。GitHub:star:7k​

  • Ventoy:Ventoy是一个制作可启动U盘的开源工具。有了Ventoy你就无需反复地格式化U盘,你只需要把ISO文件拷贝到U盘里面就可以启动了,无需其他操作。你可以一次性拷贝很多个不同类型的ISO文件,在启动时Ventoy会显示一个菜单来选择。无差异支持Legacy BIOS和UEFI模式。目前已经测试了各类超过260+ 个ISO文件。GitHub:star:5.7k​

  • PowerToys:PowerToys是微软开发者开发的免费实用工具集,可以用于高级用户调整和简化Windows操作,以提高效率。其最早出现在Windows 95中,但并不受微软官方支持,对其测试也不够彻底。到了Windows XP时代,所有进入Windows的应用都需要进行安全审查,于是PowerToys便消失了。最近,微软宣布以官方名义重启该项目。GitHub:star:28.3k​

  • Eyepetizer:一个高颜值的APP项目,基于 Kotlin 语言 开发,采用 Jetpack + Coroutines + Retrofit 实现的 MVVM 架构。项目的源码恰到好处,特别适合复用和学习,源码简单易懂容易上手,而且最大程度遵守了官方的一些开发规范建议,并吸取了第三方开发规范经验。

  • tsunami-security-scanner:谷歌专门为大型企业网络开源的一个漏洞扫描神器,主要用于数千个甚至数百万个物联网组成的企业系统。GitHub:star:5.3k​

  • Bigheads:BigHeads是一个头像生成工具,通过设置将表情,服装,发型和颜色,可以组合成成千上万个角色头像。

  • MS-Lumos:Lumos是一个Python库,用于网络应用程序中的度量回归的自动检测与诊断。

  • AgoraLive:一个新的开源项目,它实现了单主播直播、多人连麦直播、PK 直播、虚拟主播,四种现在社交直播领域最成熟的场景。

  • codequestion:一个便捷编程Q&A工具codequestion,直接在终端输入「你要问的问题」,用普通的自然语言就行,和你去谷歌搜索没什么两样。

  • transformers:最新NLP transformers模型,基于 TF2 和 PyTorch,GitHub:star:34.7k​

  • easy163:安卓端一键解锁网易云音乐,无须 ROOT,GitHub:star:1.1k​

  • data-augmentation-review:数据增广最全资料集锦

  • Real-Time-Voice-Cloning:一个黑科技开源项目,只需要你 5 秒钟的声音对话,就能克隆出你的声音,而且能够实时的生成你任意语音。GitHub:star:27.8k

Linux 🐧

💨 Back to Top

  • Awesome Linux:一份让Linux变得更棒的项目和资源列表。
  • Tldr:简化版本的 "Linux man" 可以很详细的为 Linux 命令提供例子说明,GitHub:star:26k​
  • Kmdr:Linux 命令解释工具
  • The art of command line:本文是作者在 Linux 上工作时,发现的一些命令行使用技巧的摘要。有些技巧非常基础,而另一些则相当复杂,甚至晦涩难懂。这篇文章并不长,但当你能够熟练掌握这里列出的所有技巧时,你就学会了很多关于命令行的东西了。目前Github获:star:60k+。其他相关资源:
  • 《The Linux Command Line》:Linux 命令行必学书籍
  • Awesome shell:一份精心组织的命令行工具及资源的列表。
  • Lede:LEDE是基于OpenWrt的嵌入式Linux发行版,该项目教你如何编译自己需要的 OpenWrt 固件,GitHub:star:8.5k​

Docker 🐳

💨 Back to Top

  • Docker-cheat-sheet:Docker Cheatsheet,GitHub:star:18.4k​
  • Docker Practice:Docker——从入门到实践,GitHub:star:17k
  • 《Docker入门实战》:《Docker入门实战》是由国内Docker社区DocKOne.io推出的刊物,旨在帮助国内爱好者学习使用Docker。
  • Docker 中文指南:Docker中文文档
  • Docker library docs:Docker官方库文档,GitHub:star:3.4k​
  • Docker slim:Docker-slim 工具使用静态和动态分析方法来为你臃肿的镜像瘦身,具体使用可查看examples。GitHub:star:8.8k。
  • Ctop:Ctop 是一个简单的工具,它能够提供多个容器的实时指标视图。GitHub:star:10.1k​
  • Docker-gc:Docker 镜像垃圾回收,Docker-gc 工具通过删除不需要的容器和镜像来帮你清理 Docker 主机。它会删除存在超过一个小时的所有容器。此外,它还删除不属于任何留置容器的镜像。GitHub:star:5.1k
  • Watchtower:Watchtower 监视运行容器并监视这些容器最初启动时的镜像有没有变动。当 Watchtower 检测到一个镜像已经有变动时,它会使用新镜像自动重新启动相应的容器。GitHub:star:6k

Math (数学) 📐

💨 Back to Top

  • MIT线性代数课程精细笔记:该笔记总结了我们在学习MIT线性代数课程的学习经验和过程。课程顺序是按照麻省理工公开课的 Linear Algebra. 记录的学习笔记。知乎专栏
  • 《Mathematics for Machine Learning(机器学习数学基础)》:作者表示撰写这本书旨在激励人们学习数学概念。这本书并不打算涵盖前沿的机器学习技术,因为已经有很多书这样做了。相反,作者的目标是通过该书提供阅读其他书籍所需的数学基础。这本书分为两部分:数学基础知识和使用数学基础知识进行机器学习算法示例。Github地址
  • 《An Introduction to Statistical Learning - R》:《统计学习导论》,它的内容会有点数学,但是也很容易阅读。对于机器学习这样一个广泛的领域,这本书能将篇幅控制在400页左右很不容易。唯一的缺点是代码是用 R语言而不是Python编写的。
  • 《An Introduction to Statistical Learning - Python》:经典教材《统计学习导论》现在有了Python版
  • 《The Elements of Statistical Learning》:斯坦福《统计学习要素》一直是机器学习领域公认经典的教材,是一本在机器学习、统计推理和模式识别领域有影响力和被广泛研究的书。而这本书一直没有得到中文翻译。近期由 szcf-weiya 博士整理翻译的 《The Elements of Statistical Learning (ESL) 》的中文翻译、代码实现及其习题解答公开,非常值得学习!GitHub仓库
  • 线性代数(Linear Algebra)中文笔记:该笔记总结了我们在学习MIT线性代数课程的学习经验和过程。课程顺序是按照麻省理工公开课的 Linear Algebra. 记录的学习笔记。
  • 《Seeing Theory》:来自斯坦福大学的一位研究生和他的伙伴们开发了一本颇有新意的统计概率入门教材,与传统教材不同的是,这本书充分利用了数据可视化技术,交互性和趣味性都非常强,可以边读边玩。书籍下载地址
  • 《Interactive Linear Algebra》:《交互式线性代数》,它的最大特点就是“交互式”,总共包含了 6 章内容,涵盖了线性代数的核心知识。离线 PDF 电子版下载地址。这份《交互式线性代数》在线网页,作者开源了所有代码,并发布在 GitHub 上。你可以修改程序中的源代码,实现更加个性化的体验。GitHub源码地址
  • A Beginner’s Guide to the Mathematics of Neural Networks:一份为初学者准备的指南,关于神经网络中的数学问题,帮助读者理解神经网络模型中的数学概念和应用。
  • 面向机器学习的线性代数和微积分要点速览:斯坦福大学CS229课程中线性代数和微积分回顾,中文版
  • 《Introduction to Applied Linear Algebra》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著的一本线性代数书籍。这本教科书结合了直观的解释和丰富的实例,让抽象的线性代数知识变得通俗易懂,并且你不需要任何线性代数基础就能看懂。斯坦福课程主页UCLA课程主页
  • 《Linear Matrix Inequalities in System and Control Theory》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著数学书之一
  • 《Convex Optimization》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著数学书之一
  • 《Linear Controller Design – Limits of Performance》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著数学书之一
  • Professor Bingsheng He:南方科技大学何炳生教授个人主页,有许多数学讲解文章
  • Mathigon:一本来自未来的教科书。Mathigon 提供交互式学习方式、个性化学习服务和故事化的教学内容,试图改变原本枯燥的数学学习方式,为数学学习过程注入活力,保护和提升学习者的好奇心、创造力和想象力。推荐等级::heart::heart::heart:!
  • penrose:卡内基梅隆大学开发的一款新工具,你只需要描述一些数学关系或输入数学表达式,该软件就能自动帮你画图,从而将抽象的数学公式转化为直观的图。GitHub:star:3k,论文地址
  • Essentials of Mathematical Methods:这个开源项目是基于深度学习,机器学习以及数据建模的数学笔记。1800 页,33 章数学方法精要笔记。推荐等级::heart::heart::heart:!

Algorithm (算法) 💡

💨 Back to Top

CheatSheets (速查表) 📑

💨 Back to Top

  • Data Science Cheat Sheet:数据科学速查表,GitHub:star:8k+。内容几乎涵盖数据科学相关的所有领域,在理论应用方面包括大数据分析、数据挖掘、数据可视化、深度学习,机器学习等等;在编程语言与工具方面,包括Excel、SQL、Python、MATLAB、Linux;基础的学科知识包含统计学、数学、概率论。另外,就连面试问题都没放过
  • Git 基本操作:一张 Git 基本操作的速查表(脑图)
  • Python Data Science Cheatsheet:Python 数据科学速查表中文版,英文原版
  • Python 3 Cheat Sheet (PDF):Python 3 Cheat Sheet 由法国国家科学研究中心(CNRS)的法国机械工程与信息技术实验室(LIMSI)的工程师 Laurent Pointal 总结。Python 3 Cheat Sheet 一共包含两页,分成了多个框图,涉及基本的 Python 数据结构、数学运算、条件和循环语句、文件读写,以及异常值处理等
  • Python Cheatsheet: 全面的Python备忘单,内含超全代码示例。基于Python 3.6打造,未来将会进一步丰富,添加Asyncio等内容。GitHub上获:star:4.6k。文本下载链接
  • DS Cheatsheets:GitHub上:star:5k+的项目,一份数据科学备忘单
  • Tips of Feature Engineering:机器学习实用的特征工程技巧
  • Python 3 Cheat Sheet:Python 3 Cheat Sheet 由法国国家科学研究中心(CNRS)的法国机械工程与信息技术实验室(LIMSI)的工程师 Laurent Pointal 总结。这个简单的 Cheat Sheet 专注于从算法/编程开始所必需的语言部分,提供了学生入门所需的一般信息。注意:它不涉及面向对象的编程。PDF 地址
  • Deep Learning cheatsheets for Stanford's CS 230:吴恩达CS230深度学习课小抄,清单主页
  • Matplotlib Cheatsheet:Matplotlib 3.1 cheat sheet,GitHub:star:1.5k​
  • Docker-cheat-sheet:Docker Cheatsheet,GitHub:star:18.4k​
  • Awesome Cheatsheet:速查表资源大全
  • Devhints:这个网站里面收集了非常多技术类型的速查表,你能很轻松的从上面找到具体某项技术的快捷命令与基础语法,用上之后,相信能大幅提升开发效率。除此之外,该网站上还提供了 Linux、VSCode、Vue、Go、Python、Ruby 等诸多语言与开发者工具的速查表。推荐等级::heart::heart::heart::heart:!

Awesome ✨

💨 Back to Top

  • Awesome:github 上很多的各种 Awesome 系列合集。GitHub 获:star:120k。众所周知,如果想要学习什么知识,只需要在GitHub上搜索"Awesome xxx" 即可获得一大堆相关的学习资源。推荐等级::heart::heart::heart::heart:!
  • Best-of Machine Learning with Python:这个 GitHub 项目提供了大量机器学习 Python 库,覆盖机器学习框架、数据可视化、强化学习等多个领域,而且项目作者还对每个类别中的项目做了排名,每周进行更新,GitHub:star:1.7k​。推荐等级::heart::heart::heart::heart:!
  • Awesome JupyterLab:Jupyter lab 插件和资源大全列表,GitHub::star:1k。
  • Awesome Jupyter:Jupyter 插件和资源大全列表,GitHub::star:1.4k。
  • Awesome Machine Learning Jupyter Notebooks For Colab:机器学习和深度学习教程的列表,以Jupyter笔记本格式运行在谷歌Colab上,推荐等级::heart::heart:!
  • Awesome Python cn:Python资源大全中文版,包括:Web框架、网络爬虫、模板引擎、数据库、数据可视化、图片处理等,由伯乐在线持续更新。GitHub:star:15k,推荐等级::heart::heart::heart:!
  • Awesome Python:一个很棒的Python框架、库、软件和资源的列表,GitHub ⭐78k。推荐等级❤️❤️❤️❤️!
  • Awesome Python in Education:关于Python的学习资源列表。
  • Awesome Python Applications:181 个 Python 开源项目,涵盖了 15 个领域。GitHub:star:10.8k,推荐等级:heart::heart::heart::heart:!
  • Awesome Spider:GitHub上:star:8k+的项目,收集了各种爬虫的Python实现代码,推荐等级::heart::heart::heart:!
  • Awesome Knowledge Distillation:作为模型压缩的一种方法,知识蒸馏能够利用已经训练的一个较复杂的模型,来指导一个较轻量的模型训练,从而在减小模型大小和计算资源的同时,尽量保持原始大模型的准确率的方法。Github上的dkozlov同学,整理了Knowledge Distilling的paper、教程、代码,看完这些资料,你一定有所收获
  • Awesome Machine Learning cn:机器学习资源大全中文版,包括机器学习领域的框架、库以及软件。GitHub:star:3k
  • Awesome Time Series:时间序列预测相关的比赛、论文、会议、代码、理论资源以及数据集
  • AwesomeCV:记录state-of-art计算机视觉相关论文。
  • Awesome Reinforcement Learning:强化学习资源大全,Github:star:5k+,推荐等级::heart::heart::heart:!
  • Awesome Graph Classification:这是一个野心勃勃的项目,涵盖了从深度学习、图形内核、到统计指纹和分解等领域的优秀论文以及对应的Python实现,作者表示会持续更新。GitHub ⭐2k+。
  • Awesome Network Embedding:关于 Network Embedding 的相关论文合集,GitHub ⭐2k。
  • Awesome Graph Neural Networks:GNN相关论文列表。
  • Awesome GCN:图卷积神经网络相关资源,GitHub:star:300+。
  • Awesome Fraud Detection Research Papers:关于欺诈检测的数据挖掘论文的整理列表
  • Awesome Graph Attack Papers:图神经网络攻防论文集合
  • Awesome-model-compression-and-acceleration:模型压缩论文大全,GitHub:star:467​
  • Awesome Knowledge Distillation:作为模型压缩的一种方法,知识蒸馏能够利用已经训练的一个较复杂的模型,来指导一个较轻量的模型训练,从而在减小模型大小和计算资源的同时,尽量保持原始大模型的准确率的方法。Github上的dkozlov同学,整理了Knowledge Distilling的paper、教程、代码,看完这些资料,你一定有所收获
  • Awesome TensorFlow:TensorFlow中的教程和 ML 项目的集合,GitHub:star:14k
  • Awesome Tensorflow 2:Tensorflow 2.x资源,如教程,博客,代码和视频。推荐等级::heart::heart::heart::heart:!
  • Awesome Pytorch list:GitHub上一个:star:9k+的项目,收集了GitHub上PyTorch相关内容以及不同的模型实现、帮助文档、教程,使用PyTorch的学习。中文版。推荐等级::heart::heart::heart::heart:!
  • Awesome Papers:机器学习,深度学习,自然语言处理,计算机视觉方面的顶级期刊会议论文集
  • Awesome RecSys:推荐系统必读文献
  • Awesome Windows:GitHub上:star:9k+的项目,收列了Windows上优质&精选的最佳应用程序及工具
  • Awesome Macos:GitHub上:star:9k+的项目,为macOS整理了一份很棒的应用程序、软件、工具和亮点的列表
  • Awesome Google Colab:GitHub上的一个新项目,Colab资源汇总。作者还自己建了非官方的colab网站,收集了大量学习资源。同时上面还有很多GitHub相关技术教程汇总。推荐等级::heart::heart::heart:!
  • Awesome-algorithm-interview:算法工程师(人工智能cv方向)面试问题及相关资料的网站收集
  • Awesome Interview Questions:这个精选的面试题库不仅全,而且对提交的面试题会进行审核,并且会不定期对链接进行审核,提剔除失效链接,GitHub:star:30k+。推荐等级::heart::heart::heart:!
  • Awesom Public Datasets:本数据集列表中,按主题整理了大量的数据集内容,例如:生物学、经济学、教育等。其中列出的大多数数据集都是免费的,但在使用任何数据集之前,均需检查数据集的许可要求。
  • Awesome-Cybersecurity-Datasets:网络安全数据集列表大全。
  • Fontawesome:字体和图标库,GitHub⭐66k+。
  • Awesome Linux:一份让Linux变得更棒的项目和资源列表。
  • Awesome shell:一份精心组织的命令行工具及资源的列表。
  • Awesome osx command line:一份针对 OS X 命令行的更深入的指南。
  • Awesome Self-supervised Learning:自监督学习资源,GitHub:star:2.3k​
  • Awesome MATLAB:MATLAB 资源
  • Awesome matlab:MATLAB 资源
  • Awesome Cheatsheet:速查表资源大全
  • awesome-production-machine-learning:这个存储库包含了一系列非常棒的开源库,它们将帮助您部署、监视、版本、扩展和保护生产机器学习。GitHub:star:5.3k​
  • awesome-self-supervised-learning-for-graphs:图自监督学习论文集
  • DenseAI/awesome-deep-learning: 深度学习资料 (github.com):深度学习资料集
  • NLP-Conferences-Code:项目记录了NLP相关顶会(如ACL、EMNLP、NAACL、COLING、AAAI、IJCAI)的论文开源项目合集
  • awesome-transformer-for-vision:一个transformer用于CV的论文列表资源库。

Courses (学习课程) 🎓

💨 Back to Top

  • CS231n: Convolutional Neural Networks for Visual Recognition:斯坦福CS课程CS231:卷积网络视觉识别笔记
  • 计算机科学速成课:翻译自Youtube上的计算机科学速成课,可在B站上观看中文版(带中英字幕)
  • 北大课程资源:北京大学课程资料民间整理
  • 中国科学技术大学课程资源:收录中国科学技术大学众多课程资源的笔记,总结,经验等学生原创内容
  • 浙江大学课程攻略共享计划:浙江大学课程资源,至今为止收录了以下内容:选课攻略、电子版教材、平时作业答案、历年试卷、复习资料等
  • 清华大学计算机系课程攻略:受浙江大学相关项目启发创立的项目
  • 上海交通大学课程分享:上海交大课程学习资料
  • Mlcourse.ai:mlcourse.ai是OpenDataScience提供的开源机器学习课程。你还可以参加课程中举行的几次Kaggle Inclass比赛。GitHub:star:6.6k。
  • Hung-yi Lee:李宏毅老师的个人主页,内附有他的所有机器学习相关演讲课程
  • 李宏毅机器学习(2017):B站上李宏毅机器学习的教程视频,已有几十万的播放量,李宏毅的教授水平真心觉得很高,对于机器学习的讲解十分有趣吸引人,思路清晰,适合初学者观看。课程讲义
  • 李宏毅机器学习2020:李宏毅老师新发布的2020机器学习视频,所有课程都有各种学习资源,视频、PPT、作业一项都不少。与其它只教授机器学习基础内容不同,按照惯例,李宏毅老师还会特别讲解当前最新的算法,并将其作为补充视频上传到网上。而且,李宏毅老师的课程涉及领域非常完整,从有监督、半监督、无监督到强化学习,都会有介绍。在最新的 2020 ML 课程中,他展示了完整的学习路径。推荐等级:❤️❤️❤️❤️!
  • Applied Deep Learning:台湾大学陈蕴侬老师的“应用深度学习”课程,这门课程结构安排得相当合理,并且重点在BERT及其相关的内容和NLP任务上,对于学习深度学习自然语言处理的同学来说,完全可以和李宏毅老师深度学习人类语言处理的课程互补。B站视频
  • 斯坦福 吴恩达《CS229机器学习》):B站上吴恩达老师的机器学习教程,播放量已达到百万。吴恩达的教学视频虽然备受推崇,但其实并不适合作为入门视频,教授内容还是有一定深度的
  • Applied Machine Learning Spring 2020:哥伦比亚大学应用机器学习课程2020,GitHub视频
  • Coursera ML Py:吴恩达机器学习课程笔记,Python代码
  • CourseraML:吴恩达机器学习课程笔记,Jupyter笔记本格式
  • MIT 6.824: Distributed Systems:MIT"分布式系统课程"(Distributed Systems),业内大名鼎鼎,新手入坑分布式系统的首选学习教程。B站地址
  • Virgilio:这个项目是 GitHub 上一位名为“维吉尔(Vigilio)”的开发者整理的一个:star:10k的项目,项目包括职业进阶路径、专业知识讲解、工具介绍等,着重强调,不走弯路,简明扼要。GitHub中文版链接。推荐等级::heart::heart::heart:!
  • Leeml Notes:李宏毅老师的机器学习视频是机器学习领域经典的中文视频之一,也被称为中文世界中最好的机器学习视频。这个笔记是根据李宏毅老师机器学习视频的一个辅助资料,本笔记基本上完全复刻李老师课堂上讲的所有内容,并加入了一些和相关的学习补充资料和参考资料,结合这些资料一起学习,相信你会对机器学习有更加深刻的理解。在线阅读地址配套视频。推荐等级::heart::heart::heart:!
  • Spring 2019 Full Stack Deep Learning Bootcamp:深度学习全栈课程,这份课程主要可以学习到计算机视觉目标检测,机器学习项目通用流程,文本OCR识别, 深度学习工具全栈,数据管理,深度学习调试等等知识。
  • OKAI:通过交互动画的形式来科普人工智能的历史,应用和主要算法(深度学习算法)的基础原理。OKAI摒弃了那些复杂的数学公式,采用轻松有趣的动画形式来讲解人工智能的相关概念。
  • Deep Learning Drizzle:Deep Learning Drizzle 是一个深度学习相关课程/讲座视频的大合集,其中不乏学界知名大牛的亲授课程。目前该项目已经在Github收获了6000+星,Fork数也超过1.4K。仓库维护者整理了14个类目共计232门视频课程,并且这个数字还在不断增加。推荐等级::heart::heart::heart:!
  • Computer Science:Github 50k​ ⭐的计算机专业课程,总结了从零开始成为计算机大牛的学习之路。课程主要分为两部分,即 CS 核心知识与 CS 进阶知识。CS 核心知识需要我们具备高中水平的理科知识,包括几何、代数、简要微积分等等。当然,如果我们还记得大学学过的高数,那么背景知识就已经非常充足了。对于 CS 进阶知识,我们应该首先掌握整个 CS 的核心知识体系,从而进一步选择想要进修的子领域,推荐等级:❤️❤️❤️!
  • Berkeley-cs294-158-sp19:这份课程涵盖了两个无需标签数据的深度学习领域:深度生成模型(Deep Generative Models)和自监督学习(Self-supervised Learning)。生成模型的最新进展使得可以对高维原始数据进行逼真的建模,例如自然图像,音频波形和文本语料库;自我监督学习的进步已经开始缩小监督表征学习与无监督表征学习之间的差距,以微调未见任务。本课程将涵盖这些主题的理论基础及其新启用的应用程序,你可以观看 YouTube 讲座视频,还可以下载课件的 PDF 版。
  • Machine Learning Study Path:从入门到进阶,所用到机器学习资料,包括书、视频、源码。
  • The Craft of Selfteaching:自学的技巧,GitHub上10k的项目,作者是李笑来
  • AppliedML:一个深入scikit-learn和机器学习的内容,免费。这套课程名叫AppliedML。
  • Machine Learning Crash-Course:谷歌的《机器学习速成课程》 (内容已全部汉化,注重实践)
  • The Matrix Calculus You Need For Deep Learning:本文从简单函数求导到多元函数求偏导,再到矩阵的微积分运算,逐层深入,引导我们探索深度学习背后的学习规则与数学基础。本文试图解释理解深度神经网络的训练所需要的所有矩阵演算,本文适用于对神经网络基础有所了解的人,不过即使没有数学基础的同学也不要紧,作者提供了相关数学知识链接。在文末作者提供的参考部分,总结了这里讨论的所有关键矩阵演算规则和术语。
  • FreeCodeCamp:开放源码代码库和课程。与数百万人一起免费学习编程。网站:https://www.freeCodeCamp.org (一个友好的社区,您可以在这里免费学习编码。它由捐助者支持、非营利组织运营,以帮助数百万忙碌的成年人学习编程技术。这个社区已经帮助 10,000 多人获得了第一份开发人员的工作。这里的全栈 Web 开发课程是完全免费的,并且可以自行调整进度。这里还有数以千计的交互式编码挑战,可帮助您扩展技能。)GitHub 获:star:300k。
  • Design Patterns For Humans:GitHub上获:star:25k,一份超全的设计模式讲解(共 23 种),每一种设计模式解释都通俗易懂(中文版)。英文原版链接,推荐等级::heart::heart::heart:!
  • Web 学习笔记:GitHub上:star:13k+的项目,超详细的Web前端学习图文教程,推荐等级::heart::heart::heart:!
  • Javascript课程地址,这本教程由国外一个叫 iliakan 的小哥所著,并提供了英文、俄文、日文、中文等多个版本供读者免费在线查阅。如果你需要进行离线查阅,可付费购买该教程的 EPUB/PDF 版本。完整教程的购买只需要 60 元,可以说是非常良心了。如果你读完觉得这本教程不错,不妨也花钱支持一下作者。
  • LaTeX-cn:目前最好的 LaTex 中文教程
  • Google Machine Learning Crash Course:谷歌机器学习速成课程(招式)+机器学习术语表(口诀)+机器学习规则(心得)+机器学习中的常识性问题 (内功)。该资源适用于机器学习、深度学习以及TensorFlow研究人员参考!
  • Halfrost-Field 冰霜之地:GitHub上的一个笔记仓库,包含了作者阅读开源框架源代码的心得记录。例如其中的机器学习模块,包含了吴恩达机器学习课程 11 周完整内容,每一周单独对应一个 Jupyter Botebook 文件。GitHub 获:star:4k+。作者主页
  • ML Paper Notes:机器学习/计算机视觉/ NLP论文的笔记和总结,推荐等级::heart::heart::heart:!
  • BigData-Notes:大数据入门指南,其中对大数据学习路线、技术栈思维导图、常用软件安装指南都给出了非常详细的介绍。GitHub 上已获:star:3k。
  • CS 205L: Continuous Mathematical Methods with an Emphasis on Machine Learning:斯坦福大学最近新开设一门课程《Continuous Mathematical Methods with an Emphasis on Machine Learning》,以机器和深度学习为重点的计算机视觉和机器人学中连续数学方法的综述。虽然从机器学习的角度出发,但本课程将侧重于计算线性代数和优化等基础数学方法,以及反向传播自动微分、常微分方程动量法、CNNs、RNNs等专题。
  • Project Based Learning:该资料主要汇总整理了一系列编程教程,教你如何从零开始构建一个应用,其中包含 C、C++、Java、PHP、JavaScript、Python 等主流编程语言教程。GitHub ⭐20k+。推荐等级:❤️❤️❤️❤️!
  • Build your own X:该仓库收集了诸多计算机科学领域的教程资源,旨在从零开始,教授开发者构建一款完全属于自己的开发工具,其中包括增强现实、区块链、机器人、编辑器、命令行工具、神经网络、操作系统等几大领域。作为一名开发者,若能日拱一卒,沉下心来,跟着这个仓库里面的教程挨个做一遍,相信其技术水平定会有质的飞跃。GitHub ⭐50k+。推荐等级:❤️❤️❤️❤️!
  • Tensorflow Data and Deployment:吴恩达创始的 deeplearning.ai 在 Coursera 上另外开设了一门课程,主要介绍使用 Tensorflow.js、TensorFlow Lite、TensorFlow Hub 等工具进行数据分析的方法。该专项课程已于今日开放注册。吴恩达对课程进行了转推。
  • 机器学习中的神经网络:深度学习三巨头之一,Geoffrey Hinton通过twitter公布了自己在2012年准备的MOOC课程——机器学习中的神经网络。课程中详细介绍了神经网络的各种概念与特点,虽然来自于5年前,但仍不失为一份很有意义的讲解
  • Practicalai:近期开源的自学深度学习 GitHub 项目,作者为每种具体算法提供了 Jupyter notebook 实现,可以轻易地在 Google Colab 上运行(免费提供云端 GPU 或 TPU)。所以想自学深度学习,不需要价格几千美元的 GPU,有一个 Chrome 浏览器就够了。这一套实践教程都能直接在 Colab 上运行,因此结合解释与代码,我们能更好地入门机器学习。推荐等级::heart::heart::heart::heart:!
  • Introduction to Artificial Intelligence:Gilles Louppe Fall2019硬核课程:人工智能导论(Introduction to Artificial Intelligence),722页ppt,本课程的核心内容基于教科书:“人工智能:一种现代的方法”【第三版,作者:罗素 (Stuart J.Russell) / 诺维格 (Peter Norvig)】,某些课程和材料部分改编自加州大学伯克利分校的“人工智能入门”。
  • Kaggle: Faster Data Science Education:想学Python 、机器学习、数据可视化……你可能会想Coursera上的在线教程,或者吴恩达大名鼎鼎的深度学习视频课,或者一些有名的网上社区,比如fast.ai,Udemy和EdX。但是你可能会因为时间不够就半途而废。Kaggle官网的一系列课程完美地解决了这个问题。只需要几个小时就可以学到最有用的技术。包含课程为:Python,机器学习入门,中极机器学习,数据可视化,Pandas,特征学习,深度学习,SQL入门,SQL进阶,地理空间分析,机器学习可解释性。推荐等级::heart::heart::heart::heart:!
  • Introtodeeplearning:MIT 6.S191:全面、公开,还有业界反馈的深度学习课。每周更新一次课程视频,还提供了 PPT 和 Lab Session 的内容。在家闲着没事的你,也可以看看这些资料,感受下 MIT 的熏陶。推荐等级::heart::heart:!
  • CS512 Spring 2020 "Data Mining: Principles and Algorithms":UIUC韩家炜老师2020年新课:CS512 数据挖掘:原理与算法课程。本课程内容包括:网络概论、信息网络挖掘、序列与图数据挖掘、先进的聚类方法、离群点分析方法、数据流挖掘、时空数据挖掘、文本数据挖掘、Web数据挖掘等。个人主页
  • 实验楼:各种语言基础教程及相关项目。
  • Python 中文学习大本营:Python中文学习大本营
  • CS234: Reinforcement Learning Winter 2020:斯坦福大学的最新课程CS234——强化学习,主讲人是斯坦福大学Emma Brunskill,她是斯坦福大学计算机科学助理教授,任职斯坦福大学人类影响力实验室、斯坦福人工智能实验室以及统计机器学习小组,主要研究强化学习。要实现人工智能的梦想和影响,需要能够学会做出正确决策的自主系统。强化学习是这样做的一个强有力的范例,它与大量的任务相关,包括机器人、游戏、消费者建模和医疗保健。本课程通过讲课、书面作业和编码作业的结合,学生将精通强化学习的关键思想和技术。
  • Lectures for INFO8010 - Deep Learning:深度学习课程 PPT,深入探讨深度学习架构的细节,重点是学习这些任务的端到端模型。学生将学习实施、训练和调试自己的神经网络,并对该领域的前沿研究有详细的了解。该课程还将介绍推理方法的最新创新,包括微分推理、对抗性训练和贝叶斯深度学习。作者主页Gilles Louppe
  • Electrical Engineering and Computer Science:麻省理工学院(MIT)近日放出了 2400 门课程资料,其中也包括电气工程和计算机科学系的多门公开课。这个平台上课完全是为了解决自身知识盲区而来,它的各种 quiz、problem sets、project 等一系列辅助配套设施非常完善。线上教学的所有课件、教授所写的补充材料等都能下载下来以便随时复习。
  • More Python for Beginners:微软退出的 Python 学习课程,该课程将研究一些Python中级知识,诸如lambda和面向对象的编程等。这一系列课程共有20个视频,每个视频时长在2-15分钟不等。
  • 微软官方 Python 初级教程:由微软的高级项目经理 Christopher Harrison、以及 AI Gaming 的开发经理 Susan Ibach 共同讲解的《微软官方 Python 初级教程》。这个课程主要分为 44 集,内容主要面向初级开发者,着重介绍 Python 安装流程、在 VSCode 中安装 Python 扩展、基础知识(注释、字符串、日期、错误类型、循环、函数、模块、变量、API)的应用。
  • 微软官方 Python 进阶教程:该课程共分为 20 集,内容包含 Python 的格式化、类、继承、文件系统管理、异步编程等核心知识,让你了解 Python 的进阶使用技巧。
  • 微软官方 Python 高阶教程:在这个教程里面,将由前两个初中级课程的老师接着担任,带你感受 Python 在当下最流行的技术应用领域 - 机器学习中的实际应用。你将从这里面学到 Jupyter Notebooks、Anaconda、Pandas、DataFrame 的使用技巧,手把手带你玩转数据科学,感受 Python 的高阶用法。
  • Even More Python for Beginners: Data Tools:它将带你使用Python进入数据科学和机器学习。虽然课程里面不会讨论选择算法或构建模型的问题,但是会重点介绍Jupyter Notebooks,这是数据科学家最喜欢的工具之一。
  • 微软人工智能教育与学习共建社区:本社区是微软亚洲研究院(Microsoft Research Asia,简称MSRA)人工智能教育团队创立的人工智能教育与学习共建社区。平台开发团队在GitHub上表示,该平台是在教育部指导下,依托于新一代人工智能开放科研教育平台,微软亚洲研究院研发团队和学术合作部将为本社区提供全面支持。
  • AI-神经网络基本原理简明教程:GitHub上微软人工智能教育与学习共建社区,微软Xiaowuhu根据自己亲身经历的学习轨迹,归纳出了以下教程,可以帮助小白做到真正的从入门到精通。通过以下循序渐进地学习与动手实践,一方面可以帮助读者深刻理解“深度学习”的基础知识,更好地理解并使用现有框架,另一方面可以助力读者快速学习最新出现的各种神经网络的扩展或者变型,跟上快速发展的AI浪潮
  • Analytics Vidnya:一个国外的网站,有各类深度学习相关的教程,推荐等级::heart::heart::heart:!
  • Dataquest.io:Dataquest 提供完整的数据分析师、数据科学家和数据工程师学习路径。其中大量内容,尤其是数据分析师学习路径的内容可以免费获取。如果你资金充足,我强烈建议你付费订阅并学习这些内容。我学了这个课程,从中了解到数据科学的基础知识。数据科学家路径课程花费了我 6 个月时间。每个月的价格从 24.5 美元到 49 美元不等,这取决于你是否购买年费会员。资金充足的话,购买年费会员更划算
  • Amueller:如果你已经学完了 Dataquest 上的数据科学课程,那么你应该对使用 Python 执行机器学习的基础知识有了充分了解。如果还没有,这方面也有很多免费资源。我推荐首先从 scikit-learn 开始学起,因为 scikit-learn 是目前最常用的机器学习 Python 库。很幸运,scikit-learn 核心开发者之一 Andreas Mueller 举办了为期两天的 workshop,同时发布了该课程的所有材料,包含幻灯片、课程笔记和 notebook。推荐大家先学习这份资料。
  • 《CSE 291: Domain Adaptation in Computer Vision》:来自加州大学圣地亚哥分校《计算机视觉中的领域自适应》课程,还有一些优秀的学习资源。推荐等级::heart::heart::heart:!
  • The Machine Learning Summer School:机器学习暑期学校(MLSS)系列开始于2002年,致力于传播统计机器学习和推理的现代方法。今年因新冠疫情在线举行,从6月28号到7月10号讲述了众多机器学习主题。推荐来自DeepMind Shakir Mohamed博士讲述《贝叶斯推断》,125页ppt系统性讲述了贝叶斯推断基础知识和最新进展,非常干货。
  • Harvard College CS50:哈佛大学 CS50 2020 秋季课程即将面世,在家也可以共享「撕书教授」David Malan 的 4k 超高清神课了。推荐等级::heart::heart::heart:!
  • CSC2515 2020 Machine Learning:多伦多大学2020秋季《机器学习导论》课程,课程的前半部分侧重于监督学习。从最近邻、决策树和集合开始。然后介绍了参数化模型,包括线性回归、logistic回归和softmax回归以及神经网络。然后转向无监督学习,特别关注概率模型,以及主成分分析和k均值。最后介绍了强化学习的基础知识。推荐等级::heart::heart::heart:!
  • 20h lectures:reddit上20小时深度学习与强化学习的课程。推荐等级::heart::heart::heart:!
  • 《Advanced Machine Learning》:UBC 高级机器学习课程。推荐等级::heart::heart::heart:!
  • conv_arithmetic:卷积神经网络算法可视化学习

Books (书籍资料) 📚

💨 Back to Top

  • 数据科学推荐阅读清单:一份数据科学推荐阅读清单,包含 10 本在线免费书籍
  • Most Recommended Programming Books:25本最推荐的编程书籍,推荐等级:heart::heart::heart:!
  • Free Books:阮一峰老师在 GitHub 上整理了他平时所发现的一些免费技术书籍。书籍列表包括 Web 开发、人工智能、系统管理等内容,覆盖面颇广
  • Deep Learning Books:一些机器学习、深度学习等相关话题的书籍。推荐等级::heart::heart::heart::heart:!
  • CS-BOOK:计算机类常用电子书整理,并且附带下载链接,包括Java,Python,Linux,Go,C,C++,数据结构与算法,人工智能,计算机基础,面试,设计模式,数据库,前端等书籍。GitHub:star:1.5k。
  • CSBook:另一个计算机电子书仓库
  • Books Collection:books-collection 给程序员的开源、免费图书集合,GitHub:star:1.8k。
  • Free Machine Learning Books:免费机器学习书籍下载
  • Free programming books:免费提供的编程书籍。GitHub获:star:130k。
  • Cambridge Textbooks:剑桥大学出版社免费开放了网页版高等教育教材,包含Cambridge Core(剑桥电子期刊和电子图书数据库)中超过700本教材,涵盖21个学科、领域。其中计算机领域提供了25本与计算机相关的高等教材。细分领域包括机器学习、数据科学、网络、编程等,而且教材大部分都特别新!
  • Freecomputerbooks:这是一个专注于计算机、变成、数学、电子工程、软件工程等技术书籍的网站,所有资源均可免费下载。网站的分类做得非常棒,资源也很丰富,还能看到不少2019年新出版的新书。
  • 《Python Tips for Data Scientist》:Wenqiang Feng, Xu Gao and Upendra Madam三位数据科学家撰写了一本《给数据科学家的Python技能秘籍》,简明扼要,非常实用,使用与数据科学家相关的详细演示代码和示例来共享一些用于数据科学家工作的有用python技巧,值得放在身旁学习查看!推荐等级::heart::heart::heart::heart:!
  • 《深度学习:Deep Learning》:深度机器学习的最新发展使视觉识别、语音和文本理解或自主智能体系统取得了前所未有的巨大进步。在此背景下,本课程将深入探讨深度学习架构的细节,重点是学习这些任务的端到端模型。学生将学习实施、训练和调试自己的神经网络,并对该领域的前沿研究有详细的了解。该课程还将介绍推理方法的最新创新,包括微分推理、对抗性训练和贝叶斯深度学习。
  • 《贝叶斯深度学习: Deep Learning with Bayesian Principles》:来自东京RIKEN研究中心的Emtiyaz Khan给了关于以贝叶斯原理进行深度学习的教程《Deep Learning with Bayesian Principles》,共有86页ppt,以及撰写了最新的论文,讲述贝叶斯和深度学习如何结合到一起进行学习新算法,提出了一种基于贝叶斯原理的学习规则,它使我们能够连接各种各样的学习算法。利用这一规则,可以在概率图形模型、连续优化、深度学习、强化学习、在线学习和黑盒优化等领域得到广泛的学习算法。非常具有启发性,值得查看!视频地址
  • 《Machine Learning Yearning cn》:Machine Learning Yearning 中文版 - 《机器学习训练秘籍》 - Andrew Ng 著。GitHub 已获:star:5k+
  • 《A Self-Learning, Modern Computer Science Curriculum》:国外一位工程师写的计算机自学指南,中文译名应为《现代化计算机科学自学指南》,内容包含着许多来自许多世界知名高校、顶尖的教授与技术专家所编著的计算机课程
  • 深度学习,统计学习,数学基础》人工智能算法工程师手册:市面上很多人工智能相关的书籍。大部分的书,面向小白,内容深度不够;小部分教材书或者科研书,内容艰深,又过于复杂。那么有没有,面向算法工程师(程序员)人群的,面向有一定数学基础、算法基础,能够快速上手写代码的人群的人工智能手册呢?有的!而且免费开源,非常有程序员范!《AI算法工程师手册》你值得拥有!推荐等级::heart::heart:!
  • 《Introduction to Applied Linear Algebra – Vectors, Matrices, and Least Squares》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著的应用线性代数导论:向量、矩阵和最小二乘法。这本书的目的是提供一个介绍向量,矩阵,最小二乘方法,应用线性代数的基本主题。目标是让学生通俗易懂,入门学习。让学习者了解在包括数据拟合、机器学习和人工智能,断层、导航、图像处理、金融、和自动控制系统的应用。是一本不可多得好教材。
  • 《Machine Learning in Action》:以 Python 为基础的机器学习实战编程书籍:《Machine Learning In Action》,中文译为《机器学习实战》。本书代码地址,以及中文版代码仓库地址
  • 《Pattern Recognition and Machine Learning . Information Science and Statistics》:又名 “PRML”(书名首字母缩写),一本经典好书,以贝叶斯的视角为主,同时其难度可能很不适于缺乏数学基础的入门者。算法实现 PRML,GitHub:star:6k+。推荐等级::heart::heart::heart:!
  • 《Natural Language Processing in Action》:自然语言处理(NLP)系统的开发已建立了通过人脑与人脑之间进行信息流和计算的多种技术。这本新书《Natural Language Processing in Action:Understanding, analyzing, and generating text with Python 》为我们提供了从基础知识到动手构建后端NLP系统的全套学习内容,希望对您开启NLP学习之旅有所帮助。GitHub代码地址
  • 《语雀 IT 百科精品知识库》:这是由国内语雀团队出品的《语雀 IT 百科精品知识库》,这些精品知识库涵盖了互联网技术的主要领域,包含了实实在在的内容,都经过作者认真的整理和编辑,具有一定的学习和参考价值。对于想要投身互联网开发的朋友,这些都是很好的资料,值得收藏。
  • 《Algebra, Topology, Differential Calculus, and Optimization Theory For Computer Science and Engineering》:宾夕法尼亚大学计算机和信息科学系教授 Jean Gallier 的开源书籍《Algebra, Topology, Differential Calculus, and Optimization Theory For Computer Science and Engineering》用一本书的容量涵盖了学习计算机科学所需要的数学基础
  • 《神经网络与深度学习》:这本《神经网络与深度学习》全中文版,大大降低了深度学习的语言门槛,让大家有更多的精力放在核心知识内容的学习上。内容上,它面向深度学习小白,从人工智能的基本概念开始讲起,可以说很友好了。此外,各种附加资料一站式配齐:从教材、讲解PPT、示例代码到课后练习,全方位无死角学习。这本书的作者邱锡鹏老师,目前是复旦大学计算机科学技术学院的博士生导师、自然语言处理与深度学习组的副教授。 PDF 讲义课件 PDF课程练习,推荐等级::heart::heart:。
  • 《You-Dont-Know-JS》:您还不认识 JS(书籍系列)- 第二版。GitHub 获:star:110k。
  • 《Limitations of Interpretable Machine Learning Methods》:可解释机器学习的局限性《Limitations of Interpretable Machine Learning Methods》,阐述了可解释机器学习的概念、方法等,以及重要的是适用的边界,即可解释机器学习的局限,知道能与不能方能用好IML。本书共14章,是Christoph Molnar课题组最新成果,值得参阅。
  • 《Introduction to Natural Language Processing》:Google AI研究科学家Jacob Eisenstein 博士的自然语言处理领域新书《Introduction to Natural Language Processing》由MIT出版社在10月份发行。在该教材最新版PDF 在 GitHub 上开放。这本书的内容主要分为四大章节,即 NLP 中监督与无监等学习问题、序列与解析树等自然语言的建模方式、语篇语义的理解,以及后这些技术最在信息抽取、机器翻译和文本生成等具体任务中的应用。整本开放书共四部分,19章,587页pdf,是了解最新自然语言处理进展的不可多得的教材。
  • 《A Course In Machine Learning》:A Course in Machine Learning》属于入门级资料,它涵盖了现代机器学习的大多数主要方面(监督学习,无监督学习,大间隔方法,概率建模,学习理论等)。它的重点是具有严格基础的广泛应用。
  • 《Bayesian Networks》:贝叶斯网络在经济学、人工智能、交通系统、医疗领域都有举足轻重的应用,许多研究表明,贝叶斯网络是可靠和稳定的因果关系表示。本书的写作者阐明了贝叶斯网络在各个领域的进展和应用。
  • 《Django By Example》:《Django By Example》中文翻译博客。
  • 《Clean Python》:探索用Python编写代码的正确方法。GitHub
  • 《ThinkStats2》:统计思维:程序员数学之概率统计这本书的作者是美国计算机科学家Allen B. Downey。《统计思维》着重介绍了一些简单的技术,读者可以用真实的数据集对其进行探索。GitHub地址
  • 《The Elements of Statistical Learning: Data Mining, Inference, and Prediction》:统计学习基础,斯坦福大学数学科学教授Trevor Hastie等人出品。这本书强调的是概念而非数学本身,内文采用大量图表来展示范例。本书涵盖的范围很广,从监督学习到无监督学习,均有涉及。
  • 《Think Bayes: Bayesian Statistics Made Simple》:简明贝叶斯统计。关于贝叶斯统计的大多数书籍都是用数学符号来表达思想。这本书则用Python代码代替了数学符号,并用离散近似替代连续。此书同样附赠配套代码实现,还有人提供了IPython notebooks版本,可以在线修改、运行代码。Jupyter notebook
  • 《Probabilistic Programming & Bayesian Methods for Hackers》:贝叶斯方法:概率编程与贝叶斯推断,这本书旨在从计算/理解第一,数学第二的角度介绍贝叶斯推断。作为一本入门书籍,本门适合非数学专业、对数学没有那么感兴趣的贝叶斯方法实践者。
  • 《Computer Age Statistical Inference》:计算机时代统计推断,同样来自斯坦福大学,由Bradley Efron和Trevor Hastie两位老爷子共同打造。从经典推理理论开篇,以对统计和数据科学未来方向的推测作为结尾,这本书回顾了1950年以来数据分析革命的始末。生存分析、逻辑回归、经典贝叶斯、随机森林、神经网络、马尔可夫链蒙特卡罗方法……在这本书中,你都能找到。
  • 《The Elements of Data Analytic Style》:这本书侧重于传统统计学课程和教科书容易遗漏的细节,可作为数据科学或数据分析入门课程教材。
  • 《The Ancient Art of the Numerati》:程序员数据挖掘指南,这是一本入门向书籍,用于学习基本的数据挖掘知识。大部分关于数据挖掘的书都着重于理论知识的讲解,虽然理论知识非常重要,但还是有些让人望而却步。如果你是一名程序员,想对数据挖掘做一些初步的了解,那么可以选择这本书。本书采用“边学边做”的方式编写,作者强烈建议读者动手实践每一章结尾提供的练习题。中文版
  • 《Social Media Mining: An Introduction》:社交媒体挖掘,本书将社交媒体、社交网络分析和数据挖掘集成在一起,为相关从业人员提供了一个方便的平台,以了解社交媒体挖掘的基础和潜力。这本书适合作为高年级本科生、研究生课程,以及专业短期课程的教材,内含难度系数不等的练习,可以帮助读者加强理解。
  • 《The Art of Data Science》:数据科学的艺术,本书介绍了分析数据的过程。作者是约翰霍普金斯大学生物统计学教授Roger D. Peng和UT奥斯汀教授Elizabeth Matsui,他们在数据分析方面具有丰富的经验。
  • 《The Data Science Handbook》:数据科学手册,这本书是25位杰出数据科学家深度访谈的汇编。其中,有来自领域专家的见解、故事和建议。
  • 《Conversations On Data Science》:数据科学对话,约翰霍普金斯大学生物统计学教授Roger D. Peng,以及Stitch Fix数据科学家Hilary Parker的对话实录,主题是数据科学及其在现实世界中是如何发挥作用的。
  • 《Object-Oriented Programming with Python》:Python面向对象编程,此书针对Python 3面向对象编程,是一本简明、权威的指南。语言简明,概念清晰。适合已经对Python有所理解的中级学习者。
  • 《Automate the Boring Stuff with Python》:Python编程快速上手:让繁琐工作自动化,本书是一本面向实践的Python编程实用指南。不仅介绍了Python语言的基础知识,作者还希望通过项目实践,教会读者如何应用这些知识和技能。每一章的末尾都有习题和实践项目,附录部分提供了参考答案。适合编程基础薄弱的初学者。中文版
  • 《Python-Knowledge-Handbook》:《Python知识手册》 由 『Python数据之道』出品
  • 《Python Data Science Handbook》:Python数据科学手册,ython科学计算必备资料。这本书非常适合作为解决日常问题的参考书籍,包括:处理、转换和清除数据;可视化不同类型的数据;使用数据建立统计或机器学习模型。
  • 《Learn Python, Break Python》:这本书由浅入深,从对编程的简要介绍开始,一步步引入更复杂的程序元素。面向初学者。
  • 《Natural Language Processing with Python》:Python自然语言处理,本书对自然语言处理进行了易于理解的介绍。从中可以学习到如何编写适用于大量非结构化文本的Python程序。
  • 《Data Science in Production》:产品中的数据科学,从初创企业到价值数万亿美元的大公司,数据科学正在最大化数据价值方面发挥着重要的作用。本书面向希望在多个云环境中构建数据产品,并开发应用数据科学技能的分析从业人员。
  • 《Data Driven》:数据驱动,介绍了Google、Linkedln和Facebook如何利用自身数据,以及沃尔玛,UPS和其他公司是如何在大数据时代到来之前,就充分利用了数据资源的案例。
  • 《Hands-on Machine Learning with Scikit-Learn and TensorFlow》:Scikit‑Learn与TensorFlow机器学习实用指南,通过具体的示例,最少的理论和scikit-learn、TensorFlow这两大工具,作者将构建人工智能系统的概念和工具直观地展示了出来。同样由浅入深循序渐进,从简单的线性回归开始,一路深入到神经网络。
  • 《Understanding Machine Learning: From Theory to Algorithms》:深入理解机器学习:从原理到算法,本书讨论了学习的计算复杂度、凸性和稳定性、PAC-贝叶斯方法、压缩界等概念,并介绍了一些重要的算法范式,包括随机梯度下降、神经元网络以及结构化输出。适合有一定基础的高年级本科生和研究生学习,也适合作为IT行业从事数据分析和挖掘的专业人员以及研究人员参考阅读。
  • 《Reinforcement Learning: An Introduction》:强化学习简介,本书对强化学习领域的关键思想和算法进行了简明清晰的说明。
  • 《Deep Learning》:深度学习,Ian Goodfellow,Yoshua Bengio和Aaron Courville共同撰写。旨在帮助学生和从业人员全面了解机器学习,尤其是深度学习。讲课练习其它。MingchaoZhu 同学基于数学推导和产生原理重新描述了书中的概念,并用Python (numpy 库为主) 复现了书本内容,已在Github上开放: DeepLearning。推荐等级:❤️❤️❤️❤️!
  • 《Machine Learning Yearning》:吴恩达出品。本书的重点不在于机器学习算法本身,而是如何让机器学习算法工作。GitHub
  • 《D3 Tips and Tricks》:D3 Tips and Tricks介绍了如何利用d3.js这一工具,实现数据可视化。其中包含50多个可以下载的代码示例。
  • 《An Introduction to Statistical Learning》:统计学习导论:基于R应用,这本书由南加州大学马歇尔商学院院长Gareth James等人出品,主要面向非数学专业的高年级本科生,硕士生和博士生。该书内容主要由R语言实现,并详细说明了统计学习方法在现实生活中的应用实例。
  • 《Deep Learning》:深度机器学习的最新发展使视觉识别、语音和文本理解或自主智能体系统取得了前所未有的巨大进步。在此背景下,本课程将深入探讨深度学习架构的细节,重点是学习这些任务的端到端模型。学生将学习实施、训练和调试自己的神经网络,并对该领域的前沿研究有详细的了解。该课程还将介绍推理方法的最新创新,包括微分推理、对抗性训练和贝叶斯深度学习。
  • 《Algorithm Design》:康奈尔大学Jon Kleinberg 与Éva Tardos 两位著名教授编著的算法设计《Algorithm Design》是关于算法经典的教科书。在普林斯顿大学wayne个人主页下配备了关于算法设计的相关课件,以及电子书864页pdf,值得查看学习。本文鼓励对算法设计过程的理解和算法在更广泛的计算机科学领域的作用的欣赏。
  • 《Machine Learning Systems》:《机器学习系统》,本文首先介绍了反应性机器学习基础,然后介绍如何建立一个反应式机器学习系统(收集数据、生成特征、学习模型、评估模型、发布模型),最后介绍如何操作一个机器学习系统。
  • 《Python Tips for Data Scientist》:最近Wenqiang Feng, Xu Gao and Upendra Madam三位数据科学家撰写了一本《给数据科学家的Python技能秘籍》,简明扼要,非常实用,使用与数据科学家相关的详细演示代码和示例来共享一些用于数据科学家工作的有用python技巧,值得放在身旁学习查看!
  • 《Mastering Large Datasets with Python》:《用Python掌握大型数据集》,作者J.T. Wolohan向您介绍了如何使用Python编码的功能影响方法来处理小型项目并对其进行扩展。您将探索有助于清晰性和可伸缩性的方法和内置Python工具,比如高性能并行方法,以及支持高数据吞吐量的分布式技术。本实用教程中丰富的实践练习将为任何大型数据科学项目锁定这些基本技能。
  • 《深度学习实践》:旷视研究院和北大数学科学学院机器学习实验室联合出品的中文深度学习课程,不仅有讲课视频、有PPT,而且还免费。
  • 《Grokking-Deep-Learning》:《探索深度学习》教会你从头开始建立深度学习神经网络!经验丰富的深度学习专家 Andrew W. Trask 将向你展示了深度学习背后的科学,所以你可以自己摸索并训练神经网络的每一个细节。只使用 Python 及其数学支持库 Numpy,就可以训练自己的神经网络,将文本翻译成不同的语言,甚至像莎士比亚一样写作!完成后,您将准备好掌握深度学习框架。
  • 《The Hundred-Page Machine Learning Book》:《百页机器学习》,这本书诞生于 LinkedIn 上的一个挑战(Andriy 是一个有影响力的人)。他的书不需要太多的介绍:亚马逊同类产品的畅销书,可能还是这一主题的最好的书面知识总结。
  • 《Learn From Data》:如果你想开始学习机器学习的关键概念,那么你会喜欢这本书:简单易懂,简洁明了。这可能是继吴恩达课程之后最好的学习资源!这是我第一本关于机器学习的书和课程。
  • 《Machine Learning Yearning》:《机器学习秘籍》,Andrew Ng 博士目前正在撰写的一本免费书籍,教你如何构造机器学习项目。 本书的重点不是教你如何使用 ML 算法,而是教你如何使用 ML 算法。
  • Interpretable Ml Book:Christoph Molnar年初公开的《可解释的机器学习(Interpretable Machine Learning)》,带你打开机器学习的黑盒子。在线阅读链接中文版链接
  • InterpretableMLBook:《可解释的机器学习》中文版翻译,由复旦大学朱明超完成它的翻译和校正工作,目前已经开源放到GitHub网页上
  • 《神经网络与深度学习》:神经网络是有史以来最漂亮的编程范例之一。在传统的编程方法中,我们告诉计算机要做什么,把大问题分解成许多小的、精确定义的任务,计算机可以轻松地执行这些任务。相反,在神经网络中,我们不会告诉计算机如何解决我们的问题。相反,它从观测数据中学习,找出自己解决手头问题的方法。
  • 《自然语言处理》:《自然语言处理》一书 pdf
  • 《Structure and Interpretation of Computer Programs》:这是曾经 MIT 计算机系本科生的教材,用 Lisp 的一种极简的方言 Scheme 语言作为初学者编程语言 —— 而不是常用的 Java、Python、C,SICP 训练的是大家如何表达。
  • 《The Art of Unix Programming》:Unix 有很多设计的智慧值得学习。
  • 《Paul Graham‘s Essays》:Paul Graham 是硅谷著名的工程师、创业者、和投资人,创办了 Y Combinator,在他的主页上有一系列著名的文章。推荐等级:heart::heart::heart:!
  • 《Optimization for Machine Learning》:机器学习最优化课程笔记
  • Cpp-Primer:《C++ Primer 第五版》英文版习题解答。
  • Cpp_Primer_Answers:《C++ Primer 第五版》中文版习题解答
  • Cpp_Primer_Practice:《C++ Primer 第五版》笔记和课后练习答案
  • 《Go2-book》:《Go2编程指南》开源图书,重点讲解Go2新特性,以及Go1教程中较少涉及的特性
  • Data Science Notes:数据科学的笔记以及资料搜集,GitHub:star:3k​
  • Cobol Programming Course:本项目主要提供一份适合初学者的分章节 COBOL 编程语言课程指南,以及各个章节的源代码。就具体内容而言,本指南主要介绍了如何通过配置有 Zowe 和 Z Open Editor 扩展的 Visual Studio Code 等现代工具,来掌握 COBOL 编程技巧。并且,指南中还讲述了如何来编写、测试、执行和 debug COBOL 程序。GitHub:star:1.1k+​
  • 《Hands-on Scala Programming》:《Hands-on Scala Programming》,中文译名(借鉴自阮一峰老师)为:《动手学 Scala 编程》,由新加坡 总理儿子所著
  • 《Ensemble Methods:Foundations and Algorithms》:2012年,周志华教授出版的一本被称为“森林书”的英文专著:《Ensemble Methods:Foundations and Algorithms》,本书在豆瓣读书上的参评人数不多,但一小部分有机会读过原著的同学硬生生把分数给到了逆天的10分满星!推荐等级:❤️❤️❤️❤️!
  • 《Machine Learning Concepts with Python and the Jupyter Notebook Environment》:这本书打破了编程机器学习应用程序的任何障碍,通过使用Jupyter Notebook而不是文本编辑器或常规IDE。您将从学习如何使用Jupyter笔记本来改进使用Python编程的方式开始。在获得一个良好的基础与Python工作在木星的笔记本,你将深入什么是TensorFlow,它如何帮助机器学习爱好者,以及如何解决它提出的挑战。在此过程中,使用Jupyter笔记本创建的示例程序允许您应用本书前面的概念。推荐等级::heart::heart::heart::heart:!
  • 《Machine Learning From Scratch》:本科毕业于哈佛大学统计学与经济学专业、现任哈佛助教的 Daniel Friedman 开放了他撰写的一本免费在线书籍《Machine Learning from Scratch》,该书从理论和数学上介绍了 ML 最常见算法(OLS、逻辑回归、朴素贝叶斯、决策树、boosts 和神经网络等)的完整推论。GitHub,GitHub:star:16.3k。推荐等级::heart::heart::heart::heart:!
  • 《现代机器学习技术导论》:清华大学王东老师出版
  • 《Research Software Engineering with Python》:目前,软件对于研究而言至关重要。这意味着研究人员需要了解如何创建、检查、使用和共享程序。但是,大多数编程指南侧重于开发商业应用,而不探索那些尚未得到解答的问题。而在这本开源书籍《Research Software Engineering with Python》中,作者旨在向读者展示如何做到这一点,无论作为个人还是团队成员。在本书中,作者通过帮助读者为自己编写代码以及创建有助于整个领域进步的工具,为研究软件工程这一角色做好准备。

Visualization (可视化) 👀

💨 Back to Top

  • Bokeh:一份用 Python 做交互式图形的资源,官方介绍称,它能读取大型数据集或者流数据,以简单快速的方式为网页提供优美、高交互性能的图形,官方提供了一个通过Jupyter使用Bokeh的教程:Bokeh Tutorial 以及 Quickstart,Bokeh官网地址
  • Plotly:Python开源的交互式图形库,GitHub:star:6.1k。
  • Plotly Express:Plotly.py 已经发展成为一个非常强大的可视化交互工具:它可以让你控制图形的几乎每个方面,从图例的位置到刻度的长度。不幸的是,这种控制的代价是冗长的:有时可能需要多行 Python 代码才能用 Plotly.py 生成图表。使用 Plotly Express 的主要目标是使 Plotly.py 更容易用于探索和快速迭代.
  • Plotnine:Plotnine是Python中图形语法的一种实现,它基于ggplot2。语法允许用户通过显式地将数据映射到构成图的可视对象来组成图。GitHub:star:2.1k​
  • Cufflinks:Cufflinks 基于 Plotly 做了进一步的包装,可以绘制一个交互式、可缩放、可扩展的全景图呢
  • Scikit Plot:这是另一个机器学习的画图神器,几行代码就能画出高大上的机器学习图,作者当年的博士论文也是靠这个画图的
  • Effectively Using Matplotlib:如何高效使用 Python 可视化工具 Matplotlib。GitHub地址
  • Matplotlib Gallery:一个Matplotlib图表库网站,里面有各式各样好看的图表及Python实现代码,可以帮你画出更好的图表以及快速上手学习Python中的Matplotlib库
  • SciencePlots:科学论文画图风格的 Matplotlib style 库,安装和使用十分简单,推荐等级:❤️❤️❤️!
  • Ipyplot:Jupyter 画图库,推荐等级:❤️❤️❤️!
  • Veusz – a scientific plotting package:Veusz是一个具有图形用户界面的科学绘图和绘图程序,旨在生成可发布的2D和3D图形。GitHub
  • ECharts Gallery:由百度开源的数据可视化工具,基于JavaScript编写,一个强大的,交互式的图表和浏览器可视化库,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可
  • PyCharts:Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。简而言之,这是一个类似Matplotlib,可以利用Python画图的工具库
  • Draw Convnet:画卷积神经网络(ConvNet)结构图的Python脚本
  • ConvNet Drawer:描述卷积神经网络(CNN)结构的Python脚本。灵感来自上述的Draw Convne项目
  • NN-SVG:这个工具可以非常方便的画出各种类型的图,开发者来自于麻省理工学院弗兰克尔生物工程实验室, 该实验室开发可视化和机器学习工具用于分析生物数据。可以绘制的图包括以节点形式展示的FCNN style,这个特别适合传统的全连接神经网络的绘制。github地址
  • PlotNeuralNet:这个工具是萨尔大学计算机科学专业的一个学生开发的,使用的门槛相对来说就高一些了,用LaTex语言编辑,所以可以发挥的空间就大了。类似工具:tikz_cnn
  • ConvNetDraw:ConvNetDraw是一个使用配置命令的CNN神经网络画图工具,开发者是香港的一位程序员
  • Draw_Convnet:这一个工具名叫draw_convnet,由Borealis公司的员工Gavin Weiguang Ding提供。简单直接,是纯用python代码画图的,核心工具是matplotlib,图不酷炫,但是好在规规矩矩,可以严格控制,论文用挺合适的。类似工具:convnet-drawer
  • Netscope:caffe的网络结构可视化工具,大名鼎鼎的 netscope,由斯坦福AILab的Saumitro Dasgupta开发
  • Vis Conv:一个有意思的画图工具,不是画什么正经图,但是把权重都画出来了
  • Matplotlib 入门教程:一个私人Matplotlib 入门教程项目
  • Kepler.gl:一款强大的开源地理空间分析工具,用于大规模数据集
  • Graphviz:程序员的绘图利器,一个由AT&T实验室启动的开源工具包。Graphviz就是用来处理Dot(一种非常简单的图形描述语言)的工具
  • GraphvizOnline:一个可以使用 Graphviz 在线画图的网页工具
  • Manim - Mathematical Animation Engine:Manim 是解释性数学视频的动画引擎。用于以编程方式创建精确的动画,如 3Blue1Brown 的视频中所展示的样例。教程视频
  • Pixelhouse:一个极简的绘图库,用于在 python 中制作精美的动画。
  • Render py:一个用 Python 编写的软件 3D 渲染器,旨在让每个人都能轻松理解。
  • pyray:Python 中使用 POV ray 渲染复杂的 3D 对象和场景,动画以及更多普通的香草 Python。
  • SandDance:SandDance 是 Microsoft Research 最受欢迎的数据可视化工具,由微软研究院的可视化和交互式数据分析(VIDA)小组创建,通过提供了触控式的界面,实现使用者和 3D 信息图表进行互动,已经作为 GitHub 上的开源项目重新发布。在线体验
  • Coblis Color Blindness Simulator:色盲模拟器,来看看你的配色能否被色盲人群分辨出来,以防颜色设置不妥。
  • ColorBrewer:这个工具的配色非常经典,几乎就是office里的默认配色。
  • Palettable:一个Python绘图专用的调色板,提供了从美术角度来讲的精美配色。推荐等级::heart::heart::heart::heart:!
  • Data Color Picker:用于生成两种颜色的渐变,可以自由选择需要多少种颜色过渡。
  • Chroma.js Color Palette Helper:可以制作顺序调色板或者发散调色板,根据不同需要调整调色板的渐变过程。
  • Color Thief:我们知道许多自然情景中的颜色都是让人感到舒服的配色,这款工具就可以帮你把照片中的颜色提取出来。
  • Viz Palette:对色盲非常友好的调色工具
  • Draw.io:一免费制图神器来袭!名为draw.io,打开网页就能使用,支持中文版,也不会给你上水印。不只是能让你创建空白图,官方还提供了133个模板,覆盖了商务、工程图、流程图等13个类别。如此神器,好评自然如潮。有人说,这是一个开发人员可以使用的、最有用的100%免费软件工具。推荐等级::heart::heart::heart:! GitHub地址 以及 桌面版下载地址
  • Yellowbrick:可视化利器Yellowbrick,这是一款基于sklearn+matplotlib模块构建的更加高级的可视化工具,能够更加方便地完成很多数据探索、分词与展示工作。中文文档地址
  • G6:G6 是一个图可视化引擎。它提供了图的绘制、布局、分析、交互、动画等图可视化的基础能力。旨在让关系变得透明,简单。让用户获得关系数据的 Insight。基于 G6,用户可以快速搭建自己的 图分析 或 图编辑 应用。
  • CoreDraw:CorelDRAW Graphics Suite是加拿大Corel公司的平面设计软件;该软件是Corel公司出品的矢量图形制作工具软件,这个图形工具给设计师提供了矢量动画、页面设计、网站制作、位图编辑和网页动画等多种功能。
  • Origin:Origin是由OriginLab公司开发的一个科学绘图、数据分析软件,支持在Microsoft Windows下运行。Origin支持各种各样的2D/3D图形。Origin中的数据分析功能包括统计,信号处理,曲线拟合以及峰值分析。Origin中的曲线拟合是采用基于Levernberg-Marquardt算法(LMA)的非线性最小二乘法拟合。Origin强大的数据导入功能,支持多种格式的数据,包括ASCII、Excel、NI TDM、DIADem、NetCDF、SPC等等。图形输出格式多样,例如JPEG,GIF,EPS,TIFF等。内置的查询工具可通过ADO访问数据库数据。
  • visdom:visdom是一款用于创建、组织和共享实时大量训练数据可视化的灵活工具。相较于TensorFlow的可视化工具TensorBoard,visdom 则是对应于PyTorch的可视化工具。
  • Gource: Gource 将软件项目以动画树的形式展现,根目录为中心,目录为分支,文件为叶子,当一颗 “树” 华丽丽地舒展开,减去旧枝、添加新叶,也就意味着,开发人员为这一软件项目做出的贡献越来越丰富。 并且,这棵 “树” 不仅能展示软件版本的更迭,还可以显示有多少开发者参与其中。
  • Logstalgia:Logstalgia是一个流量可视化网站,它可以回放或流媒体web服务器访问日志
  • 《D3 Tips and Tricks》:D3 Tips and Tricks介绍了如何利用d3.js这一工具,实现数据可视化。其中包含50多个可以下载的代码示例。
  • Manifold:Uber推出了一款ML可视化调试工具Manifold(流形),可以帮助开发者发现让模型不能准确预测的数据子集,通过不同子集之间的特征分布差异来解释模型性能不佳的可能原因。Maniflod可以为机器学习工作流程提供可解释性和可调试性。官方博客
  • Tensorboardx:Pytorch 可视化工具, Pytorch 版本的 Tensorboard
  • Chaco:由Enthought开发的一个绘图工具包,它既可以绘制静态图又可以生成交互式图形。它非常适合用复杂的图形化方式表达数据的内部关系。跟matplotlib相比,Chaco对交互的支持要好得多,而且渲染速度很快。如果要创建交互式的GUI应用程序,它确实是个不错的选择。官方文档
  • Mayavi:mayavi项目是一个基于开源C++图形库VKT的3D图形工具包。跟matplotlib一样,mayavi也能集成到IPython以实现交互式使用。通过鼠标和键盘进行操作,图形可以被平移、旋转、缩放。我相信它能成为WebGL(以及相关产品)的替代品,虽然其生成的图形很难以交互的形式共享。
  • Flashtorch:FlashTorch是PyTorch中用于神经网络的开源特征可视化工具包。
  • AntV:AntV是Ant Financial(Ali)的一组数据可视化语法,它似乎是中国第一个使用名为The Grammar Of Graphics的理论的可视化库。Antv附带了一系列数据处理API。它可以处理和分析简单数据,因此许多公司将其用作BI平台的底层工具。
  • Highcharts:当我们提到Echarts时,我们通常会将它与Highcharts进行比较。它们之间的关系有点像WPS和Office之间的关系。Highcharts也是一个可视化库。而且你需要交钱买商业版本。它的优点是它有详细的文档,示例和详细的CSS。通过使用该软件学习和开发,您可以节省时间和精力。它具有很强的产品稳定性。
  • FineReport:它是一个用于做报告的软件和企业级应用程序,用于开发业务报告和数据分析报告。它还可以与OA,ERP,CRM和其他应用程序系统集成,以构建数据报告模块
  • Tableau:几乎每个数据分析师都会提到Tableau。它具有通用的内置分析图表和一些数据分析模型。您可以快速进行数据分析,探索价值并生成数据分析报告。它解决的问题更倾向于商业分析。使用Tableau,您可以快速制作动态交互图表,其图表和配色方案非常棒。
  • FineBI:FineBI是一种自助式BI工具,是一种用于数据分析的成熟产品。它有丰富的内置图表。您可以直接拖放以制作图表而无需使用代码。FineBI可用于快速分析业务数据,制作仪表板或构建大屏幕。
  • PowerBI:它是Microsoft在Excel之后推出的BI产品。Power BI可以无缝连接到Excel以创建个性化数据仪表板。
  • Power Map:许多工具都有数据地图,例如Echarts,FineReport,Tableau等。在这里,我强烈推荐Power Map 2016.您可以尝试一下。这真是太神奇了。
  • Hiplot:HiPlot是一个交互式可视化工具,它帮助人工智能研究人员发现高维数据中的相关性和模式,并使用平行图和其他图形方式来表示信息。HiPlot使用一种称为平行图的技术,这是一种可视化和过滤高维数据的方便做法。
  • Plotnine:python数据可视化的新星包:plotnine ,python数据可视化版ggplot2,GitHub:star:2.1k。推荐等级::heart::heart::heart:!
  • A communal catalogue reveals Earth’s multiscale microbial diversity:Earth Microbiome Project 基因研究的论文,其数据分析和可视化代码总共加起来上万行,值得学习,GitHub代码地址。推荐等级::heart::heart::heart:!
  • ML Visual:ML Visuals是一个新的协作项目,通过使用更专业、更吸引人、更充分的图块来帮助机器学习社区改进科学传播。ML visual 提供了一份32页的PPT模型图素材,你在上面可以直接使用画出你要的机器学习深度学习模型图,再也不用担心画图了!
  • Cnn Explainer:华人博士写的卷积网络可视化项目,一个交互式学习神器,把 CNN 的工作过程画得明明白白,帮助萌新轻松入门,GitHub:star:3k​。网页地址Arxiv 地址
  • Holoviews:Holoviews 可用非常少量的代码完成数据分析和可视化,后端基于Bokeh。GitHub:star:1.6k​
  • ml-visuals:这套模板名叫 ML Visuals,是专为解决神经网络画图问题设计的。ML Visuals 提供了更加专业、美观、恰当的视觉效果和图形,可以帮助机器学习社区改善科学沟通。用户可以在 PPT 或博客中免费使用其中的视觉效果和图形。GitHub:star:1.1k。
  • Origin:Origin是由OriginLab公司开发的一个科学绘图、数据分析软件,支持在Microsoft Windows下运行。因其功能强大且使用方便,在各国科技工作者中使用较为普遍,连诸多外文知名期刊都要求必须Origin出图。推荐等级::heart::heart::heart::heart:!
  • Gnuplot: Gnuplot是一个可移植的命令行驱动的图形绘制实用程序,适用于Linux、OS/2、MS Windows、OSX、vm和许多其他平台。
  • Sweetviz:一个基于Python编写的数据分析软件,只要掌握3种函数用法,一行Python代码就能实现数据集可视化、分析与比较。
  • Flourish:一个更加美观、易用、强大的数据可视化工具。
  • Gramm:MATLAB 的高级绘图工具。推荐等级::heart::heart:!
  • VisualDL:VisualDL是飞桨可视化分析工具,以丰富的图表呈现训练参数变化趋势、模型结构、数据样本、高维数据分布等。可帮助用户更清晰直观地理解深度学习模型训练过程及模型结构,进而实现高效的模型优化。GitHub:star:2.6k​
  • cutecharts.py:Python 手绘风格可视化神包
  • PyQTGraph:一款科研必备的Python数据可视化神器,PyQtGraph是一个纯python的图形和GUI库,构建于PyQt4/PySide和numpy之上,它主要用于数学/科学/工程应用方面。虽然该库完全用python编写,但其内部使用了Qt的GraphicsView框架及numpy计算库,因此其在图形绘制及数据处理速度方面有着极其优异的表现。大多数使用pyqtgraph数据可视化的应用程序都会生成可交互缩放,平移和使用鼠标配置的小部件。GitHub:star:2.1k。​推荐等级::heart::heart:!
  • pytorchviz:PyTorch 执行图可视化,GitHub:star:1.5k​
  • PlotNeuralNet:神经网络可视化工具库,GitHub:star:12.2k,推荐等级::heart::heart::heart:!
  • HiPlot :Facebook 的 HiPlot 是一个很好的工具,帮助你在使用不同参数组合时将模型结果可视化。GitHub:star:1.8k,推荐等级::heart::heart:!
  • netron:网络结构可视化工具
  • dodrio:乔治亚理工提出的DODRIO,一种可交互的Attention可视化工具,从句法和寓意层面总结了不同注意力头的信息。
  • lets-plot:统计数据可视化库,GitHub:star:605​
  • altair:可声明性统计可视化库,GitHub:star:6.7k​
  • pygal:pygal比较小众,专注于SVG图,擅长交互,最主要的是它能用非常少的代码就可画出非常漂亮的图形,GitHub:star:2.4k

Tutorials & Blogs (教程博客) 🗨

💨 Back to Top

Learning (Resource) Websites (学习资源网站) 💻

💨 Back to Top

  • Web Develope Roadmap:web 开发者学习路线图,GitHub ⭐93.2k,推荐等级❤️❤️❤️❤️!

  • 网易云课堂:上面有许多不错的网课,并且经常有一些直播,不过一些精品课程需要收费

  • 中国大学慕课:类似网易云课堂,收看网课

  • 菜鸟教程:上面有许多教程,涵盖各类编程语言、开发工具等

  • 多来码:类似菜鸟教程,但是课程较少

  • 廖雪峰官方网站:上面主要是Python、Git、Java教程,都写得十分浅显易懂

  • Programiz:国外的一个学习网站,主要包括Python、Java和等语言教程,讲得十分好

  • 阿西河前端教程:该网站主要是前端教程,涵盖大量前端知识

  • PowerShell教程:PowerShell在线中文教程

  • shellscript:shell 学习网站

  • SQL Bolt:国外的一个网站,通过简单的交互式练习学习SQL

  • SQLZOOSQLZOO 包括了 SQL 学习的教程和参考资料,支持多国语言,每一个语法配套一个教程、一份数据和一个测验,非常适合初学者使用,因为可以一边通过教程学习语法知识,再通过测验巩固。

  • XUESQLxuesql.cn,一个适合小白学SQL的网站,该网站会由浅入深的介绍所有有关 SQL 的知识, 每一个章节是一组相关的SQL知识点; 并且会配备一组动手练习任务。

  • LeetCodeSQL:LeetCode 上关于 SQL 的题目

  • W3Resource:SQL 在线刷题网站

  • Regex101:一个在线正则表达式学习(转换)网站,还可以将你的正则表达式转换为各种语言的代码

  • Regular Expression Visualizer:一款很酷的正则表达式可视化工具

  • Learn Regex:无论你使用的是 Python、Java、Perl 还是 Shell,正则表达式是学习主流编程语言几乎绕不开的话题。有了它,就能帮你快速定位到符合筛选条件的文本内容。现在 GitHub 上的有个 24k:star:的项目 learn-regex 解决了初学者的困难。最近这个教程刚完成了汉化工作,还附有在线练习,帮助初学者快速入门正则表达式

  • Brilliant | Math and Science Done Right:可以边打游戏边学习,包含数学、物理、逻辑、计算机

  • 3Blue1Brown:深入浅出、直观明了地分享了数学之美。3Blue1Brown中国官方B站账号,用动画的形式生动讲解了微积分的本质,线性代数等数学原理,推荐等级::heart::heart::heart:!

  • 斯坦福概率和统计:斯坦福概率和统计

  • MIT线性代数:MIT线性代数

  • 斯坦福卷积网络视觉识别B站链接

  • 程序员深度学习实战B站链接

  • 斯坦福深度学习自然语言处理B站链接

  • 吴恩达机器学习课程中文版

  • 斯坦福概率图模型专项课程:斯坦福概率图模型专项课程

  • DeepMind强化学习导论B站链接

  • 全栈深度学习训练营B站链接

  • 可汗学院:可汗学院几乎涵盖所有机器学习相关概念,且可免费学习。你可以在注册可汗学院时选择想要学习的主题,这样就可以得到量身定做的理论学习路径了。

  • 伯乐在线:伯乐在线翻译组,GitHub上翻译了多个学习资源仓库,内含大量学习资源

  • Machine Learning: Coursera 上开设的另一门机器学习课程,相比于吴恩达的课程更加简单易懂。

  • Latexstudio:Latex 学习网站

  • SQL学习网:这个网站提供用于练习的两张数据表 user 与 user_ext,并在表的下方提供了表说明跟字段说明,配对的案例相对简单,直接输入运行即可。

  • SQLFIDDLE:这玩意,名字听的我也不知道要表达啥,字面意思是可以随意「摆弄」SQL,打开看能支持多种目前主流的数据库,设计来看属于简洁明了的那种。

  • SQLBOLT:一边学习,一边练习,从SQL是什么开始介绍。

  • W3RESOURCE:从名字看就猜到可能内容包含不只是SQL的学习,打开看像是一本计算机相关的百科全书,值得大家收藏阅读。

  • Statistics:一个非常专业的统计学总结,主要介绍描述性统计学基本知识,统计学的核心知识都在里面,推荐等级::heart::heart::heart:!

  • Comet.ml:Comet.ml 的作用就像GitHub对代码的作用一样,允许数据科学团队自动跟踪他们的数据集、代码更改、实验历史和生产模型,以创建效率、透明性和可重复性。

  • Comet Examples:使用 Comet.ml 的机器学习例子代码。

  • Made With ML:该网站上提供了大量与机器学习相关的文章、教程、工具、开源项目等资源。现阶段每天都会更新一批内容,用户可根据自己的喜好对内容进行点赞收藏。推荐等级::heart::heart::heart::heart:!

  • Fast.Ai:要想对深度学习有一个全面的了解,我觉得 fast.ai 是最好的选择,它完全免费且没有广告。该课程包含机器学习导论、深度学习实践、计算线性代数和自然语言处理导论(代码优先)。所有课程都以实践为先,强烈推荐大家学习这些课。深度学习课程Practical Deep Learning for Coders,推荐等级::heart::heart::heart:!

  • Fastai v2:深度学习入门Fast.ai 2.0上线!自带中文字幕,所有笔记、资源全部免费!教学视频亚马逊链接。推荐等级::heart::heart::heart::heart:!

  • Data Science Group:一个通过机器学习来推动创新的学生组织,内有一些有趣的项目值得学习。

  • 深度学习(PyTorch):Yann Lecun在纽约大学开设的2020春季《深度学习》课程,干货满满。YouTube。推荐等级::heart::heart::heart::heart:!

  • Refactoring.guru:这是国外的一个网站,建立的初衷,是帮助开发者以更为简单便捷的方式,迅速掌握各个设计模式的学习。Refactoring Guru 上面共拥有 22 种设计模式及 8 条原则的详细讲解。

  • CodePen:CodePen 是一个完全免费的前端代码托管服务。与 GitHub Pages 相比,它最重要的优势有: 即时预览。你甚至可以本地修改并即时预览别人的作品。 支持多种主流预处理器。你从不需要手写生产级别的代码,无论是 Jade 、 LESS 、 Sass ,还是 CoffeeScript 、 es6+( Babel ),都能尽情使用。专业前端人员都在使用。

  • Scrimba:前端学习网站。关于Scrimba,它不同于传统的视频教学,除了评论就什么也不能做,Scrimba不同,它是音频+编码回放的形式展现,用户能随时暂停,除了编辑同时可以在形似Siri窗口查看视图,总之是非常有创意的编程教学网站,新手去学习,大佬去找灵感!

  • Learn X in Y minutes: GitHub 上开源的一个项目,名叫「Learn X in Y minutes」,中文译名为「在 Y 分钟内速成 X」。顾名思义,该网站的目的在于提供一些优质、简短的计算机科学入门教程,让你可以在短短几分钟内快速上手,了解一门语言、一款工具的具体使用。以减轻或消除由于未知所带来的恐惧,让你有信心接着走下一步。

  • CodeGym:CodeGym是一个非常适合初学者的Java编程课程练习网站。它将Java的学习过程游戏化,一步步解锁,一步步提升level,每个level都有对应数量的课程可供学习。

  • JavaSED:这个网站有点意思,直接输入关键字就可以查找你感兴趣的代码示例或者代码用法,方便有目的的学习和查阅。

  • codecademy:codecademy是一个在线互动编程学习网站,目前提供了诸多编程课程,适合碎片化学习。而且它也是主打阶梯性练习,由易到难完成学习。

  • BeginnersBook:这个网站上面包含了很多编程语言的免费教程,文档写得通俗易懂,也有很多代码练习,可以直接跟着练。

  • LeetCode:正所谓 「熟刷习题三百道,不会做题也会吹」 说的是数据结构和算法刷题的重要性,那么刷题上哪里刷呢?LeetCode无疑是最好的选择之一。推荐等级::heart::heart::heart::heart:!

  • LintCode:LintCode和LeetCode类似,也是一个刷题的OJ网站,而且还提供闯关式的阶梯训练以及国内外知名大厂的笔试面试真题。

  • Learn SQL:想成为数据科学家,SQL 是必不可少的一项技能,因为抽取数据是数据建模的基础流程之一。这通常需要对数据库运行 SQL query。如果你没有学完上述 Dataquest.io 数据科学课程,那么这里有一些免费资源可供选择。Codeacamdemy 有一门 SQL 入门课程,这门课实践性很强,学习过程中你可以在浏览器内进行编程。如果你还想了解基于云的数据库查询,那么 Google Cloud BigQuery 是不错的选择。它有免费试用方案,你可以免费尝试 query、大量公共数据集,以及阅读官方文档

  • Learn-R:要想成为全面的数据科学家,只学 Python 还不够。推荐大家学习一门 R 语言入门课程。Codeacademy 就有一门免费入门课程。

  • 30 Days Of JavaScript:这个项目主要面向JavaScript初学者,通过这30天,你将学会使用JavaScript开发移动应用程序、游戏、桌面应用程序。GitHub:star:1.8k​

  • 30 Days Of Python:这个项目主要教你如何利用30天的时间,学习Python编程所需的编程基础,每一天都包含几个主题,其中充满了易于理解的文字介绍,还举了大量的真实示例,最主要的是还有许多实践练习需要你去完成。

Learn by Game (寓教于乐) 👾

💨 Back to Top

  • Learn Git Branching:一个用于学习 Git 的交互式学习网站,GitHub上收获了:star:10k+
  • Nazo Game:这是一个在线解谜游戏,画风简洁,部分关卡需要具备一定的web知识。url地址直接访问,打开浏览器调试等操作都是解谜必要的。对于web开发人员来说非常值得一玩
  • Robocode:Robocode是一款编程游戏,你可以通过开发代码来创造你自己的机器人坦克,用于消灭其他坦克。它主要使用Java语言来创建属于你自己的机器人。
  • Coding Games:Coding games支持包括PHP、C、JavaScript在内的20多种编程语言。用户界面功能强大,可以定制。例如,你可以选择你的代码编辑器的风格:Emacs、Vim、Classic。如果你想提升编程技能,玩Coding games是一种有趣的途径
  • CodeCombat(极客战记):CodeCombat 是一款网页编程游戏。这款编程游戏借鉴了游戏的很多设计元素,游戏剧情十分丰富。当你打开CodeCombat网站,你不会觉得这是一个让你看不懂的代码学习网站,因为他的网站外观看起来就像是一个魔兽争霸风格的线上游戏,而且当你实际玩玩看,你会发现过程真的就是英雄要去打怪、寻宝与解谜,只是搭配了程序语言的学习。CodeCombat能够学习 Python、JavaScript、Lua、CoffeeScript、Clojure 等不同程序语言,这些语言能够运用到游戏设计、网页应用、App 的开发上。极客战记(中国版CodeCombat)网址
  • Screeps:如果你想学习JavaScript,那Screeps是一个很好的选择,Screeps 是一个为 JavaScript 程序员准备的大型多人在线游戏(MMO)。这个游戏是一个开放的策略游戏,游戏中你控制的单位被称为“creeps”,它可以帮你获得资源、建立自己的领地等等。作为一个多人在线游戏,游戏中你的creeps会被其他玩家的creeps包围
  • Checkio:Check iO 是一个基于浏览器的游戏,你需要使用 Python 或 JavaScript 来解决问题才能将游戏进行下去(需要登录)
  • Vim Adventures:顾名思义,这个网站让你通过玩游戏来学习 Vim
  • Cyber Dojo:Cyber-dojo是一个提供给程序员们练习写程序的地方。支持 JavaScript、Java、Python、PHP、Ruby 等语言。源代码
  • Code Monkey:CodeMonkey 是一款非常富有童趣的网页编程游戏,玩家通过编程向怪兽小猴子传达指令,帮助小猴子吃到香蕉就可以过关了。 CodeMonkey 以游戏闯关的方式进行教学,总共有300多个关卡,涉及到编程的各种概念
  • Elevator Saga:电梯编程游戏,需要一步步解决问题过关。比如说第一关是在 60 秒内运输 15 个人。(编程语言为JavaScript)。代码
  • Codewars:在战斗中进行学习。和其他人一起在真实的编程挑战中提升技巧,支持JavaScript、Python、C#、Java、Python等语言(支持的语言见下图)
  • Ruby Quiz:Ruby Quiz是一个面向Ruby程序员的每周编程挑战项目,目前有156个测验项目
  • Git-Game:Git-game是一个基于终端的游戏,它用来教授 git 中的那些非常酷的功能。游戏的主题内容是搜寻,通过 git 命令来找到线索,解开谜题
  • Hacker.org:hacker.org 挑战赛是一系列的拼图、敲砖块、测试和智力题,用来测试你的黑客能力。要通过这一系列的考验,你需要学会解密、编码、渗透等等技能,揭开重重迷雾
  • Code Hunt:Code Hunt 是一个由Microsoft Research开发的 HTML5 科幻主题游戏。在这个游戏中,你扮演一个代码猎人,负责修复代码,并使它它返回预期的结果。Code Hunt支持 Java 和 C# 两种语言。你可以学习到包括算法、循环和条件表达式等编程概念
  • Fight Code:在 FightCode 中,通过编写 JavaScript 代码,你可以创建一个能够击败其他玩家机器人的机器人
  • Human Resource Machine:Human Resource Machine 是一款非常有意思的移动端游戏。这款游戏由粘粘世界(World of Goo)的设计者和制作小小炼狱(Little Inferno)的团队共同制作,游戏虽是走解谜路线,但玩法相当新颖:玩家将扮演一个从基层做起的员工,需要通过指令代码来编写一条条程序,完成每个阶段的任务,最终走上职场巅峰
  • Pex for fun:这是微软开发的一个游戏,在这个游戏中你需要和其他的程序员进行比拼。而代码就是你的武器
  • Rankk:你需要解决一系列由易到难的问题。这个游戏是对 Pyramid 游戏的复刻,Pyramid里面有很多逻辑和数学问题
  • TopCoder:在这个游戏里你不光可以解决问题,还可以获取真金白银。来自全世界知名IT公司的程序员在这里互相挑战,为的就是赢得他们的奖品
  • Python Challenge:玩家可以通过 Python 编程解决问题并提升等级
  • Lumosity:一组能够训练大脑的游戏,由科学家和游戏设计师一同开发
  • Algorithm Geeks:一个交流讨论算法的 Google 群组
  • CodeKata:妙趣横生的编程问题
  • LessThanDot:一个专门论坛,程序员在这里发布一些比较困难的编程挑战
  • The Daily WTF:类似BYOD(Bring Your Own Device)模式,不过这里是BYOD(Bring Your Own Code)程序员们编写他们自己的代码片段放在这里,用来解决一些比较困难的问题
  • Programming Praxis:这个博客每周都会出一些新的编程问题
  • Project Euler:包含了很多复杂的数学问题,这让发烧友们感到非常开心
  • 4Clojure:在这里你可以通过解决一些不同难易程度的问题来学习 Clojure
  • Prolog Problems:你可以在这里练习逻辑编程
  • Codingbat:由很多 Java 和 Python 的习题(难度各有不同)
  • Sphere Online Judge:各种各样的编程问题
  • Rosalind:通过解决实际问题来学习算法和生物信息学
  • LeetCode:这个网站是为了帮助程序员准备面试而创建的。在这里你可以找到不同领域的典型问题
  • Career Cup:程序员面试时最容易被问到的真实问题
  • Kodable:Kodable是一款适用于 5 岁及以上儿童的教育型 iPad 游戏,适合为儿童进行编程启蒙
  • Lightbot:Lightbot是一款移动端游戏,玩家通过控制机器人的移动在固定位置点亮灯泡。在线地址
  • Box Island:Box Island 是一款经典且屡获殊荣的移动端编程冒险游戏,这款游戏在为孩子们带来令人兴奋的冒险体验的同时, 向他们介绍编程的基础知识。
  • The Wandering Wraith:失落的幽灵在寻找平静的世界中徘徊。您会引导他回到他的坟墓中,以便他最终可以安息吗?
  • Trick Parade:Trick Parade 是一款 RPG 游戏,它结合了一些游戏特性,您将会成为技巧和恐惧的大师。
  • Daemon vs. Demon:Daemon vs. Demon 是 2017 年 Game Off 的获胜者,他们使用 W A S D 键移动并使用 J K 键砍断和砍击挑战各种英雄,以重返自己的世界。
  • Murder at the Residence Gudul:以“我们现在要做什么?”为主题,几乎可以保证我们有一些经典的点击式冒险游戏。
  • Mogee:这款像素化游戏仅用三天就开发完成了,并以64×64像素构建,能给你带来很大的挑战。
  • Monster Pong:2017 年的 Game Off 混合了 Breakout 和 Pong ,会很有挑战。
  • Witch ‘em up:仅限于CGA调色板,这款滚动射击游戏可能是 fantasy consoles 的完美介绍。
  • Meteorite:低分辨率第一人称射击游戏中,巨大的浮动眼球会发射紫色激光束。此游戏有一个限制,即任何游戏最多只能有64×64像素时,这一点会给人留下深刻的印象。
  • The Sucker:您能在僵尸的猛烈袭击中幸免吗?这款僵尸生存游戏的大小不到13kB。
  • Dark Forest:只用了 10 天就开发完成,这个游戏会让您感到愉悦,当您从黑暗世界战胜恶魔时。
  • Blood Worm:该游戏使您可以控制带有声音效果的蠕虫。
  • Micromancer:这是 Ludum Dare 33 的另一个游戏,您将在其中扮演一名死灵法师之王,带领您的亡灵大军奋勇前进。
  • Johnny Smiter: Episode Zero:该游戏将您带入虚拟现实森林,您必须在其中收集符文并避免致命的蜘蛛的攻击。
  • DerkGame:在游戏里训练「神经网络小怪兽」,学习强化学习!已在 steam 上线
  • Free Python Games:一行代码就能进入使用Python开发的小游戏快乐玩耍!同时这个项目也可以作为学习资料,学习编程游戏,GitHub:star:1k,推荐等级::heart::heart::heart:!

C/C++ Learning (C/C++ 学习) 🇨🇱

💨 Back to Top

  • C++ 匠心之作 从0到1入门资料:C++ 匠心之作 从0到1入门资料,视频教程
  • Cpp-Primer:《C++ Primer 第五版》英文版习题解答。
  • Cpp_Primer_Answers:《C++ Primer 第五版》中文版习题解答
  • Cpp_Primer_Practice:《C++ Primer 第五版》笔记和课后练习答案
  • CPlusPlusThings:C++那些事,一位国内在读研究生的C++学习指南,除了教程,还有各大厂面试试题总结,面试经验传授,以及内推、招聘情报等珍贵资料。无论你是编程入门还是求职面试,这份指南不容错过,网页版指南。GitHub:star:2.2k,推荐等级::heart::heart::heart:!
  • Dotcpp:该网站有很多C语言相关的教程、资源、博客和练手习题,同时也有很多题库和比赛,比较实用。
  • cppreference:cppreference是一个免费网站,上面包含了关于C语言和C++的编程知识、库函数、以及诸多代码示例,目前连最新的C++20标准都支持了。
  • C:使用C语言实现的算法,可以帮助我们更好的学习数据结构、以及刷算法题。GitHub:star:4.6k
  • libhv:libhv类似于libevent、libev和libuv,是一个跨平台的具有非阻塞I/O和计时器的异步事件驱动库,但libhv提供了更加简单易用的API接口并支持更加丰富的网络协议,基于它可以快速驱动HTTP服务端和客户端,从而提供高性能的http服务。该项目可以帮助我们理解和实践操作系统的相关知识
  • design-patterns-cpp:这是一个C++语言版的设计模式实现,里面包含了常见设计模式的C++ 语言实现,可以 帮助我们理解和实践设计模式相关知识
  • Tmux:tmux一个开源免费的的终端复用软件。它的命令行界面非常炫酷易用,支持自由分割窗口,并且可以自由移动和调整,灵活且强大。一个非常强大的使用场景是:当远程连接到服务器使用时,只需要启动tmux,利用它就可以方便地进行后续操作,而无需打开多个ssh控制台窗口。既是一个高效的工具,研究源码也可以帮助我们学习和理解Linux环境实战编程。GitHub:star:18k​
  • netdata:netdata是一款开源免费的炫酷Linux系统实时性能和运行状况的系统监控工具。netdata通过使用可交互的仪表盘形式,来提供灵活易用的系统监控。除了支持常见系统平台的安装之外,它还可以非常方便地安装于Docker容器和集群之中并提供监控服务。既是一个高效的工具,研究其源码也可以帮助我们学习和理解Linux环境实战编程。GitHub:star:47k​
  • 《modern-cpp》:《现代 C++ 教程》。这本书有中英文两个版本,包含10个章节。每个章节中都有大量的代码,该书作者也提供了代码链接,所有代码按章节组织,文件夹名称为章节序号。此外,每章最后还加入了少量难度极小的习题,用于检验读者能否混合运用当前章节中的知识点,同样地,该书作者也提供了习题答案链接。

Go Learning (Go 学习) 🇬🇱

💨 Back to Top

  • Ultimate Go:网友hoanhan101分享的一份完整Go语言学习笔记,里面记录了他从零开始学习Go语言时所用的方法,以及对应全部学习资料。Hackernews热度1天升至400,好评如潮
  • Learn Go with Tests:Hackernews 上用户推荐的一个Go语言课程,表示:Learn Go with Tests是我经历过的最好的编程语言课程
  • Introducing Go:如果搞不明白Go是什么,可以去OReilly上查阅资料
  • Gotraining:一个GitHub上:star:5k+的课程培训,Ardan Labs机构
  • Roadmap:网友贡献自制Go学习思维导图
  • Web Dev Golang Anti Textbook:学习如何在没有框架的情况下用Go语言编写web app
  • hackernews讨论区:hackernews 上的 Go 讨论区
  • The Go programming language:Go语言源码仓库
  • 《Go 入门指南》:《The Way to Go》中文译本,中文正式名《Go 入门指南》,Github上:star:近20k。在线电子书
  • Go指南: 该指南可以进行交互。点击 “运行”按钮(或按 Shift + Enter)可以在 远程服务器上 编译并执行程序。 结果展示在代码的下面。这些例子程序展示了 Go 的各个方面。在指南中的程序可以成为你积累经验的开始。
  • Advanced Go Programming:Go语言高级编程,涵盖CGO、Go汇编语言、RPC实现、Web框架实现、分布式系统等高阶主题,针对Go语言有一定经验想深入了解Go语言各种高级用法的开发人员。
  • Gopl-zh:Go语言圣经中文版,建议初学者先从该项目学起。
  • 《Go2-book》:《Go2编程指南》开源图书,重点讲解Go2新特性,以及Go1教程中较少涉及的特性

Jupyter Notebook 📔

💨 Back to Top

  • Nbviewer: 在线渲染 Jupyter 文件的网页,只需要输入 Github 仓库地址即可。里面也含有一些Python代码示例。
  • jupyterbook:用于制作一个漂亮的计算机书籍和文档的开源库,GitHub jupyter-book,GitHub:star:1.8k​
  • Nbdev:fast.ai 创始研究员 Jeremy Howard 撰文介绍了 fast.ai 最近提出的新型编程环境 nbdev,它基于 Jupyter Notebook 构建,并将 IDE 编辑器的优点带入 Jupyter Notebook,可以在 Notebooks 中开发而不影响整个项目生命周期。文档
  • Reviewnb:Code Reviews for Jupyter Notebooks,Jupyter Notebook 的代码审查工具。介绍博客:Introducing ReviewNB: Code Reviews for Jupyter Notebooks
  • Polynote:使用类似 Jupyter Notebook 进行数据分析和机器学习是近来较为方便灵活的开发方式,但是 Jupyter Notebook 缺乏对多种语言的原生支持,在管理笔记本内的依赖、数据可视化等方面有所欠缺。近日,NetFlix 公司将其数据分析和机器学习开发工具 Polynote 开源。这一工具支持多语言在一个笔记本程序内运行,还增加了很多新特性,值得尝试使用。推荐等级::heart:!
  • Starboard:一款与 Jupyter Notebook 颇为相似的 Web 交互式笔记本:Starboard。利用这款工具,你可以直接在网页上写出可交互、可运行的代码笔记,内置浏览器,零配置,简单易用。推荐等级::heart::heart::heart:!
  • Deepnote:对全世界的 Python 高手而言,Jupyter Notebook 是目前最流行的编程环境,但它也有一些令人难以忍受的缺点。为此,一个位于旧金山的小团队开发了一款名为 Deepnote 的笔记本工具,这是一种云协作、云硬件,上云的 Notebook 编程环境。Pindrop 的高级研究科学家 Anthony Agnone 认为,Deepnote 已经表现出了超越 Jupyter Notebook 的趋势。推荐等级::heart::heart::heart:!
  • Awesome JupyterLab:Jupyter lab 插件和资源大全列表,GitHub::star:1k。
  • Awesome Jupyter:Jupyter 插件和资源大全列表,GitHub::star:1.4k。
  • A gallery of interesting Jupyter Notebooks:有趣的 Jupyter Notebooks 介绍
  • Deep Learning Models:GitHub上:star:10.8k+的项目,rasbt在Github上整理了关于深度学习模型TensorFlow和Pytorch代码实现集合,含有100个,各种各样的深度学习架构,模型,和技巧的集合Jupyter Notebooks,从基础的逻辑回归到神经网络到CNN到GNN等,可谓一网打尽,值得收藏!推荐等级::heart::heart::heart::heart:!
  • Awesome Machine Learning Jupyter Notebooks For Colab:机器学习和深度学习教程的列表,以Jupyter笔记本格式运行在谷歌Colab上,推荐等级::heart::heart:!
  • Topic: Jupyterlab Extension:GitHub上关于Jupyter lab插件的话题讨论
  • Topic: Jupyterlab:GitHub上关于 Jupyter lab的话题讨论
  • Jupyterlab:Jupyterlab 官方仓库
  • Jupytext:Jupytext,顾名思义,能够把 Jupyter Notebook 的内容转化成纯文本,用你最顺手的 IDE 打开。Jupytext 现在支持的语言还不能覆盖 Jupyter Notebook 的全部,但搞定了最流行的几种。它支持 Jupyter Notebook 和下面这些格式之间的相互转换:Julia 脚本(.jl)、Python 脚本(.py)、R 脚本(.R)、Markdown 文件(.md)、R Markdown 文件(.Rmd)。Jupytext 作者 Marc Wouts 在博客 Jupytext 1.0 highlights 展示了怎样借助这个工具在 IDE 或者编辑器里来编辑 Jupyter Notebook、进行版本控制。
  • Marc Wouts:Jupyter 作者 Marc Wouts 的 Medium 博客主页。
  • Tf2_course:官方推荐,用tf.keras和TensorFlow2.0做深度学习任务的Jupyter教程
  • Feature-Engineering-Handbook:一份系统的特征工程教程,介绍了如何利用 scikit-learn 处理静态的连续变量,利用 Category Encoders 处理静态的类别变量以及利用 Featuretools 处理常见的时间序列变量。
  • Jupyterlab Debugger:首款 Jupyter 官方可视化 Debug 工具,JupyterLab 未来可默认支持 Debug。虽然这只是第一版,但目前已经可以设置常见的断点 Debug,查看各种变量、执行模块等信息。博客文章:A visual debugger for Jupyter
  • Binder:可以将一个 Git repo 转换为一个交互式 Jupyter notebook 集合。
  • jupyter-text2code:一个能将文本快速转化为代码的 Python 神器(Jupyter插件)

Python Learning (Python 学习) 🐍

💨 Back to Top

  • Python Patterns:如果说算法是一个程序员的九阳神功,那么设计模式就是你的乾坤大挪移。设计模式在日常工作中会经常用到,对于不同的场景会需要用到不同的模式。python-patterns是非常棒的一个项目,如果你可以跟着他一个个学的话,你回头看看昨天写代码,会有种“哪个傻逼写的垃圾代码啊”的错觉。GitHub:star:23.3k。推荐等级::heart::heart::heart::heart:!
  • Python Weekly:一份免费的每周通讯,提供与Python相关的最佳手工策划的新闻、文章、新版本、工具和库、事件等,每周都会有更新。推荐等级::heart::heart::heart:!
  • GooglePythonStyleGuideCN:谷歌Python代码风格指南中文翻译,推荐等级::heart::heart::heart:!
  • Pycrumbs:搜集了各种来自互联网的免费Python的资料,你可以收藏后慢慢看,GitHub:star:2.9k。推荐等级::heart::heart::heart::heart:!
  • The Python Tutorial:Python官方文档(英文),官方文档无疑是最好学习Python的参考书
  • Python 教程:Python官方文档(中文),适用于英文不好的人
  • 《The Hitchhiker’s Guide to Python》:Python漫游指南(英文版),讲解了如何正确使用Python,是一本极佳的讲解Python实践的教程书。GitHub上收获了十分多的:star:
  • 《Python最佳实践指南》:Python漫游指南(中文版)
  • 《Python Programing》:由计算机科学教师开发,在“为绝对初学者”系列丛书通过简单的游戏创造教授编程的原则。您将获得实际的Python编程应用程序所需的技能,并将了解如何在真实场景中使用这些技能。在整个章节中,你会发现一些代码示例来说明所提出的概念。在每一章的结尾,你会发现一个完整的游戏,展示了这一章的关键思想,一章的总结,以及一系列的挑战来测试你的新知识。当你读完这本书的时候,你将非常精通Python,并且能够将你所学到的基本编程原理应用到你要处理的下一种编程语言。
  • 《Dive Into Python 3》:深入 Python3(英文版),网上大多人推荐的Python学习书
  • 《深入 Python3》:深入 Python3(中文版)
  • 《Python One-Liners》:【2020新书】《“一行”Python:如何写出专业的Python代码》
  • Learn Python:GitHub上一个:star:3k+的中文项目,以撸代码的形式学习Python,以Python代码加上注释作为教程,内容十分详细
  • Python 100 Days:GitHub上一个:star:40k+的中文项目,带你100天从新手到大师
  • Learn Python ProgrammingProgramiz 的 Python 教程
  • What the fuck Python:GitHub上一个:star:15k的英文项目,讲述了一些有趣且鲜为人知的 Python 特性
  • What the fuck Python-cn:What the fuck Python的中文版
  • Pandas 教程:GitHub上一个:star:七百多的Pandas私人中文教程,适合初级到中级晋升者
  • Joyful Pandas:Joyful-Pandas(顾名思义:快乐学习Pandas)由Datawhale成员耿远昊发起,作者结合了三份经典教材的学习经验,历时2个多月时间,结合最新的Pandas版本,编写了这套关于Pandas的开源教程,梳理了Pandas的主线内容。GitHub:star:1.3k​
  • Pandas Profiling:十分简单轻松从panda DataFrame对象创建HTML分析报告,GitHub:star:4.4k,推荐等级:heart::heart::heart:!
  • 知乎:哪些Python库让你相见恨晚?:知乎上的一个问题,下面许多大佬介绍了各种各样的Python库,一方面方便Python的使用,另一方面通过这些库可以更好地学习Python
  • Practical Business Python:该网站旨在收集和传播关于如何在业务环境中更有效地使用python的想法,包括不少文章教程和代码。GitHub地址
  • Develop with Python on Windows:在 Windows 上做 Python 开发太痛苦?微软最近发布了一系列官方教程,这些教程将指导使用者如何设置开发环境、是否在原生 Windows 或 Windows Subsystem for Linux (WSL) 系统上安装自己的工具,以及如何集成 VS Code、Git 等工具
  • 30 Seconds of Python:一组有用的Python代码片段,可以在30秒或更少的时间内理解它们。
  • Intro to Python Development:微软出品,文科生也能学得懂的Python免费入门视频。代码地址
  • Python Tutorials Home:data-flair上推出的一个240多个的Python编程入门课程
  • 《Intermediate Python》:《Intermediate Python》,中文译名为《Python进阶》,该书对Python中的装饰器与推导式等高级用法做了详细说明,适合于掌握Python基础后的进一步提高。 中文译本
  • Learn-python:Codeacademy 的教程,允许在浏览器内进行动手编程实践。这个 Python 入门课程涵盖 Python 基础语法、函数、控制流、循环、模块和类。
  • Python Like You Mean It:掌握软件工程技能和最佳实践是明智的做法,这会使代码更具可读性和可扩展性。此外,当你开始将模型投入生产过程时,你需要写出高质量、测试良好的代码,并熟练使用版本控制等工具。「Python Like You Mean It」涵盖 PEP8 风格指南、文档,以及面向对象的编程。中文版
  • Python Is Cool:常常发资源的英伟达工程师小姐姐Chip Huyen,又发射了一套Python隐藏功能合集。里面都是她“从前没发现,或者从前不太敢用”的机器学习技巧,有notebook可以直接跑。合集名叫python-is-cool,推特宣布之后不到半天,已经收获了2400+赞。Notebook传送门
  • 《利用 Python 进行数据分析 · 第 2 版》:一本非常不错的 Python 数据分析入门系统教程。本书由 Python pandas 项目创始人Wes McKinney 亲笔撰写,详细介绍利用 Python 进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。第 2 版针对 Python 3.6 进行全面修订和更新,涵盖新版的 pandas、NumPy、IPython 和 Jupyter,并增加大量实际案例,可以帮助你高效解决一系列数据分析问题。翻译的 GitHub 地址GitBook(有锚点功能)书籍下载地址书籍代码的 GitHub 开源地址
  • 《Deep Learning With Python》:一本很不错的学习 Python的书籍,书本代码是基于 Keras的,GitHub上已获:star:8k+,代码地址
  • Python Small Examples:Python小例子、小Demo一网打尽。Python基础、Web开发、数据科学、机器学习、TensorFlow、Pytorch,你能想到的基于Python的小Demo都在这里。在线网页版
  • 《Classic Computer Science Problems in Python》:这本书不是对Python的介绍。相反,这本书假设您已经是一名中级或高级的Python程序员。尽管这本书需要Python3.7,但我们并不认为它能够精通最新版本的Python的每一个方面。事实上,这本书的内容是建立在这样一个假设上的:它将作为学习材料,帮助读者达到这样的掌握。另一方面,这本书不适合完全不熟悉Python的读者。
  • Awesome Python:一个很棒的Python框架、库、软件和资源的列表,GitHub ⭐78k。推荐等级❤️❤️❤️❤️!
  • Awesome Python cn:Python资源大全中文版,包括:Web框架、网络爬虫、模板引擎、数据库、数据可视化、图片处理等,由伯乐在线持续更新。GitHub:star:15k,推荐等级::heart::heart::heart:!
  • Awesome Python in Education:关于Python的学习资源列表。
  • 《Think Python》:Think Python》是很多计算机初学者的不二入门教材,受到广泛好评。该书原作者是美国 Olin 工程学院的教授 Allen B. Downey,目前该书的原版和中文版本都已免费开源。中文版地址
  • Python Tutor:Python Tutor 是由 Philip Guo 开发的一个免费教育工具,可帮助学生攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。通过这个工具,教师或学生可以直接在 Web 浏览器中编写 Python 代码,并逐步可视化地运行程序。如果你不知道代码在内存中是如何运行的,不妨把它拷贝到Tutor里可视化执行一遍,加深理解。
  • Skulpt:Skulpt 是一个用 Javascript 实现的在线 Python 执行环境,它可以让你轻松在浏览器中运行 Python 代码。使用 skulpt 结合 CodeMirror 编辑器即可实现一个基本的在线Python编辑和运行环境。
  • Ipyplot:Jupyter 画图库,推荐等级:❤️❤️❤️!
  • 《Python code for Artificial Intelligence: Foundations of Computational agents》:《人工智能Python代码》,本书的Python代码旨在演示第二版《计算agent的基础》人工智能中的一些算法,其中包含并解释了书中的所有代码。
  • Magic Python:《Python 黑魔法指南》,带你玩不一样的 Python
  • zaoqi-Python:早起Python公众号内容,内有 numpy80 题和 pandas120 题等学习资料
  • 优雅的Python: Python猫公众号原创文章合集。
  • python-whydo:“Python为什么”系列文章,主要关注 Python 的语法、设计和发展等话题,以一个个“为什么”式的问题为切入点,试着展现 Python 的迷人魅力。

Python Projects (Python 项目) 👨‍💻

💨 Back to Top

  • Awesome Python Applications:181 个 Python 开源项目,涵盖了 15 个领域。GitHub:star:10.8k,推荐等级:heart::heart::heart::heart:!
  • 抖音机器人:使用 Python+ADB 做的 Python 抖音机器人。可以实现自动翻页、颜值检测、人脸识别、自动点赞、自动关注、随机防 Ban、自动评论等功能
  • PythonRobotics:这是机器人算法的 Python 代码集合,尤其适用于自主导航。易于阅读并能快速理解每个算法的基本思想、选择被广泛使用和实用的算法、最低依赖性。
  • Google Images Download:这是一个命令行 python 程序,用于搜索 Google Images 上的关键字 / 关键短语,并可选择将图像下载到本地计算机;还可以从另一个 python 文件调用此脚本。
  • trape (stable) v2.0:Trape 是一种 OSINT 分析和研究工具,允许实时跟踪和执行智能社会工程学攻击。它的创建目的是向全世界介绍大型互联网公司如何获取机密信息,例如其网站或服务的会话状态,并通过浏览器控制用户,但它的发展是为了帮助政府和组织、公司和研究人员跟踪网络犯罪分子。
  • xonsh:xonsh 是一个基于 Python 的跨平台,Unix shell 语言和命令提示符。该语言是 Python 3.4 + 的超集,带有额外的 shell 原语。xonsh(发音为 conch)适用于专家和新手的日常使用。
  • Rebound:Rebound 是一个命令行工具,可在收到编译器错误时立即获取 Stack Overflow 结果。只需使用 Rebound 命令执行文件。
  • GIF for Cli:接收 GIF,短视频或查询 Tenor GIF API 并将其转换为动画 ASCII 艺术。使用 ANSI 转义序列执行动画和颜色支持。
  • Snips NLU:Snips NLU(自然语言理解)是一个 Python 库,允许解析用自然语言编写的句子并提取结构化信息。
  • Social Mapper:ocial Mapper 是一种开源智能工具,它使用面部识别来大规模地关联不同站点的社交媒体配置文件。它采用自动化方法在流行的社交媒体网站上搜索目标名称和图片,以准确地检测和分组人员的存在,将结果输出到人类操作员可以快速查看的报告中。
  • Sclack:命令行版 Slack,超酷
  • Draw This:一个绘制漫画的宝丽来相机。拍照后会弹出一个涂鸦图片,这张图片是相机对它所见所闻的最佳诠释。相机是用于物体识别的神经网络、谷歌快速提取数据集、热敏打印机和树莓派的混搭。
  • SimpleCoin:这是一个非常简单,不安全和不完整的用于 Python 中加密货币的区块链实现。该项目的目标是制定一种工作区块链货币,使其尽可能简单并用作教材。
  • Lector:Qt 写的电子书阅读器。
  • Makesite.py:用 Python 中编写自己的简单、轻量级的静态站点生成器,完全控制静态网站 / 博客的生成。
  • Dbxfs:dbxfs 允许将 Dropbox 文件夹挂载,就像它是本地文件系统一样。它与官方 Dropbox 客户端的不同之处主要有两种:访问需要 Internet 连接;访问不需要磁盘空间,但如果磁盘空间可用,则会缓存。
  • BabySploit:BabySploit 是一个渗透测试工具包,旨在让您轻松学习如何使用更大、更复杂的框架,如 Metasploit。通过一个非常易于使用的 UI 和工具包,任何经验级别的人都可以使用 BabySploit。
  • ASCIIFY:使用 Python 的强大功能将图像转换为 ASCII Art。
  • Datasheets:datasheets 是一个用于与 Google 表格连接的库,包括从 Google 表格中读取、写入数据和修改 Google 表格的格式
  • NonoCAPTCHA:一个异步 Python 库,使用 Mozilla 的 DeepSpeech,PocketSphinx,Microsoft Azure 和 Amazon 的 Transcribe Speech-to-Text API,通过音频自动解决 ReCAPTCHA v2。使用 Pyppeteer 构建 Chrome 自动化框架,与 Puppeteer 相似,PyDub 可轻松将 MP3 文件转换为 WAV,aiohttp 用于异步简约 Web 服务器,Python 内置 AsyncIO 以方便使用。
  • Ubelt:Ubelt 是一个包含强大、经过测试、简单函数的可扩展 Python 标准库。
  • PyCAIR:pyCAIR 是一个基于 Seam Carving for Content-Aware Image Resizing 的内容感知图像大小调整(CAIR)库。
  • Soundcloud-dl:以专辑封面和标签形式下载 128kbps 的 SoundCloud 音乐。
  • Twitter Clean-up:Twitter 账户清理工具
  • Face-tracking-with-Anime-characters:靠近摄像头,图片里的妹子会害羞的扭过头
  • YouTube Download:Youtube 下载客户端。
  • Spotify Playlist Generator:Spotify Playlist Generator 是一个 Python 脚本,每周都会使用新音乐自动构建一个新的 Spotify 播放列表。
  • Depression and anxiety self-testing telegram bot:电报机器人用于抑郁和焦虑的自我测试。
  • Face Recognition:GitHub上:star:20k+,世界上最简单的面部识别工具。它为Python和命令行提供了一个应用程序编程接口(API)。它对于识别和操纵图像中的面很有用。它使用dlib最先进的人脸识别算法构建。深度学习模型在Wild数据集中的Labeled Faces上具有99.38%的准确度。它还提供了一个简单的face_recognition命令行工具,可以让你用命令行本身图像文件夹进行人脸识别!
  • Sherlock:神探夏洛特,全网查名!国外有个小哥在 GitHub 上开源了一个 Python 工具,借助这个工具,你便可以在各大社交网站上检索自己的用户名,看看自己的名称在哪几个网站上被占用了。在线体验地址
  • PyRoyale:吃鸡版超级玛丽被复活 + 开源,用 Python 实现在线体验地址
  • Deep Flow-Guided Video Inpainting:CVPR2019 一篇论文的开源代码,名叫光流引导 (Flow-Guided) 的视频修复算法,可以将视频中的人物抹去,而且毫无违和感,让人物消失的无影无踪
  • Speech Driven Animation:进化版的造价AI,只要一张照片,说话唱歌视频自动生成,降维打击Deepfakes
  • Heartrate:一个由国外大神制作的 Python 神工具,可以实时动态地监控 Python 程序的运行情况,逐行追踪代码的运行时间,整个过程是可视化的
  • Grid studio:GitHub上获:star:5k,一个基于网页的表格应用,完全结合了 Python 和 Excel 的优势,在一个界面上同时展示可视化表格与代码,而且同时通过表格与代码修改数据
  • Dab And Tpose Controlled Lights:国外一个沙雕小哥写的Python项目,手把手教大家训练一个神经网络模型,用来识别摄像头拍下的“舞步”,从而控制灯的开关。上面还包括了作者已经搜集到的原始数据样例
  • Python Handout:谷歌大脑出品的一款工具,只要敲代码,就能在任何文本编辑器里方便的转换成标题、代码、文本等各种样式,还能直接运行处Python代码的结果,相当于一个没有hidden state的Jupyter笔记本
  • BossSensor:一个有趣的人脸识别项目,当老板靠近时,可以自动隐藏屏幕。
  • DeepFool:DeepFool是一种在深度网络中寻找最小对抗性扰动的简单算法
  • Cloud Annotations:GitHub ⭐ 2k+,比个手势,AI 自动识别 Emoji!
  • Style2Paints:GitHub上:star:10k,为动漫线稿上色的一个工程!Demo
  • Predictionio by Apache:GitHub上:star:10k,Apache PredictionIO是面向开发人员,数据科学家和最终用户的开源机器学习框架。 用户可以使用此框架构建真实的ML应用程序,部署和测试它们。它甚至支持事件收集,评估和查询预测结果。 它基于可扩展的开源服务,如Hadoop,HBase等。
  • SickZil Machine:一群韩国小伙伴开发的一个完全自动消除漫画文字的 AI;但如果人类需要,也可以手动指定消除某一部分文字。
  • rps_tfjs_demo:10 分钟内在浏览器中训练一个剪刀石头布识别模型教程,该项目使用了 TensorFlow.js,所有繁重的工作都发生在浏览器和 JavaScript 中。数据集地址
  • Celebrity-detection:GIPHY 开源了一个表情包识别器,可以分清楚超过 2300 个名人,而且它识别的还是动图,准确率超过 98%。良心的是,GIPHY 不仅把这个工具开源了,而且还直接用在了自己的网站上,不是 Demo,已经是成品。在线使用
  • PythonPlantsVsZombies:用 Python 实现植物大战僵尸代码
  • Mario-Level-1:Python 和 Pygame写的超级马里奥第一关,GitHub:star:1.7k。
  • PopMusicMaker:利用隐马尔科夫模型(HMM)和随机森林结构建立的流行音乐制作器。相关博客
  • TfPyth:一行代码切换TensorFlow与PyTorch,模型训练也能用俩框架
  • Emotion-recognition:使用 Keras 实现的实时表情识别项目
  • 自动微分法实现:200行写一个自动微分工具
  • Autograd:自动微分的实现,有效地计算numpy代码的导数。
  • AutodiffEngine:自动微分引擎,来源于华盛顿大学陈天奇的课程项目
  • Taichi:太極(Taichi)是一个开源的计算机图形库,它旨在提供易于使用的计算机图形学基础架构,并提供了 40 多份计算机图形学重要研究的实现。出于效率的考虑,太極本身是由 C++ 构建的,但用 Python 包装了接口。GitHub:star:10.2k+。
  • Difftaichi:微分太极。这一框架可以基于太極实现自动微分,在物理模拟优化方面有很高的性能和灵活性。GitHub:star:1.2k。ICLR论文
  • Xlwings:xlwings是一个利用Python操作Excel 的库,在保持易用性的同时还具有相当快的处理速度。它适用于 Windows和 Mac上的 Microsoft Excel。GitHub:star:1.6k。
  • Python Fire:Python Fire是一个用于从任何Python对象自动生成命令行接口(CLIs)的库,比其他命令行库更加方便易用。GitHub:star:16.3k。
  • Pyforest:这是一个免费的Python库,使用Pyforest可在一行代码中导入所有python数据科学库。Pyforest目前可导入包括pandas、numpy、matplotlib等等众多的数据科学库。
  • Pymatting:一键抠图,毛发毕现:这个GitHub项目助你快速PS
  • PyBoy:一个完全用 Python 从头开始编写的 Game Boy 模拟器,并且支持通过 API 编写脚本,GitHub:star:2.7k​
  • Rich:Rich 是一个可用于渲染命令行文本格式的开源 Python 库,支持对终端上的表格、进度条、Markdown、代码高亮、Emoji 表情等不同文本格式添加更为丰富的渲染效果。GitHub:star:7.3k​
  • Muggle OCR:基于深度学习的图片验证码的解决方案 - 该项目能够秒杀字符粘连重叠/透视变形/模糊/噪声等各种干扰情况,足以解决市面上绝大多数复杂的验证码场景,目前也被用于其他OCR场景。。训练项目源码,GitHub:star:1.2k
  • OpenSelfSup:香港中文大学多媒体实验室(MMLab)和南洋理工大学的研究者开源的一套统一的自监督学习代码库 OpenSelfSup。
  • PyDebloatX:开源神器,让你一键卸载 Windows 默认程序。
  • Jukebox:Jukebox是一款可自动生成音乐的机器学习框架,由OpenAI推出,它可以生成各种风格的歌曲,从teenybop和乡村音乐到嘻哈音乐和重金属音乐。GitHub:star:2.7k​
  • Pyre Check:Facebook 宣布开源静态分析工具 Pysa。这是 Instagram 上用于检测和修复应用程序庞大 Python 代码库中错误的一个内部工具,可以自动识别 Facebook 工程师编写的易受攻击的代码段,然后再将其集成到社交网络的系统中。GitHub:star:4.6k​

Python Crawler (Python 爬虫) 🕷

💨 Back to Top

  • Python爬虫:一份十五天学会Python爬虫的教程。
  • Python2爬虫学习系列教程:一份详尽的爬虫教程博客,涵盖入门、实战、进阶。
  • Awesome Spider:GitHub上:star:8k+的项目,收集了各种爬虫的Python实现代码,推荐等级::heart::heart::heart:!
  • Fuck Login:GitHub上:star:5k+的项目,模拟登录一些知名的网站,为了方便爬取需要登录的网站。
  • Python Spider:Python3网络爬虫实战:VIP视频破解助手;GEETEST验证码破解;小说、动漫下载;手机APP爬取;财务报表入库;火车票抢票;抖音APP视频下载;百万英雄辅助;网易云音乐下载;B站视频和弹幕下载。
  • 12306:这很可能是全GitHub最德高望重的购票小助手了,功能一直在更新,且现已支持Python 3.6以上版本。Github 获:star:20k,推荐等级::heart::heart:!
  • Py12306:基于上述"12306"项目的另一个抢票项目,支持分布式抢票。Github 获:star:7k+
  • 12306 code server:用于构建自托管的12306验证码识别服务器项目,GitHub ⭐2k
  • Easy12306:使用机器学习算法完成对12306验证码的自动识别的项目
  • Photon:为 OSINT 设计的爬虫,速度极其夸张!
  • XSStrike:XSStrike 是一个 Cross Site Scripting 检测套件,配备四个手写解析器,一个智能有效负载生成器,一个强大的模糊引擎和一个非常快速的爬虫
  • Twitter Scraper:作者逆向了 Twitter 前端 API,消除了官方 API 速率限制,非常快。
  • AutoCrawler:Google,Naver 多进程图像抓取工具(高品质,高速度和可自定义)。
  • Scrapy Cookbook:Scrapy中文文档
  • SourceCodeOfBook:《Python爬虫开发 从入门到实战》配套源代码
  • arxivscraper:arxiv 爬虫
  • arxiv-crawler:arxiv 爬虫
  • autoscraper:Python 实现的轻量级爬虫,该项目专为自动爬虫而设计,使爬虫变得容易。它获取网页的url或html内容以及我们要从该页面抓取的示例数据列表。示例数据可以是该页面的文本,URL或任何html标记值。它学习抓取规则并返回相似的元素。然后,可以将此学习到的对象与新的url一起使用,以获取这些新页面的相似内容或完全相同的元素。从而告别爬虫手动解析网页,写规则的烦恼。GitHub:star:2.3k​
  • InfoSpider:InfoSpider是一个集众多数据源于一身的爬虫工具箱,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书。GitHub:star:2​.5k

Machine Learning (机器学习) 🤖

💨 Back to Top

  • Numpy Machine Learning:普林斯顿博士后 David Bourgin 最近在GitHub上开源的一个非常剽悍的项目,用 NumPy 手写所有主流 ML 模型,超过 3 万行代码、30 多个模型。推荐等级::heart::heart::heart:!

  • Reddit:Reddit 上机器学习的讨论板块,类似的有 DeepLearning 板块。推荐等级::heart::heart::heart::heart:!

  • 机器学习原理:GitHbu上:star:五百多的小项目,内容都是网上扒来的,前半部分关注数学基础,机器学习和深度学习的理论部分,详尽的公式推导。后半部分关注工程实践和理论应用部分

  • 机器学习原理笔记整理:机器学习原理项目笔记

  • Homemade Machine Learning:GitHub上:star:12k的项目,内容包含大多流行的机器学习算法的Python手工实现,并未使用常见的深度学习框架(TensofFlow等),便于理解算法原理,同时还附有数学原理以及Demo展示,十分适合自学的机器学习,作者博客:Jack Cui

  • USF Data Institute:USF大学数据研究所主页,上面有许多关于机器学习的博客文章,有空看看十分涨知识

  • Deep Learning Book:深度学习界的大佬Ian Goodfellow 和 Yoshua Bengio所著的深度学习书。中文版GitHub仓库已获20k+,PDF下载。推荐等级::heart::heart::heart:!

  • Baidu AI Studio:百度的 AI 工作室,里面有各种机器学习数据集、文章、项目,可用作机器学习实践教程

  • NLP Tutorial:一个很赞NLP入门代码练习库(含Pytorch和TensorFlow版本)

  • 10 Minutes to pandas:官方文档,十分钟上手 pandas 教程

  • Numpy developer guide:官方学习文档,Numpy 上手指南

  • Pandas 中文文档:Pandas 官方中文文档的仓库。 域名访问

  • Numpy 中文文档:Numpy 官方中文文档的仓库。 域名访问。推荐等级::heart::heart::heart::heart:!

  • Matplotlib 中文文档:Matplotlib 官方中文文档的仓库。 域名访问

  • Scipy developer guide:官方学习文档,Scipy 上手指南

  • Awesome Machine Learning cn:机器学习资源大全中文版,包括机器学习领域的框架、库以及软件。GitHub:star:3k

  • Machine Learning Learning Notes:周志华《机器学习》的学习笔记,记录了作者在学习这本书的过程中的理解思路以及一些有助于消化书内容的拓展知识,笔记中参考了许多网上的大牛经典博客以及李航《统计学习》的内容

  • Models – IBM Developer:IBM开放的预训练深度模型库,目前一共有32个模型,分为可部署和可训练模型两类,涉及18个领域

  • SOTA:机器之心出品的机器学习中state-of-the-art论文和模型搜索工具

  • Machine Learning Road:一份机器学习资源列表,内容包括课程资源及电子书下载链接。

  • Super-Machine-Learning-Revision-Notes:一份长约 80 页的学习笔记,旨在总结机器学习的一系列基本概念(如梯度下降、反向传播等),不同的机器学习算法和流行模型,以及一些作者在实践中学到的技巧和经验。

  • 《Machine Learning: a Probabilistic Perspective》:谷歌研究员Kevin Patrick Murphy撰写的经典机器学习图书,由MIT出版社出版,自2012年发行以来就奉为经典机器学习书目。本书内容完整,讲解详细,便于阅读,方便工程使用。最近作者在Github上发布了关于本书的Python代码,更加方便使用!配套Python代码

  • Scikit-learn:scikit-learn 官方文档中的一些教程。之后,大家就可以构建一些实际机器学习应用,学习模型运行背后的理论了。

  • Scikit-learn 贡献指南:scikit-learn 贡献指南旨在促进开发者对 scikit-learn 库的贡献,但它实际上也涉及最佳实践。它包括 GitHub、单元测试、debug 等话题,而且其写作背景是数据科学应用。

  • SpaCy:spaCy是一个超级有用且灵活的自然语言处理(NLP)库和框架,用于清理文本文档以进行模型创建。与用于类似任务的其他库相比,SpaCy更快。GitHub:star:15.8k。

  • Super Machine Learning Revision Notes:一份长约 80 页的学习笔记,旨在总结机器学习的一系列基本概念(如梯度下降、反向传播等),不同的机器学习算法和流行模型,以及一些作者在实践中学到的技巧和经验。推荐等级::heart::heart:!

  • Machine Learning Course:Python 机器学习在线指南,本项目的目的是通过使用 Python 提供一系列简单而全面的教程来梳理机器学习的最重要方面。Github上:star:6k+。在线阅读,推荐等级::heart::heart:!

  • Machine Learning Notes:一份机器学习的笔记,由哥伦比亚大学研究生张威整理。张威同学本科毕业于加拿大滑铁卢大学电子工程系,曾经联合带队参加 2016 年 IEEE 数字信号处理大赛获得前 10 的名次,也曾在微软亚洲研究院副院长郭百宁老师研究组和首席研究员曾文军老师研究组实习。在哥伦比亚大学,张威同学也担任过《Bayesian Model Machine Learning》这门机器学习进阶课程的助教。课程地址。推荐等级::heart::heart:!

  • Dimensionality Reduction Alo Codes:网上关于各种降维算法的资料参差不齐,同时大部分不提供源代码。这个 GitHub 项目整理了使用 Python 实现了 11 种经典的数据抽取(数据降维)算法,包括:PCA、LDA、MDS、LLE、TSNE 等,并附有相关资料、展示效果;非常适合机器学习初学者和刚刚入坑数据挖掘的小伙伴。

  • Edwardlib:Edward是一个用于概率建模、推理和评论的Python库。它是使用概率模型进行快速实验和研究的试验台,范围从小数据集上的经典层次模型到大数据集上的复杂深度概率模型。Edward融合了三个领域:贝叶斯统计和机器学习、深度学习和概率编程。

  • SQLFlow:开源项目SQLFlow,它是SQL引擎(如MySQL、HIVE等)和机器学习引擎(如TensorFlow、XGBoost等)之间的桥梁。它扩展了SQL语义,使得它能够进行模型训练、预测和解释。GitHub:star:3.5k+

  • ILearnDeepLearning.py:包含了与神经网络和深度学习相关的小项目,尝试只使用 NumPy 构建,通过解决简单的分类问题来测试模型,并将其与 Keras 构建的神经网络进行性能比较。推荐等级::heart::heart:!

  • PKUSeg:北大开源的一个中文分词工具包,名为PKUSeg,基于Python。工具包的分词准确率,远远超过THULAC和结巴分词这两位重要选手。GitHub:star:4.6k。

  • JAX:JAX由谷歌提出,是TensorFlow的简化库。结合了针对线性代数的编译器XLA,和自动区分本地 Python 和 Numpy 代码的库Autograd,在高性能的机器学习研究中使用。GitHub:star:6.9k

  • Trax:Trax 是一个开源项目,它的目的在于帮助我们挖掘并理解高一阶的深度学习模型。谷歌大脑表示,该项目希望 Trax 代码做到非常整洁与直观,并同时令 Reformer 这类高阶深度学习达到最好的效果。GitHub:star:3.4k。入门简介地址。最后,这个项目最重要的还是它的实现代码,我们并不是因为可以直接运行而使用它。相反,我们是因为它的代码直观简洁,能帮助我们一步步更深刻地理解模型而使用它。推荐等级::heart::heart::heart::heart:!

  • TensorRT:TensorRT是一个C++库,用于NVIDIA GPU和深度学习加速器上的高性能推理。

  • Jittor:清华大学开发了一个名为计图(Jittor)的深度学习框架。这一框架有望为深度学习社区提供新的方案,也能够推动深度学习框架国产化的进程。据官网介绍说:「研究团队将神经网络所需的基本算子定义为元算子」,元算子非常底层,通过相互融合可以完成复杂的深度学习计算,体现出了易于使用的特点。并且研发团队表示,采用元算子的 Jittor 已超越 Numpy,能够实现更复杂更高效的操作。GitHub⭐1k+。

  • MegEngine:旷视科技在北京发布了新一代人工智能生产平台天元(MegEngine),其「训练推理一体」、「动静合一」、「兼容并包」、「灵活高效」的强大性能或许将为 AI 领域带来新的风向。天元与目前流行的 TensorFlow、PyTorch 相似,旨在让更多的人可以在其基础上构建自己的应用,创造属于自己的价值。GitHub​⭐600+

  • MindSpore:MindSpore 是华为人工智能解决方案的重要组成部分,与 TensorFlow、PyTorch、PaddlePaddle 等流行深度学习框架对标,旨在大幅度降低 AI 应用开发门槛,让人工智能无处不在。源码

  • PyCaret:一个开源低代码机器学习 Python 库 PyCaret,它支持在「低代码」环境中训练和部署有监督以及无监督的机器学习模型。 PyCaret 库支持数据科学家快速高效地执行端到端实验,与其他开源机器学习库相比,PyCaret 库只需几行代码即可执行复杂的机器学习任务。该库适合有经验的数据科学家、倾向于低代码机器学习解决方案的公民数据科学家,以及编程背景较弱甚至没有的新手。Notebook 教程。推荐等级::heart::heart::heart::heart:!

  • AiLearning:机器学习 - MachineLearning - ML、深度学习 - DeepLearning - DL、自然语言处理 NLP 学习资源,GitHub:star:25k。推荐等级::heart::heart::heart::heart:!

  • Lihang Code:李航《统计学习方法》的代码实现,GitHub:star:8k+。推荐等级::heart::heart:!

  • Statistical-Learning-Method_Code:手写实现李航《统计学习方法》书中全部算法,GitHub:star:3.4k​

  • 统计学习方法:李航的《统计学习方法》的详细笔记,以及各章节机器学习算法详细的 Python 代码

  • Machine Learning Glossary:谷歌出品的机器学习术语表

  • Analytics Zoo:一个集合主流框架PyTorch和Tensorflow的神奇动物园,Intel 出品,GitHub:star:1.5k​

  • Vaex:Vaex 是一个开源的 DataFrame 库(类似于Pandas),对和你硬盘空间一样大小的表格数据集,它可以有效进行可视化、探索、分析甚至进行实践机器学习。有了 Vaex,你可以在短短几秒内遍历超过 10 亿行数据,计算各种统计、聚合并产出信息图表,这一切都能在你的笔记本电脑上完成。它免费且开源。GitHub:star:3.5k

  • DeepFaceLab:全新“全栈”Deepfake软件,它以一个软件的形式,把各类Deepfake功能都打包在了一起。关键是,效果更清晰,肉眼都可见。GitHub:star:15.1k

  • Awesome Time Series:时间序列预测相关的比赛、论文、会议、代码、理论资源以及数据集

  • Neoml:Neoml 是一个端到端的机器学习框架,允许您构建、训练和部署机器学习模型。 该框架被 ABBYY 工程师用于计算机视觉和自然语言处理任务,包括图像预处理、分类、文档布局分析、 OCR 以及从结构化和非结构化文档中提取数据。

  • Advanced Deep Learning for Computer vision: 慕尼黑工业大学发布的《高级深度学习》课程。重点介绍计算机视觉的前沿深度学习技术,重点介绍统计学背景、递归神经网络(RNNs)和生成模型(GANs)。课程的一部分是一个贯穿整个学期的项目,深入学习现代DL方法。

  • DeepLearning-500-questions:深度学习500问,以问答形式对常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题进行阐述,以帮助自己及有需要的读者。GitHub:star:38.3k,推荐等级::heart::heart::heart::heart:!

  • TNN:由腾讯优图实验室打造,移动端高性能、轻量级推理框架,同时拥有跨平台、高性能、模型压缩、代码裁剪等众多突出优势。

  • Tengine Lite:Tengine Lite 由 OPEN AI LAB 主导开发,该项目实现了深度学习神经网络模型在嵌入式设备上快速、高效部署。为实现众多 AIoT 应用中跨平台部署,本项目基于原有 Tengine 项目使用 C 语言进行重构,针对嵌入式设备资源有限的特点进行深度框架裁剪。同时采用完全分离的前后端设计,利于 CPU、GPU、NPU 等异构计算单元快速移植和部署。同时兼容 Tengine 框架原有 API 和 模型格式 tmfile,降低评估、迁移成本。GitHub:star:1.4k​

  • TextHero:号称「从小白到大神」的Texthero的工具包。快速优雅地处理你的NLP数据集,不仅编写界面友好美观,而且功能全面,预处理、表征、可视化样样精通。

  • The Super Duper NLP Repo:181个NLP教程合集,Colab一键直达,无需环境配置,此外还有481个文本数据集,推荐等级::heart::heart::heart::heart:!

  • MKLpy:MKLpy是一个多内核学习(MKL)框架,其灵感来自于scikit-learn项目。

  • SEAL:微软研究院的 SEAL 项目,实现在神经网络上的同态加密计算,保护隐私。AI开发者能在不需要对隐私AI技术有任何了解的情况下,只需要改动两三行代码即可将现有AI代码转换为具备数据隐私保护功能的程序

  • Rosetta:国内首个自主研发的基于主流TensorFlow框架的隐私AI框架,让隐私计算与AI攻守结合

  • SDV:麻省理工推出新的数据隐私工具,给真实数据合成“替身”

  • CrypTen:Facebook 开源的用 Python 实现了多方安全计算的协议,可以进行如数据分离,数据模型分离等场景下的模型训练和推断。

  • PySyft:Openminded 开源的用 Python 实现了多方安全计算的协议,可以进行如数据分离,数据模型分离等场景下的模型训练和推断。

  • opacus:Facebook开源的Opacus库,利用差分隐私训练PyTorch模型,既保护隐私又快速训练。

  • Transfer-Learning-Library:清华大学开源迁移学习算法库:基于PyTorch实现,支持轻松调用已有算法

  • Oneflow:OneFlow是开源的、采用全新架构设计,世界领先的工业级通用深度学习框架。OneFlow目前在一些大规模场景开始使用了,研发仍在快速迭代中,最近的工作重心是支持更多模型,易用性,和其它框架兼容性。如果面临的问题规模不大,用tensorflow 或pytorch ,mxnet等是最好的选择,如果规模很大或者需要模型并行或流水并行等其它框架还不支持的技术,那可以考虑使用oneflow。

  • eagerpy:一个可以将 PyTorch, TensorFlow, JAX and NumPy 无缝衔接使用的库

  • minGPT:特斯拉人工智能研究负责人、前 OpenAI 研究科学家 Andrej Karpathy 进行了尝试。他基于 PyTorch,仅用 300 行左右的代码就写出了一个小型 GPT 训练库,并将其命名为 minGPT,一天GitHub:star:3k​

  • Pyjanitor: Python实现的R库Janitor,用于数据清洗。

  • PaddleOCR:百度自研顶会SOTA的OCR算法,GitHub:star:2.8k

  • EasyOCR:简单易用的OCR工具,支持70多种语言,包括中文,日语,韩语和泰国语。GitHub:star:10.2k​

  • PaddleX:『飞桨』深度学习全流程开发工具。PaddleX 拥有可视化开发界面 demo,不写代码也可以完成 AI 算法训练。

  • LIT:Google 研究人员发布了一款语言可解释性工具 (Language Interpretability Tool, LIT),这是一个开源平台,用于可视化和理解自然语言处理模型。

  • Msnhnet:一款基于纯c++的轻量级推理框架,该框架受到darknet启发。

  • DeepPurpose:来自哈佛大学等机构的研究人员,开发出了一个AI“药神”工具包,为加速新冠疫情下的新药研发助力。这款名为DeepPurpose的工具包,不仅包含COVID-19的生物测定数据集,还有56种前沿的AI模型。作为一个基于PyTorch的工具包,DeepPurpose只需要不到10行代码,就能训练出AI“药神”模型。

  • ferminet:DeepMind开源了一个“费米网络”(FermiNet),TensorFlow实现,用来求解分子的电子行为,在30个电子的有机分子上也达到了很高的精度。文章结果发表在期刊Physical Review Research上。

  • EasyTransfer:阿里云正式开源的深度迁移学习框架 EasyTransfer,这是业界首个面向 NLP 场景的深度迁移学习框架。

  • ivadomed:医学影像深度学习工具包

  • nimfa:Python非负矩阵分解库

  • Amazon SageMaker:亚马逊提供的面向所有开发人员和数据科学家的机器学习服务,可以帮助开发人员和数据科学家快速构建、训练和部署机器学习 (ML) 模型。SageMaker 完全消除了机器学习过程中每个步骤的繁重工作,让开发高质量模型变得更加轻松。

  • dagli:基于Java的机器学习框架

  • Enzyme:麻省理工学院(MIT)提出的自动微分框架 Enzyme 在 NeurIPS 2020 大会上引起过不少人的兴趣,现在人们已经可以尝试使用这套工具了。

  • DALLE-pytorch:DALL·E是刚公布的文字转图像网络框架,目前只公布了项目结果,甚至连官方论文都还没出,这是一个民间复现的结果,短短几天GitHub:star:1.7k​

  • kbd-audio:一个叫做 Keytap 的 “黑科技” 。Keytap 通过监听你敲击键盘的声音,就能还原出你输入的内容。而且,只需要通过你电脑里的麦克风,就能完成声波采集的任务。

  • TextBox:中国人民大学AI BOX团队推出了新的开源文本生成库TextBox(妙笔),在保证组件模块化的同时,提供了许多较新baseline的接口,使得研究者一方面可以基于模块搭建自己的模型,另一方面也可以快速调用已有的baseline完成实验。目前相关代码和相应论文都已上线。

  • Deep-Forest:南大周志华团队开源的深度森林软件包DF21:训练效率高、超参数少,普通设备就能跑

  • Spacy:spaCy 是具有工业级强度的 Python NLP 工具包,被称为最快的工业级自然语言处理工具。它支持多种自然语言处理的基本功能,主要功能包括分词、词性标注、词干化、命名实体识别、名词短语提取等。GitHub:star:1​9k

  • PyArmadillo:PyArmadillo 是一个 Python 语言的线性代数库,强调易用性。该库旨在提供类似于 Matlab 或者 Octave 的高级语法和功能,使得用户以熟悉且自然的方式表达数学运算。

  • pytorch-image-models:pytorch-image-models 库由热衷于构建 ML 和 AI 系统的加拿大人 Ross Wightman 创建,包含了图像模型、层、实用工具、优化器、调度器、数据加载器 / 扩增、推理训练 / 验证脚本等资源。该库旨在将多种多样的 SOTA 模型整合起来,以复现 ImageNet 数据集上的训练结果。

  • insightface:insightface 由 Deep Insight 团队创建,是一个开源的 2D 和 3D 深度人脸分析工具箱,主要基于 MXNet 框架构建。该库的主分支(master branch)适用于 MXNet 1.2-1.6 版本以及 Python 3.x 版本。

  • imgclsmob:imgclsmob 库由高级软件工程师 Oleg Sémery 创建,主要研究计算机视觉任务的卷积网络。该库包含用于训练、评估和转换的各种分类、分割、检测和姿态估计模型和脚本的实现或复现。

  • PRML:Python3实现的经典机器学习图书《Pattern Recognition and Machine Learning》中的代码,GitHub:star:9.7k​

  • trax:谷歌开源的深度学习训练、开发加速平台,GitHub:star:6k

  • pykale:PyTorch多模态学习库

  • machine-learning-collection:微软机器学习/深度学习开源贡献集

  • trustworthyAI/gcastle at master · huawei-noah/trustworthyAI (github.com):华为诺亚开源因果结构学习工具包gCastle

  • tensorflow/decision-forests:TensorFlow开源决策森林库TF-DF

Auto Machine Learning (自动机器学习) 🔧

💨 Back to Top

  • awesome-automl-papers:AutoML论文大全,以及相关工具的对比图,GitHub:star:2.7k
  • autokeras:它使用了高效神经架构搜索ENAS,只需使用 pip install autokeras 就能快速轻松地安装软件包,然后就能用自己的数据集来执行自己的架构搜索构建思路。相比谷歌 AutoML,两者构建思路类似,但不同的是,AutoKeras 所有代码都已经开源,可供开发者无偿使用。文档地址教程地址。GitHub:star:6.6k。
  • TPOT:TPOT 是一个 Python 编写的软件包,利用遗传算法行特征选择和算法模型选择,仅需几行代码,就能生成完整的机器学习代码。在机器学习模型开发图中,TPOT 所完成的即通过利用遗传算法,分析数千种可能的组合,为模型、参数找到最佳的组合,从而自动化机器学习中的模型选择及调参部分。GitHub:star:6.7k。
  • Featuretools:这是一个用于自动化特性工程的开源 python 框架,它可以帮助开发者从一组相关数据表中自动构造特征。开发者只需要知道数据表的基本结构和它们之间的关系,然后在实体集(一种数据结构)中指明。然后在有了实体集之后,使用一个名为深度特征合成(DFS)的方法,在一个函数调用中构建出数千个特征。官网,GitHub:star:4.6k。
  • AdaNet:AdaNet 是由谷歌开源的一个轻量级的基于 TensorFlow 框架。AdaNet 易于使用,并能创建高质量的模型,为 ML 实践者节省了用于选择最佳神经网络架构的时间,实现了一种将学习神经架构作为子网络集合的自适应算法。官方文档,GitHub:star:3k。
  • NNI (Neural Network Intelligence):2018年9月,微软亚洲研究院发布了第一版 NNI (Neural Network Intelligence) ,目前已在 GitHub 上获得 ⭐3.8K ,成为最热门的自动机器学习(AutoML)开源项目之一。最新版本的 NNI 对机器学习生命周期的各个环节做了更加全面的支持,包括特征工程、神经网络架构搜索(NAS)、超参调优和模型压缩在内的步骤,你都能使用自动机器学习算法来完成。
  • NNI:有了 AutoML,特征工程、神经架构和超参搜索这些炼金基本功再也不用担心了。作为科技巨头,微软也在 AutoML 上开源了自己的 NNI 库,这个库在 GitHub 上非常流行,长期盘踞在每日项目 Trending 榜,GitHub:star:5.7k。根据 GitHub 项目上的介绍,NNI(Neural Network Intelligence)意图帮助用户使用自动机器学习算法、帮助进行算法加速、实现更好的超参数、神经架构和模型压缩,以及进行平台部署。
  • Keras Tuner:基于 Keras 的模型调参工具,GitHub:star:1.7k
  • AutoGluon:亚马逊AWS推出新的基于mxnet的开源库AutoGluon,只需三行代码,自动生成高性能模型,让调参、神经架构搜索等过程实现自动化,无需研究人员人工决策,大大降低了机器学习模型的使用门槛。官方文档
  • Optuna:Optuna是一款为机器学习任务设计的自动超参数优化软件框架,是一款按运行定义(define-by-run) 原则设计的优化软件,允许用户动态地调整搜索空间,在同类软件中尤属首创,是下一代超参调优框架的代表。GitHub⭐1.9k,
  • Hyperopt:分布式异步超参数优化,GitHub:star:4.3k。
  • HungaBunga:Hungabunga项目将帮助你比大多数数据科学图书馆更快地找到答案。它贯穿全部的sklearn模型,使用所有可能的超参数,并使用交叉验证对它们进行排序
  • Auto sklearn:利用scikit-learn 进行自动机器学习,GitHub:star:4.4k。​
  • Gradient-Centralization:阿里达摩院的研究人员另辟蹊径提出了一种新型优化技术——梯度中心化(gradient centralization,GC),该方法通过中心化梯度向量使其达到零均值,从而直接在梯度上执行。研究者开源了论文中所提方法,使用 PyTorch 实现,一行代码即可替换现有优化器。论文地址
  • Autoflow:自动机器学习工作流建模平台
  • AutoML-Zero:AutoML是一种实现从数据集到机器学习模型的自动化方法,让你无需高深专业知识,就能自动部署ML模型。这一研究来自谷歌大脑的Quoc V.Le大神之手。AutoML-Zero 仅使用基本数学运算为基础,从一段空程序开始,即可自动发现解决机器学习任务的计算机程序。论文地址
  • Determined AI:这款深度学习训练平台,是由多年从事实践领域的专家,耗费三年时间构建完成的,他们的目标是帮助深度学习团队更快地训练模型,轻松共享GPU资源并有效协作。Determined使深度学习工程师可以集中精力大规模构建和训练模型,而无需担心DevOps,或者为常见任务(如容错或实验跟踪)编写代码。
  • fitlog:fitlog是一款在深度学习训练中用于辅助用户记录日志和管理代码的工具,由复旦大学邱锡鹏教授的实验室出品。中文文档
  • Runx:NVIDIA 推出的一款专门用于记录深度学习调 (lian) 参 (dan) 的工具,用来方便深度炼丹师记录各种实验数据。
  • CVPR 2020 Tutorial:CVPR 2020 Tutorial:自动化深度学习教程和介绍,推荐等级::heart::heart:!​
  • talos:基于Keras的超参数搜索库。Talos通过完全自动化超参数调优和模型评估,从根本上改变了普通的Keras工作流。Talos完全使用Keras功能,不需要学习新的语法或模板。GitHub:star:1.3k,​推荐等级::heart::heart:!
  • auto-sklearn:auto-sklearn 是一个自动机器学习工具包,它与标准 sklearn 接口无缝集成,因此社区中很多人都很熟悉该工具。通过使用最近的一些方法,比如贝叶斯优化,该库被用来导航模型的可能空间,并学习推理特定配置是否能很好地完成给定任务。GitHub:star:4.9k。论文:《Efficient and Robust Machine Learning》
  • TPOT:TPOT 是一种基于 Python 的自动机器学习开发工具,该工具更关注数据准备、建模算法和模型超参数。它通过一种基于进化树的结,即自动设计和优化机器学习 pipelie 的树表示工作流优化(Tree-based Pipeline Optimization Tool, TPOT),从而实现特征选择、预处理和构建的自动化。GitHub:star:7.5k​
  • igel:一个比Keras更好用的机器学习“模型包”:无需预处理,0代码上手做模型,相比于Keras,这个项目进一步简化了预处理、输入输出的工作,就像“模型包”一样简便。
  • vega:华为开源的自动机器学习工具
  • model_search:为了帮助研究者自动、高效地开发最佳机器学习模型,谷歌开源了一个不针对特定领域的 AutoML 平台。该平台基于 TensorFlow 构建,非常灵活,既可以找出最适合给定数据集和问题的架构,也能够最小化编程时间和计算资源。
  • AutoDL-Projects:PyTorch实现的自动机器学习算法,GitHub:star:1.2k​
  • ModularNAS:华为诺亚方舟实验室联合上海交大APEX实验室、新加坡国立大学最新发表开源ModularNAS,一款使用者友好的通用AutoML框架。它通过将不同的AutoML算法用统一的形式表达和编码,将搜索空间设计,优化算法,评估策略解耦为可独立交互的模块,真正实现了不同AutoML 模块的即插即用。

Computer Vision (计算机视觉) 👁

💨 Back to Top

  • CV成长指南:一本长达81页的CV成长指南,能给你无微不至的关怀:从装Python、装OpenCV、入门深度学习,到人脸识别、目标检测、语义分割等等各种应用,都有进阶路线,里面包含了教程、案例、注意事项。甚至怎样把算法部署到树莓派之类的硬件上,也能找到经验。
  • Mastering OpenCV 4:一本关于 OpenCV 4 的教材,就是《Mastering OpenCV 4 - Third Edition》,中文译为《精通 OpenCV 4》,对应的代码仓库。
  • OpenCV-Python Tutorial:一份YouTube上最火的 OpenCV-Python 入门视频教程,该教程由CodeBind网站博主录制,从今年2月份到现在已经录制了38个主题。目前已有26万+人次观看,是目前 YouTube 上最受欢迎的OpenCV视频教程。
  • ImageProcessing100Wen:图像处理入门 100 题,主要针对图像处理的一些基本操作,非常适合入门!该项目最大的特色就是 100 题循序渐进,基本涵盖了 OpenCV 的关键知识点。如果你正在入门 CV,正在学习 OpenCV,那么这个项目将会是一个不错的从入门到进阶的教程。
  • OpenPose:OpenPose 人体姿态识别项目是美国卡耐基梅隆大学(CMU)基于卷积神经网络和监督学习并以 caffe 为框架开发的开源库。它可以实现人体动作、面部表情、手指运动等姿态估计。适用于单人和多人,具有极好的鲁棒性。是世界上首个基于深度学习的实时多人二维姿态估计应用,很多人体姿态估计实例都是基于它实现,如动作采集、3D 试衣、绘画辅助等。GitHub:star:15.9k。
  • Facenet:FaceNet 采用了深度卷积神经网络(CNN)学习将图像映射到欧式空间,也被称为通用人脸识别系统。该系统可从人脸中提取高质量的特征,称为人脸嵌入(face embeddings),可用于训练人脸识别系统,从而实现对人脸的验证。它在 LFW 数据集上测试的准确率达到了 99.63%,在 YouTube Faces DB 数据集上准确率为 95.12%。GitHub:star:10k。
  • ShuffleNet Series:这是一个计算机视觉项目!shufflenet是一种计算效率极高的卷积神经网络(CNN)结构。它是为计算能力非常有限的移动设备设计的。这个github存储库包括多个shufflenet模型。
  • AwesomeCV:记录state-of-art计算机视觉相关论文。
  • Deep Learning Roadmap:深度学习资源,涵盖深度学习的各个方面,包括论文、数据集、课程、图书、博客、教程、框架等。资源的贡献者说,与其他同类资源相比,这份资源更有针对性。GitHub:star:3.7k​
  • Yet Another EfficientDet Pytorch:PyTorch版 EfficientDet,比官方TF实现快25倍,GitHub:star:1.4k,推荐等级::heart::heart::heart::heart:!
  • CVPR2020-Code:CVPR 2020接收论文的开源项目合集,GitHub:star:1.8k​
  • CVPR 2020 open access:CVPR 2020 接收论文大全
  • ImageProcessing-Python:该资源为作者在CSDN的撰写Python图像处理文章的支撑,主要是Python实现图像处理、图像识别、图像分类等算法代码实现。
  • KAIR:基于 PyTorch 实现的图像复原工具
  • scikit-image:方便实用的 Python 图像处理库,GitHub:star:3.8k​
  • Real Time Image Animation:印度一位程序员阿南德·帕瓦拉(Anand Pawara)设计了基于OpenCV实现的实时动画特效。毕竟OpenCV是成名已久的跨平台视觉库,是事实上的计算机视觉领域的标准库。项目中涉及的人脸识别、动作识别和运动跟踪,均在OpenCV库中原生支持。GitHub:star:1.3k​
  • Imaginaire:NVIDIA开源的基于PyTorch的GAN模型库:Imaginaire。支持有监督图-图转换、无监督图-图转换、视频-视频转换等任务,包含SPADE、pix2pixHD和 vid2vid等模型,均已开源!
  • NVAE:英伟达NIPS2020提出NVAE:Nouveau 变分自编码器,它包含了很多当前CV领域的新成果,包括多尺度架构、可分离卷积、Swish激活函数、flow模型等,堪称当前最强VAE!作者称:NVAE是第一个成功应用于大尺寸256×256像素自然图像的VAE!论文《NVAE: A Deep Hierarchical Variational Autoencoder》
  • imaginaire:英伟达开源的一个新的 PyTorch 库「Imaginaire」,共包含 9 种英伟达开发的图像及视频合成方法。
  • landmark_annotation:图片关键点标注工具
  • BBox-Label-Tool:图片关键框标注工具
  • labelImg:图片标注工具,GitHub:star:12k
  • FaceX-Zoo:京东发布的人脸检测工具
  • glasses:紧凑,简洁和可定制的深度学习计算机视觉库
  • albumentations:数据增强库,GitHub:star:7.1k
  • libfacedetection:人脸检测+关键点检测算法库,GitHub:star:10.3k​
  • computer-vision-in-action:《计算机视觉实战演练:算法与应用》中文电子书、源码、读者交流社区
  • External-Attention-pytorch:深度学习中的Attention总结

Reinforcement Learning (强化学习) 💪

💨 Back to Top

  • UCL Course on RL:David Silver 的强化学习课程。

  • 《Reinforcement Learning: An introduction》:Richard Sutton 和 Andrew Barto的《强化学习:简介(第二版)》。书籍主页代码地址课后习题David sliver中文字幕视频。推荐等级::heart::heart::heart::heart:!

  • 《Reinforcement Learning》:Denny Britz 亲自 用 Python,OpenAI Gym 和 TensorFlow 实现了上述两份教材资源的大多数标准强化算法,并把它们都共享了出来,方便大家配合教材食用。在这份万星资源里,每个文件夹都对应着教材的一个或多个章节。除了练习和解决方案之外,每个文件夹下还包含了一系列学习目标,基础概念摘要,以及相关链接。GitHub已收:star:10k+

  • Rainbow is All You Need:一份用 Jypyter Notebook 写的深度强化学习(Deep Reiforcement Learning)笔记,背景理论、代码实现全都有,手把手教你从 DQN 到Rainbow 。 GitHub地址,推荐等级::heart::heart::heart::heart:!

  • Pg Is All You Need:手把手教你掌握 Policy Gradients 算法。

  • Practical_RL:Github上一份强化学习教程

  • DeepRL:由“深度强化学习实验室(DeepRL-Lab)”创建,希望能够为所有DRL研究者,学习者和爱好者提供一个交流平台。

  • DeepMind:DeepMind 发布了一系列新的开源技术,包括三种 DRL 框架:OpenSpiel、SpriteWorld 和 Bsuite,这些技术将有助于简化 DRL 方法的应用。

    • OpenSpiel:OpenSpiel 是一系列环境和算法的集合,用于研究一般强化学习和游戏中的搜索/规划。OpenSpiel 的核心实现是基于 C++和 Python 绑定,便于在不同的深度学习框架中采用。该框架包含了一系列游戏组合,允许 DRL 智能体掌握合作和竞争行为。类似地,OpenSpiel 包含了多种 DRL 算法组合,例如:搜索、优化和单一智能体等。OpenSpiel 还包括分析学习动态和其他常见评估指标的工具。游戏和实用程序功能(例如:计算)是用 C++编写的。这些也可以使用 pybind11 python(2.7 和 3)绑定。
    • SpriteWorld:SpriteWorld 是一个基于 python 的强化学习环境,它由一个可以自由移动的简单形状的二维竞技场组成。更具体地说,SpriteWorld 是一个二维方形竞技场,有不同数量的彩色 Sprites,可以自由放置和渲染,但不会发生碰撞。SpriteWorld 也可以用于强化学习以外的其他目的。
    • bsuite:DeepMind试图将 bsuite(Behaviour Suite for Reinforcement Learning,强化学习行为套件)打造成为强化学习领域 的 MNIST。具体而言,bsuite 是一系列实验,旨在突出智能体可扩展性的关键点。这些实验都体现了一些基本的问题,例如「探索」或「记忆」,其实验方式可以很容易地进行测试和迭代。
  • Simple Beginner’s guide to Reinforcement Learning & its implementation:强化学习初学者教程,理论与代码实践。另一篇A Hands-On Introduction to Deep Q-Learning using OpenAI Gym in Python,推荐等级::heart::heart::heart:!

  • Awesome Reinforcement Learning:强化学习资源大全,Github:star:5k+,推荐等级::heart::heart::heart:!

  • 21 Deep Learning Videos:21个强化学习教程视频(YouTube2016)。

  • RL Courser:YouTube上的强化学习公开课。

  • Reinforcement Learning:Theory and Algorithms:微软首席研究经理Alekh Agarwal、UIUC助理教授姜楠、华盛顿研究基金会数据科学主席Sham M. Kakade合编的新书《强化学习:理论与算法》,83页pdf,讲述了强化学习最新进展,包括MDP、样本复杂度、策略探索、PG、值函数等关键议题,是了解强化学习的材料。

  • Playing Games:深度强化学习的快速发展最直接的应用和体现就在“游戏”领域,目前DRL技术主要在视频帧游戏(Atari)、棋牌游戏(Go)、实时策略游戏、Board 游戏、球类(Football)等游戏中有广泛的研究,然而很多人看了领域大牛、顶级研究机构发的论文,一头雾水,主要原因是一方面自身coding能力不是足够高,另外一方面已发表的论文省略了众多细节,导致无法复现进行研究。该开源项目就是一些强化学习复现的论文及相关代码进行了汇总,从Paper到Coding, 一览深度强化学习挑战34类游戏。

  • 《A Beginner's Guide to Deep Reinforcement Learning》:一份简明《深度强化学习初学者指南》实用的教程

  • 《Deep Reinforcement Learning Hands On》:这本书提供了一个实际的方法,通过平衡理论和编码实践的RL。一本书,让你动起手来,但也有大量的知识,如何正确地做,并了解背后发生的事情。这是一本关于 RL 的最佳实践风格书。

  • JAX:JAX由谷歌提出,是TensorFlow的简化库。结合了针对线性代数的编译器XLA,和自动区分本地 Python 和 Numpy 代码的库Autograd,在高性能的机器学习研究中使用。GitHub:star:6.9k

  • HAIKU:DeepMind发布了Haiku和RLax两个库,都是基于JAX。Haiku是基于JAX的神经网络库,允许用户使用熟悉的面向对象程序设计模型,可完全访问 JAX 的纯函数变换。

  • RLAX:RLax是JAX顶层的库,它提供了用于实现强化学习代理的有用构件。它所提供的操作和函数不是完整的算法,而是强化学习特定数学操作的实现。

  • IntroRL:香港中文大学(CUHK)信息工程系助理教授周博磊就有了一个大胆的想法,他决定把自己每周的《强化学习》课程用中文在 B 站上进行直播。除了直播和课程视频之外,周博磊还会同步更新课程的代码,使用的编程语言为 Python,深度学习框架则是 TensorFlow 和 PyTorch 皆可(PyTorch 为主)。和常规的课程一样,《强化学习纲要》也会在每节课后留下一些作业。

  • Introduction to Reinforcement Learning:David Silver 在 UCL 讲授的强化学习入门课程。没错,就是来自 DeepMind 那个在 Nature 上发表了 DQN 论文,紧接着提出 AlphaGo 和 AlphaGo Zero,从此掀起深度强化学习研究浪潮的 Silver。他的课程深入浅出,在介绍强化学习概念的过程中穿插了很多例子,对初学者非常友好,建议作为第一个观看的入门视频课程。

  • Deep Reinforcement Learning:台大李宏毅的强化学习课程

  • OpenAI Spinning Up:从 VPG(Vanilla Policy Gradient) 到 TRPO(Trust Region Policy Optimization)、SAC(Soft Actor-Critic) 均有实现,关键是 OpenAI 出品,代码质量高。

  • Stable Baselines:大量深度强化学习算法优质实现,文档丰富,包含 Colab Notebook,深度强化学习入坑必看 repo。

  • Pieter Abbeel & Sergey Levine:两位在深度强化学习领域非常有名的科学家——Pieter Abbeel 与 Sergey Levine。他们长期致力于深度强化学习的教学、研究等工作,在其个人主页可以找到很多他们所讲授课程的链接。

  • SEED RL:Scalable and Efficient Deep-RL,即可扩展且高效的深度强化学习。谷歌在最新工作《SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference》(为ICLR 2020 Oral 论文)中,提出的一个能够扩展到数千台机器的强化学习架构能够以每秒数百万帧的速度进行训练,计算效率显著提高。

  • Dreamer:Google AI 与 DeepMind 联合推出了 Dreamer,这是一种从图像中学习模型并用它来学习远见性(long-sighted)行为的 RL 智能体。通过模型预测的反向传播,Dreamer 能够利用它学得的模型高效地展开行为学习。通过从原始图像中学习计算紧凑模型状态,Dreamer 仅使用一块 GPU 即可以高效地从预测到的并行序列中学习。GitHub 博客地址论文地址

  • Tianshou:训练模型的极速,与 1500 行源代码的精简,清华大学新开源强化学习平台「天授」。天授(Tianshou)是纯 基于 PyTorch 代码的强化学习框架,与目前现有基于 TensorFlow 的强化学习库不同,天授的类继承并不复杂,API 也不是很繁琐。最重要的是,天授的训练速度非常快,我们试用 Pythonic 的 API 就能快速构建与训练 RL 智能体。

  • acme:DeepMind 发布的一种新型分布式强化学习框架「Acme」,Acme 是一款用于构建可读、高效、研究型强化学习算法的框架,核心理念在于实现对强化学习智能体的简单描述,使得智能体在各种规模下运行,包括分布式智能体。研究者在设计 Acme 的过程中也充分考虑到了不同规模智能体之间的差异,并弥合了大中小型实验之间的差别。DeepMind 研究者表示:「我们的目标是使得学界和工业界开发的各种强化学习算法更轻松地复制和推广到整个机器学习社区。」论文地址

  • NLE:Facebook研究人员发布的基于NetHack的学习环境,这是一个对强化学习智能体的鲁棒性和泛化性进行基准测试的研究工具。研究人员指出,它可以测试当前最先进人工智能的泛化极限。

  • 2048-gym:利用强化学习玩2048,一个足够有趣,又不太复杂的强化学习案例。类似项目:2048mcts 2048。相关论文:《Mastering 2048 with Delayed Temporal Coherence Learning, Multi-Stage Weight Promotion, Redundant Encoding and Carousel Shaping》《Playing Game 2048 with Deep Convolutional Neural Networks Trained by Supervised Learning》

  • RLs:Tensorflow2.0实现29种深度强化学习算法大汇总

  • Super-mario-bros-PPO-pytorch:最近,有人用 PPO 强化学习算法训练了一个超级马里奥智能体,已经打通了 29 关(总共 32 关)。

  • Deep_reinforcement_learning_Course:一门免费强化学习课程在两年前上线,将初学者到专家所需要的所有学习文档(自动调整medium专栏)、学习视频(自动嵌入)、实操游戏(自动嵌入)都打包在了一起,可以很方便的配套学习,GitHub:star:2.6k,推荐等级::heart::heart::heart:!。课程链接

  • r/MachineLearning:reddit上20个小时的深度学习和强化学习新讲座,其中包含许多示例,推荐等级::heart::heart::heart::heart:!

  • DouZero:ICML2021,快手开发的基于强化学习的斗地主AI

Recommender System (推荐系统) 🎞

💨 Back to Top

  • RecQ:一个基于TensorFlow写的Python推荐系统框架
  • DaisyRec:DaisyRec 是一个Python包,用于物体得分预测与排序,可作为推荐系统基准的多维公平比较工具
  • Librec:Librec是一个利用Java写的推荐系统库,涵盖了大量推荐系统常用算法
  • Building an Incremental Recommender System:利用CF Step python库,快速实现增量学习推荐系统,重现了Joao Vinagre等人发表的“Fast incremental matrix factorization for recommendation with positive-only feedback”的结果
  • RSPapers:必读推荐系统论文列表,GitHub:star:2k。​
  • DeepCTR:深度学习点击率算法预测包,PyTorch版本
  • RecommenderSystem-Paper:该项目收集整理了丰富的推荐系统相关资源,包括推荐系统的文献、工具和框架等,推荐等级::heart::heart::heart::heart:!
  • Paperlist for Recommender Systems:推荐系统论文列表
  • Awesome RecSys:推荐系统必读文献
  • xmall:基于SOA架构的分布式电商购物商城 前后端分离。GitHub:star:5.4k​
  • litemall:一个小商城。litemall = Spring Boot后端 + Vue管理员前端 + 微信小程序用户前端 + Vue用户移动端。GitHub:star:13.3k
  • mall:mall项目是一套电商系统,包括前台商城系统及后台管理系统,基于SpringBoot+MyBatis实现,采用Docker容器化部署。 前台商城系统包含首页门户、商品推荐、商品搜索、商品展示、购物车、订单流程、会员中心、客户服务、帮助中心等模块。 后台管理系统包含商品管理、订单管理、会员管理、促销管理、运营管理、内容管理、统计报表、财务管理、权限管理、设置等模块。GitHub:star:36.4k​
  • RecSys:项亮的《推荐系统实践》的代码实现以及结果展示分析
  • MIcrosoft News Dataset (MIND) :微软发布的大规模新闻推荐数据集MIND
  • Recommenders:这个存储库包含了微软提供的构建推荐系统的示例和最佳实践,以Jupyter笔记本的形式提供。GitHub:star:8k,推荐等级::heart::heart::heart::heart:!
  • ReChorus:一个轻量级 Top-K 推荐框架
  • neural-structured-learning:TensorFlow 开源的用于结构化数据学习的库
  • amlrecsys-tutorial:推荐系统对抗机器学习教程介绍
  • adversarial-recommender-systems-survey:推荐系统对抗机器学习综述及相关论文代码资源
  • daisyRec:推荐系统基准模型库,论文:《Are We Evaluating Rigorously Benchmarking Recommendation for Reproducible Evaluation and Fair Comparison》
  • Conversational Recommendation: Formulation, Methods, and Evaluation》:中科大何向南 SIGIR 2020 报告
  • RecBole:RecBole (中文名称:"伯乐",意取"世有伯乐,然后有千里马"),由中国人民大学的AI Box团队与北京邮电大学、华东师范大学的科研团队联合开发出品。该框架实现了推荐领域不同任务的推荐模型,拥有从数据处理、模型开发、算法训练到科学评测的一站式全流程托管。在RecBole框架中,用户只需设置几个简单的配置参数(文件、命令行、运行时参数多种方式任你选择)即可快速在不同数据集上实现各个模型,同时其简洁的开发接口十分方便相关的研究人员进行二次开发和添加新的模型支持。
  • CRSLab:中国人民大学AI BOX团队推出的开源项目CRSLab ——一个用于构建对话推荐系统(CRS)的开源工具包,在这里我们致力于帮您实现一键复现,快速开发,自动评测的一条龙服务,相关代码和对应论文目前也已经开源。
  • Awesome-RSPapers:推荐系统论文集
  • RL4Recsys:基于强化学习的推荐系统论文集
  • NeuRec:何向南小组推出的开源推荐系统库

Graph Learning (图学习) 🗺

💨 Back to Top

  • Awesome Graph Classification:这是一个野心勃勃的项目,涵盖了从深度学习、图形内核、到统计指纹和分解等领域的优秀论文以及对应的Python实现,作者表示会持续更新。GitHub ⭐2k+。
  • Awesome Network Embedding:关于 Network Embedding 的相关论文合集,GitHub ⭐2k。
  • Awesome Graph Neural Networks:GNN相关论文列表。
  • Graph-based deep learning literature: GitHub上的一个项目,作者整理了包含近期基于图的深度学习会议论文
  • Literature of Deep Learning for Graphs:GitHub上:star:2k的图神经网络的学习资源,里面整理了大量图深度学习论文,大多数都被顶会收录,数量有上百篇。这份资源最闪亮的地方,就是将这些不同方向已经发表的论文进行了整理,分门别类得放上了论文的标题、作者、关键词和地址链接。
  • Must-read papers and continuous tracking on Graph Neural Network(GNN) progress:Github上的图神经网络必读论文和最新进展列表
  • Plato:腾讯开源的高性能图计算框架 Plato,据介绍,Plato 可满足十亿级节点的超大规模图计算需求,将算法计算时间从「天」级缩短到「分钟」级,性能全面领先于其它主流分布式图计算框架,并且打破了原本动辄需要数百台服务器的资源瓶颈。
  • Machine Learning with Graphs:斯坦福大学的最新课程CS224W——图机器学习,主讲人是斯坦福大牛Jure Leskovec,他是斯坦福大学计算机学院的副教授,也是图表示学习方法 node2vec 和 GraphSAGE 作者之一。
  • Graph-based deep learning literature:图深度学习的论文集
  • Open Graph Benchmark(OGB):在 NeurlPS 2019 大会的图表示学习演讲中,Jure Leskovec 宣布开源图神经网络的通用性能评价基准数据集 OGB(Open Graph Benchmark)。通过这一数据集,可以更好地评估模型性能等方面的指标。图表示学习演讲合集
  • Deep Graph Library (DGL):在现有DL框架的基础上构建的基于Pytorch的Python包,用于简化对图的深度学习,​推荐等级::heart::heart::heart:!
  • PGL:Paddle Graph Learning,百度开源的图学习框架。
  • KDD-2019-Hands-on:KDD 2019 DGL 库教程
  • Pytorch Geometric (PYG):近几年来,图神经网络(GNN)在推荐系统、搜索引擎、计算机视觉等领域中都引起了较大的关注。Github有大量开源GNN实现,其中pytorch geometric是最优秀的实现之一,曾被 Yann LeCun 推荐,GitHub上获:star:6k+,论文:《Fast Graph Representation Learning with PyTorch Geometric》,推荐等级::heart::heart::heart::heart:!
  • PytorchGeometricTutorial:pyg教程
  • TensorFlow Geometric (TFG):基于 Tensorflow 的高效友好的图神经网络库,受 Pytorch Geometric 启发。一个新开始的项目。​推荐等级::heart:!
  • GNN-algorithmstf_geometric的作者出品的图神经网络相关算法详述及实现
  • GraphEmbedding:GraphEmbedding 算法的实现库。
  • StellarGraph:使用tf2.x写的图机器学习算法实现库。
  • Euler:阿里妈妈开源大规模分布式图表征学习框架Euler,面向工业级用户和高级研究者,结合TF/XDL/PyTorch等深度学习基础工具,支持超大规模复杂异构图的模型训练。GitHub:star:2k+
  • GDE:图神经常微分方程(Graph Neural Ordinary Differential Equations,GDE),GDE 模型的主要目的是,提供一种数据驱动的方法为结构化系统建模,特别是当这个动态过程是非线性时,更是难以用经典的分析方法进行建模。论文 Graph Neural Ordinary Differential Equations
  • Karate Club :基于 NetworkX 的无监督图机器学习算法库,GitHub:star:300+。
  • PyGSP:Python 图信号处理库,GitHub:star:100+。
  • Awesome GCN:图卷积神经网络相关资源,GitHub:star:300+。
  • Tf2 GNN:微软开源的图神经网络模型实现
  • Spektral:Spektral 是一个基于 Keras API 和 TensorFlow 2,用于图深度学习的开源 Python 库。该项目的主要目的是提供一个简单但又不失灵活性的图神经网络(graph neural networks,GNNs) 框架。推荐等级::heart::heart::heart:!
  • GNN papers:图神经网络必读论文列表,GitHub:star:7.6k,推荐等级::heart::heart::heart:!
  • DeepGCN:GNN 的论文列表
  • Graph-based NN:总结关于基于图的神经网络和关系网络的重要资料,GitHub:star:700+。​推荐等级::heart::heart::heart::heart:!
  • LiteratureDL4Graph:图深度学习论文,GitHub:star:2.5k,推荐等级::heart::heart::heart::heart:!
  • Graph Nets:PyTorch 实现的各种图模型代码,包括GCN, ChebyNet, GAT, GraphSAGE。博客地址
  • Transformers are Graph Neural Networks:Transformer和GNN有什么关系?一开始可能并不明显。但是通过这篇文章,你会从GNN的角度看待Transformer的架构,对于原理有更清楚的认知。
  • Benchmark GNNs:图神经网络 GNN-Benchmark,该框架为研究人员提供了方便地添加新数据集和模型的便利。作者团队:南洋理工大学&蒙特利尔大学(Bengio)等。推荐等级::heart::heart::heart::heart:!
  • TigerGraph:企业用唯一可伸缩的图形数据库,现在可以作为云数据库服务使用
  • Graph Learn:阿里巴巴开源的简化 GNN 应用的新框架 Graph-Learn。该框架可从实际案例中提取解决方案,应用于推荐系统、反欺骗等多个领域。GL 的可移植性和灵活性对于开发者来说十分友好,在该框架的基础上,开发者可以更轻松地实现 GNN 算法、自定义与图相关的运算符,并且更轻松地拓展现有模块。Container 和物理机上都可以安装 GL。
  • Igraph:igraph 是一组网络分析工具,集成了网络分析的诸多功能,可以在 R, Python, C/C+ 平台上使用。
  • Python igraph:用于 igraph 的Python接口
  • WWW20 Hands on Tutorial:WWW2020 DGL深度图神经网络实战教程本教程的目标有两个。首先,它将概述GNN背后的理论,讨论GNN非常适合的问题类型,并介绍一些最广泛使用的GNN模型体系结构和设计用来解决的问题/应用程序。其次,它将引入深度图库(Deep Graph Library, DGL),这是一种新的软件框架,简化了高效的基于GNN的训练和推理程序的开发。
  • Graph Learn:阿里巴巴近期开源了面向图神经网络(GNN)的框架Graph-Learn。GL 面向工业场景而设计,为当下主流 GNN 算法提供了基础运行框架。GL 旨在降低 GNN 应用落地的成本,加速整个 GNN 生态的迭代。阿里内部早在几年前就开始了 GNN 相关的探索,从研究到实际落地积累了很多有价值的经验,把这些经验通过 GL 逐渐传递出来,希望能对相关从业者有所帮助。
  • Advancements in Graph Neural Networks:图神经网络依然是研究焦点之一。最近在WWW2020的DL4G@WWW2020论坛,斯坦福大学Jure Leskovec副教授介绍了图神经网络研究最新进展,包括GNN表现力、预训练和公开图神经网络基准等。值得关注
  • Graphkit Learn:一个用于 graph kernels, graph edit distances and graph pre-image problem 的 Python 库
  • GraKeL:一个用于 Graph kernels 的scikit-learn兼容库
  • Spektral:基于 Keras 和 TensorFlow2 的图神经网络项目库,GitHub:star:1.4k
  • THUDM/cogdl: CogDL: An Extensive Research Toolkit for Graphs (github.com):清华大学开源的一个图机器学习项目库
  • AutoGL:清华大学发布的首个自动图机器学习工具包AutoGL,开源易用可扩展,支持自定义模型,项目基于CogDL
  • PyTorch-BigGraph:Facebook 开源的面向大规模图数据生成 embeddings 的库。GitHub:star:2.3k​
  • GraphGym:斯坦福开源的图神经网络设计与评价平台,推荐等级::heart::heart:!
  • 《Discrete regularity graph Laplacians》:图机器学习-图拉普拉斯算子的离散正则性
  • 《Top Trends of Graph Machine Learning in 2020》:2020图机器学习的趋势
  • 《Graph Neural Networks - Notes》:一份简短入门《图神经网络GNN》笔记小册,作者Nihal Nayak
  • 《Graph-Neural-Network-Note》:一个理解图神经网络的博客,从图(Graph)到图卷积(Graph Convolution): 漫谈图神经网络
  • [《图卷积神经网络》][https://atcold.github.io/pytorch-Deep-Learning/en/week13/13-1/]:Yann Lecun在纽约大学开设的2020春季《深度学习》课程,干货满满。最新的一期是来自新加坡南洋理工大学的Xavier Bresson教授的图卷积神经网络课程,共76页PPT,非常硬核干货,讲述了GCN近年来的研究进展,包括经典卷积网络、谱图卷积网、 空间域图卷积网、GCN基准等。现在在课程网站上也放出来笔记,非常基础细致值得学习。YouTube
  • 《An introduction to machine learning on graphs》:《Introduction to graphs and machine learning》(《图机器学习导论》)为我们介绍了图机器学习的动机与发展,包括网络表示学习、图神经网络等图机器学习方法及其在问答、知识图谱等领域的应用。
  • 《Innovations in Graph Representation Learning 》:Google图挖掘团队的两位高级科学家Alessandro Epasto和Bryan Perozzi在Google AI Blog上发表的《Innovations in Graph Representation Learning》,介绍了最新的一些图表示学习成果
  • 《A Gentle Introduction to Deep Learning for Graphs》:《A Gentle Introduction to Deep Learning for Graphs》是图深度学习领域的教程导论,它倾向于对主流概念和架构的一致和渐进的介绍,而不是对最新文献的阐述。教程在介绍概念和想法时采用了自上而下的方法并保留了清晰的历史观点,为此,导论在第2节中提供了图表示学习的泛化形式,将图表示学习泛化为一种基于局部和迭代的结构化信息处理过程。同时,介绍了架构路线图,整个导论也是围绕该路线图进行开展的。导论聚焦于面向局部和迭代的信息处理过程,因为这些过程与神经网络的体系更为一致。因此,导论会淡化那些基于图谱理论的全局方法(假设有一个固定的邻接矩阵)。
  • 《Graph Representation Learning Book》:图神经网络新书《图表示学习》,作者 William L. Hamilton,作者主页
  • 《Deep Graph Similarity Learning: A Survey》:在许多将数据表示为图形的领域中,学习图形之间的相似性度量标准被认为是一个关键问题,它可以进一步促进各种学习任务,例如分类,聚类和相似性搜索。最近,人们对深度图相似性学习越来越感兴趣,其中的主要思想是学习一种深度学习模型,该模型将输入图映射到目标空间,以使目标空间中的距离近似于输入空间中的结构距离。在这里,本文提供对深度图相似性学习的现有文献的全面回顾。本文为方法和应用提出了系统的分类法。最后,本文讨论该问题的挑战和未来方向。
  • 《Graph-Powered Machine Learning》:图驱动机器学习向您介绍图技术概念,强调图在机器学习和大数据平台中的作用。您将深入了解各种技术,包括数据源建模、算法设计、链接分析、分类和集群。在掌握核心概念之后,您将探索三个端到端项目,它们将演示体系结构、最佳设计实践、优化方法和常见缺陷。作者亚历山德罗·内格罗在构建基于图形的机器学习系统方面的丰富经验在每一章中都有所体现,你可以从他与真实客户合作的实例和具体场景中学习!
  • 《Deep Learning with Graph-Structured Representations》:图卷积网络(GCN)的作者 Thomas Kipf 公开了自己178页的博士论文,主题是「使用图结构表示的深度学习」,涵盖从图神经网络到结构发现等一系列深度学习热门话题,是他过去几年图神经网络方向研究的深度汇总。推荐等级::heart::heart::heart::heart:!
  • 《The resurgence of structure in deep neural networks》:GAT作者Petar Veličković 剑桥大学博士论文《深层神经网络结构的复兴》。推荐等级::heart::heart::heart::heart:!
  • 《Graph Representation Learning for Algorithmic Reasoning》:一份来自 DeepMind 研究员、图注意力网络一作 Petar Veličković 在WWW'20 的演讲,为我们介绍了图表征学习在算法推理领域的研究进展。演讲视频
  • 《Graph theory and additive combinatorics》:《图论和加法组合学》的课程笔记,这是一门研究生水平的课程,由Yufei Zhao教授于2019年秋季在麻省理工学院讲授。课堂笔记是由学生根据课堂内容撰写的,并在教授的帮助下进行编辑。课程网址
  • 《Learning to Reason with Graph Neural Networks》:图神经网络推理。来自佐治亚理工学院和蚂蚁金服的Le Song给了关于图神经网络推理的精炼讲解。探讨了神经网络与广义网络的结合,并利用图神经网络进行广义网络的变分推理。
  • 《Introduction to Graph Neural Networks》:2020新书《图神经网络导论》,清华大学刘知远和周杰老师著作。推荐等级::heart::heart::heart::heart:!
  • 《Towards a Theory of Vector Embeddings of Structured Data》:RWTH Aachen大学的计算机科学教授ACM Fellow Martin Grohe教授发表了《X2vec: 构建结构数据的向量嵌入理论》报告,非常干货!
  • 《Temporal Graph Network for Deep Learning on Dynamic Graphs》:《时序图神经网络》视频讲解,,作者提出了时序图网络(TGNs),一个通用的,有效的框架,用于深度学习动态图表示为时间事件序列。在内存模块和基于图的操作符中,TGNs能够显著优于以前的方法,同时计算效率也更高。作者进一步表明,以前的几个学习动态图的模型可以转换为TGN框架的具体实例。他们对TGN框架的不同组件进行了详细的消融研究,并设计了最佳配置,在动态图的几个转导和归纳预测任务上实现了最先进的性能。
  • 《Deep Learning on Graphs》:来自密西根州立大学的汤继良团队即将出版一本全面性介绍图深度学习的书。推荐等级::heart::heart::heart::heart:!
  • 《Algorithms for Convex Optimization》:耶鲁大学2020新书。这本书的目的是使读者能够获得对凸优化算法的深入理解。重点是从第一性原理推导出凸优化的关键算法,并根据输入长度建立精确的运行时间界限。由于这些方法的广泛适用性,一本书不可能向所有人展示这些方法的应用。这本书展示了各种离散优化和计数问题的快速算法的应用。本书中所选的应用程序的目的是为了说明连续优化和离散优化之间的一个相当令人惊讶的桥梁。
  • 《图数据科学傻瓜式入门》:Graph Data Science For Dummies将带您了解图数据科学的基础——从定义图分析和算法到向您展示如何使用它们进行机器学习和解决现实世界的问题。
  • 《图深度学习隐私保护》:Privacy-Preserving Deep Learning Over Graphs
  • 《Graphtheory》:图论的入门讲义。内容包括 绪论(图及其平面图形、子图、路径和循环); 图的连通性;色素;图曲面;有向图。
  • Awesome-GNN-Recommendation:图神经网络文献集锦
  • Learning Representations via Graph-structured Networks:CVPR2020-Tutorial,视觉的图网络结构表示学习
  • Knowledge-Graph-Publications:知识图谱顶会文献集锦
  • OpenHINE:为了方便大家对异质信息网络表示学习(HINE)开展相关的实验或研究,北京邮电大学 DMGroup 的研究人员在 GitHub 上发布了 HINE 训练和测试框架 OpenHINE。
  • GN Review:GNN综述阅读报告,报告涵盖有多篇GNN方面的论文,以及一个按照论文《The Graph Neural Network Model 》使用pytorch编写的模型例子,该模型在人工数据上进行运行和验证。
  • Graph Nets: The Next Generation - Max Welling:下一代图神经网络是什么?几何深度学习,大牛Max Welling教授视频讲解
  • GCN (Graph CNN) Tutorials:这门课程由宾夕法尼亚大学电气与系统工程系教授 Alejandro Ribeiro 于 2020 年 8 月底开设,专门讲述图神经网络(GNN)。就课程内容而言,本课程主要探讨了图卷积滤波器和图滤波器组,研究了单特征和多特征图 GNN。此外,课程介绍了循环 GNN 等相关网络架构,并重点强调了 GNN 的置换等变性和图变形的稳定性。这些特性提供了一种可以从实证角度观察到 GNN 良好性能的解释方法。该课程还将研究大量节点中的 GNN,以解释 GNN 在不同节点数的网络中的可迁移性。B 站地址。推荐等级::heart::heart::heart::heart:!
  • 图神经网络:深图远算,理胜其辞:20201021 视觉与学习青年学者研讨会直播,报告时间:2020年10月21日 报告人:廖仁杰、陈思衡 报告题目:Deep Learning on Graphs、Bridging graph signal processing and graph neural networks
  • awesome-gcn:图卷积神经网络相关资源
  • pytorch-GAT:GAT的一个pytorch复现仓库,可以用来学习GAT与GNNs
  • GNN_note:GNN笔记整理
  • GraphScope:阿里巴巴开源的大规模图计算系统

Generative Adversarial Networks (GANs) 🤜 🤛

💨 Back to Top

  • Generative Adversarial Networks:Ian Goodfellow2016年的GAN演讲视频
  • Adversarial Nets Papers:GitHub上一个:star:4k+的项目,收录了生成对抗网络(GAN)诞生至今的论文和代码
  • The GAN Zoo:GitHub上一个:star:5k+的项目,收录了GAN诞生至今所有GAN变体论文。
  • Generative Adversarial Networks - The Story So Far:Reddit 出现的一个归纳 GAN 发展脉络的博客,作者在博客中详细梳理了过去几年的 GAN 发展历程,包含众多 SOTA 论文及其代码和对应的学习资源。
  • CycleGAN Tutorial:官方资源帖,手把手教你在TensorFlow 2.0中实现CycleGAN,这份教程全面详细,想学CycleGAN不能错过这个。GitHub地址
  • GAN Overview Chinese (pdf):万字综述之生成对抗网络(GAN)
  • PyTorch-GAN:用Pytorch 实现的 GAN代码大全,GitHub ⭐5k+。
  • 《GANs in Action》:牛津大学Jakub Langr 撰写了《GANs in Action Deep learning with Generative Adversarial Networks》的著作,囊括了关于GAN的定义、训练、变体等,全面叙述关于当下AI最重要的技术之一GAN的著作,是学习生成式对抗网络非常好的学习图书,是关于GAN的最好的书籍之一。
  • DiscoGAN PyTorch:"Learning to Discover Cross-Domain Relations with Generative Adversarial Networks" PyTorch实现
  • A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications:史上最全GAN综述2020版:算法、理论及应用。本文是一份出自陶大程、叶杰平老师等大牛之手的 GAN 详细综述,介绍了近年来有关 GAN 模型的相关研究进展,并指出了今后该领域的发展方向。
  • GAN:GAN, DCGAN, WGAN, CGAN, InfoGAN 等各种 GAN 的实现和资源大全,GitHub:star:1.7k​
  • Keras-GAN:Keras 的 GAN 实现版本,GitHub:star:7k​

Adversarial Attack and Defense (对抗攻防)⚔🛡

💨 Back to Top

Model Compression (模型压缩) ⚙

💨 Back to Top

  • Distiller:基于Pytorch 的模型压缩库,GitHub:star:2.6k
  • Tensorflow Model Optimization:TensorFlow 官方模型优化工具,GitHub:star:600+。官网主页
  • Distil*:包含了用于训练Distill*的原始代码,以及展示如何使用DistilBERT、DistilRoBERTa和DistilGPT2的示例。
  • Apex:在PyTorch中实现简单的混合精度和分布式训练的工具,GitHub:star:3.4k。
  • Sparse Learning Library:基于PyTorch的稀疏学习库,可以很容易封装任何PyTorch神经网络,以模拟稀疏神经网络的训练。
  • Model Compression:基于pytorch实现模型压缩,博客B站
  • EfficientDet.Pytorch:EfficientNets是一种新的模型缩放方法,准确率比之前最好的Gpipe提高了0.1%,但是模型更小更快,参数的数量和FLOPS都大大减少,效率提升了10倍。该项目是一个哈佛数学系小哥哥Luke Melas-Kyriazi开源了自己的PyTorch实现,包含与训练模型和Demo。
  • ALBERT:ALBERT模型是BERT的改进版,与最近其他State of the art的模型不同的是,这次是预训练小模型,效果更好、参数更少。GitHub:star:1.8k​
  • DeepSpeed:微软开源的DeepSpeed是一个深度学习优化库,它使分布式培训变得简单、高效和有效。GitHub:star:2.1k​
  • GAN Compression:来自麻省理工学院(MIT)、Adobe、上海交通大学的研究者提出了一种用于压缩条件 GAN 的通用方法。这一新技术在保持视觉保真度的同时,将 pix2pix,CycleGAN 和 GauGAN 等广泛使用的条件 GAN 模型的计算量减少到 1/9~1/21。该方法适用于多种生成器架构、学习目标,配对或非配对设置。论文地址
  • TextBrewer:哈工大讯飞联合实验室发布基于PyTorch框架的知识蒸馏工具包TextBrewer,提供更加方便快捷的知识蒸馏框架。论文地址
  • Matrix Compression Library:谷歌开源的矩阵压缩算子
  • A Simple Dictionary Learning Implementation:谷歌开源, 基于 OMP 的字典学习实现,类似的,有 Scikit 的实现
  • Gradient Based Pruning:基于梯度的剪枝介绍
  • Awesome-model-compression-and-acceleration:模型压缩论文大全,GitHub:star:467​
  • Awesome Knowledge Distillation:作为模型压缩的一种方法,知识蒸馏能够利用已经训练的一个较复杂的模型,来指导一个较轻量的模型训练,从而在减小模型大小和计算资源的同时,尽量保持原始大模型的准确率的方法。Github上的dkozlov同学,整理了Knowledge Distilling的paper、教程、代码,看完这些资料,你一定有所收获
  • Model Compression:基于pytorch实现模型压缩
  • Torch-Pruning:Pytorch结构化神经网络修剪工具包
  • LSQ-Net:IBM的量化工作,发表在ICLR 2020。论文:《Learned Step Size Quantization》。为了解决量化精度越低,模型识别率越低的问题,本文引入了一种新的手段来估计和扩展每个权重和激活层的量化器步长大小的任务损失梯度,并在 ImageNet 上的实验和分析证明了所提出的方法的有效性, 实现了ResNet 4 bit量化不掉精度!
  • EagleEye《EagleEye: Fast Sub-net Evaluation for Efficient Neural Network Pruning》。提出一种简单有效的快速剪枝方法,具有较好的通用性。
  • EfficientDNNs:模型压缩加速相关论文集

Object Detection (目标检测) 🔎

💨 Back to Top

  • ThunderNet:作者提出来一种名为ThunderNet的轻量级two-stage检测器,整体结构分成名为SNet的轻型Backbone(主干)和Detection(检测)部分,其中SNet是基于ShuffleNetV2网络,用于对象检测,Detection部分是基于Light-Head R-CNN,并进一步压缩RPN和R-CNN子网,并设计了两个模块:Context Enhancement Module (CEM) 和 SpatialAttention Module (SAM),CEM将多尺度的局部特征和全局特征进行整合,SAM引入RPN信息来再调整RoIwarping层的特征分布。ThunderNet在推理速度、精度均显著优于同类网络,可部署在ARM平台上实现实时检测。论文地址
  • Gaussian YOLOv3:在目标检测的落地项目中,实时性和精确性的trade-off至关重要,而YOLOv3是目前为止在这方面做得最好的算法。本文通过高斯分布的特性,改进YOLOv3使得网络能够输出每个检测框的不确定性,从而提升了网络的精度。论文地址
  • YOLO v3:停更许久的YOLOv3。论文代码
  • Darknet]:目前该项目在github上已获得 5.8k ⭐,这个数量也相当之高,与原版YOLO区别在于:1. 提供Windows版本。2. 提供更详细的使用教程。3. 不停更新YOLOv3及衍生网络
  • SimpleDet:SimpleDet 是一套简单且多功能的目标检测与实例分割的框架,其是基于MXNet开发完成。目前 SimpleDet 已获得 2.3k ⭐!
  • Fast-Generic-Face-Detector-1MB:用户 Linzaer 在 Github 上推出了一款适用于边缘计算设备、移动端设备以及 PC 的超轻量级通用人脸检测模型,该模型文件大小仅 1MB,320x240 输入下计算量仅 90MFlops。项目推出不久即引起了大家的关注,登上了最近的 Github trending。
  • Pedestrian Detection:本资源整理了一些目标检测的开放代码、论文列表、行人检测开源代码以及行人检测相关数据集。非常适合初学者与科研工作者。
  • mmDetection:mmDetection 是个非常强大的目标检测工具箱,也是基于PyTorch实现。目前 mmDetection 已获得 7.6k ⭐!
  • Detectron2:Detectron2 前身就是鼎鼎大名的 Detectron,其实Detectron可以说是Facebook第一代检测工具箱,目前在github上获得 22.5k ⭐!
  • FaceMaskDetection:开源人脸口罩检测模型和数据 ,在线体验链接
  • ChineseOCR_LITE:中文OCR开源项目,采用了轻量级的主干网络 PSENet,轻量级的 CRNN 模型和行文本方向分类网络 AngleNet,总体模型只有 17M。支持任意方向文字检测,在识别时会自动判断行文本方向。GitHub:star:1.7k。​
  • OpenRadar:一个用于与雷达数据交互和处理的开源库,专门用于MIMO mmWave雷达
  • TF Object Detection API:TensorFlow 目标检测 API
  • awesome-tiny-object-detection:本项目主要涵盖小目标检测相关的论文、数据集还有一些博客文章。
  • 3DDFA_V2:一个轻松配置即可上线使用的3D人脸检测工具箱,该工具箱包括多种特性:2D稀疏点、稠密点、3D、深度图、PNCC、UV纹理展开、姿态估计、序列化等等。
  • Yolo-Fastest:这是个模型非常小、号称目前最快的YOLO算法——大小只有1.3MB,单核每秒148帧,移动设备上也能轻易部署。而且,这个YOLO-Fastest算法满足所有平台的需要。不论是PyTorch,还是Tensorflow,又或者是Keras和Caffe,可以说是全平台通用。
  • MobileNet-Yolo:基于MobileNet图像分类算法的YOLOv,同样可以在全平台使用。不仅如此,这个全平台通用的MobileNet-YOLOv3,体积和精度都要优于MobileNet-SSD。
  • 《Object Detection in 20 Years: A Survey》:以2014年为分水岭,作者将过去二十年的目标检测发展进程分为两个阶段:2014年之前的传统目标检测,以及之后基于深度学习的目标检测。接下来,文章列举了二十年来目标检测领域的关键技术,思路非常清晰。
  • TIDE:识别目标检测错误的通用工具箱
  • ImageAI:ImageAI是一个python库,只需要几行代码,就可以让程序员和软件开发人员轻松地将最先进的计算机视觉技术集成到他们现有的或新的应用中。GitHub:star:5.6k。​
  • YOLObile:CoCoPIE 团队:美国东北大学王言治研究组和威廉玛丽学院任彬研究组共同提出了名为 YOLObile 的手机端目标检测加速框架。YOLObile 框架通过「压缩 - 编译」协同设计在手机端实现了高准确率实时目标检测。该框架使用一种新提出的名为「block-punched」的权重剪枝方案,对模型进行有效的压缩。在编译器优化技术的协助下,在手机端实现高准确率的实时目标检测。该研究还提出了一种高效的手机 GPU - 手机 CPU 协同计算优化方案,进一步提高了计算资源的利用率和执行速度。相比 YOLOv4 的原版,加速后的 YOLObile 的运行速度提高了 4 倍,并且维持了 49mAP 的准确率。相比 YOLOv3 完整版,该框架快 7 倍,在手机上实现了 19FPS 的实时高准确率目标检测。同时准确率高于 YOLOv3,并没有用牺牲准确率来提高计算速度。
  • awesome-anchor-free-object-detection:anchor-free目标检测资源
  • landmark_annotation:图片关键点标注工具
  • BBox-Label-Tool:图片关键框标注工具

TensorFlow Learning (TensorFlow 学习) 🇹🇫

💨 Back to Top

  • TensorFlow 官方文档:TensorFlow 官方文档中文版
  • TensorFlow Tutorials:TensorFlow官方英文教程文档
  • TensorFlow Course:GitHub上:star:10k+的TensorFlow教程,教程、代码、笔记应有尽有
  • TensorFlow Example:GitHub上:star:30k+对初学者友好的TensorFlow教程例子
  • TensorFlow Example:GitHub上:star:500+的项目,各种从其他示例重新创建TensorFlow代码的例子
  • TensorFlow Models:GitHub上:star:60k+的TensorFlow官方项目,内容包括各种使用TensorFlow写的模型和例子,一共分为两类:官方模型和研究模型。官方模型,是使用TensorFlow的高级API的示例模型的集合。研究模型,是研究人员在TensorFlow中实现的大量模型集合,推荐等级::heart::heart::heart::heart:!
  • 简单粗暴TensorFlow:简单粗暴TensorFlow教程,基于TensorFlow最新的Eager Execution(动态图)模式,力图让具备一定机器学习及Python基础的开发者们快速上手TensorFlow。GitHub地址
  • 深度学习 TensorFlow 教程(中文全集):B站上搬运的TensorFlow深度学习教程
  • CS20SI - TensorFlow for Deep Learning Research:B站上搬运的斯坦福新开的TensorFlow课程
  • TF Girls 修炼指南:B站上一个UP主的TensorFlow入门教程视频
  • Awesome TensorFlow:TensorFlow中的教程和 ML 项目的集合,GitHub:star:14k
  • TensorFlow Cookbook:这是一个易用的TensorFlow代码集,作者是来自韩国的AI研究科学家Junho Kim,内容涵盖了谱归一化卷积、部分卷积、pixel shuffle、几种归一化函数、tf-datasetAPI,等等
  • Deep Learning With Keras Notebooks:Jupyter notebooks for using & learning Keras
  • TfPyth:一行代码切换TensorFlow与PyTorch,模型训练也能用俩框架
  • Float16 Quantization:TensorFlow模型优化工具包又一员新添大将,训练后的半精度浮点量化(float16 quantization)工具,有了它,就能在几乎不损失模型精度的情况下,将模型压缩至一半大小,还能改善CPU和硬件加速器延迟。Colab链接
  • TensorFlow Hub:TensorFlow Hub是一个库,用于发布、发现和使用机器学习模型中可重复利用的部分。GitHub地址
  • Model Zoo:这个平台,由新加坡名为Jing Yu Koh本科生牵头搭建。与上述的几个平台不同,这个平台上提供预训练模型,不仅仅只是完全针对于Pytorch或者TensorFlow,推荐等级::heart::heart:!
  • Medium:基于TensorFlow 实现的PCA,t-SNE, AE, node2vec, LSTM算法
  • 深度学习之TensorFlow工程化项目实战:《深度学习之TensorFlow工程化项目实战》是一本非常全面的、专注于实战的AI图书,兼容TensorFlow 1.x和2.x版本,共75个实例。本书结构清晰、案例丰富、通俗易懂、实用性强。适合对人工智能、TensorFlow感兴趣的读者作为自学教程。
  • Tensorflow Practice:tensorflow 实战练习,包括强化学习、推荐系统、nlp等,GitHub:star:3.6k。​
  • tflearn:基于TensorFlow1.x的高级封装,但是不支持TensorFlow2.x。
  • TensorrtTensorrt 的 TensorFlow 集成
  • Tensorflow Tutorials using Jupyter Notebook:使用Jupyter Notebook运行的TensorFlow教程,教程是基于Jupyter Notebook开发环境的Tensorflow教程,Jupyter Notebook是一款非常好用的交互式开发工具,不仅支持40多种编程语言,还可以实时运行代码、共享文档、数据可视化、支持markdown等,适用于机器学习、统计建模数据处理、特征提取等多个领域。
  • Tensorflow exercise:Tensorflow代码练习,一个从易到难的Tensorflow代码练习手册。非常适合学习Tensorflow的小伙伴。
  • Stanford Tensorflow Tutorials:Stanford 的 Tensorflow 教程,GitHub:star:9.5k​
  • Tensorflow zh:TensorFlow官方文档中文版,GitHub:star:11.8k,不过已经两年未更新了​

  • TensorFlow 2.0 迁移指南:近期 TensorFlow 2.0正式版已经推出,如果你使用过tensorflow 1.x,这是一个迁移到2.0的官方指南
  • TF upgrade v2:为了帮助你(自动地)将代码从 keras 更新为 tf.keras,Google 发布了一个名为 tf_upgrade_v2 的脚本。顾名思义,这个脚本可以分析你的代码并报告需要改动的行,该脚本甚至可以替你完成升级过程。
  • Community:存储TensorFlow开发人员社区使用的文档,推荐等级::heart::heart:!
  • Effective tf2:一个方便的指南,了解如何有效使用TensorFlow 2.0中的所有新功能
  • Models and Datasets:为了简化TensorFlow 2.0的入门工作,官方发布了几个使用2.0 API的常用ML模型的参考实现
  • Introduction TensorFlow:免费 TensorFlow 课程
  • Intro To TensorFlow For Deep Learning Ud187:另一个免费 TensorFlow 课程
  • TensorFlow 2.0:GitHub上 TensorFlow 2.0 源码
  • Hands-on TensorFlow 2.0:TensorFlow 2.0 实操教程
  • TensorFlow 2.0 + Keras Overview for Deep Learning Researchers:Keras之父出品:Twitter超千赞的TF 2.0 + Keras速成课程。需要翻墙查看。推荐等级::heart::heart:!
  • Transformer Chatbot:【TensorFlow2.0】Transformer聊天机器人教程。GitHub地址
  • TensorFlow Examples v2.0:GitHub 中:star:30k+项目TensorFlow examples的一个子项目,更新了一些2.0的样例
  • 《Deep Learning with TensorFlow book》:一本基于TensorFlow 2.0 正式版的中文深度学习开源书,GitHub趋势日榜排名全球第一,已斩获:star:3k+,并且还在不断增长。从目录章节构成来看,理论与编程并不是独立分开,而是随着难度的递增,循序渐进、穿插编排的,除此之外,每个章节里的内容编排也是理论与实战相结合。配套代码,TensorFlow 2.0 实战案例。推荐等级::heart::heart::heart:!
  • 简单粗暴TensorFlow 2.0:一份全中文教学的快速上手指南,基于Keras和Eager Execution(动态图)模式,北大学霸出品,获得TensorFlow官方认可。其名为,简单粗暴TensorFlow 2.0。GitHub地址,推荐等级::heart::heart::heart:!
  • Tf2 Course:"Deep Learning with TensorFlow 2 and Keras" 课程笔记
  • TensorFlow 2.0 中文教程:该教程主要由tensorflow2.0官方教程的作者个人学习复现笔记整理而来,并借鉴了一些keras构造神经网络的方法,中文讲解,方便喜欢阅读中文教程的朋友。知乎专栏
  • Awesome Tensorflow 2:Tensorflow 2.x资源,如教程,博客,代码和视频。推荐等级::heart::heart::heart::heart:!
  • 《动手深度学习 (TensorFlow2.0)》:《动手学深度学习》(Dive into Deep Learning) TensorFlow 2.0版本代码实现。在线阅读地址。推荐等级::heart::heart::heart:!
  • TensorFlow Tutorials:TensorFlow 官方文档示例教程,使用2.0实现了一些经典模型,GitHub仓库。推荐等级::heart::heart::heart:!
  • 《Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition》:Scikit-Learn,Keras,Tensorflow是机器学习工具链的重要组成部分。本书的作者,根据上述三个机器学习工具箱,融汇贯通成一个个机器学习实例,让即使对人工智能了解不多的程序员也可以使用简单高效的工具来实现机器学习任务。本书Sklearn,Keras与Tensorflow机器学习实用指南(第二版)涵盖大量上述三个工具和机器学习的相关内容,书内代码。推荐等级::heart::heart::heart:!
  • Tensor2Tensor:tensor2tensor(t2t)是google基于tensorflow新开源的深度学习库,该库将深度学习所需要的元素(数据集、模型、学习率、超参数等)封装成标准化的统一接口,在使用其做模型训练时可以更加的灵活。GitHub ⭐ 9.4k。
  • 《Deep Learning Pipeline: Building a Deep Learning Model with TensorFlow》:根据最新的TensorFlow方法而不是过时的工程概念来构建自己的Pipeline。这本书向你展示了如何为真实的TensorFlow项目建立一个深度学习Pipeline。
  • 《Accelerating training, inference, and ML applications on NVIDIA GPUs》:Maggie Zhang,Nathan Luehr,Josh Romero,Pooya Davoodi和Davide Onofrio深入研究了用于加速深度学习训练和推理的通用深度学习和机器学习工作负载的技术。 通过本教程将了解DALI如何消除现实应用中的I/O和数据处理瓶颈,以及自动混合精度(AMP)如何轻松地在Volta GPU上的训练性能提高3倍。 您将看到使用Horovod进行多GPU和多节点扩展的最佳实践。 他们使用深度学习探查器来可视化TensorFlow操作并确定优化机会。 本教程将教读者学习使用TensorRT(TRT)中的INT8量化来部署这些训练过的模型,所有这些都将在TensorFlow框架的新型便捷API中进行。
  • TensorFlow From Zero To One:TensorFlow 从0到1学习资料大全,含入门指南、在线博客、视频教程、书籍推荐和实战项目等。
  • Tensorflow 官方Youtube:Tensorflow 官方Youtube
  • Tensorflow 官方博客:Tensorflow 官方博客
  • TensorFlow Tutorial For Beginners:Tensorflow 新手教程
  • TensorFlow Addons:相当于以前的tf.contrib的官方实现,里面有许多新的自定义函数和类,源码值得观摩学习。
  • TensorFlow Recorder:数据科学家、数据工程师或 AI/ML 工程师只需几行代码即可创建基于图像的 TFRecords。使用 TFRecords 对于创建高效 TensorFlow ML 流水线非常重要,而过去的创建方法非常繁琐。在 TFRecorder 之前,要大规模创建 TFRecords,必须编写一个数据流水线来解析结构化数据,从存储中加载图像并将结果序列化为 TFRecord 格式。TFRecorder 允许您直接从 Pandas dataframe 或 CSV 写入 TFRecords,无需编写任何复杂的代码。教程
  • TensorFlow Datasets:TensorFlow Datasets 是可用于 TensorFlow 的一系列数据集的集合。所有数据集都显示为 tf.data.Datasets,可以提供易于使用且具有高性能的输入流水线。
  • TensorFlow Hub:TensorFlow Hub 是一个库,用于发布、发现和使用机器学习模型中可重复利用的部分。模块是一个独立的 TensorFlow 图部分,其中包含权重和资源,可以在一个进程中供不同任务重复使用(称为迁移学习)。
  • TensorFlow Recommenders:TensorFlow 开源的推荐系统项目。
  • Model Optimization:TensorFlow 模型优化工具包,该工具包是一套能够优化机器学习模型以便于部署和执行的工具。
  • TensorFlow Privacy:TF官方开源的用于机器学习模型训练数据的隐私的库
  • TensorFlow Federated:TensorFlow Federated (TFF) 是一个开源框架,可用于对分散式数据进行机器学习和其他计算。我们开发 TFF 是为了促进联合学习 (FL) 的开放式研究和实验。FL 是一种机器学习方法,使我们能够跨多个参与客户端训练全局共享的模型,并让训练数据留存在本地。例如,FL 已被用于训练手机键盘的预测模型,但不会将敏感的输入数据上传到服务器。
  • TensorFlow Extended:探索使用 TensorFlow 构建高级模型或方法的库,并访问可针对特定领域扩展 TensorFlow 的应用软件包。推荐等级::heart::heart::heart::heart:!
  • TensorFlow Magenta:一个用于部署ML管道的库
  • TFRT:TFRT 是一款全新的 TensorFlow 运行时(runtime),将取代现有的 TensorFlow 运行时(runtime)。TFRT 负责在目标硬件上以底层的设备特定原语实现内核的高效执行,其在即时执行和图执行模式中都发挥着关键作用。
  • TensorFlow Hub:TensorFlow Hub是一个在TensorFlow中发布、发现和重用部分机器学习模块的平台,可以把它称为TensorFlow模型的GitHub。
  • TensorFlow Official Models:大多数模型的TensorFlow官方实现。
  • Examples:官方的 TensorFlow examples库,GitHub:star:2.5k。
  • TensorFlow/TPU:这个存储库是云TPU使用的参考模型和工具的集合,里面实现了大量的模型。GitHub:star:3k。
  • AttentioNN:关于各种 Attention 的 TensorFlow 实现。
  • TFGAN:2017 年,谷歌推出了用于训练和评估 生成对抗网络 (Generative Adversarial Networks, GAN) 的轻量级库 TF-GAN。自那时起,TF-GAN 便在大量极具影响力的论文和项目中被广泛应用。
  • Machine Learning Zero to Hero (Google I/O'19):机器学习: 从零到一学习 TensorFlow,来自 TensorFlow 团队的 Laurence Moroney 从开发人员的角度,制作一个系列视频,向大家介绍机器学习到底是什么。
  • Learn Tensorflow 3:卷积神经网络学习及如何利用 TensorFlow 构建卷积神经网络
  • LaserTagger:LaserTagger是一种文本编辑模型,它预测一系列标记级编辑操作,以将源文本转换为目标文本。
  • TensorFlow Quantum:谷歌最新开源的TensorFlow Quantum,专注于处理量子数据,及构建量子-经典混合模型(hybrid quantum-classical models)。类似于TensorFlow ,TFQ 作为一个开源库,将直接降低量子机器学习的门槛,让我们能够快速构建量子机器学习模型。论文:TensorFlow Quantum:A Software Framework for Quantum Machine Learning
  • TensorFlow 2.0 Complete Course - Python Neural Networks for Beginners:TensorFlow2.0机器学习7小时免费视频课程,专为码农服务。推荐等级::heart::heart::heart::heart:!
  • TensorFlow Certificate:TensorFlow官方开发者认证:考试费100美元,5小时完成5个模型
  • Eat tensorflow2 in 30 days:30天吃掉那只 TensorFlow2.0 ,推荐等级::heart::heart::heart::heart:!
  • Tensorflow Constrained Optimization:TensorFlow 约束优化库,可根据多种不同指标(例如,某些特定群体成员的精度、某些国家/地区居民的真阳率 (True Positive),或者取决于年龄和性别的癌症诊断的召回率)来配置和训练机器学习问题。通过为用户提供最小化和约束指标任意组合的功能,TFCO 可轻松阐述并解决公平性社区尤其是机器学习社区特别关注的诸多问题(例如均衡赔率和预测性平价等)。
  • EfficientNet-lite:EfficientNet-Lite 为边缘设备带来了 EfficientNet 上强大的性能,并且提供五个不同版本,让用户能够根据自己的应用场景灵活地在低延迟与高精度之间选择。
  • TFmatch:基于 TensorFlow 的图像匹配算法库(特征检测+描述)
  • TF-AGENTS:作为一款优秀的强化学习框架 TF-AGENTS 可以让强化学习的工程师和科学家在设计、实现以及测试新的强化学习算法时更加的方便与快捷。同时,由于对代码结构的精心设计,在实际使用它时也有利于提高使用者的产品迭代速度。不仅仅如此,TF-AGENTS 还提供了基础的测试与基准测试部分帮助大家快速上手与构建“第一个强化学习”程序。GitHub:star:1.4k​
  • TensorNetwork:TensorNetwork 是 19 年 6 月发布的一个开源库,用于简化张量网络中的计算。示例代码,GitHub:star:1.3k。相关论文:Khrulkov et al. 的论文:https://arxiv.org/abs/1901.10787。Ma et al. 的:论文https://arxiv.org/abs/1906.09777。Lebedev et al. 的论文:https://arxiv.org/abs/1412.6553。此论文:https://arxiv.org/abs/cond-mat/0406440
  • RLs:Tensorflow2.0实现29种深度强化学习算法大汇总
  • TensorFlow Privacy :TensorFlow Privacy (GitHub) 中推出的一个全新的实验性模块,可用于评估分类模型的隐私属性。GitHub:star:1.3k​
  • TFX:TensorFlow Extended (TFX) 是一个端到端平台,用于部署生产型机器学习流水线
  • TiramisuASR:用TensorFlow实现的语音识别引擎
  • TF Object Detection API:TensorFlow 目标检测 API
  • DeepReg:基于TensorFlow2的深度学习医学图像配准工具包,可处理成对与非成对的图像数据。该工具包实现了主流的监督与弱监督医学图像配准的算法。
  • Tensorflow Coder:谷歌 TensorFlow 开源了一个帮助开发者写 TensorFlow 代码的程序合成工具 TF-Coder。输入示例,即可自动生成代码。推荐等级::heart::heart::heart::heart:!
  • tensorpack:基于TensorFlow的高级API
  • 《Machine Learning Concepts with Python and the Jupyter Notebook Environment》:这本书打破了编程机器学习应用程序的任何障碍,通过使用Jupyter Notebook而不是文本编辑器或常规IDE。您将从学习如何使用Jupyter笔记本来改进使用Python编程的方式开始。在获得一个良好的基础与Python工作在木星的笔记本,你将深入什么是TensorFlow,它如何帮助机器学习爱好者,以及如何解决它提出的挑战。在此过程中,使用Jupyter笔记本创建的示例程序允许您应用本书前面的概念。推荐等级::heart::heart::heart::heart:!
  • TensorFlow2.0-Examples:TensorFlow 2样例代码学习,GitHub:star:1.3k,推荐等级::heart::heart::heart::heart:!
  • Learn2Ai4TensorFlow2:带你学AI·深度学习与TensorFlow2实战开发
  • Hub:兼容TF和PyTorch的数据读取pipeline库

Keras Learning (Keras 学习) 🇰🇷

💨 Back to Top

  • Keras:Keras官方手册,非常详细的官方文档,文档中详细的介绍了从Keras每个知识点的用法,一步步带你从入门到精通。
  • Keras-cn:Keras中文官方手册,该中文官方手册是对对Keras英文官方手册最好的还原,适合所有阶段的Keras学习者阅读。
  • Keras中文文档:另一个非官方的Keras中文文档,笔者花了近两年的时间在维护,文档也一直在更新,包含ConvLSTM2D、SimpleRNNCellKeras、GRUCell等最新的内容,非常用心的一份Keras文档。
  • Keras examples:Keras 官网的一些代码样例
  • Benchmarking Keras and PyTorch Pre-Trained Models:使用PyTorch和Keras对模型复现比较
  • Deep Learning With Keras Notebooks:黄海广博士力荐的Keras github项目,这个github的repository主要是博主在学习Keras的一些记录及练习,满满都是干货,建议大家看一下。
  • Keraschina:磐创AI Keras系列教程总结,从CNN到RNN,以入门、基础为主的讲解,适合小白学习。
  • Waterloo:Waterloo大学关于Keras的课程,该视频在YouTube上有很高的播放率,课程质量非常高
  • CERN:CERN使用Keras进行深度学习系列教程,比较详细、权威的一个Keras系列教程视频。
  • 莫烦Keras:莫烦Keras视频教程,莫烦老师的视频在B站、YouTube上都有很高的播放量,强烈推荐给大家。
  • Sentdex Keras:YouTube上另一个大佬Sentdex的Keras教学视频,还配套有相应的文本教程和笔记。文本教程笔记
  • IMDB LSTM:用LSTM在IMDB影评数据集做文本分类
  • REUTERS MLP:路透社主题分类
  • LSTM Text Generation:LSTM做文本生成
  • FastText IMDB:在IMDB数据集上使用FastText
  • BABI LSTM:基于LSTM的BABI数据集网络
  • Pretrained Word Embeddings:预训练词向量
  • CNN:字符级卷积神经网络做文本分类
  • LSTM Gender Predictor:LSTM预测一个人的性别
  • CNN MNIST:使用CNN进行MNIST
  • Inception V3:Inception V3
  • VGG16:VGG16
  • FractalNet:FractalNet
  • Visual QA:可视问答
  • ResNet 50:ResNet 50
  • NNProject DeepMask:对象分割
  • Image Segmentation Keras:fcn、segnet、u-net等常用的图像分割模型
  • RocAlphaG:这个项目是DeepMind 2016年《自然》杂志的一个学生主导的实施项目,使用了Python+keras实现,代码清晰性更好。
  • BetaGo:项目是使用keras的深度学习Go机器人
  • DeepJazz:使用Keras深度学习驱动的爵士乐生成系统
  • dataset-sts:语义文本相似度数据集集线器
  • NMT-Keras:利用球面进行神经机器翻译
  • Headline Generator:利用循环神经网络独立生成新闻标题的实现
  • Deep Learning With Python:一本很不错的学习 Python的书籍,书本代码是基于 Keras的,GitHub上已获:star:8k+,代码地址。推荐等级::heart::heart::heart:!
  • Keras Ocr:Keras作者François Chollet近期在Twitter上推荐了Github上的一个基于tf.keras的OCR项目Keras-OCR。该项目开箱即用,可直接执行OCR,也提供了端到端训练的流水线。
  • Deep Learning with Keras Notebooks:使用 Keras 进行深度学习的 notebook 中文教程,GitHub:star:1.9k。推荐等级::heart::heart::heart:
  • Keras Tuner:基于 Keras 的模型调参工具,GitHub:star:1.7k
  • keras-io:Keras.io 官网主页的一些 Keras 代码样本示例

PyTorch Learning (PyTorch 学习) 🇵🇹

💨 Back to Top

  • PyTorch 中文文档:PyTorch是使用GPU和CPU优化的深度学习张量库,查看中文文档有助于学习这个火爆的机器学习框架
  • PyTorch Discuss:PyTorch 论坛,关于该框架的大部分问题都可以在上面找到答案,会有热心的开发者答疑解惑!
  • PyTorch 123:PyTorch 是近年来较为火爆的深度学习框架,然而其中文版官方教程久久不来。近日,一款完整的 PyTorch 中文版官方教程出炉,作者来自 pytorchchina.com。教程根据 PyTorch 官方版本目录,完整地还原了所有的内容。包括简单的环境搭建、快速入门相关 API、高级操作、图像处理实战、文本处理实战、GAN 和强化学习等,基本涵盖了目前所有深度学习相关的知识点。推荐等级::heart::heart::heart:!
  • PyTorch Tutorials:PyTorch 官方英文文档
  • PyTorch Tutorial:PyTorch Tutorial for Deep Learning Researchers。GitHub上已收获:star:18k+
  • Awesome Pytorch list:GitHub上一个:star:9k+的项目,收集了GitHub上PyTorch相关内容以及不同的模型实现、帮助文档、教程,使用PyTorch的学习。中文版。推荐等级::heart::heart::heart::heart:!
  • 《Hands-on tour to deep learning with PyTorch》:dataflowr 最近推出的一门五天初步掌握深度学习的实战教程(实战使用 PyTorch 框架),有知识点有实例有代码。GitHub地址
  • Existential Pontification and Generalized Abstract Digressions :万字综述,核心开发者全面解读 PyTorch 内部机制
  • Python Autocomplete:一个利用 PyTorch 写的自动补全代码的小项目
  • TfPyth:一行代码切换TensorFlow与PyTorch,模型训练也能用俩框架
  • PyTorch Hub:PyTorch Hub是一个简易API和工作流程,为复现研究提供了基本构建模块,包含预训练模型库。PyTorch Hub支持Colab,能与论文代码结合网站Papers With Code集成,用于更广泛的研究。GitHub地址
  • Model Zoo:这个平台,由新加坡名为Jing Yu Koh本科生牵头搭建。与上述的几个平台不同,这个平台上提供预训练模型,不仅仅只是完全针对于Pytorch或者TensorFlow,推荐等级::heart::heart:!
  • PyTorchDocs:PyTorch 官方中文教程包含 60 分钟快速入门教程,强化教程,计算机视觉,自然语言处理,生成对抗网络,强化学习。
  • Deep Learning 60min Blitz:入门 PyTorch 深度学习需要多久?PyTorch 的一份官方教程表示:只需要 60 分钟。
  • SpeedTorch:机器学习中,有一个限制速度的环节,那就是从 CPU 到 GPU 之间的张量迁移。很多计算只能在 CPU 上进行,然后迁移到 GPU 进行后续的训练工作,因此迁移中如果速度太慢,则会拖累整个模型的训练效率。近日,有一位开发者开源了针对 PyTorch 的 CPU->GPU 迁移工具,相比原版加速了 110 倍之多。
  • 《动手深度学习》:动手深度学习(Dive into Deep Learning)一书仓库,Github ⭐10k+。面向中文读者、能运行、可讨论。英文版即伯克利“深度学习导论”教材。原书地址课程B站视频官网。推荐等级::heart::heart::heart:!
  • 《动手学深度学习 (PyTorch)》:该项目将《动手学深度学习》(Dive into Deep Learning)原书中的MXNet实现改为PyTorch实现,在线版本。然而,源项目由于写的是 Markdown ,公式和代码显示不太方便阅读。一位中国海洋大学大三学生将上面 PyTorch 版本的《动手深度学习》编译成完整的 PDF 文件。方便大家阅读以及解决 GitHub 上公式显示不全的问题。GitHub 地址 Dive-into-DL-PyTorch.pdf。推荐等级::heart::heart::heart:!
  • 《Deep Learning With Pytorch》:PyTorch 终于发布了该书的免费版本。全书约 500 页,包含 15 个章节,内容详实,图文并茂,涵盖了深度学习和Pytorch库的介绍,预训练网络,张量,学习机制,数据神经网络学习。书里面有详实的代码,是入门学习Pytorch深度学习必备器物,不得不看!该书还有讨论论坛,以及配套代码。推荐等级::heart::heart::heart::heart:!
  • PyTorch: An Imperative Style, High-PerformanceDeep Learning Library:NIPS 2019接收为poster的论文,由PyTorch 开发项目组发表,完整且系统地介绍了 PyTorch 本身。推荐等级::heart::heart::heart:!
  • 高效入门pytorch视频教程:南开大学王老师强烈推荐的《高效入门pytorch视频教程》(33集完整版),推荐等级::heart::heart::heart:!
  • Pytorch Playground:Pytorch中的基本预训练模型和数据集(MNIST、SVHN、CIFAR10、CIFAR100、STL10、AlexNet、VGG16、VGG19、ResNet、Inception、SqueezeNet),GitHub:star:1.9k
  • Pytorch Handbook:pytorch handbook是一本开源的书籍,目标是帮助那些希望和使用PyTorch进行深度学习开发和研究的朋友快速入门,其中包含的Pytorch教程全部通过测试保证可以成功运行。GitHub:star:10.3k。
  • Pytorch Examples:PyTorch 简单项目,GitHub:star:3.4k+。
  • Learn2learn:learn2learn 是一个用于实现元学习的 Pytorch 库,我们只需要加几行高层 API,就能为一般的机器学习流程添加元学习能力。
  • Pytorch Optimizers:PyTorch 实现的优化器大全。推荐等级::heart::heart::heart::heart:!
  • Pytorch Lightning:对于PyTorch开发者来说,Google Colab上的TPU资源不能用,恐怕是最遗憾的事情了。Google的云计算资源眼看着不能用,转TensorFlow又是不可能的。现在福利来了,一个叫做Pytorch Lightning的项目,可以让你几乎不修改代码的情况下用上TPU,同时该项目还具有很多原生PyTorch未实现的功能。Colab演示博客地址。推荐等级::heart::heart::heart::heart:!
  • PolyGames:Polygames是Facebook开源的一个研究框架,通过自我游戏的方式来训练深度学习网络。Polygames基于著名的“零学习”概念,即允许代理无需进行任何预先设定的训练,而是通过与环境交互来掌握环境。
  • PyTorch3D:PyTorch3D是Facebook开源的一个高度模块化和优化的库,具有独特的功能,旨在让使用PyTorch的3D深度学习更容易。PyTorch3D为快速可微的3D数据提供了一组常用的3D操作符和损失函数,以及一个模块化可微绘制API,使研究人员能够立即将这些函数导入当前最先进的深度学习系统。
  • Hiplot:HiPlot是Facebook开源的一个交互式可视化工具,它帮助人工智能研究人员发现高维数据中的相关性和模式,并使用平行图和其他图形方式来表示信息。HiPlot使用一种称为平行图的技术,这是一种可视化和过滤高维数据的方便做法。
  • Efficient-PyTorch:使用PyTorch训练大型数据集的最佳实践
  • Torchprof:用于呈现PyTorch模型细节的库,推荐等级::heart::heart:!
  • Pytorch OpCounter:计算 PyTorch 模型参数量 (MACs / FLOPs) 的库,GitHub:star:1.9k
  • Pytorch Cifar:在CIFAR10 数据集上用PyTorch实现的CV模型,GitHub:star:2.7k​
  • Pytorch Tricks:使用 PyTorch 的过程中总结的一些小trick
  • Pytorch Deep Learning:利用PyTorch进行深度学习教程,GitHub:star:2.2k​
  • PyTorch: An Imperative Style, High-Performance Deep LearningLibrary:NeurIPS 2019接收,PyTorch官方论文首次曝光完整设计思路
  • Transformers Tutorials:PyTorch Transformers 教程
  • MMF:Pytorch多模态框架MMF,MMF随附了最新的视觉和语言预训练模型,大量现成的标准数据集,通用层和模型组件以及训练+推理实用程序。MMF还被多个Facebook产品团队用于多模式理解用例,因为它有助于快速将研究推向生产。GitHub:star:3.6k​
  • Poutyne:类似Keras的PyTorch框架
  • Pytorch2keras:Pytorch to Keras的转换库
  • Benchmarking Keras and PyTorch Pre-Trained Models:使用PyTorch和Keras对模型复现比较
  • Torchkeras:使用类似Keras的方法训练PyTorch模型
  • Eat PyTorch in 20 Days《30天吃掉那只TensorFlow2》的作者发布的又一个学习项目,这次是《20天吃掉那只PyTorch》。推荐等级:❤️❤️❤️❤️!
  • fairscale:Facebook最新开源的一个用于高性能和大规模训练的PyTorch扩展库。
  • MovieNet:基于Pytorch的开源电影分析工具箱
  • Torch-Pruning:Pytorch结构化神经网络修剪工具包
  • Pytorch Geometric TemporalPytorch Geometric (PYG) 作者推出的另一个时序扩展库。
  • A shallow introduction to Deep Learning with PyTorch:EPFL博士Evann Courdier带你1小时学习Pytorch!
  • Computervision Recipes:微软开源的计算机视觉库,基于PyTorch,它囊括了计算机视觉领域的最佳实践、代码示例和丰富文档。GitHub:star:5.2k。推荐等级:❤️❤️❤️❤️!
  • hivemind:一个Pytorch分散式深度学习训练框架,可以在数以千计的计算机上训练一个大规模Transformer。
  • pytorch_block_sparse:PyTorch 快速稀疏矩阵运算库,论文:《Sparse GPU Kernels for Deep Learning》
  • pytorchviz:PyTorch 执行图可视化,GitHub:star:1.5k
  • pytorch-summary:类似 Keras 的 model.summary() 输出模型信息,使用pytorch-summary
  • TorchSnooper:PyTorch代码调试工具
  • Captum:基于PyTorch 的模型可解释工具
  • pytorch-metric-learning:基于PyTorch 的度量学习库
  • nncf:基于PyTorch的模型压缩库
  • Hub:兼容TF和PyTorch的数据读取pipeline库
  • speechbrain:PyTorch语音库,GitHub:star:2.2k​
  • PyTouch:Facebook开源的触觉感知库

English Learning (英语学习) 🗣

💨 Back to Top

Papers & Codes (论文&代码) 🔖

💨 Back to Top

  • Paper Digest: ICML 2020 Highlights:为了帮助社区快速查找会议上的工作,Paper Digest团队处理所有被接受的论文,并为每篇论文生成一个亮点总结(通常是主要主题)。鼓励读者阅读这些机器生成的要点/摘要,以快速获得每篇论文的主要思想,推荐等级::heart::heart::heart::heart:!
  • Paper Digest: ECCV 2020 Highlights:ECCV2020 ,一句话点评论文亮点,涵盖1357篇论文的亮点,有138页pdf之多,这样大大帮助读者锁定想看的论文,推荐等级::heart::heart::heart::heart:!
  • ICML 2020 Accepted papers:ICML 2020 会议文章
  • KDD 2020 Accepted papers:KDD 2020 会议文章

Paper Toolkit (论文工具) 📝

💨 Back to Top

  • Google Scholar:谷歌学术
  • SemanticScholar:如果你还在用 Google Scholar 来检索计算机相关的学术论文,不妨试下这款搜索引擎,相信它能给你带来前所未有的体验。引用斯坦福大学神经生物学家 Andrew Huberman 对此说的一句话:「这将彻底改变整个信息检索引擎的游戏规则」。推荐等级::heart::heart::heart::heart:!
  • DBLP:计算机论文搜索学术库
  • Acronymify:取名网站,只需在上面的框中输入您的单词,然后按search生成可能的缩写词列表。
  • arXiv Vanity:Vanity将来自arXiv的学术论文呈现为响应性网页,这样你就不用眯着眼睛看PDF了
  • arXivDaily:arxivdaily网站, 搜集整理arXiv更新文章,推荐等级::heart::heart::heart::heart:!
  • ArXiv Text Generation Paper Searches:一款能够及时、快速、精准查阅论文的搜索工具。只需点击一下,便可直接查阅论文列表,再也不用担心查找慢或错过新论文。
  • papers-with-video:浏览器插件,arXiv论文一键链接解读视频。推荐等级::heart::heart::heart::heart:!
  • catalyzex浏览器插件,arXiv论文一键链接解读代码。推荐等级::heart::heart::heart::heart:!
  • rebiber:一个用于将将 arXiv 信息转换为正式信息,能够基于 ACL Anthology 和 DBLP 数据库自动解决arXiv 信息不准确的问题。推荐等级::heart::heart::heart::heart:!
  • 易搜搭:专业英文论文写作助手,只需要输入你想表达的中文句子,该网站会检索各种论文找出相似英文表达,使你的英文论文写作不再生硬,推荐等级::heart::heart::heart::heart:!
  • Academic Phrasebank:对于写作新手来说的神器网站,按不同条目分类罗列了各种英语表达。推荐等级::heart::heart::heart::heart:!
  • Comparxiv:用一行代码比较 arXiv 预印版本论文之间的差异
  • Conference List:计算机各领域会议的时间表
  • AI Conference Deadlines :查看各个AI顶会的 Deadline
  • Conference Acceptanc Rate:查看各个AI顶会论文的接受率,GitHub:star:1.2k​
  • Latex 代码转换器 - Mathpix:如果你经常用 latex 编写文档,那你一定得安装下 Mathpix。这款工具能将带数学公式的截图一键转成 latex 代码,帮你省下很多时间,堪称神器!(可惜现在收费了)
  • Image2LaTeX:这一工具的名称是「Image2LaTeX」。顾名思义,这是利用 OCR 技术从图像中提取文字,并转换为 LaTex 代码的工具。无论是 OCR 还是自动转码,速度都是非常快的,准确性也很高。重点是,一个月可以免费使用1000次!(Mathpix 一个月只能免费使用50次)
  • handcalcs:1行代码搞定Latex公式编写,这个4.6M的Python小插件,堪称论文必备神器。推荐等级::heart::heart::heart::heart:!
  • latexify_py:从Python函数中生成latex公式,GitHub:star:1.2k​
  • Grammarly:Grammarly 是一款非常强大的语法改错软件,帮助润色英文表达。
  • Ginger:Ginger 号称是世界上最好用的英文写作润色工具,除了提供单词拼写、语法检查功能外,还提供句子改写、翻译、词典和朗读功能。
  • 1Checker:1Checker 是一款中文本土用于进行英语文本的纠错(包括拼写、语法、样式和句子不完整)和润色的软件,界面是中文的,简单易懂,操作方便。
  • 谷歌学术镜像:一个谷歌学术的镜像网站,如果上不了谷歌学术的话可以用它作为替代
  • Mathtex Tutorial:LaTex 数学公式在线转换,包括一些常用数学公式教程
  • Tablesgenerator:LaTex 表格在线生成器
  • Codecogs:在线Latex公式编辑器
  • AOE TIME:“地球上的任何地方”(AoE)是一个日历名称,表示当日期在地球上的任何地方经过时,一段时间就结束了。许多会议(期刊)截稿时间都采用AOE时间
  • PDFresizer:PDF剪裁工具,当你的图片出现白边的时候可以使用这个工具进行剪裁
  • Arxiv国内镜像:Arxiv国内镜像。如 https://arxiv.org/pdf/1512.03385.pdf 下载很慢,换成 http://xxx.itp.ac.cn/pdf/1512.03385.pdf, 即可体验光速下载,注意 https 要换成 http。
  • Semantic Scholar:查论文神器
  • Overleaf:在线Latex编辑器,可以多人协作,堪称写论文利器
  • Mendeley:论文管理工具,全平台,还有网页版,很方便,高度安利
  • Sci-Hub:对于科研民工们,肯定很多人接触过sci-hub这个网站,一个很神奇的免费下载文献的网站。
  • SwiftLaTeX:一个名为 SwiftLaTeX 的可视化编辑器。该项目最大的亮点在于:你编写的 LaTeX 代码能够立刻展示实际的效果,所见即所得。这个编辑器还是基于浏览器的,还支持云文件存储。在线体验版本
  • Face Detection:人脸识别方面的相关论文合集。
  • Awesome Papers:机器学习,深度学习,自然语言处理,计算机视觉方面的顶级期刊会议论文集
  • Tableconvert:在线表格转换工具,实现将 EXCEL, CSV, URL, HTML, JSON, MARKDOWN 格式的文件转换为 Markdown, CSV/TSV, JSON, XML, YAML, SQL, HTML 表格,LaTex 表格, Plain Text 表格等格式。
  • AsciiMath:在浏览器中编辑你想要的数学公式,支持在浏览器中直接编辑和前端代码中实现。
  • Linggle:Linggle,英语写作学习搜索引擎,可以帮我们解决一切语言搭配的问题,是我们英文写作的得力助手。
  • Netspeak:帮助你搜索你还不知道的单词,论文写作好帮手之一。
  • Microsoft Aim Writing:亚洲研究院研发升级了以前的作文打分功能,命名为“微软爱写作”(Microsoft Aim Writing)。从小学到到雅思托福的作文都可以改。
  • 《论文是怎样炼成的》:来自厦门大学林子雨博士的报告《论文是怎样炼成的》,共125页ppt,虽然快有十年之久,但里面干货经典,部分集成周志华老师的PPT 《如何做研究,如何写论文》,至今仍有重大价值。
  • 《Strategies for writing a research paper》:《科研论文撰写策略》
  • 《How we write rebuttals》:怎么写 Rebuttal 才能让评审和领域主席心服口服?推荐等级::heart::heart::heart::heart:!
  • 《Writing Tips for PhD Theses》:博士论文写作技巧
  • 《如何撰写毕业论文》:一篇来自中国科学院自动化研究所模式识别国家重点实验室宗成庆老师的报告《如何撰写毕业论文》,27页ppt,讲述了毕业论文要注意的各种要点,非常值得我们学习,帮助大家写出更好的论文。宗成庆老师个人主页:http://www.nlpr.ia.ac.cn/cip/english/zong.htm
  • How to write a good review?:如何写好一篇论文?CVPR2020的Workshop的举办了“How to write a good review?”,重点讲解。MIT计算机大牛Bill Freeman教授关于国际会议如何组织、筛选paper以及写好一篇顶级会议论文的PPT。文中还列举了关于论文写作的若干实用资源。Freeman教授表示一篇高质量论文是要经过多次修改才能写成的,重点在于开始。
  • ACM Digital Library:ACM 数字图书馆,ACM(美国计算机协会)作为全球最大的计算机相关学会,每年都会出版大量计算机科学的专门期刊、举办国际顶会。
  • ThuThesis:清华大学的毕业论文模板,它包含了完整的 LaTeX 文件,下载下来并修改内容后,一键就能生成标准的 PDF。该学位论文 LaTeX 模板,包括本科综合论文训练、硕士论文、博士论文以及博士后出站报告。GitHub:star:2.2k,推荐等级::heart::heart::heart::heart:!
  • ThesisUESTC:此项目提供用于排版电子科技大学毕业论文的LaTeX模板类,旨在帮助电子科技大学的毕业生高效地完成毕业论文的写作。模板提供各种方便的命令,自动化地排版论文的各个部分,使毕业论文轻易地满足学校的格式要求。为了支持更好的字体效果,模板基于XeLaTeX编写,并且放弃对CTeX的依赖,使模板更加稳定。
  • Machine Learning for Big Code and Naturalness:机器学习论文集代码列表大全
  • DeepL:最近超火的英文翻译软件——DeepL,简直吊打某度、某道、某歌,可能是这个世界上最好的翻译软件了。
  • Quillbot:QuillBot Article Rewriter 文章改写工具,经过重新措辞使句子比原始文本短,并且能够在没有引入任何语法错误的情况下保留文本的含义。
  • REF-N-WRITE:REF-N-WRITE提供适合于正在处理的文本的学术短语模板列表。这些短语模板是从高质量的科学期刊论文中提取的。该工具提供了许多写作思路,用户可以用来修改措辞并将文本修改为学术上可接受的格式。
  • Paraphrasing Tool:Paraphrasing-tool是一种在线重述工具,允许用户重新编写文字和修改文章。Paraphrasing-tool的句子输出如上所示。该工具在动词和名词短语的改写方面做得很好,没有任何语法错误。不过某些技术性词语往往被不太常见的词语取代。
  • CopyTranslator:一款开源工具:CopyTranslator。这款工具的最大亮点,就是方便易用,你只需将文本复制到剪贴板,即可快速查看翻译结果,享受所见即所得的快感。工具作者是来自国内的开发者 Elliott Zheng,一开始鼓捣这个工具,主要是为了解决外文 PDF 在网页翻译时,会导致的多余换行和乱码问题。GitHub:star:7.9k​

Competition (比赛项目) 🏇

💨 Back to Top

  • CodeChef:在这里你可以解决实际问题、参加不同的比赛,这些比赛每月都会进行
  • Peking University JudgeOnline for ACIP/ICPC:这里包含了不同比赛中涉及到的不同的问题。你可以实时的解决问题并且查看结果,你的答案也会被验证是否正确
  • OCR-IdentificationIDElement:2019CCF-BDCI大赛 最佳创新探索奖获得者 基于OCR身份证要素提取赛题冠军 天晨破晓团队 赛题源码
  • Google Code Jam:Google 大赛上已经解决的算法问题。在这里你可以自己试一试
  • 如何赢取数据科学竞赛:跟顶级Kagglers学习:如何赢取数据科学竞赛:跟顶级Kagglers学习
  • 数据竞赛Top解决方案开源整理:涵盖大量数据竞赛的解题方案代码,适合作为学习机器学习的实践代码参考
  • ICME2019 Bytedance Grand Challenge:抖音短视频推荐大赛小规模赛道Top8模型代码
  • Data-Science-Competitions:一份kaggle竞赛的解决方案,集锦,汇集了多项回归、分类、时序分析、推荐系统、信号处理、语义分割等任务。
  • CDCS:CDCS 中国数据竞赛优胜解集锦,GitHub:star:1.6k
  • AutoDL:NeurIPS-AutoDL 总决赛冠军解决方案,开源代码基于 Full-AutoML 系统自动设计出的共性解并加以改造
  • kaggle-CrowdFlower:Kaggle 搜索结果相关性比赛第一名解决方案
  • KDD_CUP_2020_Debiasing_Rush:Rush团队在KDD CUP 2020的Debiasing赛道中的解决方案,此次比赛是典型的序列推荐场景中的纠偏问题,即:debiasing of next-item-prediction。模型构建的过程中要重点考虑行为序列和蕴含在序列中的时间信息,位置信息和长短期偏好等。
  • Tencent2020_Rank1st:2020腾讯广告算法大赛冠军队伍开源方案

Download (下载) 📥

💨 Back to Top

  • DownGit:Git文件下载工具,只需输入连接即可下载GitHub上的文件
  • GitHub 文件加速:GitHub 文件下载加速
  • GitHub 代下载服务:GitHub 代下载服务
  • 视频鱼:一个输入视频网址即可下载视频的网站
  • Library Genesis:一个电子书网站,可以免费下载外文电子书。
  • IPTV:PTV(Internet Protocol Television)即网络协议电视,可通过宽带网络向订阅者推送数字电视节目。直白点说,就是一种可以让你在电脑上看电视的技术。有好心人在 GitHub 上开放了自己汇总整理的,在全球范围内高达 8000+ 的公共的 IPTV 直播源,领域覆盖历史、教育、商业、电影、音乐...基本上你想看啥类型的电视节目都能在上面找到,目前该项目在 GitHub ⭐ 10k+。
  • Motrix:Motrix 号称是一款全能的下载工具,支持 HTTP、FTP、BT、磁力链、百度网盘等资源。除了功能强大,它还是是全平台支持!也就是说不管你是 Windows、macOS 还是 Linux,统统支持!!!目前GitHub获:star:17.2k。
  • Firefox Send:除了开发最广为人知的 FireFox 火狐浏览器以外,Mozilla 也会做一些开源项目,比如 FireFox Send 这个一次性文件传输共享服务。浏览器是 FireFox Send 发挥作用的主战场,虽然是火狐出品,但它支持了 Chrome、Edge、Safari 等几乎所有的主流浏览器如 ,并不局限于 Firefox 自身。另外,FireFox Send 在 iOS、Android 等移动平台上也能直接访问网页使用,支持 PWA,这种基于浏览器的特性使得使用体验几乎没有割裂感。
  • Send Anywhere:对于一款文件分享服务而言,支持的平台非常重要,因为会直接影响到使用者是否受自己的设备限制。正如它的名字一样,Send Anywhere 在平台支持上十分给力,覆盖面非常广。
  • Filemail:Filemail 是一款协助使用者传输大型文件的网络服务,Filemail 官网给自己的这款服务的描述是「the best way to securely send large files」。
  • WeTransfer:WeTransfer 是一个简单、免费的文件共享网站,一次可以发送多达 2GB 的数据,并且一次共享的文件数量也没有限制。使用 WeTransfer 无需注册或者登陆任何账户,只需输入收件人的电子邮件地址(最多可同时分发给三位)、你的电子邮件地址,即可快速分享。
  • 奶牛快传:奶牛快传创建于2016年,是一款专注于即用即走的在线大文件传输服务,也是目前本土化做的最好的,无论是界面还是操作上都十分地通俗易懂。在上传速度方面,据奶牛快传称,无论是上传还是下载,都没有速度限制,完全依托于用户本地网络的带宽。
  • BaiduPCS-Go:百度网盘客户端 - Go语言编写,支持Windows、Mac、Linux、Android、iOS五大系统,可在命令行操作百度云。GitHub:star:23.9k​
  • Baidupcs-web:基于BaiduPCS-Go, 可以让你高效的使用百度云,GitHub:star:6.4k
  • magnetW:磁力链接聚合搜索,支持在 Windows 与 macOS 上运行,可以用来寻找电影资源。GitHub:star:8.4k

Software/Application (软件/应用) 🌈

💨 Back to Top

  • MSDN:十分齐全、靠谱的Windows系统、软件资源下载网站
  • N软网:提供互联网前沿资讯及软件下载
  • OmegaXYZ:既有各种高级语言的教程,也有机器学习的教程,以及各种算法实现,还有提供一些软件资源下载。GitHub上还有许多关于Python的学习项目
  • Alternativeto:有时候会为了找一个软件而头疼不已,这里找那里问,就是为了找一个类似的软件来替代,好不容易找到了,还可能不支持手头上的平台。如果是这样,那么该网站就是一个很好的选择。这个网站支持按照平台来搜索,Windows, Mac, Linux 和Web 等平台都可以。在搜索框中键入软件名字然后按下Enter键. 页面加载后,第一眼就可以看到你搜索的软件,往下一拉,就可以看到一大堆的类似软件,可以通过软件授权类型或系统平台来缩小搜索范围。
  • Filehippo:有着多国的语言切换,国际类软件网站。最优软件的最新版都在这了。
  • Download.cnet:免费软件下载大全网站
  • Sourceforge:完整的开源和商业软件平台
  • Techsupportalert:一个评论和评价最好的免费软件的社区站点
  • Portableapps:软件下载网站
  • Awesome Windows:GitHub上:star:9k+的项目,收列了Windows上优质&精选的最佳应用程序及工具
  • Awesome Macos:GitHub上:star:9k+的项目,为macOS整理了一份很棒的应用程序、软件、工具和亮点的列表
  • Dism++:Dism++ 是一款 Windows 系统管理优化工具,它解决了我们安装、维护系统的一大痛点问题——自定义设置和优化。相当于一个 “一站式” 管理优化工具集。
  • HackMD:為工程師文件而生的協作平台,HackMD 主打即時文件協作(real-time collaboration)
  • Google Drive:谷歌云盘,随时随地使用所有文件
  • Notion:付费过印象笔记,用过其他一些笔记软件,应该说没有一个满意的,直到最近发现了这个,notion,你值得拥有,已经付费使用了,喜欢这种 All in one 的理念,而且排版和功能性都一级棒
  • Microsoft To-Do:微软打造的PC版 TODO 工具
  • Marmoset:Marmoset 是一款 Chrome 应用程序,可以让你以透视的方式截取你的代码截图。
  • Halo: 一个优秀的开源博客发布应用,无论你是想搭建个人博客还是单纯学习,这套开源项目都值的你去细细评味。GitHub:star:13.7k,推荐等级::heart::heart:!
  • PowerToys:Microsoft PowerToys是微软官方工具集,它包含了很多实用的系统功能增强小软件,如 TweakUI、虚拟桌面工具等等,为高级用户调整和简化他们的Windows体验以提高生产力。GitHub:star:17.7k
  • ChromeAppHeroes:这个项目中总结的”Chrome 插件英雄榜” 详细地为大家整理、介绍了一些实用性的插件。Github:star:10k+。
  • 谷歌插件网:因为一些众所周知的原因,谷歌浏览器上面很多实用的插件都用不了,但是有了这个网站之后,无需科学上网也可以下载chrome浏览器插件。
  • Google Colab:Google Colab是帮你快速了解Python代码的利器,你可以直接在上面运行一些好玩好用的Jupyter Notebook项目。对于初学机器学习的人,即使你没有很好的硬件,也可以利用谷歌的免费资源来跑程序。同时上面还有很多GitHub相关技术教程汇总。推荐等级::heart::heart:!
  • Awesome Google Colab:GitHub上的一个新项目,Colab资源汇总。作者还自己建了非官方的colab网站,收集了大量学习资源。同时上面还有很多GitHub相关技术教程汇总。推荐等级::heart::heart::heart:!
  • Xg2xg:前 Google 工程师出品,最佳开发工具大全,这份清单中列出的开源软件,不仅解决了硅谷大厂前员工的难处,也能为其他所有码农解除困惑。在这套大全的指导下,任何一个工程师,都能获得类似在谷歌内部写代码的体验。目前Github上获:star:7k+。推荐等级::heart::heart::heart:!
  • 合集网:一个名叫合集网的资源网站,上面不仅有软件、应用的合集,还有很多在线资源。
  • 创造者日报:创造者日报的产品分类非常细致,有好几十种。基本上涵盖了互联网、科技类的方方面面。网站应用、效率、Chrome、视频、游戏、导航网站、阅读等等。推荐等级::heart::heart::heart:!
  • 新趣集:在这个网站上,每天都会更新一些上传者发现的各种互联网产品,比如游戏、网站、开发者工具、各类软件等等。推荐等级::heart::heart::heart:!

Jobs & Interview (工作面试) 💼

💨 Back to Top

  • Interview Internal Reference:2019年最新总结,阿里、腾讯、百度、美团、今日头条等国内互联网大厂的面试题,还配备有答案和出题人分析等信息。这个项目或许对大家找工作面试有所帮助,推荐等级::heart::heart::heart:!
  • coder2gwy:程序员考公指南,3个来自同一家大厂的程序员组团在职备考一年,上岸成功率100%。为想进体制内的程序员写了这份考公务员/事业编制/教师的指南。GitHub:star:10.3k​
  • Python Interview Question:GitHub上一个:star:3k左右的中文项目,介绍了各种Python相关面试题,可以作为一个Python学习教程
  • Interview Code Practice Python:GitHub上的一个项目,用 Python 实现的各类面试题
  • Algorithm Interview Notes Chinese:2018/2019/校招/春招/秋招/算法/机器学习(Machine Learning)/深度学习(Deep Learning)/自然语言处理(NLP)/C/C++/Python/面试笔记 ,GitHub 上 ⭐24k
  • Coding Interview University:GitHub:star:100k的项目,原名「Google 面试大学」。这份指南里面包含 Google 相关的介绍视频、面试过程、教学资源,同时也有数据结构、算法、密码学等计算机专业的知识讲解。中文版指南链接,推荐等级::heart::heart::heart:!
  • CS-Notes:GitHub上:star:70k,Tech Interview Guide 技术面试必备基础知识、Leetcode 题解、Java、C++、Python、后端面试、操作系统、计算机网络、系统设计。在线阅读链接
  • Tips for interviewing at Google:谷歌大脑高级软件工程研究员、强化学习框架「多巴胺」(Dopamine)作者 Pablo Samuel Castro 分享了他拿到谷歌 offer 的经验。这份「谷歌面经」不仅适用于谷歌的软件工程师职位,对申请其他公司的软件工程师及其他职位(如研究科学家)也有帮助。
  • Hacking a Google Interview:谷歌面试编程题及解题技巧(MIT版),重点介绍科技公司在面试时经常出现的计算机科学问题,其中包括时间复杂度、哈希表、二进制树搜索,以及 MIT「算法设计与分析」(MIT 6.046)课程中会出现的内容。但是,大部分时间都会专注于你不会在课堂上学到的内容,例如刁钻的按位逻辑和解决问题的技巧。
  • A-to-Z-Resources-for-Students:GitHub:star:7k,一位国外小哥整理的一份超级全面的计算机学习资源,主要面向人群是学生,但其实上面的内容也可以适用于普通程序员,推荐等级::heart::heart:!
  • Awesome-algorithm-interview:算法工程师(人工智能cv方向)面试问题及相关资料的网站收集
  • Awesome Interview Questions:这个精选的面试题库不仅全,而且对提交的面试题会进行审核,并且会不定期对链接进行审核,提剔除失效链接,GitHub:star:30k+。推荐等级::heart::heart::heart:!
  • Interactive Coding Challenges:20个交互式Python编码面试挑战(算法和数据结构),GitHub:star:19k+。推荐等级::heart::heart::heart:!
  • Coding Interviews:《剑指Offer》题目汇总&常考题总结(Python实现)
  • JavaGuide:【Java学习+面试指南】 一份涵盖大部分Java程序员所需要掌握的核心知识。GitHub:star:74.9k,推荐等级::heart::heart::heart:!
  • JavaGuide-Interview:JavaGuide面试突击版
  • 50+ Data Structure and Algorithms Interview Questions for Programmers:Java语言算法和编程面试题精选TOP50,附解决方案。
  • 955.WLB:与 996.ICU 相呼应,955 公司白名单。旨在让更多的人逃离 996,加入 955 的行列。GitHub 获:star:20k。
  • SoftwareArchitect:高级架构师 Justin Miller 在 GitHub 上创建项目,介绍自己关于「如何成为更好的软件架构师」的想法。该项目发布一天即获得 1.4k ⭐,现在已有 ⭐3.8k。
  • DLInterview:上海科技大学 AI 实验室开源的一份深度学习面试题集锦,它从数学基础、经典机器学习算法、深度学习算法以及编程语言等方面提供了众多面试题。此外,这一个项目是作者在准备 2018 年春招实习过程中的总结,内容以计算机书籍的学习笔记为主,在整理重点知识的同时会尽量保证知识的系统性。
  • Resume:利用 GitHub 上的信息生成简历的工具。GitHub:star:43.5k。
  • ResumeSample:程序员简历模板系列。包括PHP程序员简历模板、iOS程序员简历模板、Android程序员简历模板、Web前端程序员简历模板、Java程序员简历模板、C/C++程序员简历模板、NodeJS程序员简历模板、架构师简历模板以及通用程序员简历模板。GitHub:star:20.8k。
  • How to Make More money:程序员如何优雅的挣零花钱,GitHub:star:9.3k
  • Coding:国内接项目外包平台,国内首个一站式云端软件服务平台,你可以简单把 Coding 理解为中国版 GitHub,Coding 旗下的一款产品:码市,就是 Coding 的创始人牵头搞起来的,专注于做互联网软件外包服务平台。目前在该平台上,累积对接外包金额 3 亿多人民币,1 万多个项目,15 万开发者。
  • 开源众包:国内接项目外包平台,「垂直技术社区 10 年沉淀 350 万 + 活跃开发者 海量行为数据智能匹配」,打开其官网,首先引入眼帘的便是这句话。
  • 程序员客栈:国内接项目外包平台,程序员客栈当前累积注册开发者近 40 万,覆盖多个技术领域,各种社会稀缺人才、大厂工程师,都能在上面找到。只要有钱,他们都将为你所用。
  • Upwork:国外接项目外包平台,upwork 前身为 Elance-oDesk,与 freelancer 一样,该平台上也为多种不同行业提供服务,而不仅局限于软件外包。诸如微软、Airbnb 等知名企业,都跟 upwork 有过合作。
  • Freelancer:国外接项目外包平台,目前是全球影响力最大的自由职业与众包平台,公司创办于 2010 年,总部位于澳大利亚悉尼,员工遍布 240+ 个国家,拥有 4000+ 万的雇主与自由职业者。从软件设计、开发、测试到营销、会计、法律服务,你都能在上面找到对应的合作方,其业务覆盖范围不可谓不广
  • Fiverr:国外接项目外包平台,同 freelancer 一样,Fiverr 也创建于 2010 年,不同的是,该公司经营业务较小,主打写作、翻译、图形设计、视频剪辑、软件编程。
  • InternetArchitect:年薪百万互联网架构师课程文档及源码(公开部分),GitHub:star:2.5k​
  • LeetCode:一位Java研发工程师分享了一个名为「LeetCode题目分类与面试问题整理」,这篇笔记的作者叫袁广鑫,毕业于黑龙江大学,面试三十多家互联网公司亲历整理,曾拿到字节、腾讯、滴滴offer,目前在快手担任Java工程师。GitHub:star:2.4k​

Dataset (数据集) 📊

💨 Back to Top

  • Google Dataset Search: 谷歌提供的数据集搜索工具,可以搜到绝大多数的公开数据集
  • Arxiv:arXiv 将 170万篇arXiv论文集成为一个格式机器可读的数据库,并将该数据库托管到了Kaggle上供用户免费使用。数据库包括论文标题、作者、类别、摘要、全文pdf等论文相关信息。推荐等级::heart::heart::heart:!
  • BIFROST:一个数据集搜索工具,里面共有1899个图像数据集,还专门设置分类,比如Humans、Geospatial、Autonomous Cars等。一键搜索,免费获取,直接链接到原始数据库,帮你快速找到合适的数据集。推荐等级::heart::heart::heart:!
  • CodeXGLUE:软亚洲研究院(自然语言计算组)联合 Visual Studio 和必应搜索发布了代码智能领域首个大规模多任务的新基准——CodeXGLUE。该基准可覆盖 code-code、code-text、text-code、text-text 四个类别,包含10个任务及14个数据集,具体有:代码克隆检测、代码缺陷检测、代码完形填空、代码补全、代码纠错、代码翻译、代码检索、代码生成、代码注释生成、代码文档翻译十项任务。其中,有自建数据集,也有在业界已有影响力的数据集。推荐等级::heart::heart::heart:!
  • paperswithcode datasets:Papers with Code 官网发布,Datasets 已经实现了 3044 个机器学习数据集的汇总,并且按照不同的类型进行归类,还具有过滤功能,值得一看。推荐等级::heart::heart::heart::heart:!
  • Open Images V6:Open Images是谷歌在2016年推出的大规模图像数据集,包括大约900万张图片,标注了数千个图像类别。目前是第六版,新增了507444个局部叙事。博客介绍
  • 天池数据集:阿里云天池发布的数据集网站,包含了计算机视觉,自然语言处理,金融,电商,医疗,工业,农业等数据集,非常适合学习和实践
  • Graviti Open Dataset:一个国内(可能)最好的海量CV数据集获取网站。Graviti 收录了 400 多个高质量 CV 类数据集,覆盖2D/3D目标检测、图像分割、图像分类、目标跟踪、OCR、姿态估计、无人驾驶、智慧零售、机器人等多种AI应用领域。
  • Tencent Ml Images:腾讯开源的超大型多标签图像数据集及模型训练代码
  • Machine learning datasets:这个网站上共收集到了100多个业界最大型的数据集。根据任务类别,这些数据集中又分为三大类:计算机视觉(CV)、自然语言处理(NLP)和音频数据集
  • OCTA-500:《中国图象图形学报》编委南京理工大学陈强教授及其团队发布了目前最大的OCTA图像数据集OCTA-500。它包含500只眼睛的OCT和OCTA两种模态的三维数据,六种投影图像,四种文本标签以及两种分割标签,同时基于该数据库他们还提出了一种三维到二维分割的图像投影网络。
  • Networkrepository:第一个具有实时可视化分析功能的交互式数据和网络数据存储库。里面有许多Graph相关的数据集
  • LINQS:提供了一些Graph结构的数据集
  • Network Repository:一个交互式科学网络数据仓库,里面含有大量的图结构数据集
  • Stanford Network Analysis Project:斯坦福开放的图相关数据集。
  • KONECT:一个收集所有类型的大型网络数据集以进行网络科学和相关领域的研究的项目
  • Multi-label Datasets & Code:这个页面提供了基准数据集和代码,可以用来评估多标签分类算法的性能。
  • Google Trends:同样来自于Google,使用此工具,你可以搜索关键字并查看相关数据集的各种信息。你可以选择不同的选项,包括要查看的国家(或全球),将其缩小到各个类别,或将搜索范围限制在所有网站、图片、新闻、购物或 YouTube 上。
  • 微软数据集:在2018年7月,微软与外界研究社区一起,发布了微软研究开发数据。它包含了云服务器中的数据存储库,致力于促进全球研究社区的协作,并在其中提供了一系列用于已发表研究的数据集内容。
  • 中文NLP数据集搜索:一项新的中文 NLP 数据搜索项目,它可能是目前最全的中文 NLP 数据集信息收集项目。该项目收集了一百多条中文 NLP 数据信息,并以搜索的形式展示结果。我们只要键入关键词,或者数据集所属的领域等信息,就能找到对应的数据集。GitHub项目地址。
  • Awesom Public Datasets:本数据集列表中,按主题整理了大量的数据集内容,例如:生物学、经济学、教育等。其中列出的大多数数据集都是免费的,但在使用任何数据集之前,均需检查数据集的许可要求。
  • Amazon数据集:这个数据集中包含了不同领域的数据内容,例如:公共交通、生态资源、卫星图像等。同时提供了搜索功能,以帮助用户找到所需的数据集,还有各种数据集的描述信息以及用例,非常易于使用。数据集存储在Amazon Web Services(AWS)资源中,对于使用AWS构建自己机器学习实验的用户来说,传输速度将非常块。
  • U.S. Census Bureau:你可以从这个数据集中获得与人口、经济和地理相关的信息,也可以按主题或搜索进行浏览。如果你需要统计内容,这会是一个很好用的工具。它们有一些很好的可视化效果,你也可以将其嵌入到内容中。
  • EU Open Data Portal:这是一个既可搜索又可浏览的平台。可用数据包括:地理,金融,统计学,选举结果,法案,有关犯罪、交通、健康、环境和科学研究的信息等。
  • 美国 Data.gov:作为美国政府开放数据的主页,该网站允许访问联邦、州、地方和部落政府提供的各种主题信息。
  • 英国 Data.gov:与美国的 Data.gov 类似,该网站允许访问各种主题的数据。这些数据由中央政府、地方当局和公共机构提供
  • 欧洲政府数据集:欧洲政府数据集
  • 新西兰政府数据集:新西兰政府数据集
  • 印度政府数据集:印度政府数据集
  • 北爱尔兰公共数据集:北爱尔兰公共数据集
  • Health Data:该网站可搜索的主题包括医疗设备、环境卫生、药物滥用、精神健康等等。
  • The World Factbook:该数据集包含 267 个国家和地区的信息,这是一个数据宝库,每周更新一次有关全球的信息。你可以选择要查看的国家,然后点击你喜欢的任何主题(如经济或交通)。该网站是可检索的。它还有一个关于世界领导人和一个关于 CIA Maps 的专栏。
  • Altmetric:Altmetric 有些数据是需要付费的,但它们还提供每年发布的最具热度的前 100 篇文章,这非常有用。
  • Open Corporates:Open Corporates 是全球最大的公司开放数据集,可让你访问超过 1 亿家公司的信息。
  • National Center for Environmental Information:这个数据集涵盖地球物理学、大气和海洋数据。他们目前是世界上最大的气候和天气信息提供商。他们还提供了旧工具的链接,这些工具目前可能在网站上不可使用,但可用于其他地方。
  • Reddit:虽然你需要注册,但它是免费的。你可以搜索数据集并查找提供信息和请求信息的人。总的来说,Reddit 也是一个寻找信息并了解行业趋势的好地方。
  • Kaggle 数据集:Kaggle 目前有将近 16,000 个数据集。你可以找到从运动队球员统计到洛杉矶停车引语任何范畴的数据。
  • NASA 的 Earth Data:NASA 的 Earth Data
  • Pew Internet:如果你需要的是社会学数据,这是一个很好的数据源。你还可以通过浏览找到一些有趣的文章。虽然需要注册才能查看和下载数据集,但它也是免费的。
  • Centers for Disease Control and Prevention:该网站包括各种健康主题,可让你访问大量可浏览和可搜索的数据。甚至可以通过各种与主题相关的网站创建自己过滤的数据集。
  • Bureau of Labor Statistics:你可以在这里找到有关美国劳动力市场活跃度、工作条件和价格变化的数据。
  • Five Thirty Eight:这个网站有关于政治、体育、科学、健康、经济和文化方面的数据。
  • Group Lens:Group Lens 上有几个可用的数据集,这些数据集对特定的项目很有用。一些数据集已有十多年的历史。你可以在这里得到很多关于书籍和电影的信息。
  • BuzzFeed News:这个网站给你提供了来自 Buzzfeed 的数据。如果你想了解 2016 年至 2018 年期间的假新闻,那么这个就是你的最佳选择。
  • find-free-images-online:一个很好的免费图像来源列表。
  • UCI机器学习库:这是网络上最早的数据集来源之一,是寻找各种有趣数据集的第一选择。虽然用户提供的数据集的清洁度不太一样,但绝大多数都是干净的。我们可以从 UCI 机器学习库直接下载数据,无需注册。
  • UCI机器学习数据集:这个数据集来自于加州大学信息与计算机科学学院,其中包含了100多个数据集。根据机器学习问题的类型对数据集进行分类,可找到单变量或多变量时间序列数据集,以及分类、回归或推荐系统的数据集。
  • VisualData:在这里计算机视觉数据集按类别分组,并且支持搜索查询。
  • Quandl:里面有很多经济和金融数据,你可以使用这些数据建立预测经济指标或股价的模型。
  • 世界银行开放数据(World Bank Open Data):涵盖世界各地人口统计、大量经济和发展指标的数据集。
  • 货币基金组织的数据(IMF Data):国际货币基金组织公布关于国际金融、债务率、外汇储备、商品价格和投资的数据。
  • 英国金融时报金融时报市场数据(Financial Times Market Data:):里面有来自世界各地的最新金融市场信息,包括股票价格指数、商品和外汇。
  • 数据美国(Data USA:全面的、可视化的美国公共数据。
  • 食品环境地图集(Food Environment Atlas:当地的食物选择如何影响美国饮食的数据。
  • 学校系统财务状况(School system finances:这里有美国学校系统财务状况的调查。
  • 慢性病数据(Chronic disease data:美国各地慢性病指标的数据。
  • 美国国家教育统计中心 (The US National Center for Education Statistics):来自美国和世界各地的教育机构和教育人口统计数据。
  • 英国数据服务:英国最大的社会、经济和人口数据收集机构。
  • 美国经济协会(AEA):这里你可以找到美国宏观经济的相关数据。
  • Labelme:数据集中包含大量有标注的图像数据。
  • ImageNet:是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像URL被ImageNet手动注释。根据 WordNet 层次结构来组织,其中层次结构的每个节点都由成百上千个图像来描述。
  • LSUN:场景理解与许多辅助任务(房间布局估计,显着性预测等)
  • MS COCO:通用图像的理解和文字描述。
  • COIL 100:在 360 度旋转中以各个角度成像的 100 个不同的物体。
  • 视觉基因组:非常详细的视觉知识库,配以大量带有文字描述的图像。
  • 谷歌的Open Images:知识共享”(Creative Commons)下的900万个图像网址集合,已标注超过6,000个类别的标签。
  • Labelled Faces in the Wild:13,000个人脸标记图像,用于开发涉及面部识别的应用程序。
  • Stanford Dogs Dataset:包含20580张图片和120个不同的狗品种类别。
  • 室内场景识别(Indoor Scene Recognition):这是一个非常细化的数据集,由于大多数在“户外”场景中表现良好的场景识别模型在室内表现不佳,因而这个数据集非常有用。内有 67 个室内类别,共 15,620 张图像。
  • 多域情感分析数据集(Multidomain sentiment analysis dataset):一个比较有历史的数据集,里面还有一些来自亚马逊的产品评论。
  • IMDB:影评,也是比较有历史的二元情绪分类数据集、数据规模相对较小,里面有 25,000 条电影评论。
  • 斯坦福情感树银行(Stanford Sentiment Treebank):带有情感注释的标准情绪数据集。
  • Sentiment140:一个流行的数据集,它使用16万条推文,并把表情等等符号剔除了。
  • Twitter 美国航空公司情绪数据集 (Twitter US Airline Sentiment):自 2015 年 2 月以来美国航空公司的 Twitter 数据,分类为正面、负面和中性推文。
  • 安然数据集:里面有安然集团高级管理层的电子邮件数据。
  • 亚马逊评论:里面有3500万条来自亚马逊的评论,时间长度为18年。数据包括产品和用户信息、评级等。
  • Google Books Ngram:来自Google书籍的词汇集合。
  • 博客语料库:从blogger.com收集的681,288篇博客文章。每个博客至少包含200个常用的英语单词。
  • 维基百科链接数据(Wikipedia Links data):维基百科全文。该数据集包含来自400多万篇文章,近19亿字。你可以对字、短语或段落本身的一部分进行搜索。
  • Gutenberg电子图书列表:Project Gutenberg的附加注释的电子书列表。
  • 加拿大议会的文本块(Hansards text chunks of Canadian Parliament):来自第36届加拿大议会记录的130万对文本。
  • 危险边缘 (Jeopardy):来自问答游戏节目《危险边缘》(Jeopardy) 的超过 20 万个问题的存档。
  • 英文SMS垃圾邮件收集(SMS Spam Collection in English):包含5,574条英文垃圾邮件的数据集。
  • Yelp评论(Yelp Reviews):Yelp发布的一个开放数据集,包含超过500万次评论。
  • UCI的垃圾邮件库(UCI’s Spambase):一个大型垃圾邮件数据集,用于垃圾邮件过滤。
  • Berkeley DeepDrive BDD100k:这是目前最大的自动驾驶 数据集。里面有超过 1,100 多个小时驾驶体验的视频,包含10 万个在一天中不同时段以及在不同天气条件下的数据。
  • 百度 Apolloscapes:大型数据集,定义了26种不同的语义项,如汽车,自行车,行人,建筑物,路灯等。
  • Comma.ai:超过7个小时的高速公路驾驶视频。里面的数据包括汽车的速度、加速度、转向角和GPS坐标。
  • 城市景观数据集:记录50个不同城市的城市街道场景的大型数据集。
  • CSSAD数据集:包含自动车辆的感知和导航等数据,但着重于发达国家的道路。
  • 麻省理工学院AGE实验室(MIT AGE Lab:):在AgeLab收集的1,000多小时多传感器驾驶数据集的样本。
  • LISA:智能和安全汽车实验室,加州大学圣地亚哥分校数据集:该数据集包括交通标志,车辆检测,交通信号灯和轨迹模式。
  • 博世小型交通灯数据集(Bosch Small Traffic Light Dataset):用于深入学习的小交通灯数据集。
  • Lara交通灯识别(LaRa Traffic Light Recognition):巴黎交通灯的数据集。
  • WPI 数据集:交通灯、行人和车道检测的数据集。
  • The Best Public Datasets for Machine Learning and Data Science:上述的大部分资料都来自于该网址,经过数小时的网络搜集,作者为高质量和多样化的机器学习数据集创建了一个伟大的备忘单。
  • 开源数据集(机器之心整理):skymind.ai 发布的一份非常全面的开源数据集。内容包括生物识别、自然图像以及深度学习图像等数据集,经机器之心整理。
  • Awesome-Cybersecurity-Datasets:网络安全数据集列表大全。
  • MIcrosoft News Dataset (MIND) :微软发布的大规模新闻推荐数据集MIND

Coding Toolkit (代码工具) 💻

💨 Back to Top

  • Code Reviewer:

    • Review Assistant:Review Assistant 是 Visual Studio 的一个扩展。它支持 Visual Studio 2019、2017、2015、2013、2012 和 2010。Review Assistant 可以帮助创建审查请求并能在不离开 IDE 的情况下对请求做出响应。它支持 TFS、Subversion、Git、Mercurial 以及 Perforce。Review Assistant 将“代码审查板(Code Review Board)”窗口添加到 IDE 中。该窗口可用于管理用户所有可用的审查。
    • Reshift:Reshift 是一个基于 SaaS(Software-as-a-Service,软件即服务)的软件平台,它可以帮助软件开发团队在部署代码到生产环境之前,更快地识别出代码中更多的漏洞。可以减少发现和修复漏洞的成本和时间,可以识别数据泄露的潜在风险,并能帮助软件公司达到合规性和法规要求。
    • Gerrit:这是一个开源的轻量级工具,它是基于“Git 版本控制系统”来进行构建的。在所有用户都是受信提交者的项目环境中,该工具非常有用,因为该工具允许用户检查项目中所做的总体变更。
    • Codestriker:Codestriker 是一个开源的在线源码审查 Web 应用程序。此代码审查工具可以帮助我们在数据库中记录问题、注释和决策。它也可以用于代码检查(Code Inspections)。
    • Phabricator:Phabricator 是一个开源的源码扫描程序。它还包括了基于 Web 的轻量级代码审查、规划、测试、bug 发现等功能。
    • Crucible:Crucible 是一个基于 Web 的代码质量工具。开发人员利用它来进行代码审查、bug 及缺陷发现、变更讨论和知识共享。该工具可以帮助他们捕获主要缺陷并改进他们的代码架构。
    • Review Board:Review Board 是一个安全的代码审查工具。它可用于开源项目和公司的代码审查和文档审查。
    • Barkeep:Barkeep 是一个友好的代码审查系统工具。它提供了一种最简单的方法来审查代码。它允许我们查看任何 Git 库的提交、查看差异点并编写注释。
    • Reviewable:Reviewable 是一个轻量级的、功能强大的代码分析工具,它使代码审查更快、更全面。它通过用户界面清理、bug 发现以及语法高亮显示来帮助我们提高代码质量。
    • Peer Review Plugin:Peer Review Plugin 消除了耗时的代码审查会议的需求,因为它使我们可以在基于 Web 的用户友好的环境中审查代码。
    • Codacy:Codacy 工具通过静态代码分析自动识别问题。在每个拉取(pull)和提交(commit)请求中,它能快速地告诉用户有关安全性问题、代码重复和代码复杂度的信息。
    • CodeFactor.io:使用 Code Factor 工具,我们可以了解整个项目的代码质量、最近提交的内容以及问题最多的文件。我们可以针对每次提交(commit)和拉取(pull)的请求进行跟踪及问题修复。
    • Helix swarm:Helix swarm 是一个代码审查工具,它可以安排审查、共享内容并查看代码审查变更。它支持持续集成部署。它可以帮助我们监控进度、自动化设计过程并提高项目的发布质量。
    • Rhodecode:Rhodecode 是一个开源的、安全的企业级源码管理工具。该工具可作为 Git、Subversion 和 Mercurial 的集成工具。
    • Veracode :Veracode 是一个代码审查和静态分析工具。它是基于 SaaS 模型构建的。此工具允许我们从安全性的角度分析代码。该工具使用二进制代码 / 字节码,并能保证 100% 的测试覆盖率。
    • JArchitect:JArchitect 是一款易于使用的代码审查工具,可用于分析 Java 代码。每次审查后,它都会发送一份项目开发相关的报告。该工具还可以帮助我们提高代码的可维护性。
    • SonarQube:SonarQube是市场上最受欢迎的代码质量和安全性分析工具。它在开源社区的支持下,目前可以分析和产生对超过25种编程语言的输出,这比市场上大多数工具都要高。它具有免费的社区版本和其他付费版本。
    • Kritika:Kritika.io是一款出色的在线代码分析工具,可直接为你分析公共和私有存储库。
    • DeepScan:DeepScan擅长扫描Javascript代码存储库。它能够处理几乎所有javascript框架的动态代码质量检查。
    • Klocwork:Klocwork可以对几乎任何大小的项目执行静态代码分析。使用Klocwork的主要好处是它可以轻松地与Visual Studio Code IDE,Eclipse,IntelliJ等集成。这使开发人员更容易使用Klocwork。此外,它也可以集成到CI/CD管道中,以确保交付前的代码质量。它支持C,C#,C ++和Java。
    • CodeSonar:CodeSonar是一种统计代码分析工具,可以从计算角度分析代码。它能够从你的代码中开发模型,分析它们的潜在执行威胁,例如锁死,内存溢出,空指针,数据泄漏以及可能难以捕获的许多此类程序错误。
    • Bandit:Bandit是一个Python安全漏洞扫描工具,可扫描python软件包中的安全漏洞。它是数据科学家和AI专家中流行的工具,用于构建符合组织标准的代码。Bandit可用于命令行界面。
    • Fortify:Micro Focus的Fortify专注于扫描代码库中的安全漏洞。它着眼于已知的安全漏洞以及可能存在问题的任何恶意软件或损坏文件的存在。
    • Codecov:Codecov是用于管理代码库以及使用单个实用程序进行构建的综合工具。它分析推送的代码,执行所需的检查,并在需要时自动合并它们。
  • Lepton:一个很好用的开源代码片段管理软件,基于GitHub Gist。GitHub:star:6.8k,推荐等级::heart::heart:!

  • Codeimg.io:Codeimg.io 是一个仍在测试中的创建代码图像的工具,目前发布了创建代码图像所需的基本功能:按照常用社交平台 Facebook、Twitter、Instagram 及自定义创建项目、支持 JPG、PNG 和 SVG 项目格式、调整字体大小、保存用户定义的设置等。

  • Carbon:Carbon 是由 Dawn Labs 创建开发的一个代码转图像的开源项目,目前在 GitHub 上拥有 ⭐200k+。

  • Glorious Demo:Glorious Demo 是一个开源的 JavaScript 库,它提供了一个简单的 API 来为你的代码示例创建动画。目前在 GitHub 拥有:star:3k。GitHub

  • CodeZen:CodeZen 是一个非常简约的代码转图像工具,就像操作文本编辑器一样简单,能快速将你的源代码导出为具有语法风格的图像。

  • StarHistory:查看某个项目的 star 的增长趋势,Github:star:1.6k

  • Pure Bash Bible:这是一位澳大利亚的工程师在Github上开源了一本书——《pure bash bible》,本书收集汇总了编写 bash 脚本经常会使用到的一些代码片段,无论是常见和不太常见的方法都可以在这书里找到,通过书中的代码片段,可以删除脚本中的依赖项,并且在大多数情况下可以让程序运行的更快。GitHub:star:23.9k。推荐等级:heart::heart::heart::heart:!

  • VS Code Debug Visualizer:写代码,难免会遇到各种神奇的问题,代码短我们在脑海中「运行」一遍也就差不多能找出原因。但代码要是比较长,错误就会隐藏比较深了,这个时候,不论你是采用 print() 大法,还是善用 assert 语句,或者干脆设置断点,DeBug 总是一条慢慢排除的道路。那么能不能有一种更优雅的 DeBug 方式,以更简洁的信息快速帮我们找到代码的问题所在?这就是 VS Code 最新推出的可视化 DeBug,它能以图的方式快速展示数据结构。但目前遗憾的是它并不支持Python。

  • Codejar:免费的浏览器端代码编辑器CodeJar,优点是轻量级,总体积仅2KB。自动缩进、自动添加右括号引号。因为是在浏览器中使用,所以CodeJar自然也就跨平台,Safari、Chrome、Firefox等浏览器上都能用,iPad和Android平台上的浏览器也能正常使用。

  • CodeSanbox:全面的在线代码编辑器 CodeSanbox。

  • Paste.ubuntu:paste.ubuntu 是一个单纯发布代码的网站,对于复制粘贴容易破坏原本代码美感的情况下,可以把代码放到里面,一键 Paste。有了这个神器,贴代码请大佬调试的时候再也不怕被骂这是什么鬼玩意儿

  • App Ideas:这里面收集了共 86 个可供开发者练习参考的项目创意,其中初级项目 34 个、中级 32 个、高级 20 个。同时,每个项目创意也均附上了较为详实的项目文档,指引开发者一步步完成项目的开发工具。不过代码几乎都是JS的。GitHub:star:22k,推荐等级:heart::heart::heart::heart:!

  • VSCode Rainbow Fart:VSCode Rainbow Fart 是一个在你编程时持续夸你写的牛逼的扩展,可以根据代码关键字播放贴近代码意义的真人语音。后续其他程序员推出了扩展语音包 Kugimiya Rainbow Fart:傲娇钉宫,鞭写鞭骂 - 钉宫理惠。

  • Cyberbrain:Python调试神器,Cyberbrain(赛博大脑),可以回溯代码中的变量更改历史,查看程序执行的状态。GitHub:star:1.8k

Others (其它) ❓

💨 Back to Top

“如果你不知道编译器是如何工作的,那么你就不知道计算机是如何工作的。 如果你不是100%确定你是否知道编译器是如何工作的,那么你就不知道它们是如何工作的。“ - Steve Yegge

  • Let’s Build A Web Server:加拿大工程师 Ruslan Spivak 写的如何利用Python自己写一个网络服务器的博客,适合用于学习Web server。GitHub代码
  • StackOverFlow:这个就不用介绍了,应该是世界上最大的问答网站了
  • Mathematics Stack Exchange:Mathematics Stack Exchange是一个类似StackOverFlow的问答网站,主要提供数学问答
  • Emoji Homepage:一个Emoji大全的网站,里面有各式各样的Emoji大全,点击想要的Emoji即可复制,用于写文章加入 Emoji 十分方便
  • OpenSource MicroSoft:微软近日上线了一个新的开源网站——网站本身既是开源的,内容也是关于开源的——来展示其如何拥抱开源,同时提供一些开源服务。推荐等级::heart::heart::heart:!
  • Tiler:像文字云一样,用各种小图拼出大的图片,构建一个像素风的世界。GitHub:star:4k。
  • Moji, Moji, Emoji:这是一个可根据图片配色,将图片转为用 emoji 填充的工具。在线体验地址
  • Greasy Fork: 一个提供用户脚本的网站,浏览器安装好 TemperMonkey 后,使用这些脚本上网简直不要爽到飞起
  • Remove.bg:一个可以在线免费消除图片背景的网站,并且提供API供批量处理图片使用(收费),简单方便(只需几秒钟,但效果强大
  • Advanced Java:GitHub:star:25k,互联网 Java 工程师进阶知识完全扫盲:涵盖高并发、分布式、高可用、微服务等领域知识,后端同学必看,前端同学也可学习,推荐等级::heart::heart::heart:!
  • Windows Keyboard Shortcuts:微软官方:Windows 中的键盘快捷方式
  • Naptha:一位来自MIT的学生Kevin Kwok用计算机视觉算法写了个Chrome插件Naptha,可以直接识别网页图片中的文字,并直接对它们进行高亮、复制粘贴、翻译、修改等操作。Chrome插件下载地址
  • PDFresizer:只需几下点击,允许对PDF文件分割和合并,优化,裁剪,调整大小,进行在线转换。
  • Wolfram Alpha:Wolfram Alpha,是由 Wolfram Research 公司推出的一款在线自动问答系统。其特色是可以直接向用户返回答案,而不是像传统搜索引擎一样提供一系列可能含有用户所需答案的相关网页。推荐等级::heart::heart::heart::heart:!
  • Production Level Deep Learning:众所周知,深度学习模型仅仅只是构建 AI 产品的重要步骤,但并不是全部。一个互联网产品(如 APP)想要集成深度学习能力,往往还需要走完很多设计、开发和测试方面的工作。如何部署深度学习往往成为了系统设计中更关键的问题。近日,GitHub 上有这样一个项目,专门介绍了如何将深度学习算法和模型融入到互联网产品中。项目基本以流程、架构图为主,目前仍在完善中,适合产品经理和开发者学习。
  • Material Design:图标设计大全,GitHub:star:7.1k。
  • Fontawesome:字体和图标库,GitHub⭐66k+。
  • AutoFlip:谷歌开源的智能视频剪裁框架,其基于谷歌 MediaPipe 框架,从此裁剪视频不用愁,其能够实现自动剪辑。视频尺寸、精彩内容通通自动化,文档地址。GitHub:star:4.7k。
  • AI Portraits Ars:MIT和IBM沃森联合实验室,发布了这只画师,名叫AI Portraits Ars,可以在线玩耍。但由于生成的画像过于形神兼备,上线即遭网友大规模涌入,不到三天服务器就崩坏了。
  • SpeedCoder:你打特殊符号的次数越多,你打字速度就越快。然而,你只要做一件小事就能很大程度上加快这个过程——学习好的触摸打字方式。这是一个练习快速打代码的网站。
  • bewindoweb:某个同学把他大部分能想到的、有用的网站都整理成了书签,其中包括了写论文必备、程序员通用、数据源下载、在线工具网站、设计素材、办公常用、学生常用.......你能想到的,想不到的有用的网站都收集在这里面了,一共100多个,当你需要学习工作的时候,直接去对应的网站找到你想要的东西,大大提升你的效率,推荐等级::heart::heart::heart::heart:!
  • User.me:不需要安装,就可以在线编辑Office,使用PS、Visio、Xmind、Matlab、Jupyter等等大型软件。还有CAD、WPS、SPSS等,有了它,我们的PC上就不需要装那么多软件了。
  • Office Converter:office文档格式、视频格式、音频格式、图片格式、电子书格式.......只有你想不到,没有你找不到,有所的格式都可以在这个网站上转换。
  • Squoosh:Squoos是 Google 开源发布的一款专门用来压缩图片的在线服务,支持 JPG、PNG、WebP 等格式的极限压缩,它采用谷歌强大的算法,在保障图像质量的前提下最大化压缩图片。GitHub:star:9.7k​
  • Public APIs:该库包含可用于项目和应用的免费 API 列表,覆盖各种主题,如商业、动画、动物、新闻、金融、游戏等。GitHub:77.6k,推荐等级::heart::heart::heart:!
  • 营销号生成器:一个挺有意思的营销号内容生成器,一开口就知道是老营销号了
  • textshot:一款 GitHub 用户 ianzhao05 刚发布的小工具——textshot,只需要截屏就能实时生成文字,也可以通过此项目大致了解如何对图像中的文本进行识别。推荐等级::heart::heart::heart:!​
  • nodesign:网站上收集了许多十分便利的 UI 设计工具与设计资源,这网站对于那些不太懂设计的开发者来说,简直是超级福音
  • Marketing-for-Engineers:该项目是由来自乌克兰的一名小姐姐 Lisa Dziuba 所创立,目的在于帮助工程师解决产品上线后所面临后的市场营销难题,GitHub:star:10.2k,​推荐等级:heart::heart::heart:!
  • Have I been Pwned:我被卖了吗?一个用来查询你的账号有没有被放在黑市里交易的网站
  • Luckysheet:一款功能强大、配置简单、完全开源、类似 Excel 在线表格工具 -- Luckysheet。GitHub:star:1.9k​
  • Open-source Builders:该网站里面收集并汇总了各类知名产品的开源实现方案,一来可以让开发者选择合适软件的开源替代品;二来也可以从中学到某款知名产品的业务代码实现逻辑。像大家耳熟能详的 GitHub、Slack、1Password、Facebook、YouTube、Shopify、Heroku 等产品,在上面都有对应的开源解决方案。
  • labelImg:图片标注工具,GitHub:star:12k​
  • genact:假装工作繁忙的摸鱼神器,GitHub:star:4.6k​

Update (更新时间) 🕰 :2021/07/09

💨 Back to Top

About

A curated list of all kinds of learning resources, blogs, books, videos and so on.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published