Skip to content
This repository

HTTPS clone URL

Subversion checkout URL

You can clone with HTTPS or Subversion.

Download ZIP

敏感信息过滤

branch: master

Fetching latest commit…

Octocat-spinner-32-eaf2f5

Cannot retrieve the latest commit at this time

Octocat-spinner-32 README.md
README.md

敏感信息过滤

提供敏感信息过滤服务

愿景:让中国的网络不再需要那墙

最愚蠢的关键词过滤

假设一个进程是一个人,每个人负责过滤一个关键词,每个需要过滤的文本信息,都经过这些人的关键词过滤,全部人都审核一遍后,得到的文本信息就是符合规定的文本了。

继续假设

  • 假设我们有100w个关键词,那么我们需要100w人
  • 如果一个人负责1w个关键词,那么我们需要100人
  • 如果一个人负责10w个关键词,那么我们需要10个人

最多的关键词会有多少?100w?1000w?1亿?15亿?100亿?1000亿?10000亿?

要是真能做到10000亿,而且过滤系统又能顺利处理,是否就可行了?

Something went wrong with that request. Please try again.