Skip to content

xuqinhaow/MillionHeroAssistant

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

西瓜视频百万英雄助手

本文的所有答案均来自百度知道的搜索,根据前两个投票最高的答案来,目前已经去除了广告,只支持android手机,程序运行时间是3秒左右(答题是10秒)。

本软件使用了汉王云ocrAPI,参考了wuditken/MillionHeroes 项目,目前主要改进了广告和配置问题,提供免费的云api,不需要用户自己注册汉王api,如果发现不可用请扫描二维码联系。

汉王OCR APPCode

notice: 第一次使用汉王阿里云只需要0.01元/100条,所以如果没有了,可以自己注册阿里云账号购买(汉王)。

  • 714501eede0b4ac9a75a11af64b3b4d7

V2 文本关联相似度分析

对于答题这样的项目,首先一个问题,然后有三个答案可以选择,能不能通过分别统计问题与三个答案的关联度来选择出正确的答案,由于数据采集是来自百度的,可能会受到部分广告数据的影响,但是在集合相当大的情况下,关联度还是会呈现正相关。

假设题目是:

中国历史上著名的科举制度开始于那个朝代?

  • 汉朝
  • 唐朝
  • 隋朝

我们先用百度分别搜索汉朝唐朝隋朝,得到如下数据:

朝代 搜索出的数量(来自百度为您找到相关结果约)
汉朝 17900000
唐朝 30500000
隋朝 16600000

然后我们在用题目 + 答案的方式,搜索示例:

中国历史上著名的科举制度开始于那个朝代? 汉朝 得到三次的搜索结果:

关键字 搜索出的数量(来自百度为您找到相关结果约)
Q + 汉朝 602000
Q + 唐朝 837000
Q + 隋朝 658000

关联度计算方式:

K = count(Q&A) / (count(Q) * count(A))

关联度如下:

答案 关联度
汉朝 0.0336
唐朝 0.0274
隋朝 0.0396

Release

  • 2017/1/9: baiduzhi.com 答案获取bug,增加长文本信息摘要算法,增加百度OCR
  • 2017/1/9: 使用相似度猜测答案,请切换分支使用

部署

  1. 从python官网安装python3.6环境
  2. pip install -r requirements.txt
  3. 创建默认的临时文件夹mkdir -p screenshots
  4. 修改默认的配置文件config.py,配置文件夹中可以配置临时数据目录和appcode

ADB工具配置

以linux 为例:

  1. 下载android-platform-tools,访问google下载,默认mac,windows,linux均支持
  2. 配置环境变量,进入platform目录下面export PATH=$(pwd):PATH配置adb工具到系统的path下面
  3. 手机打开开发者模式
  4. 使用usb连接手机后信任,adb devices来检查是否有自己的设备,确认已经连接
  5. 接下来就进入百万英雄,等待有题目的时候就运行python main.py即可

交流学习

想要交流学习或者联系充值汉王OCR的请扫描二维码联系(有效期7日)

群已经满了100人了,需要邀请进群。

请加wexin后邀请:

qq: 294101042

About

百万英雄答题助手(汉王/百度OCR, 百度搜索/机器自动决策[kneaby 分支], android/ios[切换ios分支])

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%