Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

【PaddlePaddle Hackathon 4】产业合作开源贡献任务合集 #50633

Closed
cloud2009 opened this issue Feb 18, 2023 · 9 comments
Closed

【PaddlePaddle Hackathon 4】产业合作开源贡献任务合集 #50633

cloud2009 opened this issue Feb 18, 2023 · 9 comments
Assignees

Comments

@cloud2009
Copy link

cloud2009 commented Feb 18, 2023

【PaddlePaddle Hackathon 4】产业合作开源贡献任务合集

(此 ISSUE 为 PaddlePaddle Hackathon 第四期活动的任务 ISSUE,更多详见 【PaddlePaddle Hackathon 第四期】任务总览

注:开发请参考 贡献指南,任务列表如下,其他说明事项在任务列表后:

No.236:基于PaddleOCR的工频场强计读数识别

  • 技术标签: 深度学习,Python,OCR
  • 任务难度: 基础⭐️
  • 详细描述:
    • 数据集
      • 训练集:包含100张原始图片,数据集;不提供标签信息,可以结合 PPOCRLabel等标注工具构建训练数据并进行模型微调;可以使用数据生成方法批量生成识别数据。
      • 测试集:评审前公开
    • 方案建议(不局限于此)
      • 基于PaddleOCR中的PP-OCR模型微调
    • 任务详情:识别工频场图像中的工频电磁场数值和单位、以及下方X\Y\Z的数值,要求结构化输出结果:
      • [ {"Info_Probe":""}, {"Freq_Set":""}, {"Freq_Main":""}, {"Val_Total":""},{"Val_X":""}, {"Val_Y":""}, {"Val_Z":""}, {"Unit":""}, {"Field":""} ]

| image | image (1)

  • 评分方式
    • 综合以下两方面成绩最高队伍获奖
      • 测试集H-means值最高者,最低大于90%(分数占比80%)
      • 技术方案的可用性和可扩展性、产业落地价值和影响、项目作为教程的详细程度(分数占比20%)
  • 提交内容:
    • AI Studio 项目(遵从模板规范),全部代码和使用数据需开源,效果完整可复现
  • 提交流程:
    • 本issue 下按如下模板回复,提交自己的完整方案
【队名】:一个让人印象深刻的名字
【测试集精度】:xxx
【AI Studio 项目地址】:xxx 
  • 技术要求:
    • 熟练掌握 Python 开发
    • 熟悉 OCR 算法

No.237:基于PaddleNLP的跨模态文档信息抽取

  • 技术标签: 深度学习,Python,NLP

  • 任务难度: 基础⭐️

  • 详细描述:

    • 任务:结合OCR及NLP技术实现机动车发票信息结构化。目标抽取字段:
      • 共包含11种实体标签:购买方名称、车辆类型、厂牌型号、产地、发动机号、销售单位名称、纳税人识别号、开户银行、增值税税额、不含税价、主管税务机关及代码
    • 数据集
      • 训练集:可进行标注用来训练的数据,包含30张原始图片,数据集下载地址。不提供标签信息,可以结合 PPOCRLabel、Label-Studio 等标注工具构建训练数据并进行模型微调
      • 测试集:带标注的数据,仅可作为测试集使用,不可作为训练集。评审前公开
    • 方案建议(不局限于此)
      • 基于PaddleOCR PPStructure训练定制版面分析模型,优化发票场景的版面分析能力,提升UIE-X跨行抽取效果
      • 基于PaddleNLP UIE-X实现在小样本数据集下的文档抽取模型定制,可使用PaddleNLP 提供的数据协议基于 Label-Studio 对原始文档进行标注
  • 评分方式

    • 综合以下两方面成绩最高队伍获奖
      • 测试集F1值(50%)
      • 技术方案的可用性和可扩展性、产业落地价值和影响、项目作为教程的详细程度(50%)
  • 提交内容:

    • AI Studio 项目(遵从模板规范),全部代码和使用数据需开源,效果完整可复现
  • 提交流程:

    • 本issue 下按如下模板回复,提交自己的完整方案
【队名】:一个让人印象深刻的名字
【测试集精度】:xxx
【AI Studio 项目地址】:xxx 
  • 技术要求:
    • 熟练掌握 Python 开发
    • 熟悉 NLP 算法

No.238:基于PaddleClas的中草药识别

  • 技术标签: 深度学习,Python,图像分类

  • 任务难度: 基础⭐️

  • 详细描述:

    • 任务:训练一个中草药分类模型
    • 数据集:按照开源数据集划分的训练集和测试集进行实验,可自行扩增训练集数目,不可将测试集用于训练
    • 方案建议:可以使用包括但不限于PaddleClas中的基础模型库,产业特色解决方案(PP-LCNet、PULC等)
  • 评分方式

    • 综合以下两方面成绩最高队伍获奖
      • 测试集ACC大于0.842,最高者(分数占比80%)
      • 技术方案的可用性和可扩展性、产业落地价值和影响、项目作为教程的详细程度(分数占比20%)
  • 提交内容:

    • AI Studio 项目(遵从模板规范),全部代码和使用数据需开源,效果完整可复现
    • 训练模型,实现中草药识别
  • 提交流程:

    • 本issue 下按如下模板回复,提交自己的完整方案
【队名】:一个让人印象深刻的名字
【测试集精度】:xxx
【AI Studio 项目地址】:xxx 
  • 技术要求:
    • 熟练掌握Python开发
    • 熟悉 PaddleClas或者相关图像分类模型算法。

No.239:基于PaddleDetection的无人机航拍图像检测

  • 技术标签: 深度学习,Python,Detection

  • 任务难度: 基础⭐️

  • 详细描述:

  • 评分方式:

    • 综合以下几方面成绩最高队伍获奖
      • 检测模型,使用原图评估,cocoapi mAP 0.5:0.95大于42.5
      • 跟踪模型,效果稳定
      • 算法实时性较好,可以在T4或同等算力硬件平台上大于20FPS
      • 技术方案的可用性和可扩展性、产业落地价值和影响、项目作为教程的详细程度
  • 提交内容:

    • AI Studio 项目(遵从模板规范),全部代码和使用数据需开源,效果完整可复现
  • 提交流程:

    • 本issue 下按如下模板回复,提交自己的完整方案
【队名】:一个让人印象深刻的名字
【测试集精度】:xxx
【AI Studio 项目地址】:xxx 
  • 技术要求:
    • 熟练掌握 Python 开发
    • 熟悉 Detection, Tracking算法

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

答疑交流

@paddle-bot
Copy link

paddle-bot bot commented Feb 18, 2023

您好,我们已经收到了您的问题,会安排技术人员尽快解答您的问题,请耐心等待。请您再次检查是否提供了清晰的问题描述、复现代码、环境&版本、报错信息等。同时,您也可以通过查看官网API文档常见问题历史IssueAI社区来寻求解答。祝您生活愉快~

Hi! We've received your issue and please be patient to get responded. We will arrange technicians to answer your questions as soon as possible. Please make sure that you have posted enough message to demo your request. You may also check out the APIFAQGithub Issue and AI community to get the answer.Have a nice day!

@paddle-bot paddle-bot bot added type/others 其他问题 hackathon labels Feb 20, 2023
@cloud2009 cloud2009 changed the title 【PaddlePaddle Hackathon 4】 子任务合集4(2023-02-20公布) 【PaddlePaddle Hackathon 4】产业合作开源贡献任务合集 Feb 20, 2023
@renmada
Copy link

renmada commented Feb 21, 2023

No.237:基于PaddleNLP的跨模态文档信息抽取
30条是用来标注训练的,测试集在哪?

@tensorfly-gpu
Copy link

No.238
【队名】:梦境爱丽丝
【测试集精度】:1.0
【AI Studio 项目地址】:https://aistudio.baidu.com/aistudio/projectdetail/5554057

@smilyhd
Copy link

smilyhd commented Mar 1, 2023

赛题【No.239】:请问题目中的跟踪功能,需要在真实无人机上进行检测吗,效果稳定的判断条件是什么呢?

@Curry5491
Copy link

【队名】:squad
【测试集精度】:1.0
【AI Studio 项目地址】:https://aistudio.baidu.com/aistudio/projectdetail/5579669?contributionType=1

@resnext999
Copy link

【队名】:唯心而已
【测试集精度】:93.6%
【AI Studio 项目地址】:https://aistudio.baidu.com/aistudio/projectdetail/5634822?contributionType=1

@Yinita
Copy link

Yinita commented Apr 9, 2023

No.238
【队名】:决战紫禁城
【测试集精度】:96%
【AI Studio 项目地址】:https://aistudio.baidu.com/aistudio/projectdetail/5915109

@kiharanagisa
Copy link

No.238
【队名】:NONAME
【测试集精度】:1.0
【AI Studio 项目地址】:https://aistudio.baidu.com/aistudio/projectdetail/5582072

@cuyoo
Copy link

cuyoo commented Apr 14, 2023

No.237
【队名】:cnrk
【测试集精度】:0.95
https://aistudio.baidu.com/aistudio/projectdetail/5958649

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests