Skip to content

XiaoyuZHK/TianChi_resource

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 

Repository files navigation

天池历届比赛资料

PAKDD2020 阿里巴巴智能运维算法大赛

给定一段连续采集(天粒度)的硬盘状态监控数据(Self-Monitoring, Analysis, and Reporting Technology; often written as SMART)以及故障标签数据,参赛者需要自己提出方案,按天粒度判断每块硬盘是否会在未来30日内发生故障。例如,可以将预测故障问题转化为传统的二分类问题,通过分类模型来判断哪些硬盘会坏;或者可以转化为排序问题,通过Learning to rank的方式判断硬盘的损坏严重程度等。

赛题

数据集

各队分享

第二届海南大数据创新应用大赛 - 智能算法赛

本次比赛围绕人才数据智能服务体系的构建的目标,梳理人才相关数据,从海量异构非结构化文档中,抽取识别人才简历中关键信息。

赛题

疫情数据可视化公益行动

要求参与团队基于疫情相关数据,分析挖掘出对社会公众或者抗疫一线指战员有参考意义的数据模型,以可视化的方式进行展现。

赛题

各队分享

蛋白质结构预测大赛

目前已知一部分氨基酸序列和与其对应的二级结构,通过已有数据寻找一级结构到二级结构的映射模型,提高通过氨基酸序列进行蛋白质二级结构预测的准确性。

赛题

各队分享

“公益AI之星”挑战赛-新冠疫情相似句对判定大赛

比赛主打疫情相关的呼吸领域的真实数据积累,数据粒度更加细化,判定难度相比多科室文本相似度匹配更高,同时问答数据也更具时效性。本着宁缺毋滥的原则,问题的场地限制在20字以内,形成相对规范的句对。要求选手通过自然语义算法和医学知识识别相似问答和无关的问题。

赛题

各队分享

2020数字中国创新大赛—算法赛:智慧海洋建设

2020数字中国创新大赛(Digital China Innovation Contest, DCIC 2020),以“培育数字经济新动能,助推数字中国新发展”为主题,采取多赛道并行的竞赛形式,采用4+1的赛事架构,设置了数字政府、智慧医疗、鲲鹏计算、网络安全等4个赛道和中小学生赛道,打造具有全国影响力的顶级赛事。

赛题

数智重庆.全球产业赋能创新大赛【赛场一】

瓶装酒的生产过程中,受到原材料质量(酒瓶)以及加工工艺(灌装)等因素的影响,产品中可能存在各类瑕疵影响产品质量。一条产线一般有三到五个质检环节分别检测不同类型的瑕疵。由于瑕疵种类多样、有的瑕疵体积小不易察觉,瓶装酒厂家往往需要投入大量人力成本用于产品质检。高效、可靠的自动化质检能够降低大量人工成本,创造经济效益。本赛题要求选手通过计算机视觉以及人工智能算法帮助瓶装酒生产企业提高质检效率以及效果、降低质检成本。

赛题

安全AI挑战者计划第三期 - 文本分类对抗攻击

本次比赛的任务为 辱骂场景对抗攻击:基于辱骂文本生成对抗样本,使模型识别错误,同时扰动较小,并且不影响辱骂性质。

赛题

各队分享

“数字人体”视觉挑战赛——宫颈癌风险智能诊断

大赛旨在通过提供大规模经过专业医师标注的宫颈癌液基薄层细胞检测数据,选手能够提出并综合运用目标检测、深度学习等方法对宫颈癌细胞学异常鳞状上皮细胞进行定位以及对宫颈癌细胞学图片分类,提高模型检测的速度和精度,辅助医生进行诊断。

赛题

赛题解读

安全AI挑战者计划第二期 - ImageNet图像分类对抗攻击

此次比赛针对图像分类模型进行对抗攻击。为了模拟更加困难且真实的攻击场景,我们挑选了3个性能良好的防御模型作为被攻击模型。选手需要在不知道模型详细信息的前提下,构造有目标或者无目标的对抗样本。其中有目标的对抗样本需要被模型识别为特定类别;无目标的对抗样本需要被错分为任意类别,但是有目标和无目标攻击的难度不一样,所以设置的得分也不一样。选手在线下对测试样本进行修改,然后提交至线上做攻击测试。

赛题

各队分享

"合肥高新杯"心电人机智能大赛

大赛要求选手通过使用主办方提供的数据,训练算法来预测测试集中的心电异常事件。

赛题

赛题详解

各队分享

Apache Flink极客挑战赛——垃圾图片分类

本赛题希望你和你的团队使用Flink和Intel Analytics Zoo 实现对垃圾图片进行识别,实现对垃圾图片的分类功能。

赛题

赛题详解

各队分享

Apache Flink极客挑战赛——Flink TPC-DS性能优化

性能是数据库系统追求的永恒目标,为此人们在软件和硬件上都做了大量的工作,而业界已经有成熟的测试标准集TPC-DS来检验这些优化。 近一段时间,Apache Flink作为一个统一的计算引擎,在SQL以及批处理的支持上做了大量的优化和完善,吸引了越来越多的关注;全新英特尔® 傲腾™ 数据中心级持久内存重新定义了传统的架构,在内存密集型工作负载、虚拟机密度和快速存储容量方面具有突破性的性能水平。本题结合Apache Flink和英特尔® 傲腾™ 数据中心级持久内存(后文简称DCPMM),优化软件系统和利用硬件的特征,追求TPC-DS测试集的最优性能。

赛题

赛题详解

各队分享

2019广东工业智造创新大赛【赛场二】

本赛场聚焦面料剪裁利用率优化,要求选手研究开发高效可靠的算法,在较短时间范围内计算获得高质量可执行的排版结果,减少切割中形成的边角废料,提升面料切割利用率,减少计划时间、提高工作效率和避免人工计算的失误,提升价值降低成本。

在规则面料的情况下,满足零件旋转角度、零件最小间距、最小边距的约束,解决以下两类问题:

初赛赛题:基于所给零件,进行面料排版加工,耗料长度最短,面料利用率最高;

复赛赛题:在问题一的基础上,避开瑕疵区域面料加工,耗料长度最短,面料利用率最高。

赛题

答辩视频

队伍分享

赛题解读

2019广东工业智造创新大赛【赛场一】

在布匹的实际生产过程中,由于各方面因素的影响,会产生污渍、破洞、毛粒等瑕疵,为保证产品质量,需要对布匹进行瑕疵检测。布匹疵点检验是纺织行业生产和质量管理的重要环节,目前人工检测易受主观因素影响,缺乏一致性;并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难道大,导致布匹疵点智能检测是困扰行业多年的技术瓶颈。 ​ 近年来,人工智能和计算机视觉等技术突飞猛进,在工业质检场景中也取得了不错的成果。纺织行业迫切希望借助最先进的技术,实现布匹疵点智能检测。革新质检流程,自动完成质检任务,降低对大量人工的依赖,减少漏检发生率,提高产品的质量。

本赛场聚焦布匹疵点智能检测,要求选手研究开发高效可靠的计算机视觉算法,提升布匹疵点检验的准确度,降低对大量人工的依赖,提升布样疵点质检的效果和效率。要求算法既要检测布匹是否包含疵点,又要给出疵点具体的位置和类别,既考察疵点检出能力、也考察疵点定位和分类能力。

赛题

答辩视频

各队分享

安泰杯 —— 跨境电商智能算法大赛

本次比赛给出若干日内来自成熟国家的部分用户的行为数据,以及来自待成熟国家的A部分用户的行为数据,以及待成熟国家的B部分用户的行为数据去除每个用户的最后一条购买数据,让参赛人预测B部分用户的最后一条行为数据。

赛题

答辩视频

队伍分享

CIKM 2019 EComm AI用户行为预测

在电商场景中,推荐系统作为电商核心功能之一,对用户体验的提升有重要作用。预测用户的兴趣,为其做出合理的推荐是工业界与学术界长久以来研究的课题。经典方法包括基于内容的推荐、协同过滤等,一定程度上完成了推荐系统的任务。近年来,随着图神经网络研究的兴起,基于深度学习的GNN(Graph Neural Network)在推荐领域也逐渐称为研究热点。

电商场景中, 用户,商品,以及两者之间的行为可以用一张二部图来表示。预测用户未来的行为, 转化为预测二部图中用户-商品边的概率,有更好的可解释性、可推理性。

赛题

答辩视频

赛题解读

队伍分享

超大规模推荐之用户兴趣高效检索

近年来,不管是学术界还是工业界,都在如何提升推荐系统中的用户兴趣预估精度方向上进行了很多的工作。然而,大规模的推荐系统由于受到了响应时间的约束,必须在模型的精度和复杂度上做出权衡。一个典型的大规模电商推荐系统,往往需要在很短的时间内,从千万级别的商品库 C 中为用户挑选出其最可能感兴趣的 k 个商品。对于这样规模的问题而言,使用兴趣预估模型来逐一地预测每个用户-商品对的兴趣度,再挑选出最靠前的 k 个商品的模式,由于计算效率太低而难以在实际系统中应用。本次竞赛将聚焦在解决大规模推荐中用户兴趣检索的问题上,即,如何在避免穷举计算的情况下,高效地从全量商品库中精确地检索到用户最感兴趣的 k 个商品。

赛题

赛题解读

队伍分享

安全AI挑战者计划1 - 人脸识别对抗

此次比赛模拟人脸场景下的对抗攻击。在不知道模型详细信息的前提下,选手在线下对测试样本进行修改,然后提交至线上做攻击测试。

赛题

队伍分享

赛题解读

阿里巴巴优酷视频增强和超分辨率挑战赛

比赛要求通过训练样本对视频增强和超分模型进行建模,对测试集中的低分辨率视频样本预测高分辨率视频。其中,高分辨率视频来自优酷高清媒资库,优酷拥有视频的知识产权。低分辨率视频的生成模型是模拟实际业务中的噪声模式。

赛题

数据集

答辩视频

【追风少年】台风图像时间序列预测

在东亚上空,有着多颗地球同步气象卫星,定时观察大气中水汽的分布,并且积攒了历史数据记录。如果能够依据过去的台风发育发展的数据记录来训练深度学习模型,实现图像的时间序列预测,获取水汽分布的未来36小时发展,就意味着能够对台风进行一定程度上的预测。本次比赛是一个图像的时间序列预测问题。根据过去的气象卫星数据时间序列来训练,预测未来36小时的台风发展细节,包括位置、强度、水汽分布。

赛题

各队分享

天气学解读

首届中文NL2SQL挑战赛

首届中文NL2SQL挑战赛,使用金融以及通用领域的表格数据作为数据源,提供在此基础上标注的自然语言与SQL语句的匹配对,希望选手可以利用数据训练出可以准确转换自然语言到SQL的模型。

赛题

答辩视频

队伍分享

赛题解读

第二届阿里巴巴大数据智能云上编程大赛-智联招聘人岗智能匹配

本次大赛要求参赛者根据智联招聘抽样的经过脱敏的求职者标签数据、职位信息、及部分求职者行为信息、用人单位反馈信息,训练排序模型,对求职者的职位候选集进行排序,尽可能使得双端都满意的职位(求职者满意以及用人单位满意)优先推荐。本次比赛里,假定对于曝光给求职者的职位候选集里,假如求职者感兴趣会产生浏览职位行为,浏览职位后,如果求职者满意会产生主动投递行为。用人单位收到求职者主动投递的简历后会给出是否满意的反馈信号。

赛题

答辩视频

队伍分享

第五届中间件性能挑战赛

第五届中间件性能挑战赛围绕“挑战双11零点流量洪峰“展开。负载均衡是最大规模计算机系统中的一个基础问题。灵活的负载均衡算法可以将请求合理地分配到负载较少的服务器上。本题需要按照题目提供的扩展接口,实现一套自适应负载均衡机制。复赛为“实现一个进程内基于队列的消息持久化存储引擎”。Apache RocketMQ作为的一款分布式的消息中间件,历年双十一承载了万亿级的消息流转,然而随着业务的逐步发展和云上的输出,各种依赖消息作为输入输出的流计算场景层出不穷,这些都给RocketMQ带来了新的挑战。

赛题

答辩视频

各队分享

2019 年县域农业大脑AI挑战赛

本次大赛,我们选择了具有独特的地理环境、气候条件以及人文特色的贵州省兴仁市作为研究区域,聚焦当地的特色优势产业和支柱产业——薏仁米产业, 以薏仁米作物识别以及产量预测为比赛命题,要求选手开发算法模型,通过无人机航拍的地面影像,探索作物分类的精准算法,识别薏仁米、玉米、烤烟、人造建筑四大类型,提升作物识别的准确度,降低对人工实地勘察的依赖,提升农业资产盘点效率,并结合产量标注数据预测当年的薏仁米产量,提升农业精准管理能力。

赛题

赛题解读

队伍分享

答辩视频

全球数据智能大赛【赛场一】肺部CT多病种智能诊断

大赛旨在通过提供大规模经过严格标注的临床胸部CT影像数据,选手能够提出并综合运用目标检测、深度学习等优秀方法对肺结节、索条、动脉硬化或钙化、淋巴结钙化等影像特征进行定位和疾病分类工作,提高检测的速度和精度,辅助医生进行诊断。

赛题

答辩视频

队伍分享

赛题解读

数据预处理

“数智教育”数据可视化创新大赛

完成教育数据的清洗处理工作,完成数据分析的指标体系开发

赛题

答辩视频

队伍分享

津南数字制造算法挑战赛【赛场二】

本次比赛涵盖了三个大类,五个子类的危险品/限制品/特殊物品,后简称统称为限制品。数据包含了带有限制品的日常包裹X光图像及对应限制品的位置标注。

赛题

答辩视频

队伍分享

全球城市计算AI挑战赛

大赛以“地铁乘客流量预测”为赛题,参赛者可通过分析地铁站的历史刷卡数据,预测站点未来的客流量变化,帮助实现更合理的出行路线选择,规避交通堵塞,提前部署站点安保措施等,最终实现用大数据和人工智能等技术助力未来城市安全出行。

(赛题)

答辩视频

各队伍分享

津南数字制造算法挑战赛【赛场一】

本次大赛要求选手以异烟酸生产过程中的各参数,包括各主要步骤的时间、温度、压强等参数为基础,设计精确智能的优秀算法,提升异烟酸的收率。阿里云将为参赛选手提供机器资源,复赛团队可申请使用。

(赛题)

答辩视频

各队伍分享

OGeek算法挑战赛

在搜索业务下有一个场景叫实时搜索(Instance Search),就是在用户不断输入过程中,实时返回查询结果。

此次赛题来自OPPO手机搜索排序优化的一个子场景,并做了相应的简化,意在解决query-title语义匹配的问题。简化后,本次题目内容主要为一个实时搜索场景下query-title的ctr预估问题。本次赛题为开放型算法挑战赛,优秀的解决方案会对我们解决这个场景以及其它场景下的问题带来极大的启发。我们期待优秀的你和你的团队能够投入进来!

(赛题)

答辩视频

各队伍分享

瑞金医院MMC人工智能辅助构建知识图谱大赛

本次大赛旨在通过糖尿病相关的教科书、研究论文来做糖尿病文献挖掘并构建糖尿病知识图谱。参赛选手需要设计高准确率,高效的算法来挑战这一科学难题。第一赛季课题为“基于糖尿病临床指南和研究论文的实体标注构建”,第二赛季课题为“基于糖尿病临床指南和研究论文的实体间关系构建”。本次大赛禁止使用外部数据,可以使用外部工具。本次大赛禁止通过构造字典方式来进行实体预测。

文件标注工作基于brat软件,http://brat.nlplab.org/。其中.txt文件为原始文档,.ann文件为标注信息,标注实体以T开头,后接实体序号,实体类别,起始位置和实体对应的文档中的词。如果需要在brat软件中查看标注结果,需要添加.conf文件。

(赛题)

数据集

答辩视频

各队伍分享

第一届POLARDB数据库性能大赛

云原生数据库是为了更好的服务于云环境下的应用而诞生的,它是一种融合了众多创新技术,举办POLARDB数据库性能大赛的初衷是希望能够促进国内数据库研发人员的交流,碰撞出创新的火花,一起为云数据库的事业添砖加瓦。POLARDB日常的挑战是自研数据库所需要的各个模块, 例如存储引擎, 一致性协议, 查询优化等等,本届大赛的题目就是实现数据库的核心存储引擎。希望各界技术爱好者更多了解阿里云数据库团队在这个领域的积累,更多的了解阿里云自研数据库POLARDB。

赛题

答辩视频

各队伍分享

广东工业智造大数据创新大赛 - 智能算法赛

智能算法赛以“铝型材表面瑕疵识别”为主题,选择佛山市南海区铝型材标杆企业的真实痛点作为赛题场景,寻求解决方案,助力企业实现转型升级,提升行业竞争力。

赛题

答辩视频

各队伍分享

广东工业智造大数据创新大赛 - 应用创新赛

人工智能是国家战略性新兴产业。随着广东制造产业信息建设的不断完善,且产业布局较为完整,诞生了一批信息化程度高的工业制造企业。本届广东工业智造创新大赛—应用创新赛,通过阿里云天池作为唯一竞赛平台,整合优质资源,通过在全国范围内宣传征集优质智慧工业领域创业创新项目,吸引未来商业领袖入驻广东,并后续利用阿里云丰富的创投资源及庞大的人才资源库,为入驻项目赋能孵化,引导智能制造产业转型升级和变革发展,为广东省发展改革事业做出持续贡献。

赛题

答辩视频

第三届阿里云安全算法挑战赛

恶意软件是一种被设计用来对目标计算机造成破坏或者占用目标计算机资源的软件,传统的恶意软件包括蠕虫、木马等,这些恶意软件严重侵犯用户合法权益,甚至将为用户及他人带来巨大的经济或其他形式的利益损失。近年来随着虚拟货币进入大众视野,挖矿类的恶意程序也开始大量涌现,黑客通过入侵恶意挖矿程序获取巨额收益。当前恶意软件的检测技术主要有特征码检测、行为检测和启发式检测等,配合使用机器学习可以在一定程度上提高泛化能力,提升恶意样本的识别率。

(赛题)

长期赛

答辩视频

阿里巴巴大数据智能云上编程大赛

参赛队伍将得到气象业务人员在预报中所广泛参考的多种格点降水预报(集合预报)的结果,需要选手综合考虑各种预报的误差规律,将各个预报的结果融合分析,得到资料覆盖区域(东经118°121°,北纬28.5°31.5°,也即杭州及周边区域)的未来24小时降水预报结果。

赛题

各队伍分享

解题思路

决赛培训一

决赛培训二

2018阿里云全球区块链大赛

赛题

阿里巴巴全球调度算法大赛

赛题

数据集

答辩视频

干货帖

复赛解读

雪浪制造AI挑战赛—视觉计算辅助良品检测

赛题

答辩视频

FDDC2018金融算法挑战赛01-A股上市公司季度营收预测

赛题

数据集

答辩视频

各队伍分享

【赛题解读】FDDC金融算法挑战赛赛题一:A股上市公司季度营收预测

FDDC2018金融算法挑战赛02-A股上市公司公告信息抽取

赛题

数据集

答辩视频

各队伍分享

【赛题解读】FDDC金融算法挑战赛赛题二:A股上市公司公告信息抽取

AI Word Cup - 2018世界杯新闻智能创作极限挑战赛

赛题

答辩视频

[各队伍分享](https://tianchi.aliyun.com/forum/game_detail.htm?spm=5176.100067.5678.4.396f3f08KFgNCV#raceId=231664&game=AI Word Cup - 2018世界杯新闻智能创作极限挑战赛)

【赛题解读】6.26晚8点直播:新华智云AI Word Cup大赛

第四届阿里中间件性能挑战赛

赛题

答辩视频

美年健康AI大赛——双高疾病风险预测

赛题

答辩视频

各队伍分享

美年健康ai大赛——双高疾病风险预测赛题解读

FashionAI全球挑战赛—服饰属性标签识别

赛题

长期赛

FashionAI全球挑战赛—服饰关键点定位

赛题

长期赛

答辩视频

【阿里巴巴技术讲堂】第一讲-FashionAI百万挑战赛从学术走向应用

【阿里巴巴技术讲堂】第二讲-深度学习大牛手把手指导解决计算机视觉的经典问题:图像分类

IJCAI-18 阿里妈妈搜索广告转化预测

赛题

答辩视频

[各队伍分享](https://tianchi.aliyun.com/forum/game_detail.htm?spm=5176.100067.5678.5.430821634e3ra4#raceId=231647&game=IJCAI-18 阿里妈妈搜索广告转化预测)

BRYAN大神IJCAI-18比赛思路详解

天文数据挖掘大赛

赛题

数据集

答辩视频

各队伍分享

比赛思路分享:天文大赛TOP6选手

天文大赛实践分享:PAI+Tensorflow

印象盐城·数创未来大数据竞赛 - 盐城汽车上牌量预测

赛题

答辩视频

[各队伍分享](https://tianchi.aliyun.com/forum/game_detail.htm?spm=5176.100067.5678.5.37c077cd5ap94E#raceId=231641&game=印象盐城·数创未来大数据竞赛 - 盐城汽车上牌量预测)

印象盐城·数创未来大数据竞赛 - 乘用车零售量预测

赛题

汽车大数据应用场景介绍及市场预测分析研究

答辩视频

各队伍分享

天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测

赛题

【天池大赛】2018天池精准医疗大赛答辩会直播

各队伍分享

天池工业AI大赛-智能制造质量预测

赛题

【全集】天池工业AI大赛资料集

各队伍分享

未来已来——气象数据领航无人飞行器线路优化大赛

赛题

数据集

各队伍分享

商场中精确定位用户所在店铺

赛题

各队伍分享与视频

《商场中精确定位用户所在店铺》赛题解析和答疑

广东政务数据创新大赛

赛题

答辩视频

各队伍分享

【天池直播间】图像语义分割在遥感影像中的应用

【天池直播间】如何用数据讲好故事

【天池直播间】三维地理信息在可视化中的应用

【天池直播间】有意思和有意义的数据可视化

余震捕捉AI大赛

赛题

各队伍分享

地震学家教你用卷积神经网络自动检测地震

第二届阿里云安全算法挑战赛

赛题

各队伍分享

天池医疗AI大赛【第一季】

赛题

【天池直播间】天池医疗AI大赛肺部结节智能诊断在线分享

【天池直播】图像识别系列直播二--进阶:U-Net在CT图像分割中的应用

各队伍分享

全国社会保险大数据应用创新大赛

赛题

各队伍分享

“数聚华夏 创享未来”中国数据创新行——智慧交通预测挑战赛

赛题

数据集

【答辩视频】智慧交通大赛答辩现场视频回放

各队伍分享

智慧航空AI大赛

赛题

数据集

各队伍分享

梁教授-同济教授分享应用算法优化航空运营

大航杯“智造扬中”电力AI大赛

赛题

各队伍分享

CIKM AnalytiCup 2017

赛题

数据集

各队伍分享

第三届阿里中间件性能挑战赛

赛题

各队伍分享

KDD CUP 2017

赛题

数据集

各队伍分享

IJCAI-17 口碑商家客流量预测

赛题

数据集

各队伍分享


About

天池比赛历届部分资料及top方案

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published