给定一段连续采集(天粒度)的硬盘状态监控数据(Self-Monitoring, Analysis, and Reporting Technology; often written as SMART)以及故障标签数据,参赛者需要自己提出方案,按天粒度判断每块硬盘是否会在未来30日内发生故障。例如,可以将预测故障问题转化为传统的二分类问题,通过分类模型来判断哪些硬盘会坏;或者可以转化为排序问题,通过Learning to rank的方式判断硬盘的损坏严重程度等。
本次比赛围绕人才数据智能服务体系的构建的目标,梳理人才相关数据,从海量异构非结构化文档中,抽取识别人才简历中关键信息。
要求参与团队基于疫情相关数据,分析挖掘出对社会公众或者抗疫一线指战员有参考意义的数据模型,以可视化的方式进行展现。
目前已知一部分氨基酸序列和与其对应的二级结构,通过已有数据寻找一级结构到二级结构的映射模型,提高通过氨基酸序列进行蛋白质二级结构预测的准确性。
比赛主打疫情相关的呼吸领域的真实数据积累,数据粒度更加细化,判定难度相比多科室文本相似度匹配更高,同时问答数据也更具时效性。本着宁缺毋滥的原则,问题的场地限制在20字以内,形成相对规范的句对。要求选手通过自然语义算法和医学知识识别相似问答和无关的问题。
2020数字中国创新大赛(Digital China Innovation Contest, DCIC 2020),以“培育数字经济新动能,助推数字中国新发展”为主题,采取多赛道并行的竞赛形式,采用4+1的赛事架构,设置了数字政府、智慧医疗、鲲鹏计算、网络安全等4个赛道和中小学生赛道,打造具有全国影响力的顶级赛事。
瓶装酒的生产过程中,受到原材料质量(酒瓶)以及加工工艺(灌装)等因素的影响,产品中可能存在各类瑕疵影响产品质量。一条产线一般有三到五个质检环节分别检测不同类型的瑕疵。由于瑕疵种类多样、有的瑕疵体积小不易察觉,瓶装酒厂家往往需要投入大量人力成本用于产品质检。高效、可靠的自动化质检能够降低大量人工成本,创造经济效益。本赛题要求选手通过计算机视觉以及人工智能算法帮助瓶装酒生产企业提高质检效率以及效果、降低质检成本。
本次比赛的任务为 辱骂场景对抗攻击:基于辱骂文本生成对抗样本,使模型识别错误,同时扰动较小,并且不影响辱骂性质。
大赛旨在通过提供大规模经过专业医师标注的宫颈癌液基薄层细胞检测数据,选手能够提出并综合运用目标检测、深度学习等方法对宫颈癌细胞学异常鳞状上皮细胞进行定位以及对宫颈癌细胞学图片分类,提高模型检测的速度和精度,辅助医生进行诊断。
此次比赛针对图像分类模型进行对抗攻击。为了模拟更加困难且真实的攻击场景,我们挑选了3个性能良好的防御模型作为被攻击模型。选手需要在不知道模型详细信息的前提下,构造有目标或者无目标的对抗样本。其中有目标的对抗样本需要被模型识别为特定类别;无目标的对抗样本需要被错分为任意类别,但是有目标和无目标攻击的难度不一样,所以设置的得分也不一样。选手在线下对测试样本进行修改,然后提交至线上做攻击测试。
大赛要求选手通过使用主办方提供的数据,训练算法来预测测试集中的心电异常事件。
本赛题希望你和你的团队使用Flink和Intel Analytics Zoo 实现对垃圾图片进行识别,实现对垃圾图片的分类功能。
性能是数据库系统追求的永恒目标,为此人们在软件和硬件上都做了大量的工作,而业界已经有成熟的测试标准集TPC-DS来检验这些优化。 近一段时间,Apache Flink作为一个统一的计算引擎,在SQL以及批处理的支持上做了大量的优化和完善,吸引了越来越多的关注;全新英特尔® 傲腾™ 数据中心级持久内存重新定义了传统的架构,在内存密集型工作负载、虚拟机密度和快速存储容量方面具有突破性的性能水平。本题结合Apache Flink和英特尔® 傲腾™ 数据中心级持久内存(后文简称DCPMM),优化软件系统和利用硬件的特征,追求TPC-DS测试集的最优性能。
本赛场聚焦面料剪裁利用率优化,要求选手研究开发高效可靠的算法,在较短时间范围内计算获得高质量可执行的排版结果,减少切割中形成的边角废料,提升面料切割利用率,减少计划时间、提高工作效率和避免人工计算的失误,提升价值降低成本。
在规则面料的情况下,满足零件旋转角度、零件最小间距、最小边距的约束,解决以下两类问题:
初赛赛题:基于所给零件,进行面料排版加工,耗料长度最短,面料利用率最高;
复赛赛题:在问题一的基础上,避开瑕疵区域面料加工,耗料长度最短,面料利用率最高。
在布匹的实际生产过程中,由于各方面因素的影响,会产生污渍、破洞、毛粒等瑕疵,为保证产品质量,需要对布匹进行瑕疵检测。布匹疵点检验是纺织行业生产和质量管理的重要环节,目前人工检测易受主观因素影响,缺乏一致性;并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难道大,导致布匹疵点智能检测是困扰行业多年的技术瓶颈。 近年来,人工智能和计算机视觉等技术突飞猛进,在工业质检场景中也取得了不错的成果。纺织行业迫切希望借助最先进的技术,实现布匹疵点智能检测。革新质检流程,自动完成质检任务,降低对大量人工的依赖,减少漏检发生率,提高产品的质量。
本赛场聚焦布匹疵点智能检测,要求选手研究开发高效可靠的计算机视觉算法,提升布匹疵点检验的准确度,降低对大量人工的依赖,提升布样疵点质检的效果和效率。要求算法既要检测布匹是否包含疵点,又要给出疵点具体的位置和类别,既考察疵点检出能力、也考察疵点定位和分类能力。
本次比赛给出若干日内来自成熟国家的部分用户的行为数据,以及来自待成熟国家的A部分用户的行为数据,以及待成熟国家的B部分用户的行为数据去除每个用户的最后一条购买数据,让参赛人预测B部分用户的最后一条行为数据。
在电商场景中,推荐系统作为电商核心功能之一,对用户体验的提升有重要作用。预测用户的兴趣,为其做出合理的推荐是工业界与学术界长久以来研究的课题。经典方法包括基于内容的推荐、协同过滤等,一定程度上完成了推荐系统的任务。近年来,随着图神经网络研究的兴起,基于深度学习的GNN(Graph Neural Network)在推荐领域也逐渐称为研究热点。
电商场景中, 用户,商品,以及两者之间的行为可以用一张二部图来表示。预测用户未来的行为, 转化为预测二部图中用户-商品边的概率,有更好的可解释性、可推理性。
近年来,不管是学术界还是工业界,都在如何提升推荐系统中的用户兴趣预估精度方向上进行了很多的工作。然而,大规模的推荐系统由于受到了响应时间的约束,必须在模型的精度和复杂度上做出权衡。一个典型的大规模电商推荐系统,往往需要在很短的时间内,从千万级别的商品库 C 中为用户挑选出其最可能感兴趣的 k 个商品。对于这样规模的问题而言,使用兴趣预估模型来逐一地预测每个用户-商品对的兴趣度,再挑选出最靠前的 k 个商品的模式,由于计算效率太低而难以在实际系统中应用。本次竞赛将聚焦在解决大规模推荐中用户兴趣检索的问题上,即,如何在避免穷举计算的情况下,高效地从全量商品库中精确地检索到用户最感兴趣的 k 个商品。
此次比赛模拟人脸场景下的对抗攻击。在不知道模型详细信息的前提下,选手在线下对测试样本进行修改,然后提交至线上做攻击测试。
比赛要求通过训练样本对视频增强和超分模型进行建模,对测试集中的低分辨率视频样本预测高分辨率视频。其中,高分辨率视频来自优酷高清媒资库,优酷拥有视频的知识产权。低分辨率视频的生成模型是模拟实际业务中的噪声模式。
在东亚上空,有着多颗地球同步气象卫星,定时观察大气中水汽的分布,并且积攒了历史数据记录。如果能够依据过去的台风发育发展的数据记录来训练深度学习模型,实现图像的时间序列预测,获取水汽分布的未来36小时发展,就意味着能够对台风进行一定程度上的预测。本次比赛是一个图像的时间序列预测问题。根据过去的气象卫星数据时间序列来训练,预测未来36小时的台风发展细节,包括位置、强度、水汽分布。
首届中文NL2SQL挑战赛,使用金融以及通用领域的表格数据作为数据源,提供在此基础上标注的自然语言与SQL语句的匹配对,希望选手可以利用数据训练出可以准确转换自然语言到SQL的模型。
本次大赛要求参赛者根据智联招聘抽样的经过脱敏的求职者标签数据、职位信息、及部分求职者行为信息、用人单位反馈信息,训练排序模型,对求职者的职位候选集进行排序,尽可能使得双端都满意的职位(求职者满意以及用人单位满意)优先推荐。本次比赛里,假定对于曝光给求职者的职位候选集里,假如求职者感兴趣会产生浏览职位行为,浏览职位后,如果求职者满意会产生主动投递行为。用人单位收到求职者主动投递的简历后会给出是否满意的反馈信号。
第五届中间件性能挑战赛围绕“挑战双11零点流量洪峰“展开。负载均衡是最大规模计算机系统中的一个基础问题。灵活的负载均衡算法可以将请求合理地分配到负载较少的服务器上。本题需要按照题目提供的扩展接口,实现一套自适应负载均衡机制。复赛为“实现一个进程内基于队列的消息持久化存储引擎”。Apache RocketMQ作为的一款分布式的消息中间件,历年双十一承载了万亿级的消息流转,然而随着业务的逐步发展和云上的输出,各种依赖消息作为输入输出的流计算场景层出不穷,这些都给RocketMQ带来了新的挑战。
本次大赛,我们选择了具有独特的地理环境、气候条件以及人文特色的贵州省兴仁市作为研究区域,聚焦当地的特色优势产业和支柱产业——薏仁米产业, 以薏仁米作物识别以及产量预测为比赛命题,要求选手开发算法模型,通过无人机航拍的地面影像,探索作物分类的精准算法,识别薏仁米、玉米、烤烟、人造建筑四大类型,提升作物识别的准确度,降低对人工实地勘察的依赖,提升农业资产盘点效率,并结合产量标注数据预测当年的薏仁米产量,提升农业精准管理能力。
大赛旨在通过提供大规模经过严格标注的临床胸部CT影像数据,选手能够提出并综合运用目标检测、深度学习等优秀方法对肺结节、索条、动脉硬化或钙化、淋巴结钙化等影像特征进行定位和疾病分类工作,提高检测的速度和精度,辅助医生进行诊断。
完成教育数据的清洗处理工作,完成数据分析的指标体系开发
本次比赛涵盖了三个大类,五个子类的危险品/限制品/特殊物品,后简称统称为限制品。数据包含了带有限制品的日常包裹X光图像及对应限制品的位置标注。
大赛以“地铁乘客流量预测”为赛题,参赛者可通过分析地铁站的历史刷卡数据,预测站点未来的客流量变化,帮助实现更合理的出行路线选择,规避交通堵塞,提前部署站点安保措施等,最终实现用大数据和人工智能等技术助力未来城市安全出行。
本次大赛要求选手以异烟酸生产过程中的各参数,包括各主要步骤的时间、温度、压强等参数为基础,设计精确智能的优秀算法,提升异烟酸的收率。阿里云将为参赛选手提供机器资源,复赛团队可申请使用。
在搜索业务下有一个场景叫实时搜索(Instance Search),就是在用户不断输入过程中,实时返回查询结果。
此次赛题来自OPPO手机搜索排序优化的一个子场景,并做了相应的简化,意在解决query-title语义匹配的问题。简化后,本次题目内容主要为一个实时搜索场景下query-title的ctr预估问题。本次赛题为开放型算法挑战赛,优秀的解决方案会对我们解决这个场景以及其它场景下的问题带来极大的启发。我们期待优秀的你和你的团队能够投入进来!
本次大赛旨在通过糖尿病相关的教科书、研究论文来做糖尿病文献挖掘并构建糖尿病知识图谱。参赛选手需要设计高准确率,高效的算法来挑战这一科学难题。第一赛季课题为“基于糖尿病临床指南和研究论文的实体标注构建”,第二赛季课题为“基于糖尿病临床指南和研究论文的实体间关系构建”。本次大赛禁止使用外部数据,可以使用外部工具。本次大赛禁止通过构造字典方式来进行实体预测。
文件标注工作基于brat软件,http://brat.nlplab.org/。其中.txt文件为原始文档,.ann文件为标注信息,标注实体以T开头,后接实体序号,实体类别,起始位置和实体对应的文档中的词。如果需要在brat软件中查看标注结果,需要添加.conf文件。
云原生数据库是为了更好的服务于云环境下的应用而诞生的,它是一种融合了众多创新技术,举办POLARDB数据库性能大赛的初衷是希望能够促进国内数据库研发人员的交流,碰撞出创新的火花,一起为云数据库的事业添砖加瓦。POLARDB日常的挑战是自研数据库所需要的各个模块, 例如存储引擎, 一致性协议, 查询优化等等,本届大赛的题目就是实现数据库的核心存储引擎。希望各界技术爱好者更多了解阿里云数据库团队在这个领域的积累,更多的了解阿里云自研数据库POLARDB。
智能算法赛以“铝型材表面瑕疵识别”为主题,选择佛山市南海区铝型材标杆企业的真实痛点作为赛题场景,寻求解决方案,助力企业实现转型升级,提升行业竞争力。
人工智能是国家战略性新兴产业。随着广东制造产业信息建设的不断完善,且产业布局较为完整,诞生了一批信息化程度高的工业制造企业。本届广东工业智造创新大赛—应用创新赛,通过阿里云天池作为唯一竞赛平台,整合优质资源,通过在全国范围内宣传征集优质智慧工业领域创业创新项目,吸引未来商业领袖入驻广东,并后续利用阿里云丰富的创投资源及庞大的人才资源库,为入驻项目赋能孵化,引导智能制造产业转型升级和变革发展,为广东省发展改革事业做出持续贡献。
恶意软件是一种被设计用来对目标计算机造成破坏或者占用目标计算机资源的软件,传统的恶意软件包括蠕虫、木马等,这些恶意软件严重侵犯用户合法权益,甚至将为用户及他人带来巨大的经济或其他形式的利益损失。近年来随着虚拟货币进入大众视野,挖矿类的恶意程序也开始大量涌现,黑客通过入侵恶意挖矿程序获取巨额收益。当前恶意软件的检测技术主要有特征码检测、行为检测和启发式检测等,配合使用机器学习可以在一定程度上提高泛化能力,提升恶意样本的识别率。
参赛队伍将得到气象业务人员在预报中所广泛参考的多种格点降水预报(集合预报)的结果,需要选手综合考虑各种预报的误差规律,将各个预报的结果融合分析,得到资料覆盖区域(东经118°121°,北纬28.5°31.5°,也即杭州及周边区域)的未来24小时降水预报结果。
【赛题解读】FDDC金融算法挑战赛赛题一:A股上市公司季度营收预测
【赛题解读】FDDC金融算法挑战赛赛题二:A股上市公司公告信息抽取
[各队伍分享](https://tianchi.aliyun.com/forum/game_detail.htm?spm=5176.100067.5678.4.396f3f08KFgNCV#raceId=231664&game=AI Word Cup - 2018世界杯新闻智能创作极限挑战赛)
【赛题解读】6.26晚8点直播:新华智云AI Word Cup大赛
【阿里巴巴技术讲堂】第一讲-FashionAI百万挑战赛从学术走向应用
【阿里巴巴技术讲堂】第二讲-深度学习大牛手把手指导解决计算机视觉的经典问题:图像分类
[各队伍分享](https://tianchi.aliyun.com/forum/game_detail.htm?spm=5176.100067.5678.5.430821634e3ra4#raceId=231647&game=IJCAI-18 阿里妈妈搜索广告转化预测)
[各队伍分享](https://tianchi.aliyun.com/forum/game_detail.htm?spm=5176.100067.5678.5.37c077cd5ap94E#raceId=231641&game=印象盐城·数创未来大数据竞赛 - 盐城汽车上牌量预测)
【天池直播】图像识别系列直播二--进阶:U-Net在CT图像分割中的应用