往届seed大赛(江苏大数据开放与应用)赛题分享

helloworld_70863843
• 阅读 529

下载方式:远程ftp下载

下载url路径:

ftp://58.215.217.12:2121 账号:seed2020

密码:seed@123

ftp使用方式见比赛讨论贴

数据尚未完全完成标注和切分,所以需要分批提供下载,提供下载数据说明如下:

1、医疗卫生初赛数据集01.rar:初赛数据集,共205张,全部为阴性样本数据

2、医疗卫生初赛数据集02.zip:初赛数据集,共232张,全部为阳性样本数据,包含原始阳性样本图像和对应标注样本图像;2020/08/13更新

3、医疗卫生初赛数据集03.rar:初赛数据集,共795张,全部为阴性样本数据;2020/08/14更新

4、test.zip:初赛测试集,共600 300张,并且全部为阳性样本;2020/09/02更新

5、医疗卫生初赛数据集04.zip:初赛训练集,共500张,并且全部为阳性样本;2020/09/06更新,至此,初赛训练集全部更新完毕。

提醒:2020年09月02日开始上线新的评估指标Dice,之前的像素精确率PA评估指标废弃,评估指标上线后将进行清榜动作,将之前的所有选手提交成绩置为0,请大家重新提交作品并进行评分

数据说明 本次大赛提供的是胃部组织病理切片图像数据。示例如下: 往届seed大赛(江苏大数据开放与应用)赛题分享

胃部组织病理切片数据包括阳性样本和阴性样本,阳性样本是图像中出现癌症病灶的样本,阴性样本是图像中没有出现癌症病灶的样本;所有图像都是20倍率视野下获取的

注意:阴性样本中包括正常胃部组织图像、胃炎性病变组织图像,胃炎性病变组织图像的产生是由于患者通常在胃部产生了不适之后才会去医院进行检查,而通常情况下,胃炎的可能性比较高,胃癌的可能性比较低,所以我们认为胃炎性病变组织图像也是非胃癌恶性病变组织的类别。

初赛数据: 初赛数据集选手可以下载,提供训练集1798张和测试集600张,其中训练集包括1000张阴性样本和798张阳性样本,测试集中阳性样本和阴性样本数量不定;

训练集中只对阳性样本做了标注, 标注文件为单通道二值图,记录了胃癌区域的mask掩膜,前景值为255,背景值为0。

复赛数据: 复赛提供新的测试集(300张阳性样本),样本格式为JPG格式;

注意:初赛中由于图像切割保存成jpg格式的问题,标注图像边缘会产生0~9和246~255的像素值,训练集中需要大家把这个自己处理下,将1~9处理成0,246~254处理成255,测试集的标注结果已经修改,不存在此问题 ;

本次比赛将从数据安全角度保证医疗数据安全。本次比赛数据集将基于专门的数据安全脱敏软件,所有胃镜影像数据严格按照国际通行的医疗信息脱敏标准,进行脱敏处理,脱敏信息包括:医院信息、患者信息和标注医师信息,所有数据不可溯,切实保障数据安全,保护患者的隐私。

点赞
收藏
评论区
推荐文章
黎明之道 黎明之道
3年前
天池比赛数据挖掘心电图赛题理解
Datawhale零基础入门数据挖掘Task1赛题理解Task1赛题理解比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introduction1.1学习目标理解赛题数据和目标,清楚评分体系。完成相应报名,下载数据和结果提交打卡(可提交示例结果),熟悉比赛
2022“SEED”第三届江苏大数据开发与应用大赛
一、赛事简介江苏省工业和信息化厅、无锡市政府通过连续两年举办江苏大数据开发与应用大赛,已累计吸引到全球超过3800名选手参与其中,同时在医疗、能源、车联网、城市治理等前沿热门领域,均提供了大量经过数据全生命周期加工后的珍贵产业案例数据集,充分展现了无锡市数据开放、数据共享工作的成效。为进一步汇聚核心产业高价值种子数据集,促进公共数据共享开放,吸引数字化产业人
往届seed大赛(江苏大数据开发与应用)赛题分享
初赛阶段:针对胃癌病理切片,对发生癌症病变的区域进行像素级预测并对癌症类别进行分类。初赛将进行2种胃癌类别的检测任务,具体分为:1、识别出病理图片的癌症类别2、病理图片的病灶分割复赛阶段:与初赛阶段任务相同,但相较于初赛,复赛将进行3种胃癌类别(管状腺癌、粘液腺癌、乳头状腺癌)的检测任务。赛题数据与提交说明数据示例如下,每张小图包含一种胃癌类别。选手需要提
2022“SEED”第三届江苏大数据开发与应用大赛
一、赛事简介江苏省工业和信息化厅、无锡市政府通过连续两年举办江苏大数据开发与应用大赛,已累计吸引到全球超过3800名选手参与其中,同时在医疗、能源、车联网、城市治理等前沿热门领域,均提供了大量经过数据全生命周期加工后的珍贵产业案例数据集,充分展现了无锡市数据开放、数据共享工作的成效。为进一步汇聚核心产业高价值种子数据集,促进公共数据共享开放,吸引数字化产业人
Wesley13 Wesley13
2年前
COCO数据集的下载以及姿态关键点的数据处理
第一步、coco数据集下载链接不过还在罗嗦一句,第一组是train数据,第二组是val验证数据集,第三组是test验证数据集。数据包括了物体检测和keypoints身体关键点的检测。http://images.cocodataset.org/zips/train2017.ziphttp://images.cocodataset
2022年第三届seed大赛(江苏大数据开发与应用大赛)
一、赛事简介江苏省工业和信息化厅、无锡市政府通过连续两年举办江苏大数据开发与应用大赛,已累计吸引到全球超过3800名选手参与其中,同时在医疗、能源、车联网、城市治理等前沿热门领域,均提供了大量经过数据全生命周期加工后的珍贵产业案例数据集,充分展现了无锡市数据开放、数据共享工作的成效。为进一步汇聚核心产业高价值种子数据集,促进公共数据共享开放,吸引数字化产业人
2022“SEED”第三届江苏大数据开发与应用大赛--医疗卫生赛道
一、赛事简介江苏省工业和信息化厅、无锡市政府通过连续两年举办江苏大数据开发与应用大赛,已累计吸引到全球超过3800名选手参与其中,同时在医疗、能源、车联网、城市治理等前沿热门领域,均提供了大量经过数据全生命周期加工后的珍贵产业案例数据集,充分展现了无锡市数据开放、数据共享工作的成效。为进一步汇聚核心产业高价值种子数据集,促进公共数据共享开放,吸引数字化产业人
混世魔王 混世魔王
1年前
皕杰报表之数据集函数
所谓数据集函数就是与数据集相关,从数据集取数的函数。这些函数不仅可以将数据直接从数据集取出,而且可以将取出的数据分组、求和、求最大值最小值、求第一条数据和最后一条数据、求前n条数据以及对取出的数据进行按段分割,还能对列和记录进行统计。在皕杰报表中共提供了1
四儿 四儿
9个月前
大模型数据集:力量的源泉,进步的阶梯
一、引言在人工智能的繁荣发展中,大模型数据集的作用日益凸显。它们如庞大的知识库,为AI提供了丰富的信息和理解能力。本文将用一种独特的风格来探讨大模型数据集的魅力和潜力。二、大模型数据集:宏大的舞台大模型数据集如广袤的舞台,为AI技术的展现提供了广阔的空间。
四儿 四儿
9个月前
语音数据集:为AI注入听觉的力量
一、引言在人工智能的多元领域中,语音技术占据了举足轻重的地位。而语音数据集则为其提供了成长与进步的养料。本文将深入探讨语音数据集的重要性、种类、挑战以及未来趋势。二、语音数据集的重要性提供丰富的语言信息:语音数据集包含了各种语言、口音和语速,为模型提供了丰