「肺炎X光病灶识别」挑战赛几行代码就能让医疗检测准确率20%的提高!

语音播放文章内容 由深声科技提供技术支持 您的浏览器不支持 audio 元素。

雷锋网 AI 开发者按:自 2017 年 7 月国务院印发《新一代人工智能发展规划》以来,中国人工智能技术得以迅猛发展,并在金融、医疗、教育、交通、社交等领域快速推广。

整个比赛的评审完全透明化,我们将会对比选手提交的 csv 文件,确认正确分辨图片数据,并按照如下公式计算得分,其中:

雷锋网原创文章,。详情见转载须知。

肺炎 X 光病灶识别

尤其在医疗这个拥有海量数据、严格判断规则且存在大量重复性劳动的现实场景中,人工智能的特性完全契合了这些工作需求,并发挥着重要的作用。

当地时间2018年11月2日,美国得州Hidalgo,中美洲移民大军压境美国,美国士兵在美墨边境安装铁丝网严防移民入境。

最终提交结果文件如下所示,其中,第一个字段位:测试集图片 ID(注意 ID 即文件名是从 0 开始的);第二个字段:病灶数量(0、1、2、3、4)。

而除了肺炎外,人工智能算法也能根据 X 光片,诊断出其它疾病,包括:纤维变性、疝气以及细胞团块等;它能够高效分析 CT 头扫描疑似中风,并标记那些更容易出现脑溢血的人,然后将它们集中起来供放射科医师重点检查。

据悉,美墨边界被捕的移民每到年末都会减少,次年春天又重新升高,但今年5至11月的降幅为21世纪以来最大一次。

分析称,该数据显示特朗普政府修改移民庇护政策和墨西哥减少移民涌入美国的努力取得成效。

甚至这种算法还可以帮助发现乳腺 X 光图像中那些放射科医生肉眼难以发现的乳腺肿瘤。并且值得一提的是,数据显示人工智能的诊断准确率也高于国立卫生研究院的基准线。

大赛基础奖金池为 2000 元,比赛一共设置了三种奖项,包括了:参与奖(30%)、突破奖(20%)、排名奖(50%);三种奖项互不冲突,而优秀的选手(比如你),当然也是可以直接一次性全部拿走哦!

据报道,2018年被捕的移民多为中美洲移民的家人和无人陪伴的小移民,他们越境后几乎都立刻申请美国的庇护。今年春季大量移民涌入,政府因无力处理和提供安全卫生的居住环境而酿成人道危机。

移民政策研究所认为,特朗普政府“在墨西哥等候”的政策,是边界被捕移民大幅减少的最重要因素之一,此外还有墨西哥在特朗普加征关税的威胁下,开始在与中美洲国家边界加强执法。

早在 17 年时,吴恩达等研究者借助国立卫生研究院公布的 10 万幅 X 光片对人工智能算法进行训练,就能使该智能体在短短两个月的时间,检测精度超越放射科医师水平。

雷锋网 AI 开发者  雷锋网(公众号:雷锋网) 

AI 病理诊断技术可大幅缩短医生的工作量,提高放射学、病理学等依赖医学图像支持的专业的诊断效率和准确性。因此,AI 研习社这次以 AI 医疗为主题,开设了「肺炎 X 光病灶识别」挑战赛。

首先是数据挖掘,主要应用于数据采集环节。在这一部分,人工智能需要从大量的数据中自动搜索其中与病理特征有着相关性的图像信息;而高质量的数据资源正是进行有效算法开发的关键。 其次是图像识别,主要应用于数据分析环节。通过对影像等多媒体医疗非结构化数据的识别与分析,从而实现对具有临床意义信息的提取。 最后是深度学习,主要应用于学习和分析环节,也是整个 AI 诊断中最核心的环节。正因临床医学能够提供极为丰富的相关数据,利用深度学习对人工智能(AI)进行训练的难度就越低,它可以达到较高性能,应用也十分灵活。

特朗普政府要求庇护申请人“在墨西哥等候”的政策今年1月实施后,已有54000人被送回墨西哥,而以前则是在美国释放。

正是由于 AI 具备对大量数据学习与判断的能力,通过对大量 X 光片数据集的训练,智能体能够在很短的世界内达到接近人类的识别准确度。

当地时间2018年6月12日,美国德克萨斯州麦卡伦,一名两岁洪都拉斯小女孩与妈妈在美墨边境被拦截。

True:模型分类正确数量 Total :测试集样本总数量

但批评者指出,“在墨西哥等候”的政策迫使庇护申请人在犯罪率高、资源少的墨西哥城市长期等候,导致部分符合庇护条件的移民放弃申请。人权组织的统计显示,“在墨西哥等候”的政策实施后,移民被绑架和受到攻击的公开报道达636起。

可以看到,在临床应用中的 AI 医疗核心流程即:以传统医疗手段中采集到的医疗数据作为基础,通过这些数据对人工智能进行相应的训练,然后根据临床治疗经验建立人工智能医疗图谱。当然,由于应用场景、病种、病程等不同,病理数据的获取、分类也将有所区别。

大赛主页提供了「肺炎 X 光片」相关的数据集,包括了训练集 20013 张以及测试集 6671 张。比赛任务也非常明确:只需编写相应代码,训练模型完成对测试集图片内容的正确识别即可~

当然,AI 医疗远不止识别 X 光片、判断病情,它还可以帮助医生有效提高病例录入效率、辅助医生进行药物研发、提供诊疗方法参考等。

Ps:建议使用 UTF-8 编码,共计 6671 个结果,因为数量不足可能导致无法评分哈~

每日 24:00,我们也会将最新结果更新在官网排行榜上,你可以随时随地查看自己的排名情况。

除此之外,在这一挑战赛中,我们也向大家免费开放了珍贵的 GPU 资源;只要报名之后,点击页面右侧的「获取免费云训练资源」,即可任意使用。

CBP代局长摩根表示,特朗普重视中美洲移民大规模涌入的问题,逮捕移民大幅减少显示特朗普的政策已经奏效,并将继续发挥作用。

训练时长短、准确度高的 AI 医疗

从这些实例中我们会发现,AI 医疗的应用非常广泛,但 AI 病理开发环节主要涉及到了三个部分,包括了:数据积累、算法开发、场景应用环节;而这三大环节所包含的 AI 病理诊断及医学影像识别核心技术,其实也主要涉及到三部分: