最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

大数据能否彻底改变食品安全?

[复制链接]
跳转到指定楼层
楼主
发表于 2017-7-29 10:57:53 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
来源: 荣格工业传媒
大数据”无所不在,并被到处谈论,包括越来越多地涉及到食品安全和食品质量方面。例如,在国际食品保护协会(IAFP)2014年年会中,只有一个关于“大数据”的专题研讨会;而在最近的2015年年会上,至少有四个会议的标题或摘要里出现了“大数据”。





虽然,利用大数据和数据分析的潜力,能够提高我们解决食品安全和质量问题的能力,但我们也越来越多地认识到,这些工具在食品安全和质量方面的能力仍然是有限的。即使在这一领域使用“大数据”,许多人可能还会认为在这种情况下,其中只有很少的数据量符合真正意义上的大数据,而许多数据可能往往只是传统的大型数据集。尽管大数据只是慢慢地以它们的方式进入到食品安全和质量领域,但仍有必要让食品科学专业人士讨论和考虑大数据及相关分析所带来的影响,以便能在食品安全和质量管理上及时、适当的实施和使用这些工具,从而实现决策的改进。


1有关大数据的简介
虽然存在许多关于“大数据”的定义,但有一个共同的定义是:“大数据”是一个广泛的巨量数据集,如此大或复杂的海量数据,以至于传统的数据处理应用程序还不能够管理和处理(维基百科,2015年8月3日)。基于Douglas Laney“3V”的数据定义,今天的大数据定义经常使用“4V”,可以概括为“大数据是具备大数据量(high volume)、高变化速度和/ 或高度多样化(high veracity, and/or high variety)的信息资产,这些信息资产需要新型的处理方式来强化决策制定、洞察发现和处理优化。”通常情况下,“大数据”也被链接到预测分析,相比食品安全典型的数据使用情况,其重点是追溯识别和越来越多的实时或接近实时的监测过程。大多数大型数据集和大数据分析的应用,目前主要专注于为食品安全和质量提供更好的追根溯源和回顾性分析,但在食品安全方面,开发和进行预测分析很可能在不久的将来迎来快速增长。

2食品大数据的来源
许多大数据的早期讨论都集中在基因组学数据的使用,以及社会媒体相关的食品安全信息。用于创建大型的数据集,基于全基因组测序(WGS)的子类别已经使用了5年多,而用于高分辨率亚型食源性病原体和食源性致病菌的数据,可以更好的进行疫情检测和源属归因。重要的是,WGS数据中的食源性致病菌,也往往会迅速通过公共卫生和监管机构发表,并允许行业使用这些数据。例如,正如2015年初所报道的,WGS数据中,来自于堪萨斯州的冰淇淋中检测出含有李斯特菌菌株,数据公开后不久,即在堪萨斯州爆发了李斯特菌病的案件,从而将疫情与冰淇淋关联起来。其他组学数据集,如宏基因组学数据,也已经被用于鉴定和辨别食品变质问题。很可能这些类型的数据源将越来越多地成为食品工业可用的数据。

利用社会化媒体相关信息,人们在很早就已表现出了相当的积极性,初步报告认为:“谷歌流感趋势”(Google Flu Trends)可能有助于及早发现流感疫情。随后的研究表明,尽管这个工具可能会经常不准确地预测流感的爆发,然而,美国疾病控制与预防中心最近的一份报告表明,挖掘Yelp 的评论可以帮助公共卫生机构确定食源性疾病爆发的源头,并链接到本来可能未被发现的相关餐厅。同样,销售数据,包括来自于购物者俱乐部和类似机构的数据,亦可用于多家零售商和企业,能够用来帮助检测和识别食源性疾病的爆发,帮助产品快速召回和其他消费者安全行动的快速启动。

除了以上简要讨论的数据来源,食品安全专业人员也能有机会访问相当数量的其他结构化和非结构化数据的来源,通常包括大量的、通过记录设备自动捕捉于食品加工和零售环境的数据(例如,热处理步骤或冷藏的温度数据);以及就业数据(确定某个人、在给定的一天,执行某项任务,如卫生任务)。挖掘相关信息的非结构化数据,包括但并不仅限于视频捕获的设施和员工数据。


这些数据可以迅速获得,而且往往没有成本(除了计算机和人员时间),这些大型元数据集将会与已收集的微生物或其他测试的样品数据相关联。例如,公共数据源提供的天气模式(温度、降雨事件、风向和速度等)与样品采集地点和特定样品采集的日期相关联。这些类型的数据可以用来快速确定超出规格的样品(例如,样品呈阳性病原体或指标生物)是否与特定的天气模式(例如,前一天或多天有雨)相关,这有助于进行根本性原因的分析。例如,与降雨有关,可能表明屋顶渗漏或其他因水而起的根本性原因。这些相同的元数据也可被用于预测分析,在特定的天气模式可能显示发现病原体或腐败事件的风险增加,并由此可能引发加强预防性的工作措施。

3该方法在食品中的实例
在食品安全中使用大型数据集最成熟的案例之一,是由公共卫生和监管机构基于WGS子类型分析方法的使用。在美国,疾病预防控制中心和国家合作伙伴正在执行 WGS对每个人进行临床产单核细胞李斯特菌分离。同样,美国食品药品管理局等监管机构当前正在执行来自于食品及有关食品来源的WGS食源性病原分离。WGS将确定李斯特菌单核细胞基因组几乎所有的300 万个核苷酸序列图谱(A,T,C 和Gs),且通常至少具有20 倍的覆盖范围,因此每个基因组会产生60 亿个数据点,用于极高分辨率子类型。这些 WGS 工具的使用,大大改善了公共卫生机构检测人类李氏杆菌病爆发的能力,相比以前的子类型分析工具(即脉冲场凝胶电泳),更多疫情可能在未被发现前就已进行检测与鉴定,包括小规模爆发(少于5例)的情况。鉴于这些工具正被应用于其他病原体,特别是沙门氏菌,这些由其他病原体引起的疫情被发现数目也将可能增加。

除了WGS,以宏基因组学为基础的工具,还提供大型数据集(通常提供序列数据的亿个碱基),它可以帮助表征总样本的微生物种群。这些工具已被允许用于在临床和食物样品中检测新的或先前未识别的病原体;而且已被证明能够检测到由传统的微生物学方法检测不到的病原体。这些方法也可有利于检测和识别腐败变质的问题,并可以用作无针对性的筛选工具,用于原料流和配料成分。


使用地理信息系统(GIS)的数据集来预测和管理食品安全风险也得到迅速地推广。例如,最近的研究表明,GIS数据可用于预测位置和时间间隔,这预示了某些领域食源性致病菌污染的风险可能更高。

4面临的挑战
尽管,在改善食品安全和食品质量的途径方面,以大数据为基础的方法有着明显的相当大的潜力,但是对于业界而言,利用这些工具的优势仍然存在许多挑战。虽然大多数挑战并不是食品行业独一无二的,但其中一些可能会更加明显。例如,在食品工业中的许多数据采集仍然常常使用人工,并且还往往涉及不易用于数据挖掘的纸质记录。然而,只有少数训练有素的数据科学家同时也熟悉食品系统类型等问题(或是说很少有能配合大型数据集工作的食品科学家),能够利用大数据解决食品安全和质量问题,进而影响产业的发展能力和系统的有效实施。鉴于这些挑战,业界已明确需要采取行动,准备利用大数据工具及其解决方案来解决食品安全和食品质量的难题。

5未来能给我们什么?
随着大数据收集和分析的快速发展,这些工具越来越多地应用于食品安全和质量,用它来推测“未来的中长期可能是什么样子”将是很有价值的。例如,使用WGS 进行食源性病原体分离株鉴定的监管和公共卫生机构,已经在美国将完整的测序数据快速且公开地发布出来。这使得该行业有了用武之地,它也许很快就能监测人类临床分离株子类型的数据,并通过子类型数据与其它处理设施和其它数据(例如,分销途径、购买模式)的分离株进行比较,对可能爆发疫情的地点进行快速检测等。在加工环境中,整合不同的数据源与历史微生物测试数据,不仅可以提高和加速根本原因分析,也能用于预测时间间隔对腐败或食品安全问题可能呈现的降低或升高的风险;这些信息可用于调整食品安全和在操作规范,包括增加额外的障碍与控制,诸如预防性维护时间表的调整等。能够用于这些分析的数据源,包括天气模式、设施的环境参数(监测湿度、寒露点等)和设备的相关参数(振动、 流量等)。

随着这看似近乎无限的可能性,行业审慎评估其需求和具有较高影响的领域,并确定具体的问题和事项是必不可少的。我们并不是简单地收集日益庞大的数据集,并希望“一些有用的东西会自己呈现出来”。


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-1 17:38

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表