内容简介
《食药质量安全大数据分析方法、原理与实践》从多学科交叉的视角对食药质量安全管理中的图谱检测大数据分析方法进行了介绍。主要内容包括:①食药质量安全大数据的来源及模态特点,尤其是近年受到普遍关注的图谱快速检测装备及技术;②介绍了信号处理领域*新的压缩感知理论和方法,以及面向新型检测硬件及物联网场景如何实现更加高效的信号采样和数据传输;③针对异构数据统一表征和私有数据格式的规范化问题,介绍了基于标准化领域本体的食药大数据存储和管理方法;④面向对象和领域应用的食药大数据分析和管理决策,通过多个具体案例探讨了机器学习与图谱检测相结合的管理决策新范式。
目录
目录
第1章食药质量安全数据的领域特点及研究现状1
1.1食药质量安全问题背景及研究现状1
1.2食药质量安全图谱检测大数据的来源及其领域特点13
1.3面向食药质量安全的图谱检测大数据生命周期17
第2章面向食药质量安全的图谱快速检测技术18
2.1面向食药质量安全的图谱检测技术介绍18
2.2离子迁移谱应用案例19
2.3MALDI-TOF MS应用案例25
2.4拉曼光谱应用案例30
第3章基于压缩感知的图谱数据采集和传输37
3.1采样定理及压缩感知37
3.2领域任务自适应的压缩感知39
3.3压缩感知自适应变换基的设计50
3.4数学符号和术语表58
第4章食药质量安全领域本体建模研究60
4.1本体建模的研究背景及研究综述60
4.2食药图谱数据的领域本体模型61
4.3基于标准化领域本体的食药图谱大数据管理系统67
第5章机器学习与图谱检测相结合的食药质量安全管理决策75
5.1机器学习与图谱检测相结合的管理决策新范式75
5.2多谱图数据的特征提取和融合方法77
5.3基于深度学习的预测建模研究86
5.4食药质量判别任务中的超参数优化研究95
第6章总结与展望101
6.1非结构化数据的分析101
6.2大数据伦理问题102
6.3大数据与新兴应用场景的结合103
参考文献105
后记126
试读
第1章食药质量安全数据的领域特点及研究现状
本章概要:*先介绍食药质量安全的问题背景和研究现状,通过文献计量分析,引出大数据驱动的管理决策新趋势和新范式。然后介绍了食药质量安全大数据的来源,特别是极具领域特色的图谱检测大数据,并介绍其领域特点及带来的*特挑战。*后提出图谱大数据的分析流程和生命周期,并引出本书的章节结构。
1.1食药质量安全问题背景及研究现状
食药质量安全是关乎民生的重大问题。以婴幼儿配方奶粉为例,自三聚氰胺奶粉事件以来,与奶粉相关的恶性事件仍然存在。此类恶性事件对食药行业和市场格局产生了深刻影响,导致消费者普遍对国产品牌信任不足,国有品牌遭受重创。食药质量安全已成为转型时期我国面临的重大民生问题。党的十九大报告重申“实施食品安全战略,让人民吃得放心”。党的二十大报告强调“强化食品药品安全监管”。
食药质量安全是一个涉及多学科的综合性研究领域。本节将对食药质量安全的几大研究方向和相关工作进行梳理,具体包括:关键因素分析、公共管理理论研究和研究趋势。
1.1.1食药质量安全关键因素分析
食品和药品的质量安全是涉及多个主体、多个阶段的复杂性问题,包括生产、分销、包装、保存等。同时,它也与多种因素有关,如监管、科技、金融、社会和环境因素。影响食药质量安全的因素涉及方方面面,非常复杂,但大致可以从表征因素、过程控制因素、制度因素三个方面进行归类。
(1)表征因素:影响食药质量安全的主要因素有六个方面:①水、土壤和空气等农业环境资源的污染;②种植业和养殖业生产过程中使用的化肥、农药、生长激素致使有害化学物质在农产品中残留;③农产品加工和储藏过程中违规或超量使用食品添加剂(如防腐剂);④微生物污染引起的食源性疾病;⑤新原料、新工艺带来的食药质量安全风险,如转基因食品的安全性;⑥科技进步对食药质量安全控制带来新的挑战。目前影响中国食药质量安全的主要因素是微生物污染所造成的食源性疾病,如沙门氏菌等引起的食物中毒;其次是农药、兽药、生长调节剂等农用化学品的不当使用,导致农作物和畜产品中农药、兽药残留超标,如瘦肉精事件等。
(2)过程控制因素:食药质量安全问题涉及生产、加工到销售的整个供应链过程。从过程管理的视角来看,导致食药质量不安全的因素主要有四个方面:生产过程中的不安全因素、加工过程中的不安全因素、包装容器对食药的污染、生产经营者在食药中掺杂使假。生产和流通对食药质量安全和农产品贸易的影响,主要源于当前中国消费流通领域的法规体系不完善、流通市场的规范化和标准化程度不高。食药质量安全控制的技术水平和管理水平低是导致流通环节二次污染的主要原因。另外,食药生产和流通链条中存在的信息不对称以及加工过程中的质量控制不完善是食药质量安全问题产生的主要原因。关于消费环节的食药质量安全问题及因素,主要在于不同特征的个体消费者对食药质量安全认知的程度和消费行为的特点不同,其中,收入、消费者的安全忧虑度、对健康信息的关注度等是造成差异的重要因素。
(3)制度因素:政府规制、管理制度等方面对食药质量安全问题的影响有其深层次的原因。将中美食药质量安全管理体制比较研究后认为,中国的质量安全体系在法律标准、组织体系、技术保障体系等方面尚存在差距。政府监管投入成本过高、监管体制与机制不到位、部分监管人员责任心不强、监管信息不畅、监测与预警机制失灵等是中国食药质量安全监管中存在的主要问题。中国食药质量安全管理存在的制度缺陷主要包括:缺乏专业的管理部门;生产者和消费者之间存在严重的信息不对称;食药质量安全制度缺乏创新激励;食药消费者只具有有限理性,生产者机会主义特征明显;制度执行不力等。
1.1.2食药质量安全的公共管理理论研究
由于食药质量安全公共管理体系是一个涉及政府、企业、消费者等各方面的复杂系统,不仅有技术层面的因素,还有经济、环境、制度等层面的因素。通过考察世界各国食品质量安全管理的理论与实践,在其纷繁复杂的表象背后,学者们建立了一系列的相关支撑理论,其中具有代表性的研究视角主要包括以下几个方面。
(1)食药质量安全管理的信息效率论:SouzaMonteiro和Caswell[1],以及Antle[2]认为由于食药安全信息属于公共物品,且往往具有不完全性,利用交易费用经济学和不完全契约理论,研究认为市场机制下监管政策效能的高低关键取决于合适的信息制度。乔娟[3]、刘增金等[4]的研究都表明,在没有外力干预的市场机制作用下,食品安全信息不对称会导致生产者的机会主义行为倾向;刘为军等[5]、王锋等[6]、Pillai和Chakraborty[7]则从信息不对称理论出发,研究了我国食品消费市场中的质量信息传递问题,并提出政府应建立食品安全的专门机构,以促进食品安全信息的有效传递。
(2)食药质量安全管理的主体行为论:对食品药品安全的有效监管是政府和企业对社会*基本的责任和必须做出的承诺,具有政治性、经济性、唯一性和强制性等[8];孙宝国等[9]、Mol[10]认为食品安全可看作是一种“社会约定”,具有社会性,明确主张政府应对食品安全负责;Trienekens等[11]从供需匹配效率方面分析了政府在食品安全市场准入制度的设计方面的作用;而Oosterveer等[12]则认为知识性消费者(具有获取信息、处理信息的能力)完全能断定产品的安全性,提出在具有完全信息的竞争市场和具有不完全信息但企业信用等级高的市场,消费者才是产品安全的责任人;Resende-Filho等[13]从消费者的质量安全偏好出发,探讨了生产企业的质量安全行为的差异性规则。
(3)食药质量安全管理的管制成本论:Hoffmann等通过发展中国家的案例发现食品质量与品牌价值呈现正相关,拥有品牌价值的企业通常具有更高的溢价收益和守法意识,相应的政府监管成本低于小微企业[14];Beske等[15]用经济工程法,证明了食品安全成本中的质量成本是日益增加的;Manzini等[16]在激励契约绩效研究中,具体探讨了政府保证食品安全的价格贴水模型;Lam等[17]对食品质量安全的政府管制成本进行了研究。
(4)食药质量安全管理的数据标准论:20世纪80年代中期之后,学者们纷纷从经济学、战略管理学、法学和政治学等角度对食品质量安全技术标准的可行性问题展开了广泛而深入的研究[18-25]。vanAsselt等[21]指出食品安全的保障机制依赖于生产技术标准的国际化;Dabbene等[25]认为生产技术标准是食品安全的基础标识,建立了完善的室间质量安全评价和室内质量安全控制数据比对计划(美国等国家是以法律法规来规定的),对检验结果的质量安全评估和质量安全控制起到积极作用。每类产品都对应着相应的指令、认证模式及测试方法,并由公立主管当局负责市场监督。美国将合格评定的重点放在协调全球范围内食品数据标准应用的有效性方面,其战略目标是使食品安全满足消费者健康、公共安全、国家安全和社会环境安全的需求。
可见随着食药质量安全公共管理面临的原料全球化、工艺快速化、感官相似化、数据离散化、质量隐形化、偏好多元化等决策信息的特征不断变化,决策环境已经由确定型向不确定型转变,决策过程正在由结构化向非结构化过渡,因此大数据驱动的新范式可为食药质量安全的公共管理提供系统的解决思路。
1.1.3食药质量安全的研究趋势
1.发文量增长趋势
国外数据来源于WebofScience数据库的核心合集,国内数据来源于中国知网平台收录的中国科学引文数据库(ChineseScienceCitationDatabase,CSCD)和南京大学中国社会科学引文索引(ChineseSocialSciencesCitationIndex,CSSCI)数据库的期刊论文,检索时间为2021年11月。在WebofScience核心合集检索框的“主题”字段中检索:(machinelearningORbigdataORdeeplearningORontolog*ORneuralnetwork*)AND(traditionalmedicin*ORmedicinalmaterial*ORfoodORherb*)AND(detect*ORidentif*),可以检索到3565条文献记录,为确保文献数据的质量和相关度,将检索结果的文献类型限定为期刊论文,去除书评、会议论文等其他文献。在对检索结果进行精炼以后,还保留了3204篇论文。CSCD和CSSCI分别收录了中国自然科学与社会科学领域的重要期刊,这两个数据库的检索结果基本可以涵盖国内食药大数据研究的主要领域。在中国知网期刊数据库通过专业检索功能检索“SU%(人工智能+机器学习+神经网络+大数据+深度学习+本体+算法+图谱+快检+快速检验+分类器)ANDSU%(检测+识别+鉴定)ANDSU%(食品+药材+中药)”,来源类别限定为“CSSCI”和“CSCD”,时间范围为系统默认年限,可获得1434条文献记录。对国内外该领域发文量初步的统计结果如图1-1所示,显然国外该领域的发展势头更强。
图1-1食药质量安全国内外发文量增长趋势
2.国外相关研究热点分析
运用文献计量分析工具VOSviewer对中英文的文献题录数据进行分析。VOSviewer是由荷兰学者NeesJanvanEck和LudoWaltman共同开发的分析工具,该软件可实现对标准化的文献题录数据进行自动化提取和处理,实现关键词共现分析,可用于探究学科领域的研究现状与趋势。
从国外食药大数据研究文献中共提取了16106个关键词,频次在5次以上的关键词共有998个,通过VOSviewer软件的关键词聚类功能大致可获得以下聚类(关键词共现网络见图1-2,高频关键词见表1-1):食药检测结果的分类与预测、机器学习、深度学习、大数据与本体、基因表达、网络药理学、营养学。以上聚类可以进一步合并为三大主题:一是共现网络左侧包含三个聚类的食药大数据技术与机器学习方法在食药检测分析中的应用研究主题,主要研究各类新技术和方法与食药传统检测分析方法的结合和应用;二是共现网络中间区域的大数据分析方法在食药供应链、舆情与消费行为需求中的应用研究主题,主要基于文本数据与机器学习方法展开研究;三是共现网络右侧包含三个聚类的大数据分析方法在食药活性成分与作用机制分析中的应用研究主题,主要研究新技术在食药领域其他情景中的应用,旨在解决基因表达、药理分析与食药质量安全治理管理决策等具体问题。下面对三大主题分别展开介绍。
图1-2国外关键词共现网络
表1-1国外高频关键词
一是大数据技术与机器学习方法在食药检测分析中的应用。该主题的高频关键词有identification、classification、prediction、food、quality、discrimination、artificialneuralnetwork、chemometrics、electronicnose、neural-network、machinelearning、model、selection、randomforest、performance、deeplearning、system、agriculture、artificialintelligence、convolutionalneuralnetwork等。
对食药成分、污染物进行识别、分类与预测是食药领域应用大数据分析方法开展研究的主要目标,而机器学习方法则是实现这些目标的主要手段,因此,本书第5章将介绍机器学习与图谱检测相结合的管理决策新范式。