一、基于幂集的关联规则挖掘算法研究(论文文献综述)
崔晨[1](2021)在《基于领域知识的异常值处理算法研究》文中研究指明
侯家麒[2](2021)在《基于关联分析和集成学习的慢性病多标签分类算法研究》文中研究指明近年来慢性非传染性疾病对人类健康的威胁日益增大。各类慢性病因其复杂的发病过程,很难确定疾病的发病时间。慢性病的早期筛查和确诊是公认的降低慢性病危害的有效办法,只有通过定期的体检来尽早发现诊断慢性病。伴随医疗信息化的建设不断深入,大部分医疗机构已经存有大量医疗健康数据。在这个前提下,逐渐成熟的人工智能技术为慢性病早期的筛查和诊断提供了有力的工具。近年来,针对各类慢性的研究逐渐增多。本文以体检数据为研究对象,针对现有的慢性病研究中存在的疾病关系考虑不充分、预测结果单一等问题,对肥胖症、脂肪肝、糖尿病等10种慢性病进行深入分析,提出了用于多种慢性病的多标签预测模型,并在数据集上进行性能评估与验证。本论文主要研究内容和成果包含如下:(1)基于诊断文本的疾病提取模型。由于操作不当、人员疏忽等因素,数据集中对同一疾病的描述不同。为解决这一问题,本文提出基于Word2Vec的疾病提取模型,收集大量医学相关语料库,训练医学词向量模型,实现疾病名称提取。(2)基于聚类分析的多疾病关联规则挖掘。分别利用K-Means和DBSCAN聚类方法对64种疾病进行聚类处理,再利用FP-growth算法对每个簇中的疾病进行关联规则挖掘,深入挖掘不同疾病之间的关联关系。(3)基于Bagging的多标签分类集成预测模型。各类慢性病之间存在依存关系,大多数患者同时患有多种慢性疾病。现有研究多数针对单一疾病进行预测,没有充分考虑不同慢性病之间的关联关系。因此,本文采用多标签学习算法对多种疾病进行同时预测。首先提出基于神经网络的多标签学习模型ML-NN,为了进一步提升模型的稳定性,提出了基于Bagging的多标签分类集成模型(BMCE),该模型基于本文提出的多标签神经网络模型,再结合两个成熟多标签算法,对三个模型分别进行Bagging集成,在此基础上对三个Bagging模型的结果通过Stacking方法进行整合形成最终的多标签预测模型。经过实验验证,本文提出的ML-NN相较于其他多标签模型具有较好的性能,而BMCE则进一步提升了预测性能,优于常见的多标签模型。最后,实验证明将BMCE与疾病关联规则结合可以再次提升模型性能。
赵震宇[3](2021)在《基于关联规则挖掘的同态加密算法研究》文中提出随着大数据成为国家基础性战略资源,许多企业和组织希望从海量数据中取得经济利益,并为用户提供便利。对于大多数企业和组织来说,他们没有处理海量数据的能力。因此,将数据挖掘任务外包给云计算服务机构有效地解决了这些企业和组织计算和存储容量不足、资源利用不足和资金投入等问题。但随之而来新的安全隐患,核心问题是数据所有者不希望自身敏感信息被别人知道。因此,隐私安全问题是海量数据挖掘技术应用的主要瓶颈之一。频繁项集和关联规则挖掘技术作为数据挖掘最重要技术之一被广泛应用于商品推荐系统、金融行业预测中和医疗数据分析中。在这些应用中对隐私保护要求较高。本文针对外包关联规则挖掘这一场景,通过对经典的Paillier同态加密算法进行加强,使其满足同态乘法,从而能够对密文处理复杂的计算,并提出完整的隐私保护关联规则挖掘方案。主要工作如下:(1)在原始Paillier同态加密算法基础上对其进行加强,利用Paillier的加法同态性质和数乘同态性质,实现乘法同态计算从而满足全同态加密,并设计了安全比较方案。改进后的Paillier同态加密方案称为FH-Paillier同态加密方案。与原始Paillier同态加密算法相比,在保留原有安全性的条件下,可以在更复杂计算场景下应用。(2)基于FH-Paillier加密算法,提出了完整的隐私保护外包关联规则挖掘方案。方案通过插入虚假数据扰乱原始数据库的信息,可以应对频率分析攻击。并使用FH-Paillier同态加密算法加密数据标签值,保证敏感信息不被泄露。频繁项集和关联规则的挖掘采用基于Map Reduce框架改进的并行算法MREclat对数据进行挖掘,该算法在各个站点之间无需通信,并且I/O次数较少。通过理论和实验对提出的方案进行反复论证和分析,实验表明,该方案具有较高的安全性和效率。(3)针对Paillier加密算法在加密和解密时可能出现计算过载,基于中国剩余定理对Paillier加密算法进行改进,研究并提出了一种改进的加密和解密方法。具体来说,利用中国剩余定理提升加密和解密过程的运算效率,并证明了算法改进后的理论正确性和准确性。实验结果表明,该方法具有较高的解密速度。
刘凯峰[4](2021)在《基于非平衡医疗数据集的关联规则挖掘方法研究》文中研究表明近年来,随着医疗数据量的暴增,运用数据挖掘方法从数据中获取潜在的、有价值的信息受到了医疗界和科研人员的广泛关注。其中,关联规则挖掘由于其可以有效地揭示数据背后隐含的规律,而成为了医疗数据挖掘领域的研究热点。本论文围绕医疗数据挖掘在不平衡数据集的应用展开了研究,提出了“先平衡后关联规则挖掘”的方案。具体研究工作如下:1.针对现有的关联规则挖掘研究未考虑医疗数据集中存在的数据不平衡问题,提出了基于K-means的数据平衡处理方法。实验结果表明,相较于已有的SMOTE算法,本论文提出的平衡处理方法具有更好的处理效果。2.考虑到Apriori算法和现有改进算法存在忽视权重以及重复扫描数据库等问题,本论文提出了基于随机森林加权的矩阵关联规则方法。该方法利用随机森林算法为数据集中的各项分配权重,并引入矩阵理论,将事务数据集转化为矩阵形式后进行存储,从而提高运行效率。实验结果表明,提出的方法有效提高挖掘效率,并减少了冗余规则的产生。3.在上述数据挖掘方法的基础上,设计了骨质疏松数据集的整体挖掘方案。在专业医师的指导下,完成了规则的提取和分析,为疾病预防提供了一定的参考价值。
吴佳慧[5](2021)在《机器学习中隐私保护数据计算研究》文中进行了进一步梳理随着云计算与分布式计算的发展,数据挖掘和深度学习等机器学习算法已能很好地结合大数据的优势,训练出更加精确的模型。因此,云外包学习和联邦学习成为当下流行的两种大数据机器学习范式。然而,在云外包机器学习和联邦学习过程中,要求数据拥有者提供原始数据或共享局部数据的训练参数,这些信息的提供均存在大数据隐私泄露的风险。例如,从医疗、金融等采集的大数据可能会泄露私人数据,包含个人基本信息、患者病历、经济信息等,一旦被披露,个人的生命财产将受到严重威胁。因此,研究云外包机器学习和联邦学习中隐私保护的大数据计算方法具有重要意义。本论文研究云计算环境下多数据拥有者的联合关联规则挖掘和分布式多客户端环境下的联邦深度学习中的隐私安全计算问题。论文分析现有的各类攻击方法,设计出安全数据加密算法。针对联合关联规则挖掘和联邦学习的各自特征,设计出各自特定的适用于加密数据的隐私保护数据计算方案。两种机器学习方法中,客户端提交给云服务器的原始数据均为加密数据,云服务器对加密数据进行计算,并返回加密形式的预测结果给客户端。论文证明了所提出的机器学习模型的适用性并评估了它们的性能。实验结果表明,论文中提出的方案能够提供准确的隐私保护关联规则挖掘和深度学习分类。本论文的主要研究成果是:(1)设计了数据库模糊方法,以保证数据挖掘效率。为了确保数据挖掘和深度学习的精度,论文的隐私保护计算均在密文数据上进行。考虑联合数据库的数据量非常庞大,无论是对数据的加密还是对加密数据的计算,所需的算力和存储消耗均会很大。因此,论文中并不是直接对数据集进行加密,而是设计一种数据库模糊方法,即在数据库中插入虚假交易以混淆敌手,从而保证数据库的隐私安全性;同时,为了保证数据集的可用性(可进行数据挖掘计算),需给每条交易标记一个标签,真实交易的标签为1,虚假交易的标签为0。这样,数据挖掘结果由插入虚拟交易后的数据库挖掘的结果和标签共同决定。(2)设计了多密钥同态加密机制,以防止在数据挖掘与深度学习过程中,多联合方的窜某攻击。具体地,论文设计了一种多方协商的秘钥划分方法,并基于该方法设计出两种同态加密算法:采用指数乘的对称同态加密算法和基于椭圆曲线的加法同态加密算法。论文利用指数乘的对称同态加密算法加密待挖掘数据库的标签,并设计出用于数据挖掘的安全比较算法,使得多方联合挖掘能够顺利进行。论文基于椭圆曲线加同态加密设计隐私保护机制,用以掩盖每个客户端的局部梯度,使恶意敌手和半可信云难以推理数据集原始信息。所提出的隐私保护机制在保持训练模型高预测精度的同时,很好地平衡了安全性和效率。(3)设计了一种数据同态验证机制,以防止联邦学习中的全局参数被恶意敌手/云服务器篡改。该机制允许各分布式客户端验证从云服务器端获取的聚合密文是否为所有联合客户端的局部数据密文的融合。因此设计的同态验证方法需要能对同态计算进行验证。具体地,论文设计基于椭圆曲线的同态hash函数,该函数能将任意长度的输入数据转换为固定长度的输出摘要,且该函数满足同态属性,即对输入数据的计算操作可直接转移到对摘要的计算操作;同时,由于hash函数的抗碰撞性,敌手不能根据摘要猜测出原始函数输入,也不能在无密钥情况下同时篡改输入与摘要。因此,基于设计的椭圆曲线的同态hash函数构建的验证机制可以用来验证来自敌手/云服务器的全局参数(即聚合梯度)是否正确。(4)设计了一种快速同步随机梯度下降(F-SSGD)方法,以保证联邦学习的在多客户端异质情况下,模型的快速训练和训练收敛。该方法可保证当联邦学习中的各客户端算力存在差异或客户端数据分布不一致时,联邦学习模型能快速收敛。具体地,在F-SSGD中,设置了一个时间周期,在此期间,算力较强的客户端可以继续计算多个本地梯度,而无需等待速度较弱的客户端;而算力较弱的客户端加权他们的多个梯度副本,以确保训练收敛,并防止最终模型偏向执行计算最快的客户端。在达到设定的时间周期之后,所有的客户端都将它们的本地聚合梯度提交到云上进行模型更新。实验和理论证明了F-SSGD方法可保证联邦模型的收敛,且收敛速度为O(1/M),其中M为迭代次数。
郝爽[6](2021)在《基于矩阵的增量式关联规则更新算法研究》文中研究表明关联规则挖掘是数据挖掘非常重要的研究领域,通常用于发现数据背后隐藏的关联关系。传统的关联规则挖掘算法用于处理静态数据库,对于动态变化的数据库处理效率低下。为了提高关联规则更新的效率,增量式关联规则更新算法成为学者们研究的热点。到目前为止,国内外的专家学者们提出了许多增量式关联规则更新算法,大致可分为基于Apriori的算法和基于FP-Tree的算法两类,前者需要多次扫描事务数据库,时间开销巨大;而后者会生成大量的条件FP-Tree,空间开销巨大。在基于Apriori算法的增量更新算法中,FUP(Fast Update Pruning)算法是一种解决在事务数据库中增加数据集情况下挖掘新的关联规则的经典算法。FUP算法利用了已挖掘到的频繁项集信息,减少了大量的重复计算。然而,该算法计算项集的支持度时还是需要扫描整个事务数据库,候选项集的连接与剪枝效率不高,当事务数据库很大时,此操作会成为该算法的性能瓶颈,降低频繁项集的挖掘速率。为了解决上述问题,本文重点研究当事务数据库大小发生改变时,新的关联规则如何快速更新。本文在FUP算法的基础上,提出了一种新的增量式关联规则更新算法FBBM(FUP Algorithm based on Boolean Matrix)算法。该算法使用布尔矩阵对事务数据库进行优化,只需扫描一次事务数据库,降低性能开销。此外,优化对原有关联规则信息的使用方法,使得在增删数据集的情况下都能充分利用原有关联规则信息以避免比不必要的重复计算。针对于传统候选项集的连接与剪枝效率低下的问题,本文通过分析候选项集的产生机制,利用频繁2-项集矩阵及其支持矩阵对项集进行判定和筛选,提高候选项集的连接效率和减少项集支持度计算量。使用公开数据集对改进后的算法进行测试,并与已有的经典算法进行对比。实验结果表明,改进后的算法在关联规则更新效率方面有较大提升。
江雨欣[7](2021)在《高速铁路运营安全评估关键方法及工作流程研究》文中研究说明自2008年京津城际铁路开通至今,我国高速铁路已走过十余年的运营历程。十年间,尽管我国高铁安全形势基本保持稳定,高铁行车事故得到有效控制,但高等级事故风险依然存在,诸多隐患亦不容忽视。安全评估是安全生产管理中的关键环节和有效方法,也可以成为保障高铁安全运营的重要手段。目前铁路广泛应用的事故分析方法、安全评估方法大多沿袭普速铁路的模式,缺乏定量化的精准评估分析手段,越来越难以适应我国高速铁路场景日益复杂、规模庞大的运营现状,其科学性、准确性与有效性也难以保障。因此,围绕高速铁路运营安全评估现状展开系统化的深入研究具有重要的理论与现实意义。本文从高速铁路运营安全规律分析、事故致因分析、评估方法、工作流程等方面展开了研究,具体内容如下:(1)调研分析我国高速铁路运营十年安全现状,开展高铁运营安全资料收集和整理。在此基础上,运用安全系统论和方法论,初步分析高速铁路运营安全规律,并进行可视化展示,掌握高速铁路运营事故的总体特征。(2)利用数据挖掘理论及方法,建立高速铁路运营安全事故致因关联规则挖掘模型,开展事故致因机理研究,揭示事故致因因素之间的复杂关联与本质规律,并以某条高速铁路线路运营十年间所发生事故的有关数据信息为样本进行了实例分析验证。(3)基于安全系统工程的理论与方法,开展高速铁路运营安全评估定量方法研究。通过引入直觉模糊集、交互式群评估、三角白化权函数等多指标综合评估概念,建立高速铁路安全组合评估模型,进而以某条高速铁路外部环境为分析评估对象,开展模拟分析与评估,验证了模型的有效性。(4)高速铁路运营现状安全评估工作流程研究,提出了高速铁路运营现状安全评估的工作范围及主要内容、工作流程、评估组织模式、可供采用的依据及标准等。本论文提出的安全评估相关方法与模型,可以有助于指导高速铁路运营安全管理,为我国高速铁路领域建立安全风险分级管控和隐患排查治理双重预防机制、更有效地开展高等级事故预防提供技术支持。
王谦[8](2021)在《基于时态参数类化软集的极大关联规则挖掘及应用研究》文中指出数据挖掘泛指与数据库中知识发现相关的一切分析方法和算法过程,旨在从数据集中自动识别和提取出隐藏于其中的关联规则、潜在规律或模式等多种形式的知识,进而引导各类实践活动中的决策、控制和行为.在“数据爆炸,知识贫乏”的大数据时代,如何从海量数据中提取出有价值的知识受到了前所未有的关注,数据挖掘这一研究领域蓬勃兴起,推动了数学、计算机科学和人工智能等学科的交叉渗透.关联规则挖掘是数据挖掘中最关键的技术之一,其目的是从交易数据集中发现频繁项集,以及不同项集之间潜在的关联规则.极大关联规则作为常规关联规则的有益补充,有助于揭示常规关联规则挖掘中被忽略的特异性内在关联.极大关联规则挖掘能有效降低冗余规则数量,并剔除无效规则.应当指出,软集理论作为处理不确定信息的有力数学工具,在数据挖掘过程中可从对象论域和参数空间两方面来描述不确定性,从而实现更为全面的数学描述与信息处理.此外,传统关联规则挖掘技术并未考虑时间因素的影响,但在许多实际的应用场景中数据会随时间产生动态变化,数据中蕴含的关联关系相应会随时间变化.本文定义并研究了时态软集、时态参数类化软集及其基本性质,提出了时态极大关联规则这一新规则模式,研究了时态极大关联规则的软集描述方法,提出了基于时态参数类化软集的极大关联规则挖掘算法,研究了该算法的运行效率、阈值敏感度与冗余处理能力,并将提出的挖掘方法应用于探索全球气候变化问题.文章核心内容如下:(1)以数据挖掘和软集领域内,Web of Science核心合集数据库中收录的期刊论文为对象,利用Web of Science数据库内置文献分析工具和VOSviewer文献可视化软件,通过文献共现聚类分析功能,从关键词、研究学者及国家等不同角度出发,系统梳理了该领域的文献知识结构与研究进展情况.(2)简要介绍了软集、软子集、软相等关系及软集的基本运算,探讨了软集与信息系统之间的联系.系统研究了常规关联规则与极大关联规则方面的基础知识,概述时态关联规则挖掘的相关理论,并对现有的时态关联规则挖掘方法进行了分类.(3)融合参数化和粒度化方法,提出了时态软集和时态参数类化软集等概念.引入了时态极大关联规则的概念,并研究了时态极大关联规则的软集描述方法,构建了基于时态参数类化软集的极大关联规则挖掘算法,结合数值实例对算法的有效性进行了验证,并与已有的几种挖掘算法进行了对比分析.(4)探索所提的时态极大关联规则挖掘方法在全球气候变化研究中的应用.在国际紧急灾难数据库中的全球极端天气气候事件数据集中进行数据挖掘和知识发现,揭示出了全球范围内出现的极端天气气候的相关性和潜在规律.
钟倩漪,钱谦,伏云发,冯勇[9](2021)在《粒子群优化算法在关联规则挖掘中的研究综述》文中认为关联规则挖掘是数据挖掘中的重要领域,考虑到当前数据的大规模、高维度、模态多样及类型复杂等特性,传统关联规则挖掘算法已无法适应大数据的需求,粒子群优化算法作为一种高效的智能优化算法,为其提供了一种全新的解决方案,近年来被广泛应用于该领域。首先对粒子群优化算法的基本原理及关联规则的基本概念进行了详细介绍,回顾了粒子群优化算法的研究进展,分析了粒子群优化算法在关联规则挖掘中的研究,包括常用的数据转换方法、编码方式及评估指标,并与其他在关联规则挖掘中被广泛应用的算法进行了对比,总结了各自的优缺点及适用场景。然后对已有改进方法进行了较为系统的分类,即分为基于参数、基于变异机制和混合其他算法的改进。接着梳理归纳了粒子群优化算法在关联规则挖掘中的应用领域,阐述了该算法在购物篮、金融、医疗、工业生产及风险评估领域中的应用优势。最后在介绍这一领域的最新研究进展的基础上,通过对现存问题进行分析,讨论了进一步的研究方向。
韩驰,熊伟[10](2021)在《航天侦察装备体系指标关联信息挖掘研究》文中指出航天侦察装备体系的体系效能和体系贡献率影响因素指标数量多,指标间关系复杂。如何识别关联,优选关键性能指标并明确性能指标与体系贡献率之间的关系是体系效能及贡献率评估问题的关键。通过MATLAB与STK联合仿真获取航天侦察装备底层指标数据,基于FP-Tree(Frequent Pattern-Tree)算法发现指标间关联信息,去除冗余,确定指标关联类型,并结合Marichal熵建立优化模型确定关键性能指标的贡献度。仿真实验结果表明,通过FP-Tree算法可挖掘航天侦察装备初始评价指标体系间的关联性及关联类型,确定指标贡献度并实现指标体系的精简。
二、基于幂集的关联规则挖掘算法研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于幂集的关联规则挖掘算法研究(论文提纲范文)
(2)基于关联分析和集成学习的慢性病多标签分类算法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 选题背景及意义 |
1.2 国内外研究现状 |
1.2.1 慢性病风险评估模型国内外研究现状 |
1.2.2 多标签分类算法研究现状 |
1.3 研究目的与实施方案 |
1.4 本文组织总结 |
第2章 相关理论与技术介绍 |
2.1 关联规则挖掘 |
2.1.1 关联规则挖掘原理 |
2.1.2 关联规则挖掘相关算法 |
2.2 多标签分类学习 |
2.2.1 多标签分类任务概述 |
2.2.2 多标签分类算法 |
2.2.3 多标签学习评价标准 |
2.3 集成学习理论 |
2.3.1 集成学习介绍 |
2.3.2 集成学习方法 |
2.4 本章小结 |
第3章 慢性病关联规则挖掘及分析 |
3.1 数据集介绍 |
3.2 基于Word2Vec疾病标签提取 |
3.3 慢性病挖掘方法 |
3.3.1 慢性病的聚类分析 |
3.3.2 慢性病关联规则挖掘 |
3.4 慢性病之间关联规则挖掘结果 |
3.5 本章小结 |
第4章 基于集成学习的多标签慢性病预测模型 |
4.1 多标签神经网络预测模型 |
4.2 Bagging方法 |
4.2.1 RAkEL算法 |
4.3 基于Bagging的多标签分类集成预测模型 |
4.4 本章小结 |
第5章 基于体检数据慢性病多标签预测结果与评估 |
5.1 实验环境 |
5.2 数据准备与处理 |
5.2.1 特征提取 |
5.2.2 特征降维 |
5.3 参数设置 |
5.4 慢性病多标签预测模型结果分析 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读学位期间取得的研究成果 |
致谢 |
(3)基于关联规则挖掘的同态加密算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.2 国内外研究现状 |
1.2.1 数据挖掘和关联规则 |
1.2.2 隐私保护外包方法研究 |
1.3 研究内容 |
1.4 组织架构 |
第2章 关联规则挖掘和隐私保护相关理论 |
2.1 数据挖掘概述 |
2.1.1 数据挖掘基本概念 |
2.1.2 数据挖掘技术分类 |
2.2 关联规则挖掘技术概念 |
2.2.1 关联规则的基本概念 |
2.2.2 关联规则的经典算法 |
2.3 关联规则隐私保护技术 |
2.3.1 隐私保护的意义 |
2.3.2 隐私保护相关技术 |
2.4 本章小结 |
第3章 Paillier加密算法加强和安全外包关联规则挖掘方案 |
3.1 模型和设计目标 |
3.1.1 问题描述 |
3.1.2 模型架构 |
3.1.3 威胁模型 |
3.1.4 设计目标 |
3.2 Paillier算法改进设计 |
3.3 并行关联规则挖掘算法 |
3.3.1 Map Reduce概述 |
3.3.2 MREclat挖掘算法 |
3.4 算法设计和分析 |
3.4.1 数据预处理阶段 |
3.4.2 数据挖掘阶段 |
3.4.3 正确性和安全性分析 |
3.5 实验结果和讨论 |
3.5.1 实验设置 |
3.5.2 实验数据集 |
3.5.3 性能效率分析 |
3.6 本章小节 |
第4章 基于中国剩余定理对Paillier优化 |
4.1 中国剩余定理 |
4.1.1 中国剩余定理介绍 |
4.1.2 中国剩余定理证明 |
4.2 基于CRT的Paillier加速加密方法 |
4.2.1 密钥生成加速方法 |
4.2.2 加速加密过程 |
4.2.3 加速解密过程 |
4.3 性能分析和安全性分析 |
4.4 实验分析 |
4.5 小节 |
第5章 总结与展望 |
5.1 论文总结 |
5.2 展望 |
参考文献 |
攻读学位期间取得的研究成果 |
致谢 |
(4)基于非平衡医疗数据集的关联规则挖掘方法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 研究现状 |
1.2.1 关联规则算法研究现状 |
1.2.2 骨质疏松症研究现状 |
1.2.3 存在的问题 |
1.3 本论文的研究内容和方案 |
1.4 论文组织结构 |
第二章 相关理论及工作 |
2.1 关联规则基本介绍 |
2.1.1 关联规则起源 |
2.1.2 关联规则基本定义 |
2.1.3 关联规则的一般过程 |
2.1.4 关联规则的应用 |
2.2 Apriori算法介绍 |
2.2.1 Apriori思想 |
2.2.2 Apriori流程及实例 |
2.2.3 Apriori性能分析 |
2.3 Apriori改进方法 |
2.3.1 基于压缩的Apriori改进算法 |
2.3.2 基于采样的Apriori改进算法 |
2.3.3 基于启发式的Apriori改进算法 |
2.3.4 基于并行的Apriori改进算法 |
2.3.5 改进方法的比较 |
2.4 不平衡数据集相关研究 |
2.4.1 数据不平衡的影响分析 |
2.4.2 数据平衡方法分析 |
2.5 本章小结 |
第三章 基于K-means的数据平衡算法研究 |
3.1 K-means-SMOTE算法设计 |
3.1.1 K-means分析 |
3.1.2 K-means-SMOTE算法思想及实现步骤: |
3.2 实验设计及分析 |
3.2.1 实验设计 |
3.2.2 结果分析 |
3.3 本章小结 |
第四章 基于随机森林加权的矩阵关联规则算法研究 |
4.1 随机森林算法的介绍与分析 |
4.2 基于随机森林加权的矩阵关联规则算法设计 |
4.2.1 MARFW算法思想 |
4.2.2 MARFW算法相关定义 |
4.2.3 MARFW算法实现步骤 |
4.3 实验设计及分析 |
4.3.1 实验设计 |
4.3.2 结果分析 |
4.4 本章小结 |
第五章 MARFW算法在骨质疏松数据集中的应用 |
5.1 骨质疏松数据集分析 |
5.2 骨质疏松数据集的预处理 |
5.2.1 数据预处理任务 |
5.2.2 骨质疏松数据的处理 |
5.3 规则的评估与解释 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(5)机器学习中隐私保护数据计算研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 隐私保护数据挖掘研究现状 |
1.2.2 隐私保护深度学习研究现状 |
1.2.3 分布式优化方法研究现状 |
1.3 论文的主要工作及结构 |
第二章 相关问题与安全计算基本概念介绍 |
2.1 简写符号说明 |
2.2 相关机器学习方法介绍 |
2.2.1 频繁项集挖掘与关联规则挖掘 |
2.2.2 神经网络和深度学习 |
2.3 数据安全技术介绍 |
2.3.1 同态加密 |
2.3.2 数据验证 |
2.4 本章小结 |
第三章 云外包环境下的隐私保护关联规则挖掘研究 |
3.1 引言 |
3.2 问题定义 |
3.2.1 系统模型 |
3.2.2 威胁模型 |
3.2.3 设计目标 |
3.3 相关知识介绍 |
3.3.1 水平与垂直分区数据库 |
3.3.2 虚拟交易 |
3.4 子算法设计 |
3.4.1 对称同态加密算法 |
3.4.2 安全比较算法 |
3.4.3 HE参数范围限定 |
3.4.4 虚拟交易插入算法 |
3.5 SecEDMO方案设计 |
3.5.1 SecEDMO方案概览 |
3.5.2 隐私保护关联规则挖掘 |
3.6 正确性分析 |
3.7 安全性分析 |
3.7.1 对称HE算法的密钥安全性 |
3.7.2 安全抗攻击 |
3.8 性能评估 |
3.8.1 插入交易的随机性 |
3.8.2 SecEDMO的计算复杂度 |
3.8.3 SecEDMO的存储容耗 |
3.8.4 SecEDMO的通信复杂度 |
3.8.5 不同模型的复杂度比较 |
3.8.6 端到端时延 |
3.9 相关工作 |
3.9.1 基于查询限制的隐私保护挖掘 |
3.9.2 基于数据干扰的隐私保护挖掘 |
3.9.3 基于数据加密的隐私保护挖掘 |
3.10 扩展工作——安全数据聚合 |
3.11 本章小结 |
第四章 联邦深度学习中分布式训练方法研究 |
4.1 引言 |
4.2 问题定义 |
4.2.1 联邦学习系统 |
4.2.2 设计目标 |
4.3 相关知识介绍 |
4.3.1 随机梯度下降 |
4.3.2 ASGD与 SSGD |
4.4 F-SSGD算法设计 |
4.5 收敛性分析 |
4.6 实验性能评估 |
4.6.1 实验设置 |
4.6.2 实验结果 |
4.7 本章小结 |
第五章 快速、安全、可验证的联邦深度学习研究 |
5.1 引言 |
5.2 问题定义 |
5.2.1 系统模型 |
5.2.2 攻击模型 |
5.2.3 设计目标 |
5.3 相关知识介绍 |
5.3.1 椭圆曲线密码 |
5.3.2 密码学hash函数 |
5.4 子算法设计 |
5.4.1 密钥生成算法 |
5.4.2 隐私保护机制 |
5.4.3 验证机制 |
5.5 FSV-FDL模型设计 |
5.6 安全性分析 |
5.6.1 EC-AHE的安全性 |
5.6.2 部分数据加密的安全性 |
5.6.3 云与客户端合谋攻击 |
5.7 验证性分析 |
5.7.1 正确性 |
5.7.2 可靠性 |
5.8 实验性能评估 |
5.8.1 模型精度 |
5.8.2 客户端运行时 |
5.9 本章小结 |
第六章 总结与展望 |
6.1 本论文的主要工作 |
6.2 下一步的工作思路 |
参考文献 |
致谢 |
攻读博士期间已发表的论文 |
攻读博士期间参加的科研项目 |
(6)基于矩阵的增量式关联规则更新算法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究的背景和意义 |
1.2 增量式关联规则挖掘技术的研究与展望 |
1.2.1 国内外研究现状与应用 |
1.2.2 存在的问题 |
1.3 本课题主要研究内容 |
第2章 相关理论概述 |
2.1 数据挖掘 |
2.1.1 数据挖掘的定义 |
2.1.2 数据挖掘的过程 |
2.1.3 数据挖掘的技术 |
2.1.4 数据挖掘的发展趋势 |
2.2 关联规则挖掘 |
2.2.1 基本概念 |
2.2.2 关联规则的挖掘步骤 |
2.2.3 关联规则的发展方向 |
2.3 增量式关联规则挖掘 |
2.3.1 基本概念 |
2.3.2 增量式关联规则挖掘技术 |
2.4 本章小结 |
第3章 传统关联规则及其增量更新算法研究 |
3.1 静态关联规则挖掘算法 |
3.1.1 Apriori算法 |
3.1.2 FP-Growth算法 |
3.2 增量式关联规则更新算法 |
3.2.1 FUP算法 |
3.2.2 IUA算法 |
3.3 本章小结 |
第4章 改进关联规则增量更新算法研究 |
4.1 改进算法介绍 |
4.2 事务矩阵化优化思想 |
4.3 增删数据集计算改进策略 |
4.3.1 增加事务数据集 |
4.3.2 删除事务数据集 |
4.4 基于频繁2 项集及其支持矩阵的改进策略 |
4.4.1 频繁2-项集矩阵和支持矩阵的建立 |
4.4.2 算法描述 |
4.5 实例说明 |
4.6 本章小结 |
第5章 实验结果与分析 |
5.1 实验环境 |
5.2 实验设计 |
5.3 实验结果分析 |
5.3.1 增加事务数据集实验分析 |
5.3.2 删除事务数据集实验分析 |
5.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间所发表的学术论文 |
致谢 |
(7)高速铁路运营安全评估关键方法及工作流程研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 事故分析模型 |
1.2.2 多指标综合定量评估方法 |
1.2.3 安全评估流程 |
1.3 主要研究内容 |
1.4 论文总体框架及研究技术路线 |
2 高铁运营总体安全态势研判及安全规律初步分析 |
2.1 总体安全态势 |
2.1.1 事故等级分布 |
2.1.2 事故原因分布 |
2.2 移动装备安全规律分析 |
2.2.1 动车组总体情况 |
2.2.2 动车组事故/故障特征统计分析 |
2.2.3 不同检修周期下动车组故障/事故演变规律 |
2.2.4 动车组安全规律 |
2.3 工务设备安全规律分析 |
2.4 电务设备安全规律分析 |
2.5 供电设备安全规律分析 |
2.6 技术规章安全规律分析 |
2.7 高铁事故主要致因因素分析 |
2.8 小结 |
3 高铁事故致因关联规则数据挖掘模型研究 |
3.1 高速铁路事故致因关联规则数据挖掘方法 |
3.1.1 关联规则基本概念 |
3.1.2 关联规则挖掘算法 |
3.1.3 算法比选 |
3.2 挖掘模型的研究与构建 |
3.3 系统分析及致因因素分析 |
3.4 数据分析与处理 |
3.5 基于FP-Growth算法的关联规则挖掘 |
3.6 小结 |
4 基于直觉模糊信息的高铁安全交互式群组合评估模型 |
4.1 概念介绍 |
4.1.1 直觉模糊集相关概念 |
4.1.2 交互式群评估原理 |
4.1.3 三角白化权函数灰色聚类分析方法 |
4.1.4 组合评估模型 |
4.2 实例分析 |
4.2.1 建立评估指标体系模型 |
4.2.2 基于直觉模糊信息的交互式群评估 |
4.2.3 基于投影的指标权重确定 |
4.2.4 基于三角白化权函数的灰色聚类评估 |
4.3 小结 |
5 高速铁路运营现状安全评估工作流程研究 |
5.1 高速铁路运营安全现状评估工作范围及主要内容 |
5.1.1 主要工作目的和评估范围 |
5.1.2 主要评估内容 |
5.2 高速铁路运营安全现状评估工作模式 |
5.2.1 成立安全评估组 |
5.2.2 主要工作流程 |
5.3 高速铁路运营相关安全数据调用及汇聚 |
5.3.1 数据范围 |
5.3.2 数据来源 |
5.3.3 数据汇聚方式 |
5.3.4 数据处理分析所面临的困难及对策 |
5.4 运营安全评估的依据及标准 |
5.5 小结 |
6 研究结论与展望 |
6.1 主要结论 |
6.2 研究展望 |
参考文献 |
作者简历及攻读硕士学位期间取得的科研成果 |
学位论文数据集 |
(8)基于时态参数类化软集的极大关联规则挖掘及应用研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.3 研究动机与主要贡献 |
1.4 论文的组织结构 |
第2章 软集理论与关联规则挖掘 |
2.1 软集理论与信息系统 |
2.1.1 软集的定义 |
2.1.2 软子集与软相等关系 |
2.1.3 软集的运算 |
2.1.4 软集与信息系统 |
2.2 关联规则挖掘 |
2.2.1 常规关联规则 |
2.2.2 极大关联规则 |
2.2.3 时态关联规则 |
2.3 本章小结 |
第3章 时态软集与时态参数类化软集 |
3.1 时态软集 |
3.2 时态参数类化软集 |
3.3 本章小结 |
第4章 基于时态参数类化软集的极大关联规则挖掘 |
4.1 时态关联规则的软集描述方法 |
4.2 基于时态软集的关联规则挖掘算法 |
4.2.1 算法描述 |
4.2.2 算法步骤 |
4.3 时态极大关联规则的软集描述方法 |
4.4 基于时态参数类化软集的极大关联规则挖掘算法 |
4.4.1 算法描述 |
4.4.2 算法步骤 |
4.5 数值实例 |
4.6 本章小结 |
第5章 时态极大关联规则挖掘在全球气候变化研究中的应用 |
5.1 问题背景 |
5.2 数值实验 |
5.2.1 数据预处理 |
5.2.2 挖掘过程 |
5.2.3 结果分析 |
5.3 本章小结 |
第6章 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
附录 |
攻读硕士学位期间取得的研究成果 |
致谢 |
(9)粒子群优化算法在关联规则挖掘中的研究综述(论文提纲范文)
1 相关概念及原理 |
1.1 粒子群优化算法基本原理 |
1.2 关联规则基本概念 |
2 PSO算法的研究现状 |
3 PSO算法在关联规则挖掘中的研究 |
3.1 数据转换 |
3.2 编码方式 |
3.3 规则评估 |
3.3.1 兴趣度 |
3.3.2 理解度 |
3.3.3 相似度 |
3.4 PSO算法与其他关联规则挖掘算法对比 |
4 改进PSO算法在关联规则挖掘中的研究 |
4.1 基于参数的改进 |
4.2 基于变异机制的改进 |
4.3 混合PSO算法 |
4.3.1 混合精确算法 |
4.3.2 混合智能算法 |
4.3.3 混合神经网络 |
5 PSO算法在关联规则挖掘中的应用 |
6 总结与展望 |
四、基于幂集的关联规则挖掘算法研究(论文参考文献)
- [1]基于领域知识的异常值处理算法研究[D]. 崔晨. 沈阳建筑大学, 2021
- [2]基于关联分析和集成学习的慢性病多标签分类算法研究[D]. 侯家麒. 四川大学, 2021
- [3]基于关联规则挖掘的同态加密算法研究[D]. 赵震宇. 太原理工大学, 2021(01)
- [4]基于非平衡医疗数据集的关联规则挖掘方法研究[D]. 刘凯峰. 内蒙古大学, 2021(12)
- [5]机器学习中隐私保护数据计算研究[D]. 吴佳慧. 西南大学, 2021(01)
- [6]基于矩阵的增量式关联规则更新算法研究[D]. 郝爽. 哈尔滨理工大学, 2021(09)
- [7]高速铁路运营安全评估关键方法及工作流程研究[D]. 江雨欣. 中国铁道科学研究院, 2021(01)
- [8]基于时态参数类化软集的极大关联规则挖掘及应用研究[D]. 王谦. 西安邮电大学, 2021
- [9]粒子群优化算法在关联规则挖掘中的研究综述[J]. 钟倩漪,钱谦,伏云发,冯勇. 计算机科学与探索, 2021(05)
- [10]航天侦察装备体系指标关联信息挖掘研究[J]. 韩驰,熊伟. 系统仿真学报, 2021(10)