天才小说 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

今天还是有点拉肚子,所以,晚一会儿更新,大概凌晨一点左右吧,到时候重新刷新这一章就行了。

…………

摘要:为了保证网络安全,提出基于大数据分析的网络安全风险挖掘与估计方法,选取hadoop平台的map和reduce函数挖掘网络安全事件关联规则,将所挖掘关联规则作为网络安全事件特征,将网络安全事件特征作为径向基核函数的支持向量机输入,通过训练建立网络安全风险估计模型,并采用qpso方法的寻优性能搜寻支持向量机最优参数,实验结果表明,该方法提升了网络安全风险估计精度,对于防御网络安全风险具有重要的参考价值。

关键词:大数据分析;网络安全风险;关联规则;支持向量机

1引言

互联网技术发展极为迅速,互联网网络环境具有较高的开放性,部分攻击者利用网络具有的不确定性以及多样性攻击网络,严重威胁网络运行安全[1-2]。以往的网络防御方法仅利用数据包中所包含信息获取风险估计结果,所获取风险估计结果准确率较低。为了保障网络运行安全性,令网络管理者实时明确网络运行状态,提前明确网络安全风险,采用相应的防御措施抵御风险,是保障网络安全运行的重要基础[3-5]。目前众多研究学者针对网络安全风险进行大量研究。韩晓露与何春蓉等人分别利用直觉模湖集以及注意力机制评估网络安全态势[6-7],但网络安全风险仍存在告警量过大以及由于数据量过大导致误报率较高的缺陷。从海量网络大数据中挖掘有用的网络安全风险数据是网络安全风险精准评估的关键。网络存在攻击行为时,将形成大量众多类型的告警信息,提升数据挖掘难度[8],高效的大数据挖掘方法对于提升网络安全风险评估精度极为重要。为此本文提出了基于大数据分析的网络安全风险挖掘与估计方法,并对其性能进行了测试与分析。

2大数据分析的网络安全风险挖掘与估计方法

2.1数据挖掘的关联规则提取

采集海量网络数据中的安全事件,由于所采集网络安全事件格式存在较大差异,需归一化处理安全事件,便于挖掘其中所包含的关联规则。利用所挖掘关联规则分析网络安全风险的相似病毒[9],相似漏洞等攻击行为,提升网络安全风险评估精度。利用大数据分析技术的数据挖掘方法提取网络安全事件关联规则。n}表示安全事件元素集合,r={r1,r2,…,rn}表示数据集,数据集r中所包含元素ri均为由w建立的集合,即存在riw。定义1:利用集合r内元素建立集合c,数据集内元素可满足cri要求数量为l时,可得数据集r内集合c的支持度计算公式如下:(1)(1)定义2:存在集合idw时,利用表示c→d的置信度。所挖掘数据集合内可满足最小置信度以及最小支持度的c→d即大数据挖掘方法所需挖掘的关联规则。关联规则通过挖掘事务集内频繁项集合,获取不同事务与事务间所存在的关联规则。网络安全事件具有规模量极大的特点[10],选取云计算平台hadoop平台实现海量网络安全事件关联规则挖掘。大数据分析技术挖掘关联规则分为两部分:(1)挖掘频繁项集,所挖掘频繁项集应满足最小支持度;(2)利用数据挖掘所获取的频繁项集挖掘满足最小置信度条件的关联规则。hadoop平台利用map函数以及reduce函数获取项目集子集以及综合已获取子集的支持度,通过分析全部子集支持度获取所挖掘网络安全事件中频繁项支持度,挖掘网络安全事件数据集中所包含频繁项集。hadoop平台挖掘关联规则过程如下:将最小支持度β以及原始网络安全事件数据集r作为hadoop平台运算输入;将可满足最小支持度的频繁项作为hadoop平台运算输出。map任务:(1)依据所输入文件路径利用最小支持度的频繁项集分割原始网络安全数据集为大小为n的数据子集,格式化处理所分割的各子集,获取键值对,其中value与key分别表示数据信息以及字符偏移量。(2)将所获取不同子集中的键值对依据map函数读取,将数据信息value利用split函数解析,将解析结果传送至集合内;(3)利用输出key表示全部子集,设子集value值等于1;(4)调用全部可选的bin函数,全部map端在网络安全数据中生成相同key值的键值对,通过bin函数合并全部相同的键值对,改善通过网络将所获取的键值对发送至reduce端造成运算效率低的缺陷;reduce任务:(1)排序bin函数所发送的键值对,合并相同key值的键值对,获取,所获取键值对利用re-duce函数读取,累加键值对中l内的值。网络安全数据集r内key集合的支持数量,所获取结果即reduce端具有频繁候选项集的全局支持度;(2)将高于最小支持度的候选项集基于最小支持度发送至存储数据外部表内,利用所获取外部表查询挖掘所获取的频繁项集,设置该频繁项为mapreduce程序的输入以及输入相关文件。将最小置信度δ以及满足最小置信度δ的关联规则分别作为挖掘网络安全事件关联规则的输入与输出,运算过程如下:(1)选取map函数启动setup法连接数据库;(2)分割存储数据所建立外部表内的频繁项集,完成分割后获取数量为n的数据子集,将全部数据格式化处理至键值对;(3)解析value内频繁项集内元素,完成解析后获取相应value值用(c,d,svalue)表示,将所获取的(c,d)存储至集合中;(4)求解频繁项集内元素子集c,读取元素子集c支持度sup(c),利用表示c→d的置信度。(5)当所获取置信度高于已设定阈值时,所获取的频繁项集内部包含该子集外的全部元素与该子集存在关联规则,利用所获取差集与子集建立key值,该key值的置信度值即value。通过以上过程挖掘网络安全事件关联规则,利用支持向量机方法基于所挖掘关联规则实现网络安全风险估计。

2.2网络安全风险估计方法

将所挖掘关联规则作为网络安全事件特征,利用所挖掘关联规则估计网络安全风险。利用样本输入xi以及样本输出yi所组成的(xi,yi)表示网络安全事件训练样本集,该样本集满足xirn,yirn。网络安全事件样本集(xi,yi)内网络安全事件样本利用非线性映射函数φ映射至高维特征空间内,可得网络安全事件评估的最优线性回归函数表达式如下:(2)式中,b与w分别表示偏置量以及权值。利用结构风险最小化原则获取lssvm回归模型的解,可得公式如下:(3)(4)式中,ei与c分别表示回归函数与实际结果的误差以及惩罚函数。将公式(4)的约束优化问题引入拉格朗日乘子可得公式如下:(5)式中,ai表示拉格朗日乘子。依据mercer条件定义核函数公式如下:(6)选取径向基核函数设置为网络安全风险估计的核函数,可得径向基核函数表达式如下:(7)获取最终支持向量机回归模型如下:(8)式中,σ为径向基核函数宽度。支持向量机参数决定其估计精度,选取合适的参数有助于提升网络安全风险估计精度。选取qpso算法对支持向量机的参数寻优。qpso算法设置存在数量为m的粒子于维度为d的搜索空间内,粒子原始位置用xi(xi1,xi2,…,xid)表示,pb(pb1,pb2,…,pbd)表示当前最优位置,gb(bg1,bg2,…,bgd)表示全局最优位置。粒子进化表达式如下:(8)式中,mbest与β分别表示粒子群内最优粒子值以及算法收敛速度。迭代次数为t时,算法收敛速度计算公式如下:(9)网络安全风险评估过程如下:(1)依据网络安全风险评估规模设置粒子群内粒子数量,粒子群内粒子维度分别表示用于估计网络安全风险支持向量机的参数c与σ。(2)设置优化支持向量机参数的粒子群算法的参数以及最大迭代次数;(3)获取粒子的适应度函数;(4)计算粒子的最优个体位置以及全局最优位置,建立网络安全信息库;(5)更新粒子群内各粒子位置;(6)依据以上过程重复迭代计算,判断是否满足终止条件,满足终止条件时,转至步骤(7),否则转回至步骤(3);(7)将通过以上过程所获取的最优粒子作为支持向量机参数,完成网络安全风险估计模型建立,利用所建立网络安全风险估计模型获取网络安全风险估计结果。

3实例分析

选取某通信网络运行时间为60min的通信数据作为测试对象,共采集样本数据条,采用本文方法评估网络安全风险。选取直觉模湖集方法(参考文献[6])以及注意力机制方法(参考文献[7])作为对比方法。本文方法采用大数据分析技术挖掘海量网络通信数据间所存在的关联规则,统计不同最小置信度以及最小支持度时所挖掘的关联规则数量,统计结果如图1所示。图1实验结果可以看出,最小置信度以及最小支持度分别为0.7以及0.3时,可挖掘数量较多的关联规则,设置采用本文方法挖掘海量网络数据时,β值以及6值分别为0.7以及0.3。本文方法具有较高的关联规则挖掘性能,应用于海量网络通信数据时,仍具有较高的挖掘效率。完成关联规则挖掘后,利用qpso算法的寻优性能获取支持向量机最优参数,qpso算法在不同迭代次数时收敛情况如图2所示。图2实验结果可以看出,本文方法采用qp-so算法寻找支持向量机评估网络安全风险的最优参数,仅需40次左右的迭代次数即可快速获取最优支持向量机参数。本文方法所选取qpso算法具有较高的寻优效率,可在较短时间内快速获取支持向量机的最优参数,提升网络安全风险估计性能。通过qpso算法获取支持向量机算法最优参数为c=130,σ=135。采用qpso算法所获取的支持向量机最优参数建立网络安全风险评估模型,采用所建立安全风险评估模型评估网络运行5h的安全风险事件数量,将本文方法与另两种方法对比,对比结果如图3所示。图3实验结果可以看出,采用本文方法评估网络安全风险结果与实际网络安全风险结果极为接近,波动趋势具有较高的吻合性。对比结果说明本文方法可有效预测网络安全风险,预测结果极为可靠,可作为网络管理员管理网络安全的有效依据。经过多次测试,对比三种方法的网络安全风险评估性能,对比结果如图4所示。图4实验结果可以看出,采用本文方法评估网络安全风险,可有效改善所需历史数据较多、对缺失数据较为敏感等缺陷,应用于网络安全风险评估时具有较高可靠性。采用本文方法评估测试网络于2020年1月3日7:00-24:00共17个小时的安全风险情况见表1。针对表1给出的实验网络安全事件情况表,采用本文方法对其风险事件攻击类型进行评估,结果见表2。分析表2可得,本文方法可评估安全风险事件,可有效确定网络安全风险事件的具体攻击行为,验证本文方法具有较高的安全风险事件评估有效性。

4结束语

网络安全风险估计是目前网络安全防御体系中的重要部分。伴随网络中数据量的提升,对网络安全风险估计提出更高要求。充分考虑网络运行过程中的攻击形势,将大数据分析技术应用于网络安全风险估计中,利用大数据分析技术所具有的可处理海量数据的优势,充分挖掘网络安全事件中所存在的关联规则,估计网络安全风险。通过实验验证所研究方法可实现网络安全风险的有效估计,可保障海量数据运行环境下的网络安全的有效防护。

天才小说推荐阅读:末世之纪元支配者卡盒抽卡,不靠概率英雄联盟之极品天才星历一万年末世万物进化:开局豢养数万猛虎末日穷途:我能穿回2024红警之时空指挥官劫天运次元大追逃天灾末世,我努力活着无限位面之绝对追杀快穿之炮灰的开挂人生末世妖宠:冥君猫奴不归路!红色大导演末世:恶女囤了百万物资星海圣人好孕快穿:娇软女主在be文求生诸天之开局被识破高武:邪君降临妖魔战神节令师星际侠盗有点甜全球加载了惊悚游戏末日游戏崛起极寒末世:从收留邻妻后开始无敌洗劫全球,我和姐姐们超神了!当恋爱系统里的bug成了精末世之混沌御灵师赛博轮回:我在星际拆解神明爽!末世重生,我觉醒了空间异能快穿沙雕雪茶位面流浪记满级BOSS在各界种田芳缘:先捡裙儿小姐,再捡沙奈朵警察的世界进化武器关于我变成学霸美少女这档事穿书末世文:我成了小白花前女主万界圆梦收割机让你多囤货,你去搬空鹰酱樱花?外来异星末世万族录图摹万界警告!禁止S级觊觎顶级貌美向导未来之萌娃难养生之徒修行在武侠世界幻想次元掠夺记穿越1862我用水浒军团纵横宇宙快穿之黑莲花没有感情
天才小说搜藏榜:当人类灭绝后,我非常的想念他们快穿游戏加载中全宇宙最后一个人类末世城下之钢铁洪流我能合成序列星际之爱上雇佣兵我的游戏神国外星侵袭:地球反击科研的尽头是永生大唐超级奶爸疯狂求败系统天下布武录我在救世组织扮演先知意料中的末世末世神豪,美女解冻千亿财富我的本体是世界树快穿:病娇boss又黑化了!最强地球守护者末世冰封:从最强庇护所开始模拟:从奇葩动物开始通天之主黑暗造化末世火种:最强男人霹雳之仙山之主重生是精灵虫群的无尽进化之路火爆鸡爪大佬的名讳叫灾厄快穿之女王有些强大快穿系统之女配不好当天生科技狂香港之梦不走寻常路的武学系统次元降临,我苟在母星当后勤非机械式悸动这是神马黑科技我的末世大酒店游戏世界开拓者成为恶女后我被迫拯救反派捉鬼班长超正经的末世游戏剑仙老祖靠直播毛茸茸爆红星际末世之起源异族血亲手撕丧尸哪家强,问问华夏僵尸王末世:囤了千万物资后开始无敌诸天最强基因快穿之醋王系统总掐我桃花人诛记末世中的牛马生存指南
天才小说最新小说:开局激活末日系统,向全世界宣战末世重生:开局吞噬,我为最强与青梅末世觉醒,系统逼我献祭她锈蚀之花末世咸鱼王,我的安全屋能升级穿越成末世小白花杀疯啦从末世到星海末世:全公司否认18楼存在末日时钟:循环与永恒的史诗星脉觉醒:虚空回响异界求生背靠祖国怎么输?末世:我的避难所连通多元宇宙全民修仙:我的系统能偷属性末世大灾变,哥哥是我的!归一成帝灵笼:我成了龙骨村老板娘无限世界刀术大师核平末世?我创立最强基地行走在诸天万界的人逆星人冰冻星球之寒奥纪元三体之脑域侵蚀末世老魔:觉醒魔功,以杀证道炼假成真:我的虚拟帝国照映现实我的傲娇丧尸女友太可爱了怎么办全民魔域,从九星副本开始无敌末世危机?我召唤合成营平推城市重生,然后开始做计划末日远征:觉醒之战绑定进化房车,我在末世横着走星骸仙途机甲实验体诡墟清理者末世最强拾荒系统代号,全基因携带者:金平凡这里是大夏!禁忌生物止步森林童话勇敢之心进化回档末世闪点,时间异能荡天下深渊巡游者邪修:仙尊在末世躺平干饭末世:剑仙,我在茅山当大师兄雪葬纪元星海移民计划满级萌妹的烬渊藏宝之旅草灵末世求生:全世界等我奶一口末世:疯了吧!这炮灰怎么死不掉僵尸世界:我带系统成茅山师叔末世诡豪:我的资产是冥符阴兵灰烬之上:钢铁森林的余火