发布时间:2023-06-04 09:45:26
序言:写作是分享个人见解和探索未知领域的桥梁,我们为您精选了8篇的数据分析的前景样本,期待这些样本能够为您提供丰富的参考和启发,请尽情阅读。
关键词:国库统计 大数据 分析与预测
一、大数据时代国库统计分析转变
(一)树立大数据思维
“大数据时代预言家”维克托认为:世界的本质就是数据,大数据将开启一次重大的时代转型,一直以来所延续的传统统计分析思想已变得陈旧且落后。国库统计分析思维应当在大数据背景下加以转变。一是关于大数据抽样调查工作的思想。抽样调查是目前统计分析工作中的重要调查方式,但应该清醒地认识到,传感器、网络和数据处理技术,为获取全局数据提供了可能,抽样调查方式越来越多的被大数据取代成为必然。二是大数据统计思想:允许数据存在不精确性。纵观目前的各类数据,一方面,数据来源不断扩展,另一方面数据处理方法飞速发展,我们应该把重心放在统计分析效率上,而不是一味地追求数据的精确性上。三是大数据相关关系的思想,由验证因果向寻求关联转变。统计分析报告是统计工作的下游产品,对决策的意义常常大于常规报表。大数据的应用,统计分析也将发生转变,在做好因果分析的基础上向寻求关联转变,原因分析更加精准和深刻,对策建议更具参考价值。
(二)被动统计到主动分析,从人工统计到智能统计
在这样一个信息爆炸的大数据时代,无论政府机构还是社会公众都可以通过多种途径获取信息,国库统计分析部门也不例外,更应该变被动为主动,对经济转型期的一些重大问题尤其是关系到可持续发展的重要问题,做好数据统计分析,提高发展质量,实现经济转型。涂子沛指出人类使用数据的巅峰形式,是通过数据赋予机器“智能”。大数据在包括国库统计分析中应用的终极形式就是分析智能化。
(三)从事后统计向事前预测转变
统计分析报告是统计工作的重要产品,完整的进度性常规分析应该包括对未来一定时期数据的预测。但由于小数据和信息量的局限,预测一般很少作为报告的重点,多是在假定发展条件、相关政策不变的情况下对未来情况做出的粗略研判,影响了统计对决策的参考价值。而大数据的核心就是将数学算法与海量的数据有效结合,来预测事情发生的可能性。大数据的广泛应用,将有利于统计报告实现由单一的事后分析,向注重事前预测转变。
二、大数据在国库统计分析全流程应用的探讨
当前,大数据浪潮带来了一场新的革命,面对经济发展的新形势新要求,国库统计分析要学会积极的运用大数据的思想和方法,来应对各种新挑战。国库统计分析要积极主动建立大数据分析应用机制,破解新常态下面对的各种问题,实现工作的创新与发展。本文重点分析国库统计分析全流程下大数据的应用。
(一)数据源:建立国库统计分析数据池
目前国库统计分析所用数据主要通过“3T”系统产生基础数据和监管类数据,通过收集各类型政策文件、影像资料、领导讲话、内网信息等形成综合性数据。但这些数据远未达到支撑大数据统计分析的基础。国库统计分析应当建立“数据池”这一基础工程,通过人行内部数据整合、银行和其它机构数据接入、互联网数据抓取和引入等多渠道扩充基础信息源和数据库,为国库统计分析的大数据应用奠定数据基础。
一是加速整合现有国库数据。我国国库汇集了各级政府财务数据和各级国库管理数据,包括从中央到县乡的各级机构化和非结构化数据,也包括税务、海关、财政、银行等部门处理的各类收支退存等国库资金运行数据,涵盖面极广。但现有数据资源存在着部门隶属、无法共享等问题,大数据要求建立统一、高效、共享的国库业务大数据池,就必须打破现有藩篱,尽早实施“国家金库工程”,完善内部数据源。
二是扩大国库统计分析数据源。最重要的是打通各级政府及其下属各部门之间的数据传输通道,实现政府办公、工商行政、招商引资、外贸出口、仲裁诉讼等政府活动所产生的数据接入共享。其次是实现一行三会、商业银行、行业协会、企业实体等生产运营数据的持续传输和报送。最后是互联网数据,互联网是大数据的重要载体,也是数据收集的快捷途径,通过各类互联网平台,门户以及行业网站,可以收集海量数据来增加国库统计分析领域数据采集的前置性和时效性。
(二)数据采集与存储:软件与硬件结合
大数据的应用中,由于数据来源非常广泛且类型多样化,需要存储和分析挖掘的数据量也是十分庞大的,因此数据展现和处理的高效性以及可用性十分重要。因而,大数据的收集和存储应当通过先进的计算机技术自动实现,并结合线下需求采取人工收集等传统方法,以补足系统无法收集的数据的遗漏。国库统计分析数据的采集应当在国库大数据资源池基础上,通过构建云计算应用平台,统筹整合各直属国库大量分散的数据和软硬件资源,通过应用云计算平台的资源和功能,以提升和优化整体效能,从而实现全国国库统计分析的大集成、大整合以及大应用。对于其他横向联网数据,比如一些保密性较强的科学研究数据和企业生产经营数据,则可以与研究机构和企业建立合作关系,使用特定系统接口等相关方式采集数据。
在数据存储方面,在通过完善的物理存储技术和云计算平台等软硬件设施的基础上,按国库统计层级建立分级仓储式数据中心,以人行总行为总库,各项业务与非业务数据达到汇总存储,各级行通过内部接口或云计算平台实现数据上传下载,同时本级行建立分中心数据存储仓,采集本级区域内纵向和横向数据并存储。同时按照保密和信息安全等要求,实施分级授权和设置防火墙、实时加密存储数据和卷标存储加密等技术。
(三)数据清洗与结构化处理
国库海量的、不规则的数据无法提供有效决策支持,只有通过数据清洗技术将大数据转变为结构化和规则化的数据,才能体现大数据价值。数据清洗包括检查数据一致性,处理无效值和缺失值等,是发现并纠正数据文件中可识别的错误的最后一道程序。经过数据清洗技术处理残缺数据、错误数据和重复数据后将有效数据写入数据库。
在国库大数据统计分析上,通过数学知识(概率、统计、离散化等)建立合理模型,充分利用和挖掘数据内容。综合运用开源类和非开源类数据分析工具包括R、Python、MATLAB、SPSS、EVIEWS等软件进行数据分析。具体实现统计分析、数据挖掘和模型预测等功能,并以可视化的结果予以呈现。统计分析包含假设检验、差异分析、相关分析、方差分析、回归分析、logistic回归分析、因子分析、聚类分析、主成分分析、判别分析、bootstrap技术等。数据挖掘包含相关性分组或关联规则、聚类、描述和可视化、复杂数据类型挖掘等。模型预测包含预测模型、机器学习、建模仿真等。
在统计分析过程中,国库统计分析应该重点实现云应用的创新与共享。统计人员可以根据业务的新要求,在云平台数据开放接口的基础上,自由构建合理的数学模型和算法,实现业务应用的创新和扩展。与此同时,以算法的方式将统计人员的智力成果和业务知识固化,当经验证为可信任应用时,可自动进入云平台的应用共享库,在得到授权的前提下,自由使用或补充完善,实现知识固化、资源共享。
(四)国库运行智能化统计分析
在云应用平台上,国库统计分析首先要将日、旬、月和年作为数据的时间维度,将国库收入、国库支出以及国库库存等统计指标作为数据的为空间维度,利用云计算的强大能力,并借助数据分析展示工具,预先计算处理数据。或者根据用户事先提交的数据挖掘需求自动完成相关数据预处理。统计分析人员随时可以从两个维度上深度挖掘数据,并使用QLikView等数据分析工具,实现统计大数据的多维度、可视化展示。
二是实现常规统计分析的智能化生产。可以通过完善和丰富大数据应用平台的分析功能,实现机器式的学习,输入必要的参数后,系统将自动计算数据,并关联提取大数据池中的相关数据和信息,进而依据特定的模板输出分析报告,最后由分析人员对输出的分析报告进行质量把关和进一步的补充完善。
三是构建统计分析数据模型,提高预警预测水平。不断进行新的分析预测数学模型的探索和构建,充分利用国库统计大数据平台上的海量数据和动态实时数据,不断提高预测水平。
(五)数据展示与反馈
以智能化统计分析为主的大数据应用技术,为数据结构化和可视化的展示提供了支持。简要国库运行数据、系统化运行指标、国库资金运行报告、国情和舆情监测报告、企业和金融服务报告、国库运行情况预测等为中央银行、各级政府部门制定有关政策提供统计信息和参考依据,充分发挥国库在国家预算执行中的促进、反映和监督作用。同时建立信息反馈机制,对现有统计分析结果予以反馈,还包括对未满足需求提出反馈,丰富和完善大数据应用成果,充分发挥国库统计分析应用大数据的社会价值。
综上所述,从全流程看,大数据应用自数据端建立“”数据池“”到处理端智能分析在到应用端数据展示,大致可以通过下图(图1)形象展示:
三、有效提升大数据应用的政策建议
(一)从制度层面保障大数据统计分析的有效开展
制定专门的大数据应用法律法规,在由总行统一部署、统一实施的基础上,各地区分支机构结合当地实际制定特色大数据应用和发展规章制度。从数据产生、采集、存储、挖掘和应用等大数据处理全流程做出明确安排。一是通过总行层面的发文、通知等鼓励通过大数据方法加强国库统计分析,建设大数据共享和应用平台;二是强化大数据统计所需软硬件采购、数据源互联互通及模块化分割等作出具体安排;三是要求大数据应用所应达到的在信息、统计报告、预测与预警等功能上的目标和绩效予以明确,充分利用大数据平台提供统计分析支持;四是强化信息技术安全,防止信息泄露、网络攻击、系统失灵等问题,明确应急处置方案。做到严格立法,有法可依,有章可循。
(二)加大基础设施建设和人才投入,满足大数据应用的软硬件要求
大数据基础设施可分为硬件和软件两类。硬基础设施主要包括用于收集、存储、分析和应用大数据的信息化系统架构;软件基础设施主要包括各类数据信息、数据挖掘和大数据应用专业软件以及金融企业的人力资源。人民银行应通过专项资金投入等方式构建大数据应用的软硬件设施和和培养专业人才,并通过持续培训使全体员工了解并使用大数据进行国库统计分析。也可邀请专业的大数据解决方案服务商作为咨询顾问,整合国库不同生产系统数据,优化数据应用行为,加快统计系统建设步伐。
(三)提高大数据管理和应用能力
国库统计分析应不断的加强国库运行数据的采集、储存、保护和管理工作,不断提升统计分析水平。加强对国库统计分析中涉及的地方债、营改增、房地产、小微企业经营、财政专户、盘活库存等热点领域可以设计建立相应跟踪监测指标体系。与此同时加强改革数据的统计制度、方法以及程序,研究大数据共享制度,为宏观经济分析提供便捷、坚实的大数据基础。
建立国库大数据分析应用机制是新形势下的当务之急。国库统计分析需不断改革创新,强化大数据的思维,提高大数据的意识和驾驭大数据的能力,积极探索新的大数据应用方法和途径,从而在国家宏观决策、服务经济社会发展、服务国库管理方面,进一步提升国库统计分析服务的能力和水平。
参考文献:
[1]沈昱池.大数据时代我国财政信息共享的思考[J].地方财政研究,2015(11):47-67
[2]陈健慧,赵昕.国库统计分析数据集中系统建设[J].金融电子化,2010,03:89-90
【关键词】胃镜检查;焦虑恐惧情绪;原因分析;护理对策
随着我国人口不断向老龄化方向发展,需要接受胃肠镜检查的人越来越多,受检病人的条件限制日渐放宽。电子胃镜检查是诊断胃病最直观的检查方法,也是目前诊断食管、胃和十二指肠疾病最为可靠的方法。胃镜检查具有一定的痛苦,而且麻醉具有一定的风险,患者易产生焦虑恐惧情绪[1]。这种不良情绪严重影响了胃镜检查术的成功率,因此分析患者恐惧焦虑产生的原因并给予相应的对策细致护理是十分必要的。本文分析了2012年6月――2013年6月间为110例患者胃镜检查术患者焦虑恐惧产生原因,并给予针对性的护理措施,患者焦虑恐惧情绪明显缓解,效果良好,现作如下报告。
1资料与方法
1.1一般资料选择2012年6月――2013年6月我院收治具有不同程度的消化道症状、需要胃镜检查的患者110例为研究对象,其中男性患者57例,女性患者53例。年龄分布在15-87岁(35.26±6.25)岁,110例均无胃镜禁忌证。
1.2调查方法采用自拟调查问卷调查表分析患者的基本情况,内容包括性别、年龄、教育程度、家庭状况、经济条件、家庭支持、疾病认知程度、胃镜检查知识、可能出现的并发症、费用支付方式、护理质量;采用SAS自评量表[2]评估患者焦虑情绪,分1、2、3、4四个等级,分别赋分4、3、2、1分,分值越高,各项分相加后乘以1.25取整数为标准分,分值越高,焦虑程度越厉害。
指定专职调查者对已签署胃镜检查知情同意书的患者进行了调查,年龄小的患者由家长替代调查。
1.3数据处理所有资料经确认有效后存入Execl数据库,采用SPSS13.0软件对数据进行统计分析,计数资料用频数(n)或率(%)表示,采用卡方检验,检验标准:P
2结果
通过对SAS数据分析,SAS平均分>50分的为67分,表明110名胃镜检查术前患者中有67名患者均有焦虑恐惧情绪,仔细分析67名患者在性别、文化程度、经济状况、付费方式、疾病认知程度、胃镜检查知识、社会家庭支持满意度、护理干预质量满意度方面差异,表明:女性、高中(含中专)、家庭人均月收入
3讨论
3.1焦虑恐惧情绪原因分析胃镜检查是一种刺激性检查,能够引起人体不同的应激反应,包括生理上的应激反应和心理上的应激反应,生理上主要表现为恶心、呕吐、血压及脉搏的变化,心理上表现出情绪焦虑、恐惧等,两种反应相互作用,又增加了复合应激反应[3]。本文研究表明,女性(69.81%)所表现出的焦虑恐惧情绪明显高于男性(52.63%),这可以从男女承受应激反应方面得到解释。
进一步分析可以看出,不同文化程度、不同经济状况、不同付费方式的人群胃镜检查前所表现出的焦虑恐惧程度也不相同,初中文化以下文化程度与大专以上文化程度明显低于高中(含中专)文化程度,家庭人均月经济收入>3000明显低于3000以下的人群,自费人群明显高于公费及医院保险受益人群。比较分析好像有些矛盾,可能与初中以下文化程度大多生活在社会底层,抗击打能力较强有差。
从对疾病知识的认识程度、对胃镜检查及可能诱发并发症的了解程度、社会家庭支持满意度、护理质量满意度分析,可以看出了解得越深入、满意度越高,患者产生焦虑恐惧情绪的比例就会越低,国外学者从不同的角度研究的观点都支持这个结论[4-5]。
3.2护理对策构建全方位的社会家庭支持网络:胃镜检查患者因角色的转换,急需社会家庭的关心支持。护理人员要反复向家属宣讲家属陪伴对患者病情康复的作用,同时对于多次胃镜检查没有确诊的患者,要尽可能地满足患者家属陪检的要求。对于自费的患者,要注意沟通的方式方法,避免方法失当可加重患者焦虑恐惧情绪[6]。
加强健康宣教,提高患者对疾病与胃镜检查的认知水平。可采取发放宣传小手册、播放资料、或者是一对一个案教育等形式,告知胃镜检查的过程、方法、可能发生的不良反应,以期让患者获得更多的认知,从而减轻或消除焦虑恐惧情绪,增强治疗的依从性。
提高护理质量,增强服务意识。本文研究表明患者的焦虑恐惧情绪与患者对护理质量的满意度呈正相关性,这与有些研究不尽相同,但可以肯定的是,护理质量的优劣、服务态度的好坏对患者心理是有影响的[7]。因此护理人员要熟悉胃镜检查护理流程,主动热情微笑服务,以构建良好的护患关系。
综上所述,胃镜检查术前患者产生焦虑原因影响因素很多,性别、文化程度、经济状况、付费方式、对疾病的认识程度、对胃镜检查及可能产生并发症的了解程度、对社会家庭支持及护理质量的满意度均可对术前检查焦虑恐惧情绪产生影响。护理人员应分析原因,构建全方位的社会家庭支持网络,加强健康宣教,提高患者对疾病与胃镜检查的认知水平,提高护理质量,增强服务意识,从而达到有效化解或减轻患者焦虑恐惧情绪的目的。
参考文献
[1]姚菊英,高春红.膝关节镜手术病人的康复护理[J].护理学杂志,2002,17(2):150-151.
[2]汪向东,王希林,马弘.心理卫生评定量表手册[J].中国心理卫生杂志,1999,12(增刊):253-256.
[3]滕云.胃镜检查前患者焦虑的护理体会[J].中国医药指南,2012,10(28):301-302.
[4]张凌燕,王艳玲.初次胃镜与多次胃镜检查患者焦虑状况分析[J].中华现代护理杂志,2009,15(7):630-631.
[5]Zaman A,Hahn M,Hapke R,et al.A randomized trial of perorlavesus transnasal unsedated endoscopy using an ultrathim videoenodscope[J].Gastrointest Endosc,1999,49:279-84.
关键词:大数据分析 新闻深化报道 应用研究
大数据分析如今已经触及到了社会生活的各个领域,近些年来的全国两会就是典型代表,新闻报道中应用大数据分析,使得新闻报道更加具有说服力。通过大数据分析,新闻报道能够挖掘潜在新闻元素,发现新闻事件中的逻辑规律,从而丰富新闻报道的内涵,读者也能够对新闻事件作出更加理性的判断。可是,大数据分析究竟是什么?大数据分析在深化新闻报道中又是如何体现的呢?笔者将对有关内容作进一步研究。
一、大数据的基本概念
最早提出“大数据时代”概念的是美国的麦肯锡公司,在对大数据进行定义的时候,麦肯锡研究所是这样理解的:大数据是相对于传统数据而言的一个概念,指的是依靠传统的数据库软件或者工具难以抓取、存储、管理和分析的数据群。与麦肯锡研究所不同的是,百度百科给大数据下定义的时候是这样描述的:大数据又称为巨量资料,由于大数据涵盖的资料规模庞大,利用当前主流的数据软件或者工具在一定的时间内无法达到撷取、管理、处理并整理成为更加积极的帮助企业或者组织进行经营管理决策的资讯。无论是何种定义,都认为大数据已经超出了传统的数据库软件或者工具的能力范围,大数据具有大量、高速、多样、价值高等特点。
二、大数据分析在深化新闻报道中的应用
(一)寻找准确的切入角度
大数据分析应用在新闻报道中,能够帮助新闻工作者找准新闻事件的切入点。新闻行业是数据的重要应用者,通过数据分析,能够将原本分散、琐碎的数据呈现出一定的逻辑规律,使得新闻报道的切入点更好把握,从而让新闻工作者能够对新闻热点进行深度解读。比如,在报道全国两会的时候,很多老百姓关心的问题,如果通过大量的文字进行描述,可能会让老百姓感觉过于形式化,新闻报道中通过大数据分析,切入点找准之后,能够和老百姓产生共鸣,引起的社会关注度也更高。
(二)加强新闻报道的深度
以往,新闻工作者在进行新闻报道的时候,要想获得相关的数据只能够通过电话联系的方式经过有关部门的同意之后才能够实现,整个程序下来非常繁琐,并且获取的数据并不一定能够真实反映数据背后的意义。但是,和以往大不相同的是,网络的存在使得世界各国的数据触手可及,新闻报道中大数据分析的应用,可以最大限度地提升新闻报道的深度。例如,前些年有一则科技类的新闻,标题是“联想超越惠普,成为全球第一大个人电脑厂商”。面对这样一则新闻,为了能够让读者更加信服,彭博新闻社应用大数据分析进行了深度剖析,以2004年联想和IBM签订合同作为起点,对比分析了世界范围内的五大个人电脑生产商的股价变化,其中就利用到了大数据,通过数据对比,有力地说明了联想这在八年内市场份额的不断扩大,从而实现了对惠普的赶超。新闻中的大量数字的出现,很好的解决了质疑者的疑问,而这样一个实例也恰恰显示了大数据分析应用在新闻报道中能够使得报道更具深度。
(三)创新新闻报道视角
大数据分析应用在新闻报道中能够给新闻报道提供更具特色的报道视角。曾经在《两会大数据》节目中有人提出过这样一个问题:中国“两会”的召开,在哪个国家的关注度更高?以往,面对这样一个问题很难解答,即使能够作出回应也只能通过诸如《全球高度关注中国两会》这样的报道中寻找答案,而这样的答案通常都是含糊不清的。然而,借助《两会大数据》栏目,能够合理地对全球其他国家对“两会”的关注度进行排名,得出的结果将会更加具有说服力。通过对全球将近90个国家的网民对“两会”新闻的浏览、评论的数据,经过数据分析,可以客观公正地显示出关注“两会”的热点区域,使得国人对国外民众如何看待“两会”的问题的答案从模糊变得明确,而这都是利用大数据分析实现的。
(四)s短报道响应的时间
大数据时代,新闻工作者能够更加快速地收集数据、分析数据、选取数据,然后形成相应的新闻报道,为受众提供及时的新闻资讯。不管是关系百姓日常出行的天气预报,还是各种网络热点新闻,大数据分析的应用,可以在最短的时间内对问题进行解读分析,受众可以不出家门就能够及时了解到世界各地的新闻资讯,大数据极大地缩短了新闻报道响应的时间。新闻报道具有客观性,也具有时效性,对于新闻工作者而言,如何第一时间将新闻报道出来以此吸引更多读者前来阅读是他们每天必须考虑的事情。大数据分析的应用,采用最新技术和方法来加速相应的时间,这样就使得掌握大数据分析报道方法的机构能够掌握最佳的报道实际,不但节约了大量成本,还获取了海量的关注,新闻报道的实效性更强,新闻事业的发展也将更进一步。
三、结语
网络时代背景下,我们不可避免地将同各式各样的数据产生接触,大数据不但改变了我们的思维方式,还该变了我们的生产方式,更加改变了我们的生活方式。大数据分析的应用,使得新闻报道更加具有深度的同时,它的时效性也大大增强。期待在大数据背景下,新闻报道能够借助大数据分析实现更好的发展。
参考文献:
[1]程洁.大数据分析在深化新闻报道中的应用[J].新闻爱好者,2014,(07).
[2]胡艳.数据可视化在新闻报道中的应用前景探析[J].西南民族大学学报(自然科学版),2014,(05).
关键词:组合预测方法 旅游经济 数据分析预测
现阶段,国家对旅游行业的投资显著增加,旅游经济成份发展也呈现出多元化趋势,投资格局也渐趋多元,旅游业“政府主导、社会参与、市场运作”的发展模式发展应用也渐趋成熟。但是旅游行业的发展过程中面临着环境、经济政策等各项影响因素,需要构建有效的发展模式,全面提升经济发展科学化与系统化水平。本文着重分析了组合预测方法在旅游经济分析预测中的创新应用。
一、旅游经济发展现状概述
近年来,我国旅游行业的发展呈现出资源特色化与旅游需求多元化的特点,基于此发展趋势,国家注重进行了特色化、综合化旅游资源开发,为旅游行业的发展注入了新生机。伴随着旅游资源的开发,旅游经济网络不断升级完善,但是有些地方的旅游经济指标仍然存在不科学现象,还有些地方旅游经济发展相关机制并不健全,直接影响了旅游经济行业现状分析与前景预测工作的开展,间接导致了旅游经济目标的实现,严重不利于区域的协调发展。
此外,有些地方的旅游经济发展进展方式不科学,主要表现在旅游资源的开发过程中忽视环境生态指标的落实,直接降低了地区旅游资源开发过程中生态效益的实现,由此可见,健全旅游行业的组合预算模式进行旅游经济现状分析与前景预测具有必要性与紧迫性。
二、组合模型研究与应用
现阶段,旅游经济行业预测方法多样,但是受多种因素的影响,使用单一的经济预测方式具有一定的局限性,旅游行业发展受多元化因素的影响,因此行业经济预测方法应该囊括旅游行业多元因素的实际情况,并能进行综合化的预测评估,并全面提升旅游行业经济工作的科学化水平。基于这种方法需求,众多学者主张将组合预测分析法应用于旅游经济分析预测中,该方式采用模型预测模式能够全面、系统的推进旅游经济预测分析工作的进展。
(一)单项预测模型构建
现阶段,旅游经济行业分析预测工作中应用的模型主要有指数平滑模型、ADL回归分布滞后模型及局部多项式估计模型三种,其中前两种应用比较广泛,并且模型构建过程中具有一定的技术要点。
1、指数平滑模型
指数平滑模型的构建是基于指数平滑法组建的模型,又叫作指数修匀,具有进行数据自动跟踪的功用,因此在短期经济趋势预测方面应用广泛。指数平滑模型应用于旅游经济数据预测中能够减弱数据过大波动,可以进行有效的短期趋势预测。
指数平滑模型进行数据波动处理时会综合应用各种方法,这样能够有效避免数据处理的滞后性,能及时捕捉到数据的动态更新,具有广泛的应用价值。
2、ADL模型
ADL模型基于经济预测理论与数据信息处理结合基础,能够处理变量数据并总结出变量中稳定关系的应用模型,该模型主要应用于经济变量参数阐述,并进行数据统计与诊断检验,因此在旅游经济参数确定中具有利用价值。但是该模型在应用中一旦丢失解释变量将会直接导致模型应用偏差,因此要注意该模型应用中的解释变量的保存。
此外,ADL模型应用中的参数估计是其重要环节。传统的该模型应用中常考虑国际旅游外汇收入,现阶段应用比较广泛的模型将入境过夜旅游人数作为变量算入模型,有效提升了模型得出的回归参数的有效性。而且新模型应用中还进行了模型检验与优化,尤其是进行了自相关性LM检验与Wald系数检验,全面减少了模型应用的约束因素。
(二)组合预测模型参数估计预测
组合预测法是综合多种预测方法与模型设计进行经济数据分析与预测的新型方法,主要分为线性组合预测与非线性组合预测两种。组合预测法具有较高的预测精度。在预测实践中,采用不同的预测方法会得出不同的数据结果,这与其中的参数估计与预测有关。
组合预测模型中的参数估计与预测环节中比较重要的是各单项预测中加权系数的选取,应用比较广泛的是误差平方和最小的方法。现阶段,参数估计与预测中构建了误差评价指标体系,其中着重就加权系数应用有效性规定了评价标准,并分七种情况进行了预测效果罗列,这样应用该预测方法进行数据分析能够较低风险性。
三、旅游经济前景预测应用
将组合预测法应用于旅游经济数据处理领域能够有效强化旅游行业的数据统计,为旅游行业发展提供科学指导,尤其是应用于旅游经济前景预测环节。
将组合预测法应用于旅游经济数据分析预测中可以为经济调控与经营方式的改进提供指导,因此该法在旅游经济发展前景中应用将会越加广泛。
四、结束语
本文着重分析了组合预测分析法在旅游经济分析预测中的应用,笔者认为将该技术应用于旅游经济分析中能够进行经济前景预测,其应用具有重大的战略意义。强化组合预测模型构建,并精确模型参数,对于提升组合预测法应用价值意义重大。
参考文献:
[1]雷可为,方田红.基于组合模型的陕西省旅游市场需求预测[J].西北师范大学学报(自然科学版),2009(03)
云计算、大数据浪潮的一个表现是,IT市场从“以计算为中心”向“以数据为中心”转变。以IDC的2012年第三季度市场分析数据为例,外部存储市场增长3.3%,服务器市场却下降4%。这是因为,云计算让廉价的X86服务器可以担当重任,“计算”的门槛便降低了。
“数据”方面的情况则是,数据量飞速增长。最近,IDC了2012数字宇宙研究报告,报告调高了对数字宇宙增长速度的预测。2010年,IDC预测到2020年,数字宇宙的规模为35ZB。在最新的报告中,这一数字变为40ZB。
2013年,我们还将看到,云计算、大数据浪潮正在引发IT厂商格局的巨变。思科公司董事长钱伯斯最近做出预言,微软、IBM、惠普、SAP、甲骨文和思科等科技巨头,5年内将有两家或3家不在名单之列。同时,EMC、VMware进一步提出软件定义数据中心的理念,将云计算的变革推向深入。
在IT产业中,EMC公司的规模并不算很大。2012年销售收入预测为216亿美元~217.5亿美元,而它在IT业界的地位超过了很多规模大的公司。EMC之所以能够引领云计算、大数据潮流,是因为公司决策层能够敏锐地洞悉行业技术趋势,从产品、技术和解决方案上提前布局。
最近,EMC公司全球11位高管从技术的角度,对2013年全球技术趋势进行了预测。这11位高管分别来自信息安全、信息智能、企业存储、闪存产品、备份恢复、大数据分析等部门。他们认为云基础架构和大数据分析处理的最新需求趋势是:
由于软件智能、跨域基础架构管理软件包以及对象存储开放接口技术的广泛采用,混合云模式将变成现实;
大数据存储将催生新型应用,IT创新和变化的速度加快;
提供单点式工具的大数据初创公司前景不乐观,客户需要集成式解决方案;
信息安全需要基于大数据分析的深度防御战略;
企业级存储将更多采用行业标准组件、企业级闪存和领先的驱动器技术;
闪存将成为常态产品,相变存储器将迎来投资热潮;
统一存储方面,从服务器、网络到存储,将普遍采用闪存技术;
“重复数据删除技术+磁盘备份”的模式将进一步替代磁带备份,备份恢复朝着“IT即服务”方向发展;
企业内容管理方面,基于云服务模式、以内容为中心的解决方案将达到质变点;
由于人们越来越多地采用云和大数据,企业在IT改造中,人、流程和技术的重要性凸显。
【关键词】信息化系统 高速公路 交通数据分析 应用
一、前言
信息管理系统在高速公路交通数据分析中发挥着重要的作用,它不仅减轻了人工数据统计的体力支出和成本支出,同时也能够较好的适应高速公路运营的出现的新情况和新问题,并能够利用统计分析的原理加以剖析,为高速公路建设和管理的科学化提供良好的借鉴性意义,以更好保证高速公路运营的正常性,创造更多的企业效益,为经济社会的发展提供较为稳定的基础设施。信息管理系统广泛应用于高速公路交通数据分析过程中,并且在高速公路交通数据分析过程中发挥着越来越重要的作用已成为一项不争的事实,各国都注重了信息管理系统在高速公路交通数据分析中的作用,采取多种方式加以研究,力求发挥信息管理系统在高速公路交通数据分析中作用的最大化。
二、信息管理系统
作为信息管理系统是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。用户通过访问数据库中的数据,数据库管理员也进行数据库的维护工作。它可使多个应用程序和用户用不同的方法在同时或不同时刻去建立,修改和询问数据库。数据管理系统的应用增强了系统的灵活性,加快了数据分析的速度,从而更好的实现数据分享,将数据分析结果应用于政策制定和实施,从而有效的增强了政策的科学性。
三、将信息管理系统应用于高速公路交通数据分析中的意义
(一)经济社会发展的迫切需要
伴随着我国经济社会的快速发展,交通运输业也需要紧跟经济社会发展的步伐,而高速公路的建设和发展对于交通运输业的发展具有极其重要的意义。将信息管理系统应用于高速公路交通数据分析过程中,综合我国经济发展态势和各地区的经济发展现状能够更好地规划和设计交通运输方式,从而更好地推动经济社会的可持续发展。
(二)高速公路管理科学化的要求
高速公路交通系统中数据分析是重要的基础性工作。它体现公路交通系统的业务情况以及车流构成、流量、流向等特征,可以为高速公路事业的规划、建设和管理提供科学依据。随着我国公路收费系统步入了计算机联网收费阶段,利用高速公路信息管理系统进行高速公路的交通数据分析成为重要手段。高速公路信息管理系统从最初方案设计开始,就充分考虑整个系统的整体性和扩充性,并对高速公路信息管理系统进行合理划分,从而更好地实现高速公路联网收费和统一管理,做到路网内行驶一卡通和按路段合理结算,以提高高速公路管理的科学化水平。
四、广西高速公路信息化系统建设概况
广西高速公路收费系统是为了满足对高速公路收费统计查询以及分配的需要,结合现有的管理机制而分析和设计的,可分为收费管理与清分二个部分。收费管理的目的是通过利用计算机网络和相应的软件,并与通讯、监控系统相配合来大幅度提高收费效率以及提高财务核算的安全性和自动化程度,降低工作人员的工作强度。同时最大限度地防止各种营私舞弊现象,提高工作效率,为管理决策层提供各种相关信息。目前高速公路的管理体制,自上向下分为四层的行政管理结构,即联网清分总中心―收费中心―收费分中心―收费站。
收费站是收费的基层单位。收费车道的原始数据汇总到收费站,收费站监控员进行当班数据的汇总,统计核对收费数据。收费站站务员对收费数据复核,并进行必要的数据纠错,提供本收费站正确完整的汇总数据。同时收费站的原始数据实时通过TCP/IP协议上传总中心,汇总数据在站务员输入的同时也上传总中心。所以,收费站一级是总中心收费数据的基础。分中心和中心本地不保存收费数据,它访问收费站获得它要的数据。总中心的数据统计、数据查询和清分是依据收费站上传的数据。
五、从具体数据看信息管理系统在高速公路交通数据分析中的应用
(一)车流流量统计与分析应用
车流流量统计与分析应用是信息管理系统在高速公路交通数据分析中的一个方面,通过信息管理系统,我们能够实现对高速公路车流流量统计与分析。下表为某城市路段高峰车流量分析表,见表1:
通过以上分析,我们能够明确的看出个收费站在高峰和低峰期车流量,及各个时间段的变化和平均小时流量的变化,并根据相关数据合理安排各收费站的工作人员情况,更好的确保交通的畅通性。
(二)车流流向统计与分析应用
车流流量统计与分析应用是信息管理系统在高速公路交通数据分析中的另一个方面,下表是某城市途经A路段的绿色通道车辆流向统计表,见下表:
路段 其他路段站码 入口车辆数 出口车辆数 合计
A路段
101 108 10782 10890
105 754 137 891
206 43 59 102
501 202 42 244
705 1158 47 1205
803 3330 11520 14850
821 77 933 1010
909 1490 3596 5086
921 2590 3352 5942
999 359 1770 2129
从表格中我们可以清楚掌握途经A路段的绿色通道车辆在全区部分路网中分布和走向情况,为高速公路管理者更清晰地认识高速公路通行费减免情况,并提供精确数据以合理决策。
(三)路段综合信息车流量统计分析和应用
路段综合信息车流量统计分析和应用是信息管理系统在高速公路交通数据分析中的又一个方面。下表为两段高速A、B年度车流量综合统计分析表:
分析项目 A 路段 B路段 AB高速合计
路段内收费站数量 5 6 11
里程(公里) 72 116 188
拆分所得通行费 16805万 20854万 37659万
收取路段通行费 4693万 14420万 19113万
每公里路段发生的通行费 233万 180万 200万
路段内收费站出入口车流量 1639616 3576253 5215869
日均断面车流量 5911 8009 6955
通过以上分析,我们得出了两路段的综合信息车流量统计分析,透过数据,我们能够了解到路段通行费,从而实现更好的费用管理。
六、小结
信息管理系统在高速公路交通数据分析中发挥着重要的作用,高速公路交通数据分析是一个较为复杂的过程,以上只是将车流量进行了简单的统计,交通数据分析还要对通行费、通行卡进行综合统计。单方面通过某一种交通数据是无法的得出正确的交通数据分析结果,只有通过上述方式将多重数据综合进行分析,才能得出所需要的结论,为高速公路的管理者和决策者提供正确的分析依据,促进我国交通运输事业和经济社会的快速发展。
参考文献:
[1]段广云,沈振宇.高速公路交通信息系统实际应用中的若干问题及对策.公路交通技术,2009年,第06期:21-22
本研究报告数据主要采用国家统计数据,海关总署,问卷调查数据,商务部采集数据等数据库。其中宏观经济数据主要来自国家统计局,部分行业统计数据主要来自国家统计局及市场监测数据,企业数据主要来自于国统计局规模企业统计数据库及证券交易所等,价格数据主要来自于各类市场监测数据库。
报告目录:
第一章 计算机行业报告研究标准
第一节 计算机行业研究背景
第二节 计算机行业研究方法及依据
第三节 计算机行业研究基本前景概况
第二章 计算机行业发展综述
第一节 计算机概念
第二节 计算机行业特征分析
一、计算机作用分析
二、计算机行业在国民经济中的地位
三、计算机行业生命周期分析
第三节 最近几年中国行业经济指标分析
一、赢利性
二、成长速度
三、附加值的提升空间
四、进入壁垒/退出机制
五、风险性
六、行业周期性
七、竞争激烈程度指标
八、行业成熟度分析
第四节 **行业产业链及上下游之间关联性分析
第三章 XX年世界计算机行业市场分析
第一节 XX年世界计算机行业运行环境分析
一、当前经济环境分析
二、经济政策对产业的影响
第二节 XX年世界计算机市场竞争现状分析
第三节 XX年世界部分国家计算机市场分析
一、欧洲地区
二、北美地区
三、亚洲地区
第四节 XX-2019年世界计算机行业新趋势研究分析
第四章 XX年计算机行业当前发展环境分析
第一节 XX年中国计算机行业经济环境分析
一、XX年中国宏观经济分析
二、XX年中国宏观经济发展预测
第二节 中国计算机行业政策法规解读
第三节 中国计算机行业当前社会环境发展分析
第五章 我国计算机行业运行分析
第一节 我国计算机行业发展状况分析
一、我国计算机行业发展阶段
二、我国计算机行业发展总体概况
三、我国计算机行业发展特点分析
四、我国计算机行业商业模式分析
第二节 XX-XX年计算机行业发展现状
一、XX-XX年我国计算机行业市场规模
二、XX-XX年我国计算机行业发展分析
三、XX-XX年中国计算机企业发展分析
第三节 区域市场分析
一、区域市场分布总体情况
二、XX-XX年重点省市市场分析
第四节 计算机细分产品市场分析
一、细分产品特色
二、XX-XX年细分产品市场规模及增速
三、重点细分产品市场趋势分析
第五节 计算机产品价格分析
一、XX-XX年计算机价格走势
二、影响计算机产品价格的关键因素分析
1、成本
2、供需情况
3、关联产品
4、其他
三、XX-2019年计算机产品价格变化趋势
四、主要计算机企业价位及价格策略
第六章 XX-XX年中国计算机行业技术发展分析
第一节 中国计算机行业技术发展现状
第二节 计算机行业技术特点分析
第三节 计算机行业技术发展趋势分析
第四节 XX年中国计算机行业发展面临的新挑战分析
第七章 XX-XX年中国计算机市场运行情况
第一节 行业最新动态分析
一、行业相关动态概述
二、行业发展热点聚焦
第二节 行业品牌现状分析
第三节 行业产品市场价格情况
第四节 行业外资进入现状及对未来市场的威胁
第八章 XX-XX年中国计算机所属行业主要数据监测分析
第一节 XX-XX年中国计算机所属行业总体数据分析
一、XX年中国计算机所属行业全部企业数据分析
二、XX年中国计算机所属行业全部企业数据分析
三、XX年中国计算机所属行业全部企业数据分析
第二节 XX-XX年中国计算机所属行业不同规模企业数据分析
一、XX年中国计算机所属行业不同规模企业数据分析
二、XX年中国计算机所属行业不同规模企业数据分析
三、XX年中国计算机所属行业不同规模企业数据分析
第三节 XX-XX年中国计算机所属行业不同所有制企业数据分析
一、XX年中国计算机所属行业不同所有制企业数据分析
一、XX年中国计算机所属行业不同所有制企业数据分析
一、XX年中国计算机所属行业不同所有制企业数据分析
第九章 XX-XX年中国计算机行业竞争情况
第一节 行业经济指标分析
一、赢利性
二、附加值的提升空间
三、进入壁垒/退出机制
四、行业周期
第二节 行业竞争结构分析
一、现有企业间竞争
二、潜在进入者分析
三、替代品威胁分析
四、供应商议价能力
五、客户议价能力
第三节 行业国际竞争力比较
第十章 XX-XX年计算机行业重点生产企业分析
第一节 a企业
一、企业简介
二、企业经营数据
三、企业产品分析
第二节 b企业
一、企业简介
二、企业经营数据
三、企业产品分析
第三节 c企业
一、企业简介
二、企业经营数据
三、企业产品分析
第四节 d企业
一、企业简介
二、企业经营数据
三、企业产品分析
第五节 e企业
一、企业简介
二、企业经营数据
三、企业产品分析
……………
第十一章 XX-2019年计算机行业发展预测分析
第一节 XX-2019年中国计算机行业未来发展预测分析
一、中国计算机行业发展方向及投资机会分析
二、XX-2019年中国计算机行业发展规模分析
三、XX-2019年中国计算机行业发展趋势分析
第二节 XX-2019年中国计算机行业供需预测
一、XX-2019年中国计算机行业供给预测
二、XX-2019年中国计算机行业需求预测
第三节 XX-2019年中国计算机行业价格走势分析
第四节 XX-2019年中国**行业盈利水平分析
第十二章 XX-2019年中国计算机行业投资风险预警
第一节 XX-2019年中国**行业投资环境分析
第一节 中国计算机行业存在问题分析
第二节 中国计算机行业政策投资风险
一、政策和体制风险
二、技术发展风险
三、经营管理风险
四、供需波动风险
五、其他风险
第十三章 XX-2019年计算机行业投资机会与风险
第一节 经济形势给我国计算机企业带来的机遇分析
一、为享受调控政策带来机遇
二、为搞好战略转型带来机遇
三、为吸引国际投资带来机遇
四、为招聘高端人才带来机遇
五、为实施战略重组带来机遇
六、为降低制造成本带来机遇
第二节 经济形势下计算机行业发展机遇分析
一、经济形势为计算机企业提供了并购国外企业的机会
二、经济形势导致部分 经营不善的计算机企业退出市场
三、经济形势中我国计算机企业发展机遇分析
第三节 计算机企业战略规划不确定性风险
一、客观事件的不确定性风险
二、市场的不确定性风险
三、行业发展的不确定性风险
四、技术发展的不确定性风险
五、战略规划者的主观不确定性风险
六、执行过程的不确定性风险
七、工具方法的局限性风险
八、战略规划系统的不确定性风险
第十四章 计算机行业发展战略研究
第一节 计算机行业发展战略研究
一、技术开发战略
二、产业战略规划
三、业务组合战略
四、营销战略规划
五、区域战略规划
六、企业信息化战略规划
第二节 计算机行业品牌战略分析
一、品牌的基本含义
二、品牌战略在企业发展中的重要性
三、计算机品牌的特性和作用
四、计算机品牌的价值战略
五、我国计算机品牌竞争趋势
六、计算机企业品牌发展战略
七、计算机行业品牌竞争策略
第三节 计算机企业经营管理策略
一、企业经营策略综述
二、企业产品经营策略
三、企业渠道经营策略
四、企业并购策略分析
五、当前形势下企业经营管理策略
图表目录:
图表:国内生产总值同比增长速度
图表:全国计算机产量及其增速
图表:规模以上工业增加值增速(月度同比)(%)
图表:社会消费品零售总额增速(月度同比)(%)
图表:进出口总额(亿美元)
图表:广义货币(m2)增长速度(%)
图表:居民消费价格同比上涨情况
图表:工业生产者出厂价格同比上涨情况(%)
图表:城镇居民人均可支配收入实际增长速度(%)
图表:农村居民人均收入实际增长速度
图表:人口及其自然增长率变化情况
图表:XX年固定资产投资(不含农户)同比增速(%)
图表:XX年房地产开发投资同比增速(%)
图表:XX年中国gdp增长预测
图表:国内外知名机构对XX年中国gdp增速预测
图表:计算机行业产业链
图表:XX-XX年计算机行业市场供给
图表:XX-XX年计算机行业市场需求
图表:XX-XX年计算机行业市场规模
图表:XX年中国计算机所属行业全部企业数据分析
图表:XX年中国计算机所属行业全部企业数据分析
图表:XX年中国计算机所属行业全部企业数据分析
图表:XX年中国计算机所属行业不同规模企业数据分析
图表:XX年中国计算机所属行业不同规模企业数据分析
图表:XX年中国计算机所属行业不同规模企业数据分析
图表:XX年中国计算机所属行业不同所有制企业数据分析
图表:XX年中国计算机所属行业不同所有制企业数据分析
图表:XX年中国计算机所属行业不同所有制企业数据分析
图表:计算机所属行业生命周期判断
图表:计算机所属行业区域市场分布情况
图表:XX-2019年中国计算机行业市场规模预测
图表:XX-2019年中国计算机行业供给预测
图表:XX-2019年中国计算机行业需求预测
[关键词]大数据;预测精度;数据挖掘;自适应;数据质量
doi:10.3969/j.issn.1673 - 0194.2017.02.031
[中图分类号]F273 [文献标识码]A [文章编号]1673-0194(2017)02-00-07
1 大数据时代对烟草行业的影响
大数据应用于烟草信息研发,能使烟草行业充分了解、及时掌握当今世界的烟草信息,有效调整烟草战略、市场决策,使行业立于不败之地。
凌成兴在2014年全国烟草工作会议上提出烟草行业要深入思考、积极谋划、努力实践“三大课题”,即深入思考、积极谋划、努力实践改革的红利在哪里?发展的潜力在哪里?追赶的目标在哪里?这是我国烟草行业今后一段时期内努力发展的方向和奋斗的目标。
烟草企业借助大数据研发应用的分析,可以随时掌握世界新的烟草信息,捕捉其技术要领,了解其发展的先进性与适应性,并为我所用,从而可以积极有效地推动我国烟草行业的发展,促进“三大课题”的努力实践和圆满成功,为我国烟草行业快速、高效地发展提供坚实的信息技术后盾,奠定快速、高效发展的坚实基础。第一,它可以进一步优化烟草市场的资源配置,建立统一开放、竞争有序的市场体系,创造和释放烟草改革的红利空间。因为大数据的研发应用本身就是一次全新的信息技术改革。第二,它能不断地挖掘结构调整、国际市场、货币资金保值增值所蕴藏的发展潜能,努力实现烟草“十三五”的奋斗目标。第三,它能早日实现我国追赶烟草跨国公司前三名、烟机制造公司的“排头兵”、原材料与辅助材料生产的大集团的新目恕⑿吕硐搿⑿乱求,实现中国烟草行业进入新的发展格局的目标。
大数据的应用分析,是当今信息时代又一次全新的、更高的、更庞大的与更复杂的信息化技术革命。它对提高现代经济分析能力和管理水平、提高一个行业或一个单位的准确决策和经济实力的能力,有着不可估量的积极作用,蕴藏着巨大的潜力和能量。
2 烟草制造过程中大数据工艺管控和常规数理统计工艺管控的差异分析
现阶段行业内卷烟厂工艺管控主要以常规数理统计算法为主,辅助以信息化的手段实现预警控制。例如上海卷烟厂通过加入SPC对应的判异准则,固化至信息化系统中,创新地提出了SPCD的管控方法。青岛卷烟厂通过将6 sigma分析的指标权重纳入信息化实时预警管控分析,创新性地提出了卷烟制造过程能力信息化预警分析的管控方法。迄今为止,烟草行业内还没有卷烟厂实现了以大数据算法为核心的工艺管控实例,即通过大数据分析方法全面补充和完善常规数理统计的短板,实现工艺智能化管控水平的螺旋式上升。本文将从四个方面对大数据分析与常规数理统计在工艺管控层面的差异进行对比,旨在全面凸显大数据分析的优势,进而对烟草制造过程中信息化工艺管控的前景进行探索。
2.1 预测精度对比
大数据预测有别于常规数理统计的回归分析,常规数理统计的回归分析是建立在数据均满足正态性和样本独立性两个条件为前提的,同时在回归过程中要通过逐步回归剔除对应的异常点,方能进行回归算法的计算。而大数据预测则无需这些条件的限制,可直接根据特征样本进行训练,直接得出对应的预测结果。
2.1.1 常规数理统计分析
以某卷烟厂烘丝出口水分为例进行说明。
对影响烘丝出口水分对应的过程参数建立对应的回归方程表如表1所示。
由图1可以看出,叶丝冷却出料含水率的四合一残差图以及各自变量残差图分布均匀,满足齐次、正态等特点。
根据回归方程对测试集数据进行预测,如表4所示。
将预测值与真实值进行偏差计算,如表5所示。
2.1.2 大数据分析
首先,对影响烘丝出口水分对应的过程参数建立随机树模型,如图2所示。
从图2中可以看出,参数4离线程度最大,因此参数4重要度最高,根据离线度得出其参数重要性排序为参数4(叶丝干燥出料含水率)>参数1(叶丝干燥Ⅰ区筒壁温度)>参数2(叶丝干燥Ⅱ区筒壁温度)>参数3(叶丝干燥热风温度)>参数5(叶丝干燥出料温度)。
再进行决策树分析,根据决策树得出如下对应的过程参数与关键质量特性二叉树(如图3所示)。
然后根据随机树运算结果进行预测,如表6所示。
最后将预测值与真实值进行偏差计算,如表7所示。
2.1.3 大数据分析与常规数理统计预测精度对比
大数据分析与常规数理统计预测精度对比,如图4所示。
通过绘制时间序列图,将常规梳理统计预测值、大数据预测值分别与真实值进行偏差对比,可以看出,大数据预测精度远大于常规梳理统计的预测精度。
2.2 数据挖掘能力对比
常规数理统计需要挖掘数据隐含的信息,需要借助相应的现场分析为手段,例如需分析出结果指标的异常是因为哪类过程指标异常导致的。其需要建立各级过程指标对结果指标的影响程度,其次在结果指标异常时通过现场人员从影响程度高的指标进行逐一排查。而大数据分析可直接通过结果指标的允许范围得出各级过程指标的取值范围,自动进行预测分析并得出对应的结论。
2.2.1 常规数理统计分析
以某卷烟厂加料出口水分为例进行说明。
第一步:计算各级参数的Pearson系数,形成对应的Pearson矩阵,如表8、表9所示。
第二步:将各级参数的R值进行排列。
由以上的Pearson矩阵可以得出,各级参数与结果指标P值均小于0.05,表明各级参数均与结果指标相关,并得出各级参数的相关性R值大小,如表10所示。
绘制出如图5的饼图。
2.2.2 大数据分析
第一步:通过决策树形成重要度排列图,如图6所示。
第二步:通过神经网络求出结果指标对应的过程指标的相应范围。
基于结果指标的望目特性(中心值是18.20%)的允差上下限为[17.20%,19.20%],运用大数据预测技术得出各级过程参数对应的有效取值范围。
运用R语言分析,一级加料入口含水率预测有效范围如图7所示。
通过大数据预测结果可以看出,为保证一级加料出口含水率满足标准,一级加料入口含水率有效取值范围应为[16.07%,16.75%]。
运用R语言分析,一级加料工艺热风温度预测范围如图8所示。
通过大数据预测结果可以看出,为保证一级加料出口含水率满足标准,一级加料工艺热风温度有效取值范围应为[52.06%,51.90%]。
运用R语言分析,一级加料蒸汽自动阀门开度预测有效范围如图9所示。
通过大数据预测结果可以看出,为保证一级加料出口含水率满足标准,一级加料蒸汽自动阀门开度有效取值范围应为[51.70%,53.63%]。
运用R语言分析,一级加料出料温度预测有效范围如图10所示。
通过大数据预测结果可以看出,为保证一级加料出口含水率满足标准,一级加料出料温度有效取值范围应为[51.27℃,53.59℃]。
运用R语言分析,一级加料工艺流量预测有效范围如图11所示。
通过大数据预测结果可以看出,为保证一级加料出口含水率满足标准,一级加料工艺流量有效取值范围应为[2 946kg/h,3 000kg/h]。
小结:通过对比大数据分析和常规梳理统计分析,可以看出,大数据能够实现通过结果指标的取值范围挖掘出过程指标的取值范围。而常规梳理统计只能做到重要度的排序,因此,大数据分析对应的数据挖掘能力远大于常规数理统计分析对应的数据挖掘能力。
2.3 自适应能力对比
常规数理统计不具备自适应的算法,所谓的自适应算法,是指处理和分析过程中,能够根据被处理数据的数据特征自动调整处理方法、处理顺序、处理参数、边界条件或约束条件,使其与所处理数据的统计分布特征、结构特征相适应,以取得最佳的处理效果。
大数据分析由于加载了自适应分析模块,通过加载机器自学习算法,能够实现“松耦合、高扩展、低成本”的柔性化控制,即能够通过机器自学习自动根据数据特性的变化得出对应的新的控制标准,避免了卷烟厂的重复、不必要的投资,实现系统由原先的“封闭式”转变为“自我更新,自我优化”,提升系统的竞争力。图12为自适应分析算法流程图。
第一步:加d自适应算法
能够加载自适应算法,按照自适应模型进行机器自学习,确保其能不断满足生产的实际情况。
第二步:根据数据质量特性运用机器自学习形成新的标准
以松散回潮出口水分为例,其2015年和2016年通过机器自学习得出控制标准,运用R语言分析,得出结果,如图13所示。
图13 松散回潮出口水分标准自适应结果
从机器自学算法可以看出,2015年松散回潮出料含水率标准为[15.41%,18.32%],而2016年松散回潮出料含水率标准自适应变更为[14.30%,17.29%]。
2.4 数据质量分析能力对比
常规数理统计无法通过对应的方法实现对数据真实性、完整性、及时性与是否进行加载的平滑算法进行验证。需要从别的角度进行分析和验证。例如需要从底层PLC程序、上位WINCC程序进行解读才能知道是否加载了平滑算法。对数采点时间是否对应进行数据及时性的分析。大数据分析由于集成了拟合分布、AdaBoost、延迟有效性判断等算法,可实现数据真实性、完整性、及时性与是否采用平滑算法进行全面的分析和判断。
数据真实性判断:数据真实性判断通过拟合分布来实现。通过自适应建立各关键工序对应的拟合分布情况,进行拟合分布检验,当检验结果存在显著差异时,其数据的真实性就有待质疑。
数据完整性判断:数据完整性判断通过AdaBoost管控来实现。以历史数据为依据,建立以来料重量为依据的数采样本量预测区间,当实际数采样本数据量不在置信区间时,其数据的完整性就有待质疑。
数据及时性判断:数据及时性判断通过延迟判断有效性来实现。以历史数据为依据,建立各关键工序的数采延迟库,进行单样本T检验,当检验结果存在显著差异时,其数据的及时性就有待质疑。
数据是否采用平滑算法判断:建立数据质量验证功能库,加载多种算法,对数据是否采用平滑算法进行验证,通过以下两种方法根据实际情况进行筛选,得出数据质量验证可信度。
第一种对每种算法加载不同的权重,采用加权的方式得出最终的可信度得分。
第二种对某种基本算法加入一票否决项,当某种算法无法通过时,则直接将数据可信度置为0。其他算法无法通过时,采用扣分的形式得出最终的可信度得分。
当可信度低时,则认为数据可能存在平滑处理的可能。
以数据真实判断为示例进行说明,进而说明大数据的数据质量分析能力。
以某烟厂制丝烘丝工序为例进行演示。
通过大数据进行拟合优度检验。
伽马分布判断,如图14所示。
由图14可知,数据归集不全聚类于伽马分布的线性要求,因此数据特性分布不满足伽马分布。
对数正态分布判断,如图15所示。
由图15可知,数据归集聚类于对数正态分布的线性要求,因此数据特性分布满足对数正态分布。
Weibull(威布尔)分布判断,如图16所示。
由图16可知,数据归集不全聚类于Weibull分布的线性要求,因此数据特性分布不满足Weibull分布。
正态分布判断,如图17所示。
由图17可知,数据归集不全聚类于正态分布的线性要求,因此数据特性分布不满足正态分布。
通过检验可以看出,其烘丝出口水分历史数据满足对数正态分布。
通过对实际某批次烘丝出口水分进行分析,情况如图18所示。
由D18可知,数据归集聚类于正态分布的线性要求,因此数据特性分布满足正态分布。与历史数据的分布不同(传统数据服从对数正态分布),因此判断其数据的真实性有待商榷。
3 大数据技术在烟草制造过程中工艺管控的运用前景
大数据技术在烟草制造过程中工艺管控的运用前景可概括为以下3点。
3.1 可实现工艺管控“三级联动”的智能诊断分析
运用大数据技术,建立生产技术标准执行力的三级联动诊断机制,形成标准执行力评价与结果指标评价相结合的纽带,当结果指标异常时能智能诊断出是哪个过程指标异常导致的,这是一级诊断。除了分析过程指标以外,还能针对“5M1E”(人、机、料、法、环、测)保障因素进行联动诊断分析,深入挖掘原因,这是第二级诊断。在找到原因后,还能通过专家库自动发送对应的解决方案,这是第三级诊断。通过三级诊断分析全面建立一个包含“发现问题、分析问题、解决问题”的智能化PDCA循环,全面提升工艺管控智能化的管控水平。
3.2 可实现智能化料头与料尾的自动截取
运用大数据技术,以历史数据为依据,通过对历史数据的分布运用聚类分析方法,将数据值区分为待机值、临界值、稳态值三类,同时结合差分方法,更为准确地判断料头与料尾的位置,进一步实现非稳态数据的智能筛选。
例如,通过对一段时间内“叶丝干燥出料含水率”的生产数采数据进行聚类分析,分类结果如图19所示,第一类为稳态数据,第二类为料头料尾数据,第三类为待机数据。
根据以上分析,加载对应的自适应算法,即可实现对所有批次的智能化料头与料尾的自动截取功能。
3.3 可实现生产技术标准适用性自适应分析
运用大数据技术,能够根据大数据的方法对关键质量特性的相关性进行实时更新,并与生产技术的标准进行全面对比,提供生产技术标准适用性分析结果,如图20所示。
能够根据大数据随机森林(树)的方法对关键质量特性的重要度(当需要处理的数据庞大和实时性要求较高时,普通随机树建模过程耗时长,因此在部署“云”平台的稚嫩诊断模型时,在随机树建模过程中加入了数据集特征提取)进行实时更新,通过与生产技术标准实时对比:①若关键质量特性与生产技术标准一致,则运行生产技术标准执行力自适应分析功能;②若关键质量特性与生产技术标准出现不一致的情况,则选择一定周期内稳态数据运行关键质量特性自适应相关性拟合分析,形成生产技术标准执行力自适应分析结果,为生产技术标准的变更或换版提供数据支撑。
4 结 语
通过以上运用前景的初探,充分说明了大数据在烟草制造过程工艺管控发展前景较为广阔,相信不久的将来,基于大数据分析的烟草制造过程中工艺管控的卷烟厂数量也将大幅提升,大数据技术将帮助卷烟厂的工艺控制水平实现螺旋式上升。
注:李达,通讯作者
主要参考文献
[1]闫磊.烟草行业分销管理系统[D].济南:山东大学 2008.
[2]段永光.中国烟草工业兼并重组绩效研究[D].长沙:中南大学,2008.
[3]罗民军.株洲市烟草公司财务管理模式优化研究[D].长沙:中南大学,2008.
[4]李民灯.HH市烟草公司人力资源管理体系诊断与优化研究[D]. 长沙:中南大学,2008.
[5]刘兆茜.企业信息化评价指标体系研究与应用[D].上海:复旦大学,2008.
[6]梁忠伟.制度变迁视角下的我国烟草专卖制改革[D].广州:暨南大学, 2008.
[7]陈军.上海烟草集团公司生产计划管理发展探讨[D].上海:复旦大学, 2008.