发布时间:2022-04-15 22:12:18
序言:写作是分享个人见解和探索未知领域的桥梁,我们为您精选了8篇的数据分析方法样本,期待这些样本能够为您提供丰富的参考和启发,请尽情阅读。
企业数据分析的编写,核心在于对数据的科学分析。数据分析除了要以档案为基础,遵循“全面、真实、客观、有效”的原则外,关键是要掌握和应用科学的分析方法,使数据分析应尽可能做到深入、准确,从而使我们对数据背后所隐含的问题、原因、趋势和规律的认识能更接近于真理。
企业数据分析编写过程中,常用的分析方法有对比分析法、趋势分析法、结构分析法和综合分析法等。本文结合工作实际,对如何运用这四种基本分析方法谈点想法。
对比分析法
所谓对比分析法,是指将两个或两组以上的数据进行比较,分析它们的差异性,从而揭示这些数据所代表的事物的发展变化情况和规律性。对比分析法是比较研究的一种方法,在企业数据分析中的应用十分普遍。它的特点是,通过比较分析,可以非常直观地看出企业某方面工作的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少。
在实际应用中,企业数据的对比分析,一般有以下几种具体情况:
一是将企业当年的数据与历年(去年或前几年)的数据进行对比分析,目的是为了搞清楚与去年或前几年相比,企业某一方面或某些方面的发展变化情况。比如,某公司2006年利润100万元,2007年利润115万元,年增长率为15%。通过这种对比,我们就可以公司利润的变化情况有一个更直观、更清楚的认识。当然,在许多时候,这种对比分析不会局限在某一个数据,而是一组数据。比如,在对企业当年的利润与去年利润进行对比分析的同时,还可以将产量、销售量、销售额、成本、税金、市场占有量、占有率等指标进行对比分析,从而更全面了解掌握企业的发展现状。
二是将本单位数据与同行业(外单位、同行业平均水平)的数据进行对比分析,目的是为了搞清楚与外单位、同行业平均水平,本单位某一方面或各方面的发展水平处于什么样的位置,明确哪些指标是领先的,哪些指标是落后的,进而找出下一步发展的方向和目标。比如,2005年,某发电厂供电煤耗为340克/千瓦时,当年全国火电行业平均煤耗指标为310克/千瓦时,该发电厂的实际煤耗指标比全国火电行业平均煤耗多了30克/千瓦时。通过这样的对比分析,我们可以看出,该发电厂在能耗方面存在着比较突出问题,如何节能降耗应该成为企业下一步重点关注的一个工作内容,也是提高企业经济效益的一条重要途径。
为了一目了然地看出数据对比的直观效果,对比分析一般可用柱式图表表示。
趋势分析法
所谓趋势分析法,是指通过对某一个或几个数据在一定阶段的变化情况进行分析,从而发现该数据所代表事物的发展趋势和规律,并可进一步分析形成这种趋势的原因,为企业领导决策提供依据和参考。趋势分析法实际上是一种历史研究的方法,在企业数据分析的编写中,主要用来表示企业某一方面或某些方面的工作在一定时期内的发展趋势和规律。其特点是对某一时期的某一数据进行持续性考察,进而得出趋势性的结论。
一般说来,对数据进行趋势分析的结果不外乎以下四种情况:
一是某项数据的变化呈逐年加大的趋势,称为上升趋势。比如某企业利润额:2001年为150万元、2002年173万元、2003年220万元、2004年360万元、2005年500万元。从对这组数据的分析中可以得出结论:该企业的利润呈逐年上升的趋势。
二是某项数据的变化呈逐年减小的趋势,称为下降趋势。例某企业产品的市场占有率:2001年为30%、2002年24%、2003年15%、2004年9%、2005年6%。从对这组数据的分析中可以得出结论:该企业产品的市场占有率呈逐年下降的趋势,说明该产品的市场竞争力正在下降,企业应该对该产品进行升级换代,或者开发生产新的产品。
三是某项数据或上升或下降,每年都有较大变化,称为震荡趋势。比如某企业的经营成本:2001年为50万元、2002年83万元、2003年61万元、2004年46万元、2005年103万元。从对这组数据的分析中可以得出结论:该企业每年的经营成本变化较大,呈震荡趋势,说明企业在控制经营成本方面还要进一步采取措施。
四是某项数据几年来基本不变,或变化很小,称为稳定趋势。例如某企业的人均产值:2001年为60万元、2002年63万元、2003年61万元、2004年62万元、2005年63万元。从对这组数据的分析中可以得出结论:该企业的人均产值每年变化不大,呈稳定趋势。
为了更形象地看出数据在一定时期内的变化轨迹,对数据的趋势分析一般可以用曲线图表表示。
结构分析法
所谓结构分析法,就是通过分析数据的构成情况,即分析构成某一数据的各子数据的情况和权重,从而揭示构成某一事物的各方面因素在其中的作用大小和变化情况。结构分析法也是常用的企业数据分析方法,通过这一分析方法,有利于我们发现和把握事物的主要矛盾和矛盾的主要方面,对企业而言,可以据此确定工作重点或经营的主攻方向。
在实际工作中,当我们需要对企业的某一数据作深入分析时,常常需要用到结构分析法。例如我们分析某供电局利润的结构情况:2007年,企业利润为1000万元,其中主业占80%、三产占20%。这就是结构分析的方法,从中我们就可以清楚地知道,主业和三产对企业利润的贡献比例。在这个基础上,我们还可以作进一步的分析,在200万元的三产利润中:火电建设公司占35%、电力设计院占30%、电缆厂占15%、电表厂占10%、电杆厂占5%、宾馆占5%。从而我们可以看出火电建设公司和电力设计院两家对三产利润的贡献率达到了65%,是发展三产的主力军。从供电局的角度而言,抓好三产工作,重点是要抓好火电建设公司和电力设计院的工作。
为了直观地反映某一数据的构成情况,结构分析法一般采用圆饼图表来表示分析的结果。
综合分析法
在编写企业数据分析时,往往不是单一地使用一种数据分析方法,为了使数据分析更透彻、更深入,更多时候我们都需要采用综合分析的方法。所谓综合分析法,就是将以上两种或两种以上的分析方法结合起来使用,从而多角度、多层次地分析揭示数据的变化、趋势和结构情况,以增加数据分析的深度。
综合分析法在具体应用中,有以下几种情况:
一是对比分析与趋势分析相结合的方法。就是通过对两个或两组以上的数据在一定阶段的变化情况进行比较分析,从而发现数据所代表事物的发展趋势、差别和关系,并可进一步分析原因,为企业领导决策提供依据和参考。比如,我们可以使用这一方法来分析一定阶段企业利润和成本的变化和相互关系。再如,我们将“十五”期间本企业的利润指标与其他企业的利润指标进行比较分析,所应用的也就是对比分析与趋势分析相结合的方法。
二是对比分析与结构分析相结合的方法。就是对两个或两组以上的数据的构成情况进行分析比较,从而可以看出构成这两个或两组以上的数据的各种因素的差异性,以此剖析产生这种差异的原因,并提出相应的对策措施。比如,2006年,A供电局利润500万元,B供电局利润700万元。如果只采取对比分析的方法,我们获得的结论就是:“B供电局利润比A供电局多200万元”。结合结构分析:A供电局利润500万元中,主业为450万元,三产为50万元;B供电局利润700万元中,主业为560万元,三产为140万元。由此看出,A、B供电局在主业利润差距并不大,差距主要在三产上。因此,发展三产应成为A供电局利润增长的主要着力点。
三是趋势分析与结构分析相结合的方法。就是通过对构成某一数据的子数据在一定阶段的变化情况进行分析,从而揭示构成某一事物的各方面因素在其中的作用大小和变化趋势。比如,我们分析某企业一定阶段销售额及各种产品销售额的构成和变化情况,就可以使用这一方法。这样的分析既可以了解销售额的变化趋势,也可以全面掌握各种产品在销售额中的权重比例和变化趋势,从而知道哪些产品需要扩大生产,哪些产品需要减产或停产,什么时候需要开发新的产品。
网站优化数据分析方法一:流量分析
分析网站流量这是首要工作,如果是网站建设初期,那么此时的流量分析就只要记住网站登陆搜索引擎后的流量基数即可。如果是网站建设中期的话,就要记录网站流量一周的平均值,如果是网站建设后期的话,就要记录网站流量的阶段性波动值!记录好了流量值之后,就可以很好的计划出下一步优化推广的流量值了。
网站优化数据分析方法二:关键词分析
网站关键词分析也是网站优化的重要工作之一!分析现在网站关键词的布局,分析网站有流量的关键词,分析网站还没有覆盖的与网站业务相关的关键词,分析出网站主关键词的排名情况,分析关键词的设计是否合理。分析顶级关键词是否占据了搜索引擎首页的排名,分析搜索关键词的质量高不高,与网站业务的相关度如何?!分析关键词转化率如何等等。
网站优化数据分析方法三:转化率或业务目标实现情况如何
【关键词】 验证型实验 数学处理
物理实验中,验证型实验和研究型实验都是非常重要的两类实验。验证型实验是对已建立的物理规律的验证,研究型实验是通过实验得到物理规律,这两类实验虽然实验目的不同,但从数学处理方法上来看,具有相似性,都是通过实验数据分析确证物理规律或得到物理规律,所以对实验数据的分析处理方法是否得当就显得十分重要。下面以一个典型的验证型实验的数据处理为例进行相应探讨,以期望得出相对合理和妥当的实验数据处理方法。
以大学物理实验来说,验证型实验较多,诸如牛顿第二定律的验证、弹性碰撞实验等等都属于此类实验,其中牛顿第二定律的验证实验为该类实验的典型实验。牛顿第二定律的数学表达式是,力与加速度的大小关系可以表达成,要验证这个规律,就是给物体加一个大小为F的力,对应产生一个大小为的加速度,得到一个测量点,通过改变力,得到n个测量点后,即可通过适当的数学方法验证这个关系的成立。
类似这种线性物理规律,其数学模型都可以归结为的形式。要得到这个线性关系,就是要得出和。通过测量n组和的值,即、、……、、……、,在X―Y平面中得到n个测量点。若不考虑实验测量的系统误差,则测量误差应当服从高斯分布,反应在X―Y平面中,既是这n个测量点应当均匀地分布在所求表达式两侧,对第i个测量点,误差为,n个测量点导致的总体误差是最小的。若任意给一个直线,则一是测得到的这n个点不再均匀地分布在直线两侧,二是这n个测量点产生的总体误差水平将增大,甚至可以达到无穷大。由此可知,所求直线即是使得n个测量点的总体误差最小的那条直线。总体误差可以写成,但由于误差服从高斯分布,导致理论上而无法通过此求和值衡量总体误差水平。为使其不因为正负抵消而无法衡量总体误差水平,只要使得所有误差均为正再求和即可,故可用残差来衡量总体误差水平,虽然残差不再是总体误差。使得残差取最小值的和,即为所求直线的和。此即最小二乘法的数学思想。据最小二乘法处理,所求和即是使得取最小值的和,即有,解此式,得
将测量值供稿,即可得到所求和。通常大学物理实验中的处理方法,得到和,即是验证了[1]。但其实这是不太恰当的。
验证型或者研究型实验,特别是验证型实验,最关键的是需要解决两个问题,一是找出所要验证的关系,第二是要验证得出的关系的确成立,而第二点才是最重要的关键点。即使得出关系,但如果确证关系不成立,则第一步的工作就变得毫无意义。实际上,任意给出一组、、……、、……、,都可以根据最小二乘法得到和,即得出,但并不意味着此式的确成立,不能确证物理量和的确存在这样的数量关系,并没有检验此物理规律存在。因此,验证型实验做到这一步并不算已经验证被验证的物理规律成立,还需要研究和的相关性,通过计算相关系数,据的大小来检验和是否的确相关。
总之,验证型实验,是对物理规律的验证,最重要的是确证被验证物理规律成立,得出相应物理量间的数学表达式并不能说已经验证了相应物理规律的成立,最重要的是要通过计算物理量间的相关系数来确证所得物理规律是否成立。
关键词:安全防护系统;数据分析;处理方法
1 概述
机车车载安全防护系统(以下简称6A系统)是针对机车的制动系统、防火、高压绝缘、列车供电、走行部、视频等危及安全的重要事项、重点部件和部位,采用实时检测、监视、报警并可实现网络传输、统一固态存储和智能人机界面,整体研究设计而形成平台化的安全防护装置。自2013年以来,全路和谐型内燃、电力机车大面积装备、使用6A系统,为保障机车行车安全发挥了重要作用。如何科学、有效的对6A系统装置做好维护、故障处理工作,充分发挥其对安全关键的检测、监视及预警作用,显得尤为重要。
2 6A系统构成及功能
6A系统主要以中央处理平台为核心,集成了六个监控子系统,并以地面专家系统为数据分析处理平台,实现机车检测、监视、报警、数据分析及指导处置等功能。6A系统构成及个子系统功能如表1所示。
3 数据转储分析
3.1 数据转储、分析流程
地面<蚁低呈6A系统的地面数据分析部分,在“6A系统”主机启动情况下,使用专用授权的U盘下载中央处理平台记录数据,转储到地面专用计算机,并导入专家系统后,进行人、机协同分析,指导检修人员对故障部位进行检查、试验,有针对性进行检查和维修。数据处理流程如图1所示。
系统数据下载时,为确保检测数据的完整性和有效性,6A系统数据分析时,要先确认机车车号和本次机车6A系统数据范围。
3.2 数据分析方法及要求
6A地面专家系统,以曲线和数据视图的形式展示6A系统各子系统记录的车载数据信息。目前,在数据分析管理上,我段对和谐型机车数据分析采取修程、每趟入库、故障临修时机车数据台台进行转储分析。正常情况,各子系统数据状态应符合以下技术条件,如有异常,需及时报修处理。
(1)防火监控子系统
生命信号良好,探头无报警信息。
(2)高压绝缘检测子系统
将数据分析界面切换到“绝缘检测”数据视图,检查高压绝缘检测子系统“测试状态”显示“测试完成”时,当前检测电压不低于19000V。
(3)列车供电监测子系统
确认列供1、2路供电正常,列供1、2路交流输入电压为960V左右时,直流输出电压为600V左右,漏电流不大于15mA。
(4)TAX数据
确认机车运行速度、工况等数据正常显示。
(5)微机数据
确认司机室占用、主断状态、手柄级位等数据正常显示。
城市地铁深基坑施工,由于受环境条件限制,施工安全问题尤为突出,采用单一监测方法已不能满足要求,多种方法监测变形数据分析能客观准确反映安全状态与质量程度,数据的客观准确性对施工具有指导意义,掌握工程各主体部分的关键性安全和质量指标,确保地铁工程按照预定的要求顺利完成,对各种潜在的安全和质量问题做到心中有数。
关键词:桩顶沉降、桩顶水平位移、桩体水平位移、轴力监测。
引 言
车站深基坑为东西走向,基坑开挖长为160m,东侧宽28m,西侧宽21m,开挖深度为22m。车站东北侧为机场航站楼,车站位于规划停车场下方,2号风亭位于现有落客平台匝道桥旁。车站为地下双层岛式站,地下一层为站厅层,地下二层为站台层,车站附属建筑包括2个出入口和2个风亭等土建工程,施工采用明挖法,支护结构为钻孔灌注桩和钢管内支撑。
1.监测项目
车站深基坑主要进行的监测项目有:基坑桩顶沉降、桩顶水平位移、桩体水平位移(基坑测斜)、钢支撑轴力监测等。
2.布点要求
2.1基准点:在远离基坑变形区域(50m)外,布设永久性沉降和位移基准点4个。
2.1.2桩顶水平位移点:测点布设在基坑四周围护桩顶,埋设强制对中装置。边长大于30m的按间隔30m布点,小于30m的,按1点布设,基坑4角各布设1点,共布设17点。
2.1.3桩顶沉降点:测点布设在基坑四周、围护桩顶,边长大于30m的按间隔30m布点,小于30m的,按1点布设,基坑4角各布设1点,共布设17点。
2.1.4桩体水平位移(测斜)孔:测孔布设在基坑四周围护桩体内,边长大于60m的按间隔60m布孔,小于60m的按1孔布设,共布设8孔。
2.1.5钢支撑轴力:在钢支撑两端安装予埋轴力计,共布设16组。
为了便于数据对比,以上各监测项目中监测点平均分布在基坑每条主断面上,监测点布设主断面示意图如下:
2.2巡视内容
2.2.1周边环境:建(构)筑物是否有裂缝、剥落,地面是否有裂隙、沉陷、隆起、基坑周边堆载情况、地表积水情况等。
2.2.2基坑工程:明挖基坑围护结构体系有无裂缝、倾斜、渗水、坍塌、支护体系施做情况、地下水控制情况。现场巡视按要求填写巡视成果表,特殊情况下扩大巡视范围。
2.3监测频率: 施工方要求每天至少监测一次,第三方监测要求每三天监测一次,出现特殊情况(多方法监测数据变化量大、现场巡视发现有裂缝)时进行加密监测。
3.监测方法及效果
3.1监测方法及初始值:采用“同人员、同仪器、同线路”进行观测,用Leica-TCA2003型马达跟踪精密全站仪对由4个基准点组成的二等控制网进行角度和边长观测。角度观测为左右角两测回,距离采用直反觇进行观测,其各项观测精度均满足《建筑变形测量规范》要求。观测数据采用清华三维软件平差,平差精度为1/180000。变形监测工作采用整体监测形式,在基坑开挖前一周对监测点三次观测,取三次观测数据的平均值作为初始值。
3.2沉降监测:基坑四周、桩顶沉降采用电子水准仪天宝DINI03进行监测,监测等级按II等水准进行监测。观测方法采用前-后-后-前的顺序,地表监测基点为标准水准点(高程已知),监测时通过测得各测点与水准点(基点)的高程差ΔH,可得到各监测点的标准高程Δht,然后与上次测得高程进行比较,差值Δh即为该测点的沉降值:ΔHt(1,2)=Δht(2)-Δht(1)“+”值表示上浮、“-”值表示下沉。
3.3 桩顶水平位移:采用有“测量机器人”之称的最先进全站仪 TCA2300,该仪器(角度测量精度0.5”,测距精度1mm+1ppm),特制U型强制对中观测台2个,布设成相互垂直,可以控制基坑所有变形点,采用该观测台能达到观测稳定对点精度高,测点设置在围护桩顶或边坡坡顶,埋设强制对中装置,每个变形点观测三组数据,数据值保留至小数点后四位,其差值均在0.2mm内。每次测量的坐标减去上次测量的坐标,得到ΔX、ΔY,根据基坑方向与真北方向的角度关系,对变化量ΔX、ΔY进行角度归算,计算出垂直于基坑方向上的位移量。
3.4 桩体水平位移(测斜): 桩体水平位移采用CX-3C测斜仪进行测量,每0.5米读一次数,垂直基坑方向正反两次测量进行平差。基本公式:V1=(V正-V负)÷2,V2=(V正-V负)÷2+V1
依次累加;ΔV1 = V1 本次测量值-V1 上次测量值。依次对应相减,得出每点的位移量。“+”值表示向基坑内倾斜、“-”值表示向基坑外倾斜。
3.5 支撑轴力:采用XP05振弦频率仪进行轴力监测,读取数据后,用公式算出轴力变化值:P=K*(f I2-fO2)
其中P表示轴力变化值,K表示轴力计标定系数,f i表示轴力计任一时刻观测值,fo表示轴力计初始观测值。
以上各监测项的的监测预警值均为0.8倍设计容许值。
4.各项监测数据分析
监测多方法数据和资料,通过比较分析能极大提升信息反馈的可靠性,并能有效剔除粗差。可以按照安全预警位发出报警信息,既可以对安全和质量事故做到防患于未然,又可以对各种潜在的安全和质量问题做到心中有数。
现对基坑第六主断面各测项监测点数据进行对比分析,评价基坑安全性。
4.1桩顶沉降曲线图如下:
根据图表曲线可以看出,基坑刚开挖时,由于土压力突然较小,桩顶沉降有隆起现象,随着基坑开挖,侧压力平衡发生变化,变形值和沉降量由小变大,围护结构变形增大。持续一段时间后,围护结构的支撑内力,锚杆拉力与土侧压力处于平衡,变形数据达到稳定。桩顶水平位移和桩体水平位移变化趋势一致,同时跟支撑轴力成反比例,当加大支撑轴力时,位移量变化减小,向基坑外变化,支撑轴力减少时,位移量增大,向基坑内变化,但数据变化量不是很大。根据每个断面上的4个监测项目,进行数据对比,位移及沉降变化速率均小于3mm/d,累积量均小于30mm的预警值。从整个分析可以得到该工程基坑支护设计合理,一级基坑安全控制有效。
结束语
(1)监测工作在地铁深基坑开挖过程中能有效地起到指导安全施工的作用,加强监测可以及时发现隐患,为确定加固措施、确保工程安全提供重要依据。
(2)变形监测频率要根据施工进度计划,安排好监测作业时间,因为工程阶段性变形量所占比例大,与工序相关性很强。
(3)城市地铁深基坑施工,由于受环境条件限制,人为因素、环境因素、气象因素等等情况影响,单一监测数据不能说明问题,可靠性较低,单一监测方法已不能满足城市地铁施工安全要求。
(4)可靠的信息、精度合理的数据对可能发生的危及环境安全的隐患或事故提供及时、准确的预报,以便及时采取有效措施,避免事故的发生。
(5)监测多方法采集的数据,可以及时发现监测质量的好坏,并能有效剔除粗差。通过曲线时速类比、各类数据软件分析,能极大提升数据信息质量和信息反馈的可靠性。
关键词:Matlab软件;制流与分压电路实验;特性研究
一、分压电路特性研究及参数的变化
首先,用1000Ω滑线变阻作分压器,负载电阻用1000Ω(K=1),测出滑线电阻滑动端的位置参数X和U/Umax分压比,并作出U/Umax的关系曲线。其次,同上,用1000Ω滑线电阻和500Ω的负载电阻(K=0.1),测出X和U/Umax,记录不同的K值。在Matlab软件中编写下列程序实现分压电路实验数据的处理和图像的拟合:
x0=0:0.1:1.0;
y1=[0 0.24 0.48 0.58 0.72 0.92 1.12 1.58 2.18 3.42 4.46];
z1=max(y1);
y2=[0 0.38 0.72 0.98 1.32 1.72 2.02 2.48 3.26 4.18 4.64];
z2=max(y2);
y3=[0 0.40 0.82 1.18 1.58 2.02 2.40 2.98 3.62 4.32 4.52];
z3=max(y3);
y4=[0 0.18 0.28 0.34 0.48 0.58 0.78 1.02 1.66 2.98 4.48];
z4=max(y4);
n=3;
p1=polyfit(x0,y1,n)
p2=polyfit(x0,y2,n)
p3=polyfit(x0,y3,n)
p4=polyfit(x0,y4,n)
xx=0:0.01:1.0;
yy1=polyval(p1,xx);
yy2=polyval(p2,xx);
yy3=polyval(p3,xx);
yy4=polyval(p4,xx);
plot(xx,yy1/z1,'r',x0,y1/z1,'.r')
hold on;
plot(xx,yy2/z2,'k',x0,y2/z2,'.k')
hold on;
plot(xx,yy3/z3,'b',x0,y2/z2,'.b')
hold on;
plot(xx,yy4/z4,'g',x0,y4/z4,'.g')
hold off;
由实验可得不同K值的分压特性曲线,如图1所示。从曲线可以清楚看出分压电路有如下几个特点:第一,不论R0的大小,负载RZ的电压调节范围均可从0■E;第二,K越小电压调节越不均匀,曲线线性程度越差,细调程度较差;第三,K越大电压调节越均匀,因此要电压U在0到Umax整个范围内均匀变化,则取K>1比较合适。
■
图1 不同K值的分压特性曲线
二、制流电路特性研究及参数的变化
首先,用1000Ω滑线变阻作制流器,负载电阻用100Ω(K=0.1),测出滑线电阻滑动端的位置参数X和分压比I/Imax,并作出I/Imax-x的关系曲线。其次,同上,用10000Ω滑线电阻和20Ω的负载电阻(K=0.02),测出X和I/Imax,记录不同的K值,并作出关系曲线,在Matlab软件中编写下列程序实现制流电路实验数据的处理和图像的拟合:
x0=0:0.1:1.0;
y1=[0.04 0.04 0.08 0.12 0.18 0.22 0.30 0.52 1.02 3.58 4.18];
z1=max(y1);
y2=[0.04 0.04 0.08 0.12 0.18 0.24 0.30 0.52 0.92 2.38 4.98];
z2=max(y2);
y3=[0.02 0.02 0.02 0.04 0.12 0.18 0.28 0.40 0.70 2.98 3.52];
z3=max(y3);
y4=[0.01 0.01 0.01 0.01 0.02 0.08 0.20 0.30 0.60 1.20 2.0];
z4=max(y4);
n=3;
p1=polyfit(x0,y1,n)
p2=polyfit(x0,y2,n)
p3=polyfit(x0,y3,n)
p4=polyfit(x0,y4,n)
xx=0:0.01:1.0;
yy1=polyval(p1,xx);
yy2=polyval(p2,xx);
yy3=polyval(p3,xx);
yy4=polyval(p4,xx);
plot(xx,yy1/z1,'r',x0,y1/z1,'.r')
hold on;
plot(xx,yy2/z2,'k',x0,y2/z2,'.k')
hold on;
plot(xx,yy3/z3,'b',x0,y2/z2,'.b')
hold on;
plot(xx,yy4/z4,'g',x0,y4/z4,'.g')
hold off;
(上接第47页)
■
图2 不同值的制流特性曲线
图2表示不同K值的制流特性曲线,从曲线可以清楚地看到制流电路有以下几个特点:第一,K越大电流调节范围越小;电流调节越均匀,曲线线性程度较好;第二,K(K≥1)时调节的线性较好;第三,K较小时(即R0>RZ),电流调节范围大,电流调节越不均匀,曲线线性程度越差,细调程度较差;第四,不论R0大小如何,负载RZ上通过的电流都不可能为零。第五,制流电路适用于负载电阻较小,功耗较大,电压调节范围较小的场合。
综上所述,当负载电阻较大时,要求调节范围较宽时宜采用分压电路。相反,在负载电阻较小,功耗较大且调节范围不太大时,选用制流电路较好。
参考文献:
[1]陈玉林,李传起.大学物理实验[M].北京:科学出版社,2007:186-190.
[2]穆晓东.制流与分压电路实验参数的选择与确定[J].大学物理实验,2004,(01).
关键词:网络舆情;大数据;舆情分析方法
中图分类号:TP393.08
随着网络技术的高速发展,网络自媒体的数量庞大,网民人数的不断增多,互联网资源数量呈现指数型的增长,网络已经成为民众获取信息的最主要渠道。网络在传达社情民意方面的优势也逐步显现出来,成为反应社会舆情的主要载体之一,在表达民众心声、反映社会舆论方面发挥极其重要的作用。
在海量数据中,通过探测并发现网络舆情中的热点话题,有助于梳理舆情监控的思路,抓住纷繁的监控工作中的重点,从海量的互联网信息中找到目标信息,将有限的人力物力用到关键的地方,提高工作的针对性和有效性,更好地应对网络舆情。
而如何对网络舆情加以有效的监督和引导,积极化解网络舆论危机,使和谐的互联网环境为维护社会稳定、促进国家发展、构建社会主义和谐社会发挥重要作用,不仅具有重要的现实意义,也已经成为网络舆情工作面临的一个重要课题。基于上述分析,我们认为网络舆情数据越来越呈现出大数据特征。
1 问题与挑战
大数据环境下的网络舆情分析和挖掘方法具有如下挑战:
1.1 为了得到更准确的舆情信息,所需要的数据量大幅膨胀。随着数据生成的自动化以及数据生成速度的加快,自媒体时代的到来,为了获得准确的网络舆情信息需要处理的数据量急剧膨胀。一种处理大数据的方法是使用采样技术,通过采样,把数据规模变小,以便利用现有的技术进行数据管理和分析。
1.2 数据深度分析需求的增长。为了从数据中得到准确的舆情信息进而指导人们的决策,必须对大数据进行深入的分析,这些复杂的分析必须依赖于复杂的分析模型。所以对网络舆情信息的分析还需要路径分析、时间序列分析、图分析、What-if分析等。
1.3 自动化和可视化分析需求的出现。在TB级的复杂舆情信息环境下,网络舆情系统应该能根据网站的内容自动构造查询,自动提供热点推荐,自动分析数据的价值并决定是否需要保存。
2 大数据技术的主要进展
针对传统分析技术的局限性,研究者提出了一些试验性的解决方法和途径。R是开源的统计分析软件,IBM公司研究人员致力于对R和Hadoop进行深度集成,把计算推向数据并且并行处理,使Hadoop获得强大的深度分析能力,为应用开发者提供了丰富的数据分析功能。
针对频繁模式挖掘、分类和聚类等传统的舆情分析方法,研究人员也提出了相应的大数据解决方案。如,Iris Miliaraki等人提出了一种可扩展的在MapReduce框架下进行频繁序列模式挖据的算法[1],Alina Ene等人用MapReduce 实现了大规模数据下的K-center 和 k-median聚类方法[2],Kai-wei chang 等人提出了针对线性分类模型的大数据分类方法[3]。U kang等人使用“BP算法”处理大规模图数据发掘异常模式。Jayanta Mondal等人[4]提出了一个基于内存的分布式数据管理系统来管理大规模动态变化的图以支持低延迟的查询处理方法。Shengqi Yang等人[5]对基于集群上的大规模图数据管理和局部图的访问特征进行研究,为了在图查询处理中减少机器间通讯,提出来分布式图数据环境。Jiewen Huang等人提出了一个多节点的可扩展RDF数据管理系统,比目前系统的效率高出3个数量级。
3 网络舆情分析发展方向
3.1 实现更加复杂和更大规模的分析和挖掘是网络舆情分析未来发展的必然趋势。在大数据新型计算模式上实现更加复杂和更大规模的分析和挖掘是网络舆情分析未来发展的必然趋势,需要进行更细粒度的仿真、时间序列分析、大规模图分析和大规模社会计算等。
这些舆情主体间频繁联系、相互影响,在这个过程中涌现出一些大V,他们左右着其他主体的舆论方向,最终影响整个舆论场。同时,关注点相似的舆情主体间也自觉或不自觉地形成了一些联系相对紧密的子群体,在子群体中信息传播速度更快。要管理和引导网络舆情,就必须对网络舆情主体和舆论子群体进行研究,而社会网络分析方法就是有效的手段。
3.2 网络舆情信息的实时分析和挖掘。面对海量数据,分析和挖掘的效率成为网络舆情分析领域的巨大挑战。尽管可以利用大规模集群并行计算,但在数10TB以上的数据规模上,分析和发掘的实时性受到了严峻的挑战,而查询和分析的实时处理能力,对于舆情运用个体来说及时获得决策信息,做出有效应对是非常关键的前提。
3.3 关联不同领域数据进行舆情分析,非结构化大数据处理分析成为难点和重点。网络上的信息是千千万万的人随机产生的,从事网络舆情研究要从这些看似杂乱无章的数据中寻找有价值的信息。网络大数据有许多不同于自然科学数据的特点,包括多源异构、交互性、失效性、社会性、突发性和高噪音等,不但非结构化数据多,而且数据的实时性强,大量数据都是随机动态产生。网络数据的采集相对科学数据的采集成本较低,网上许多数据是重复的或者没有价值的,价值密度低。一般来说,网络舆情的数据分析及预测,比科学实验的数据分析更困难。所以我们不要一味的追求获取越来越多的数据,而是数据的去冗分类,去粗取精,从数据中挖掘有用信息,减少不必要的数据采集。
3.4 词汇理解的复杂性研究。既考虑词汇的情感倾向性,又权衡语义模式对评论的情感倾向值的影响,能比较全面地分析突发事件网络舆情的态势。但是词典的构建与语义模式的建设需要人工参与,个人的主观性影响比较大,机器学习的能力不强,准确度不高。另外,由于网络语言表达的灵活性,技术的发展速度跟不上社会话语变迁的复杂性。在国内的网络语境中,谐音、暗语是常用的表现手法,借古讽今、借外讽内是常用的叙事手段,隐喻、借代是常见的修辞。现有技术还不能完全准确地判定句子的情感倾向性,机器对词汇的理解能力需要进一步研究。
4 结束语
随着大数据时代的到来,我们要不断改进舆情的分析方法,将大数据思维及方法运用到网络舆情分析中去。首先要开始关注大数据分析,其次不再仅仅依靠语义分析,而是求诸于自动化的数据分析,再次要关联不同领域数据进行舆情分析,等等。总之,我们要突破传统,将舆情分析向大数据分析的方向创新。
参考文献:
[1]Miliaraki I,Berberich k,Gemulla R.Mind the gap:large-scale frequent sequence mining.SIGMOD’13,2013:797-808.
[2]Ene A,Im S,Moseley B.Fast clustering using MapReduce. KDD’11,2011:681-689.
[3]Chang K,Roth D.Selective block minimization for faster convergence of limited memory large-scale linear models.KDD’11,2011:699-707.
[4]Mondal J,Deshpande A.Managing large dnamic graphs efficiently.SIGMOD’12,2012:145-156.
[5]Yang S,Yan X,Zong B,e.Towards effective partition managenment for large graphs.SIGMOD’13,2012:517-528.
【关键词】数据分析;数据整理;土工实验数据
前言:土工实验的结果对岩土工程的施工方案和设计的精度具有重要影响,实验结果的可靠性越强,岩土工程的施工方案和工程设计就会越加科学合理。因此,加大对土工实验数据整理和分析方法的研究成为目前土工领域亟待解决的问题,对于土工的施工工程的正常运行具有重大意义。
1 土工实验数据整理
1.1Excel图解法整理土工实验数据
在对土工实验数据整理的过程中会遇到不合理的实验数据,这时就需要工作人员对实验数据进行改正和取舍。在实验数据的舍弃过程中,舍弃的标准要按照概率或误差分析中的标准差的3倍设置,对于不在标准范围内的实验数据就要选择舍弃,然后对实验进行重新计算和整理。土工实验的数据的土性指标主要有两种类型,一种是以水溶盐、有机质、塑限、液限、颗粒组成、土粒比重、天然含水率、天然密度等为主要类型的一般特性指标,主要作用是用来对土性进行分类和定名,以及说明岩土的物理化学特征。另一种是以岩土的渗透系数、变形模量、压缩系数、内摩擦角、粘聚力等为主要类型的主要计算指标,主要用来确定土体的稳定性、变形、强度。在对这两种土工数据指标进行整理的时候,通常使用Excel图解法,利用这种方法整理实验数据,能够简化大量繁重的数据计算工作,为分析数据节约更多的时间,从而提高计算的准确率和土工实验数据整理的效率。Excel图解法主要是根据图表制作的功能,进行相应的功能设置。如表1土工实验数据所示利用Excel进行整理[1],
表1 土工实验数据
压实系数 0.77 0.82 0.87 0.92 0.95 0.97
荷
载
系
数 0.5 15.0 14.8 17.2 19.1 22.5 18.2
1.0 29.7 27.5 28.6 32.7 37.4 30.0
1.5 38.9 42.4 39.0 44.8 44.3 45.6
2.0 55.7 44.3 55.8 52.8 61.5 55.8
具体的操作方法是:首先打开Excel,将表格中的数据输入其中;其次选择x y散点图选择图表类型,修改相应指标名称,最后生成图表,相关工作人员可以根据整理好的数据图像分析土体的强度。如图1所示,
图1 Excel整理之后的数据图形
1.2取样法校核土工实验数据
对土工实验数据的取样校核主要有室内取样和室外取样两种形式,校核的目的是分析数据产生误差的原因,提高整理的效率。室内取样过程中对进行实验的土样妥善保管,避免土样的误动影响数据的真实性。另外使用不同的测试仪器、人们视觉效果的不同和绘图的质量都可能影响数据的真实,因此要具体情况具体分析,对实验数据进行多方检验,确保土工实验数据的精确度。而在室外取样的过程中,土样的保管要注意失水、日晒、风吹等影响,以免影响数据的真实性,因此在土样的运输、储存、封装的工作中应安排专门的工作人员进行防护,在长途运输土样的情况下,应将其装箱并填塞相应的缓冲物品,防止土样震动而影响实验数据的准确度。通过取样来解决土工实验数据的不确定性问题[2]。
2 土工实验数据分析方法
2.1最小样本数分析法分析数据
在实验中样本数多少直接影响实验结果,而样本数多少容易受多方面因素的影响,例如从统计学角度分析,在某项土工中对粘土进行实验,选取四种土样进行不排水三轴实验得出Cu值,分别为109、95、97、101(KN/m2),将实验结果控制的平均值控制在5%之内,计算出最小样本数,因土样数量只用四个,少于30,于是用t分别对土样进行计算,u=3,根据统计表查出相应的数值范围100.5±2.35×6.19÷=93.27-107.77(KN/m2),其中0.95,其中t=2.35,对应Cu值为100.5(KN/m2),σ=6.19.而平均值范围计算得到的数据为7%,超出了5%的范围,因此还需要增加土样样本的数量,假设增加到七个样本数,t=1.94,0.95,v=6则平均值的范围通过计算得出,在5%的范围内,因此可以得出七个样本符合土工实验数据对精确度的要求[3]。
2.2采用贝叶斯法分析实验数据
贝叶斯法的计算公式为,将实验数据分别带入公式进行计算,它可以有机的结合不同时间阶段测得土工数据,它不是简单的加权平均算法,通过贝叶斯法计算得出的数据可靠性更强。贝叶斯法分析实验数据以其可靠性强的优势被广泛应用到大型工程的设计指标研究中,利用土性的含水量、密度等物理性质指标,丰富工程的指标验前概率。另外它还可以对不同实验结果的合并问题进行更精确的处理,保证土工的实验数据的合理性[4]。
2.3加权平均法分析实验数据
利用土体相关距离的测值点相关的特性,采用加权平均值的方法法分析试验数据,从而进一步分析岩土的平均土性,计算公式为,样本 的权值是,k是土样相关区域内样本的点数,当是以组的形式出现且0≤≤1时,可以利用相应的方程式计算权值的最小值,另外还可以根据土工的实际情况进行计算过程的简化和省略,如果简单计算就可以判断实验数据的确切数值,则可以不采用加权平均值算法,视具体情况而定[5]。
结论:综上所述,通过对土工实验数据整理和分析方法的研究,从中可以了解到对实验数据的正确处理有利于提高土工的数据的准确度,为土工的施工设计提供有效的信息数据参考,推动土工的进一步发展。
参考文献:
[1]钱红萍,史贵才. 土木工程专业实验教学新体系的构建与实践[J]. 实验室研究与探索,2012,10:122-125.
[2]张永兴,高雪超. 土木工程综合实验模块式教学改革初探[J]. 实验室研究与探索,2011,07:155-182.
[3]李黎. 土木工程实验教学体系与实验项目改革探索[J]. 高等建筑教育,2010,06:141-143.