APP下载

工业大资料中属性类资料的合格率计算

消息来源:baojiabao.com 作者: 发布时间:2026-05-22

报价宝综合消息工业大资料中属性类资料的合格率计算

工业大资料的资料来源于感测器。感测器采集资料一般按开关量、模拟量、数字量、脉冲量进行分类。因为这些采集资料都与时间有关,每个数值均有相应的时间戳对应,而且资料的顺序按时间戳排列,因此又统称为时间序列资料,简称时序资料。

大资料和工控系统不同,不是仅限于资料采集和资料显示,也不限于对指定测量点历史资料的显示,而是需要进行统计计算,或称聚合运算。

由于分析指标的计算方法不同,这些时序资料可以分为瞬时值、累计值和属性值。累计类资料包括耗电量、用水量、用气量等。属性类数值包括电压、气温、气压、PH值等,一般在一个范围之内波动,合计是没有意义的。属性值对应预先定义的上下阈值,但数值超过阈值可以报警。

由于大资料研究的是森林而不是树木,所以需要关注多个测量点、多个时间点测量资料的变化规律,也就是对时序资料的分析,需要对资料进行统计计算。

对属性类测量资料的统计计算方式有计数、平均值、最大值、最小值。

通过对不同型别的资料点计数,可以得到不同结果,如属性类就有资料点数、正常点数、异常点数、合格点数、不合格点数。

在对测量资料进行处理时,资料从资料质量角度,分为正常值与异常值,从资料限值标准分为合格值与不合格值。

资料质量主要关注离群值、不连续测量、噪声与漂移。在统计计算时,需要把离群值,也就是异常值先找出来。异常值不能用于计算合格率。

异常值是由于感测器测量、资料处理传输中异常出现的值,并不能反映真实情况,没有在真实环境中出现过。比如,测量气温的感测器出现0值,并不是当天曾经出现过0度的温度。资料异常率=异常值点数/全部点数,

如果把异常值计入统计,则这些极端值由于比任何正常值都大或小,会在按时间分析时变成每天的最高或最低温度、每月的最高或最低温度、每年的最高或最低温度。

合格值是在指定上下限值范围内的值,用于计算合格率。合格值的标准设定在不同时期会有变化,变化是企业对质量的要求不同,或国家标准变化引起的。

合格率的计算需要用真实值,是在真实环境中出现过的值,合格率=合格值点数/正常值点数,比如PH值要求不小于6.5且不大于8.5,6.0是真实测量值但是不合格。如果出现2,则是一个异常值,无所谓合格不合格。

按取样间隔时间1分钟,一个测点的取样资料有60个。判断出2个异常值,50个合格值,8个不合格值,那么,合格率是50/60=83.33%,还是50/58=86.21%?正确的应该是后一个。

有了这些统计资料后,就可以从不同维度进行分析。时序资料的分析维度主要有时间和位置。时间维度分析按年、月、日、小时观察资料的变化规律,位置维度分析按测点的安装位置,范围从大到小观察资料的变化规律,如全公司的平均电压、到车间、再到产线、再到装置的平均电压。

本文为范煜原创文章。

2019-12-19 20:52:00

相关文章