环境数据中异常值的取舍
环境数据中异常值的取舍
刘崇华 刘崇娟
1
2
(1. 黑龙江生态工程职业学院, 哈尔滨150025; 2. 带岭林业实验局, 黑龙江带岭153106)
摘 要:通过格鲁布斯检验法和狄克逊检验法判定环境数据中异常值的取舍问题。
关键词:数理统计; 环境数据; 异常值; 格鲁布斯检验法; 狄克逊检验法中图分类号:X830. 3 文献标志码:A
在分析一组环境数据时, 常常会发现一些异常值, 异常值也称为离群值、极端值或可疑值, 是指与其他数值在数量上有差异的数值。它的产生可能是因为各种随机因素的影响, 也可能是由于收集分析数据的失误造成的。因此, 需要分析判断异常的性质, 而决定取舍, 而分析判断就需要进行统计检验。
统计检验, 又称为假设检验。它的理论依据就是小概率原理, 即小概率事件在一次试验中几乎是不可能发生的。基于这个前提, 根据实际问题, 利用已知的背景知识, 在假设该值正常的条件下, 给定一个小概率A (通常为0. 05, 0. 01) 也称为显著水平。由A 与样本容量n , 根据利用的检验方法, 确定临界值与统计量。求出统计量后与临界值比较, 判定该值是否异常, 决定取舍。
常用的异常值取舍的判定方法有4 d 法、格鲁布斯检验法、狄克逊检验法、科克兰检验法、t 检验法等, 我们主要介绍格鲁布斯检验法与狄克逊检验法。
(1) 格鲁布斯检验法:常用在单个异常值的检验, 如一组数据只有一个或2个异常值。方法如下:将测得所有的观察值按从小到大顺序排列起来。
x 1
测量次数声功率级
192. 5
如果x 1为异常值, 则统计量取G =如果x n 为异常值, 则统计量取G =
x -x 1S x n - x S
根据A 与n 查临界值表确定临界值G (A , n )
当G E G (A , n) 时, 该值舍去; 当G
如果x 1, x 2(或x n-1, x n ) 为异常值, 则应先检验内侧的数
n
n-1
i
据x 2(或x n-1), 这时X =
S =
E x
i=2
n -1
(或X =
E x
i=1
i
n -1
) ,
1
(x -x ) 2
-2i=2i
E
(或S =
1
(x i -x ) 2)
-2i=1
E
如果x 2舍去则x 1也应舍去。
如果x 1和x n 为异常值, 则应分别检验x 1与x n 是否应该舍去, 如果x 1舍去后, 检验另一数据时, 样本容量应减去1。
如, 在一固定的运转状态下测量一鼓风机的声功率, 总共进行了9次独立的测量, 测量结果见表, 那么第4次测量值是否应当舍去?
1n
r x 与标准差S =n i=1i
293. 1
r (x-x ) 2
-1i=1i
391. 9
496. 8
592. 8
692. 3
793. 0
893. 9
992. 6
91. 9
=
S =
1
(91. 9+92. 3+92. 5+92. 6+92. 8+93+93. 1+93. 9+96. 8) =93. 29
[(91. 9-93. 2) 2+(92. 3-93. 2) 2+, +(96. 8-93. 2) 2]=1. 468
G =
96. 8-x 96. 8-93. 2
==2. 466S 1. 46
x 9为异常值, A =0. 01, n =9, 查表G (0. 01, 9) =2. 323
收稿日期:2008-04-01
作者简介:刘崇华(1963-), 女, 黑龙江带岭人, 副教授。
G >G (0. 01, 9) , 因而可判定96. 8为高度异常, 应舍去。(2) 狄克逊检验法:常用方法如下, 将测得所有观察值
活性炭再生技术探讨
曾志江 钟汉强
(深圳市宝安区环境监测站, 广东深圳518100)
摘 要:活性炭是废水处理中常用的一种有效吸附剂, 其再生具有重要意义。传统活性炭再生方法如对热再生法、生物再生法、湿式氧化再生法等具有一定的不足, 对目前新兴的活性炭再生技术, 如超临界流体法、电化学法、催化湿式氧化法和超声波法等进行了介绍与讨论。
关键词:活性炭; 再生; 水处理
中图分类号:X703. 1 文献标志码:A
活性炭是一种无毒无味, 具有发达细孔结构和巨大比表面积的优良吸附剂。20世纪60年代初, 欧美各国开始大量使用活性炭吸附法处理城市饮用水和工业废水。目前, 活性炭吸附法已成为城市污水、工业废水深度处理和污染水源净化的一种有效手段。我国于20世纪60年代已将活性炭用于二硫化碳废水处理, 自20世纪70年代初以来, 采用粒状活性炭处理工业废水, 不论是在技术上, 还是在应用范围和处理规模上都发展很快, 如在炼油废水、炸药废水、印染废水、化工废水和电镀废水处理等方面都已有了较大规模的应用, 并取得了满意的效果。
随着活性炭的应用范围日趋广泛, 活性炭的回收开始得到了人们的重视。如果用过的活性炭无法回收, 除了每吨废水的处理费用将会增加0. 83~0. 90元外[1], 还会对环境造成二次污染。因此, 活性炭的再生具有格外重要的意义。1 传统活性炭再生方法的不足和缺陷
传统活性炭再生方法有对热再生法、生物再生法、湿式 收稿日期:2008-01-03
作者简介:曾志江(1978-) , 男, 广东深圳人, 助理工程师, 从事环境监测研究。
按从小到大顺序排列x 1
计算极差R =x n -x 1
计算出异常值与相应值的差x n -x n -1、x 2-x 1x n -x n -1x -x 1
D =2
x n -x 1x n -x 1
由(A , n) 确定D (A , n) 计算D =
当D >D (A , n ) 时, 舍去该异常值; 当D F D (A , n ) 时, 保留该值。用狄克逊检验法检验上题。
x 9-x 8=96. 8-93. 9=2. 7 x 9-x 1=96. 8-92. 3=4. 5D =
x 9-x 82. 7
==0. 644x 9-x 14. 5
责任编辑:王洪军
氧化再生法等, 这些方法在热再生法是目前应用最多、工业上最成熟的活性炭再生方法[2, 3]。特别在处理有机废水后的活性炭在再生过程中应用最为广泛。热再生法虽然有再生效率高、应用范围广的特点, 但在再生过程中, 须外加能源加热, 投资及运行费用较高。
生物再生法是利用经驯化过的细菌, 解析活性炭上吸附的有机物, 并进一步消化分解成H 2O 和CO 2的过程[1,2]。生物再生法与污水处理中的生物法相类似, 也有好氧法与厌氧法之分。由于活性炭本身的孔径很小, 有的只有几纳米, 微生物不能进入这样的孔隙, 通常认为在再生过程中会发生细胞自溶现象, 即细胞酶流至胞外, 而活性炭对酶有吸附作用, 因此在炭表面形成酶促中心, 从而促进污染物分解, 达到再生的目的。生物法简单易行, 投资和运行费用较低, 但所需时间较长, 受水质和温度的影响很大。微生物处理污染物的针对性很强, 需就特定物质专门驯化。且在降解过程中一般不能将所有的有机物彻底分解成CO 2和H 2O, 其中间产物仍残留在活性炭上, 积累在微孔中, 多次循环后再生效率会明显降低。因而限制了生物再生法的工业化应用。
在高温高压的条件下, 用氧气或空气作为氧化剂, 将处于液相状态下活性炭上吸附的有机物氧化分解成小分子的
查D 临界值表, D (0. 01, 9) =0. 672, D (0. 05, 9) =0. 564D >D (0. 05, 9) , 显著异常, 舍去该值。
当我们舍去了该值后, 我们就可能犯第一类错误) ) ) 弃真错误, 犯这类错误的概率为A (显著水平); 如果我们保留异常值, 则可能犯第二类错误) ) ) 取伪错误, 它的概率为B 。在实际操作中, 为了避免犯两类错误的可能性, 一般情况下, 我们会给定一个较小的A , 然后通过增加样本容量(观察值) 的方法, 把B 控制在较小范围内。
)