范文写作网 > 理工毕业论文 > > 基于JPEG双量化效应的图像盲取证(2)
理工毕业论文

基于JPEG双量化效应的图像盲取证(2)

摘要:以分辨率为256256的Lena灰度图像为例,为了观察直方图特性,图像进行88分块的离散余弦变换后,我们提取所有88图像块的(1,2)位置处的DCT系数进行统计,图4(a)显示的是经过DCT后(1,2)位置上的未经量化的DCT系数概率
关键词:基于,JPEG,量化,效应,图像,取证,摘要,JPEG,图像

越爱越难过吉他谱,鄙视弟,诱捕爱妻

  以分辨率为256×256的Lena灰度图像为例,为了观察直方图特性,图像进行8×8分块的离散余弦变换后,我们提取所有8×8图像块的(1,2)位置处的DCT系数进行统计,图4(a)显示的是经过DCT后(1,2)位置上的未经量化的DCT系数概率分布直方图,图4(b)为经历量化步长Q1=5后所有图像块 (1,2)位置上的DCT系数概率分布直方图。从图4(a)中可以看出,经历离散余弦变换后,其AC系数在同一位置上的DCT系数直方图呈现出近似的拉普拉斯分布;而经历1次压缩量化后,其系数值就会呈现出周期性的缺失,如图4(b)所示。

  设第一次压缩过程中未量化的DCT系数为D1,量化后的系数为D1′,量化步长为Q1,第二次量化后的DCT系数为D2,量化步长为Q2。根据JPEG压缩和解压过程可以得到:

  D2=D1Q1Q1Q2

  根据取整的性质可以推出:

  Q1×(「Q2Q1(D2-1/2)-12)≤D1<

  Q1×(Q2Q1(D2+1/2)」+12)

  其中:・」为向下取整运算,「・为向上取整运算,[・]为四舍五入取整运算。设定:

  L(D2)=Q1×(「Q2Q1(D2-1/2)-12)

  R(D2)=Q1×(Q2Q1(D2+1/2)」+12)

  因此我们可以用DCT系数直方图上的区间长度来描述经历双重压缩前后系数之间的变化关系如式(3):

  n(D2)=R(D2)-L(D2)=

  Q1×Q2Q1(D2+1/2)」-「Q2Q1(D2-1/2)+1(3

  根据式(3)可以看出,n(D2)是D1取值区间的长度,并且是一个周期函数,而它的周期性是DCT系数直方图出现周期性的根本原因。且周期为p=Q1gcd(Q1,Q2),其中gcd(Q1,Q2)表示为Q1和Q2的最大公约数。

  四、基于JPEG双量化效应的检测算法

  4.1JPEG篡改图像双重压缩效应分析

  当一个源图像经过篡改后又保存为JPEG格式的图像时,未被篡改的区域(背景区域)会经历了2次JPEG压缩,其DCT系数值会表现出双重压缩效应,然而篡改区域则只经历过1次JPEG压缩,该区域的DCT系数不会表现出双重压缩效应。下面分3种情况来说明:

  1)当篡改区域(置换区域)的图像来自于非JPEG格式的图像时(比如,BMP、TIF格式的图像或者其他无损格式的图像时),篡改来源图像本身就没有经历过JPEG压缩,当篡改图像最终保存为JPEG格式,篡改区域只经历了1次JPEG压缩,自然不会表现出双重压缩效应。

  2)图像的篡改区域和背景区域的8×8分块位置一致的概率很低。在实际的篡改操作中往往会对图像中的某个特定区域进行篡改伪造。当篡改区域来自JPEG图像,假设背景区域的起始位置的坐标为(x1,y1),篡改区域置换的起始位置为(x2,y2),那么(|x2-x1|%8,|y2-y1|%8)=(0,0)的几率只有1/64,也就是说篡改区域表现出双重压缩效应的几率仅仅有1/64。

  3)篡改者为了使图像看起来更加真实,往往会对置换区域的边缘进行模糊润饰、羽化、平滑等操作,此时这些边缘块就不会包含完整的8×8图像块,篡改区域相当于只经历了1次JPEG压缩。

  4.2依据贝叶斯准则提取篡改块的特征值

  本文通过建立经历2次压缩和1次压缩时图像像素分布的概率模型,利用贝叶斯估计的方法估计出待测图像中每一个像素点被篡改的概率。根据文献[10]得知,图像经过基于8×8块的离散余弦变换后,其所有块同一位置的交流(AC)系数的直方图分布可以用一个以λ为参数的近似拉普拉斯分布函数来表示。因此对于一个未经量化的DCT系数块的AC分量系数D1的一个系数x(i, j)服从以λ(i, j)为参数的拉普拉斯分布:

  p(D1)=λ(i, j)2 exp(-λ(i, j)D1)(4)

  其中:λ(i, j)为位于第i行(i∈0,1,2,…,7);第j列(j∈0,1,2,…,7)的DCT系数所对应的分布参数。

  文献[11]直接使用λ=2/σ,σ为图像的标准差,此方案能准确地描述出第2次压缩因子大于第1次压缩因子时(QF2>QF1)的概率分布,然而当JPEG图像的压缩比越来越大时,也就是第2次压缩因子小于第一次压缩因子时(QF2  本文则采用局部邻域法对当前子块的λ矩阵进行估计。图5显示的是本实验中采用的邻域算法,仅考虑当前块(图5中黑色区域部分)及其邻域(邻域的大小取24,图5中白色区域部分)。对位于图像边界位置的块,则只考虑其位于图像边界内的相邻块计算λ,得到与这些块相对应的λ矩阵。此方案能够在深度量化条件下(即QF2远小于QF1)也能达到较好的估计效果。

  由式(3)可知,未篡改区域(背景区域)经过2次压缩后,区间 [L(D2),R(D2)]内的原始DCT系数D1会被映射成同一个值D2,那么对于背景区域中AC分量系数D2的系数x(i, j)的概率可以由式(5)表示为:

  p(D2H1)=∫R(D2)L(D2)p(D1)dD1=

  F(R(D2))-F(L(D2))(5)

  其中:H1代表图像块中未被篡改的像素,F(x)是累积分函数。通过第3章分析可知,当篡改区域的1次量化可以看成量化步长Q2=Q1的2次量化。因此篡改块的DCT系数为D2的概率可以用式(6)表示为:

  p(D2H2)=F(R′(D2)-F(L′(D2))(6)

  其中:R′(D2)=Q2(D2+1/2」+1/2),L′(D2)=Q2(「D2-1/2-1/2)。

  H2代表图像块中被篡改的像素。依据贝叶斯准则,则图像块中像素未被篡改的概率为:

  p(H1D2)=p(D2H1)×p(H1)p(D2H1)×p(H1)+p(D2H2)×p(H2) (7)

  其中,p(H1)和p(H2)分别为待检测图像的像素为正常和篡改时的先验概率,在本实验中取0.5,则:

  p(H1D2)=p(D2H1)p(D2H1)+p(D2H2)(8

  由于JPEG压缩是基于8×8像素块操作的,具有64个频率值(1个直流系数和63个交流系数),文献[12]研究证明,经量化后少数AC系数已经能很好地表示出图像的纹理信息。式(8)是图像中单个像素为正常时的后验概率,在实验中将每一个8×8的小块内的63个AC分量(DC分量不满足拉普拉斯分布)的后验概率值相加,就可以得到图像块的后验概率值T。

  T=∑Nj=1pj(9)

  其中N=63,pi为每一个8×8像素块内的63个AC分量的后验概率值。