离散余弦变换是jpeg压缩算法的关键步骤
思想
离散余弦变换的基本原理是:每一组离散的数据都可以由一组不同频率的余弦波来表示。
应用于图片上就是:将像素值转换为不同频率的余弦函数的系数(权重)
像素值——>权重
一维离散余弦变换
以下是一维离散余弦变换的公式
我们先来解释这个公式中的每一项
Xk:表示我们希望求得的权重系数,k表示不同余弦波的频率,假设k从0~7,那么我们将求得8个权重:X0, X1, X2, X3, X4, X5, X6, X7
xn: 表示原始像素值,假如一组像素值又8个,那么xn就是x0~x7
N: 表示一组像素值的个数
cos[...]: 表示某一个频率(k)的余弦波的采样值
简单描述:某一频率余弦波在一组像素值中的权重系数等于该频率余弦波的采样(0~N-1)和这组像素点每个值的乘积的累加值。
二维离散余弦变换
假设有一个8*8的像素矩阵,先按行进行一次DCT转换,再将转换出来的矩阵按列进行一次DCT转换,这就是二维离散余弦变换。
二维离散余弦变换的公式如下:
代码实现
C++实现二维离散余弦变换:
void JpegEncoder::_foword_FDC(const char* channel_data, short* fdc_data, const unsigned char* quant_table)
{
const float PI = 3.1415926f;
for(int v=0; v<8; v++)
{
for(int u=0; u<8; u++)
{
float alpha_u = (u==0) ? 1.f/sqrtf(8.0f) : 0.5f;
float alpha_v = (v==0) ? 1.f/sqrtf(8.0f) : 0.5f;
float temp = 0.f;
for(int x=0; x<8; x++)
{
for(int y=0; y<8; y++)
{
float data = channel_data[y*8+x];
data *= cosf((2*x+1)*u*PI/16.0f);
data *= cosf((2*y+1)*v*PI/16.0f);
temp += data;
}
}
int zigZagIndex = ZigZag[v * 8 + u];
//量化
temp *= alpha_u*alpha_v/ quant_table[zigZagIndex];
fdc_data[zigZagIndex] = (short) ((short)(temp + 16384.5) - 16384);
}
}
}
以上代码来自github上的开源项目:GitHub - thejinchao/jpeg_encoder: compress bitmap to jpeg file