Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

什么是数字图像?

数字图像的严格定义



从数学角度看,数字图像可以定义为一个函数 ff,它将一个离散的空间域映射到一个离散或连续的强度范围。

对于一个 dd 维图像,其空间域是 Zd\mathbb{Z}^d 中的一个有限点网格。对于典型的二维图像,这个域是一组整数坐标对 (m,n)(m, n),其中 0m<M0 \le m < M0n<N0 \le n < NMMNN 的值定义了图像的空间分辨率

函数的值域定义了图像强度的性质。该函数将每个空间坐标映射到一个包含 BB 个强度值的向量,该向量属于 RB\mathbb{R}^B。这可以写作:

f:ZdRBpf(p)=[i1,i2,,iB]T\begin{aligned} f: \mathbb{Z}^d &\to \mathbb{R}^B \\ \mathbf{p} &\mapsto f(\mathbf{p}) = [i_1, i_2, \dots, i_B]^T \end{aligned}

其中 p\mathbf{p} 是一个空间坐标向量(例如,对于 d=2d=2 的情况是 (m,n)(m,n))。

向量 f(p)f(\mathbf{p}) 的分量是图像的强度或通道。一些常见的例子包括:

  • 灰度图像: d=2d=2B=1B=1。每个坐标 (m,n)(m,n) 映射到一个单一的标量强度值。

灰度图像表示为像素强度值的矩阵。

Figure 1:灰度图像表示为像素强度值的矩阵。

  • 彩色(RGB)图像: d=2d=2B=3B=3。每个坐标映射到一个3元素向量,分别代表红、绿、蓝三种颜色的强度。

RGB彩色图像表示为红、绿、蓝三个通道的矩阵。

Figure 2:RGB彩色图像表示为红、绿、蓝三个通道的矩阵。

  • 体数据图像(例如,MRI): d=3d=3B=1B=1。每个三维坐标 (m,n,k)(m,n,k) 映射到一个标量值。

图像坐标系

在图像处理中,标准坐标系的原点位于图像的左上角,如 Figure 3 所示。水平轴 nn 指向右侧(列),垂直轴 mm 指向下方(行)。记住这个约定很重要,因为它不同于数学中使用的标准笛卡尔坐标系,后者的垂直轴指向上方。

图像处理中的标准坐标系,原点位于左上角。

Figure 3:图像处理中的标准坐标系,原点位于左上角。

数字图像的分类

数字图像可以根据几个关键属性进行分类。

按空间维度 (dd)

  • 一维: 一维“图像”等同于一个信号。

  • 二维: 最常见的图像类型,表示场景的平面投影(例如,照片)。二维图像的基本元素是像素(pixel,即 picture element)。

  • 三维: 体数据图像,表示三个空间维度中的数据(例如,CT扫描)。其基本元素是体素(voxel,即 volume element)。

  • 更高维度: 维度也可以表示非空间量。例如:

    • 视频是一个 2D+tt 图像(两个空间维度 + 时间)。

    • 高光谱图像是一个 2D+λ\lambda 图像(两个空间维度 + 波长)。

按通道数 (BB)

  • 单通道 (B=1): 包括二值(黑/白)图像和灰度图像。

  • 多通道 (B>1):

    • RGB (B=3): 标准彩色图像。

    • 多光谱 (B 通常为 3 到 10): 捕捉多个离散的光谱波段(例如,Landsat卫星图像,包含可见光和红外波段)。

    • 高光谱 (B 可达数百): 捕捉连续的光谱范围,为每个像素提供详细的光谱特征。

按强度分辨率(位深度)

可能的强度值集合由图像的位深度决定。如前所述,位深度为 kk 的图像可以表示 2k2^k 个不同的强度级别。

  • 二值图像 (1-bit): 值的集合为 {0,1}\{0, 1\}

  • 8位灰度图像: 值的范围为 {0,1,,255}\{0, 1, \dots, 255\}

  • 高动态范围 (HDR): 通常使用浮点数来表示比标准8位图像所能捕捉的更宽广的强度范围。

🤖