MIDI音乐的产生过程
MIDI 音乐的产生过程
通过合成器产生 MIDI 音乐的方式有两种:FM(Frequency Modulation)合成和波 形表(Wavetable)合成: FM 频率调制合成: 通过硬件产生正弦信号,再经处理合成音乐。合成的方式是将波形组合在一起,理 论上可以有无限多组波形,但实际上做不到。其泛音的合成与模拟比较困难,实际的质 量不高。 波形表合成: 其原理是在 ROM 中已存储各种实际乐器的声音采样,需要时,调用相应的声音采 样合成该乐器的乐音。ROM 的容量越大,合成效果越好,价格也越贵。
PCM 编码原理 :
数字音频的技术指标 采样频率 采样频率是指一秒钟内采样的次数。奈奎斯特(Harry Nyquist)采 样理论:如果对某一模拟信号进行采样,则采样后可还原的最高信号频 率只有采样频率的一半,或者说只要采样频率高于输入信号最高频率的 两倍,就能从采样信号系列重构原始信号。 根据该采样理论,CD 激光唱盘采样频率为 44KHz,可记录的最高 音频为 22KHz,这样的音质与原始声音相差无几,也就是我们常说的超
级高保真音质 (Super High Fidelity-HiFi) 采样的三个标准频率分别为: 。 44.1KHz,22.05KHz 和 11.025KHz。 量化位数 量化位是对模拟音频信号的幅度轴进行数字化,它决定了模拟信号 数字化以后的动态范围。由于计算机按字节运算,一般的量化位数为 8 位和 16 位。量化位越高,信号的动态范围越大,数字化后的音频信号就 越可能接近原始信号,但所需要的存贮空间也越大。 量化位 8 16 等份 256 65536 动态范围(dB) 48-50 96-100 应用 数字电话 CD-DA
声道数 有单声道和双声道之分。双声道又称为立体声,在硬件中要占两条 线路,音质、音色好,但立体声数字化后所占空间比单声道多一倍。 编码算法 编码的作用一是采用一定的格式来记录数字数据,二是采用一定的 算法来压缩数字数据。压缩编码的基本指标之一就是压缩比:
(3-6) 压缩比通常小于 1。压缩算法包括有损压缩和无损压缩;有损压缩 指解压后数据不能完全复原,要丢失一部分信息。压缩比越小,丢掉的 信息越多、信号还原后失真越大。根据不同的应用,可以选用不同的压 缩编码算法,如 PCM,ADPC,MP3,RA 等等。 数据率及数据文件格式 数据率为每秒 bit 数,它与信息在计算机中的实时传输有直接关系, 而其总数据量又与计算机的存储空间有直接关系。因此,数据率是计算 机处理时要掌握的基本技术参数,未经压缩的数字音频数据率可按下式 计算: 数据率=采样频率(Hz)×量化位数(bit)×声道数(bit/s) 用数字音频产生的数据一般以 WAVE 的文件格式存贮,以 “.WAV”作为文件扩展名。WAV
文件由三部分组成:文件头,标明是 WAVE 文件、文件结构和数据的总字节;数字化参数如采样率、声道数、 编码算法等等; 最后是实际波形数据。 WAVE 格式是一种 Windows 下通 用的数字音频标准, Windows 自带的媒体播放器可以播放 WAV 文件。 用 MP3 的应用虽然很看好,但目前还需专门的播放软件,其中较成熟的为 RealPlayer。
MIDI 术语的定义 音乐合成器(Musical Synthesizer) 音乐合成器用来产生并修改正弦波形并叠加,然后通过声音产生器 和扬声器发出特定的声音。泛音的合成决定声音音质。 复调声音(Polyphony) 简称为复音,指合成器同时演奏若干音符时发出的声音。它着重于 同时演奏的音符数。 多音色声音(Timbre) 指同时演奏几种不同乐器时发出的声音。它着重于同时演奏的乐器 数。 MIDI 标准 MIDI 电子乐器: 能产生特定声音的合成器之间的数据传送符合 MIDI 的通信约定。 MIDI 消息(message)或指令:音乐乐谱的一种记录格式,相 当于乐谱语言。 MIDI 接口(interface):MIDI 硬件通信协议。 MIDI 通道(channel):MIDI 标准提供了 16 个通道,每种通道 对应一种逻辑的合成器。 MIDI 文件:由控制数据和乐谱信息数据构成。 音序器(Sequencer):用来记录、编辑和播放 MIDI 文件的软 件。
MIDI 电子乐器通过声卡的 MIDI 接口与计算机相连。这样,计算机可通过音序器软件来采 集 MIDI 电子乐器发出的一系列指令。这一系列指令可记录到以“.MID”为扩展名的 MIDI 文 件中。在计算机上音序器可对 MIDI 文件进行编辑和修改。最后,将 MIDI 指令送往音乐合 成器,由合成器将 MIDI 指令符号进行解释并产生波形,然后通过声音发生器送往扬声器播 放出来。
音频卡的功能 音频卡即声卡,其功能是使计算机能够处理音频信号。音频卡的关 键技术包括数字音频、音乐合成和 MIDI。以 CREATIVE 的 16 位声卡 SB16 为例,其主要功能如下: 数字音频的播放 音频卡的主要技术指标之一是数字化量化位和立体声声道的多少。 早期的音频卡是 8 位,SB16 支持 16 位立体声声道。可以播放 CD-DA 唱盘及回放 WAVE 文件。 录制生成 WAVE 文件 音频卡配有话筒输入、线性输入接口。数字音频的音源可以是话筒、 收录音机和 CD 唱盘等,可选择数字音频参数,如不同的采样率、量化 位和压缩编码算法等。在音频处理软件的控制下,通过音频卡对音源信 号进行采样、量化、编码成 WAVE 格式的数字音频文件,通过软件还可 对 WAVE 文件进行进一步编辑。 MIDI 和音乐合成 通过 MIDI 接口可获得 MIDI 消息。SB16 采用 FM 频率合成的方法 实现音乐合成,以实现 MIDI 乐声的合成以及文-语转换 (Text-to-Speech
)合成。 多路音源的混合和处理 借助混音器可以混合和处理不同音源发出的声音信号,混合数字音 频和来自 MIDI 设备、CD 音频、线性输入、话筒及 PC 扬声器等的各种 声音。录音时可选择输入来源或各种音源的混合,控制音源的音量、音 调。 音频卡的安装和使用 硬件安装与使用 音频卡通过卡上的许多插口和接口与其它设备相连,主要包括与计 算机主机的连接和与其他外设的连接。:
音频卡通过卡上的许多插口和接口与其它设备相连。 位于卡内的插口和接口: CD-ROM 数据接口:可与 CD-ROM 驱动器的数据接口相连。 CD 音频数据接口:与 CD-ROM 音频线相连,音频卡接上扬声 器后就可播放 CD-ROM 光盘上的声音数据。 位于音频卡后面板上的插口和接口: 线性输入插口(Line In Jack):可与盒式录音机、唱机等相连, 进行播放或录音。 话筒输入插口 (Mic In Jack) 可与话筒相连, : 进行语音的录入。 线性输出插口(Line out Jack):可跳过音频卡的内置放大器, 而连接一个有源扬声器或外接放大器进行音频的输出。 扬声器输出插口(Speaker Out Jack):从音频卡内置功率放大 器连接扬声器进行信号输出,该插口的输出功率一般为 2-4 瓦。 游戏棒/MIDI 接口(Joystick/MIDI connect):可将游戏棒或 MIDI 设备如 MIDI 键盘连接到音频卡上。
软件安装 安装音频卡需要安装驱动程序,通常 Win95 能够自动识别音频卡, 并且预装一部分驱动程序。 音频软件的使用 不同的声卡有不同的应用软件,但基本功能类似。主要包括:CD 播放器;MIDI 播放器;录音器,混音器;WAVE 文件编辑器等。Creative 声卡的软件使用请参照图书教材《数字媒体传播基础》(刘惠芬,清华 如 大学出版社) 有的 WAVE 文件编辑器可以与声卡无关, goldenwave, 。
多媒体个人计算机 MPC(Multimedia Personal Computer)是以 Microsoft 公司为主的 MPC 市场联盟(Multimedia PC Marketing Council)制定的 MPC 的基本硬件规格为基准,主要包 括 PC 机、光驱和声卡。 微软公司开发了功能强大的软件操作系统平台。 1981 年 8 月, IBM PC 全面上市, 它采用 Intel 公司的 CPU、IBM 公司的硬件系统和微软的软件系统(MS-DOS、PC-DOS) 。与此同时, IBM 公司公开了 PC 机的内核,推动了兼容机的发展。三年之后,几乎所有的个人计算机竞 争标准都消失了,唯一例外的是苹果公司的 APPLE,后来发展成为 Machitosh(MAC) 。 Machitosh 的特点是图形功能强大,其图形和窗口平台比 Windows 还早(1984 年推出) ,但 它不公开,所以没有兼容机。1991 年,微软推出 Windows 操作系统,至今为止,PC 系列与 MAC 计算机为全球范围内使用最广的机型,而国内的
个人计算机市场主要是 IBM PC 及其 兼容机占主导地位。 MPC=高性能 PC+CD-ROM 驱动器+声卡
主机板性能 主机板性能主要包括 CPU 及主频,内存和高速缓存容量,以及总线结构。CPU 是 计算机的心脏。 主频是 PC 机振荡晶体的频率, 它使主板工作于某个速度上。 因此, CPU 与其相应的主频一起决定 PC 机的运算速度。如 Pentium III CPU 的主频速度为 450MHz-550MHz。内存 RAM 指的是动态存储器 DRAM。如果内存不够,则程序运行 时要利用虚拟内存和临时文件,也即占用一部分硬盘空间作为临时存储用。程序越大、 内存越小,则占用的硬盘空间越大、内存与硬盘之间的数据交换次数越多,程序运行的 实际速度也就越慢。因此,把一些常用数据暂存于高速缓存 Cache 可大大提高 CPU 读 取数据的速率。Pentium III 已做到了 512KB 的高速缓存。Cache 的容量越大,运算性 能提高越明显,这在图像处理时特别有用。
计算机中各部件的协同工作直接关系到系统的整体性能, 而部件间的联系是通过总 线(BUS)来实现的。总线的性能是以总线的时钟、带宽及相应的总线数据传输率来衡 量的。除了 CPU 以外,主板还可以按不同的总线接口类型分类:
不同的接口类型, 决定了 PC 机的总线结构。 不同总线结构的性能比较如下表所示: 接口 ISA EISA VESA PCI 宽度(bit) 16 32 32 64 最高传输率(MBps) 8 33 132 528 适用机型 286 386 486 pentium 总线结构的发展是与 CPU 的发展相联的, 其目的是为了让数据传输率与 CPU 的速 度相匹配。目前一般使用 PCI 总线。 。 硬盘系统 硬盘的用途主要是存储数据或程序以及用于数据的交换与暂存。 对硬盘的要求首先 是容量足够大,以便存储大的应用程序和多媒体数据。其次是数据传输率足够高,以便 数据的读取与交换。硬盘的技术指标主要包括容量、寻址时间和接口。在数据存储和交 换时, 计算机的工作效率与硬盘的数据传输率有直接关系。 可从如下几方面进行管理硬 盘: 合理利用硬盘,有效地管理硬盘上的文件 减少硬盘中碎片,提高实际数据读取时间 硬盘空间应留有一定的余量 硬盘上的自由空间越多、自由空间越连续、硬盘的实际读写速度越快,整个系统的 工作速度当然也越快。 显示系统 显示屏幕实际都是由许多不同色彩或不同亮度的点组成的。 屏幕上一个点也称为一 个像素(pixel)。像素点的排列就构成了屏幕的显示区域,也称为显示分辨率,如 800×600。显示分辨率在一定范围内可调,而点距(dot pitch)则是屏幕物理上像素间 的最小距离。因此,点距越小,分辨率范围就可以做得越高。 计算机通过红(Red)、绿(Green)和蓝(Blue)三
种色光(简记为 RGB)按不 这种相加混色是计算机中定义颜色的基本方法。 扫描显示 同比例混合而形成各种色光。 的基本工作过程是代表 R、G、B 色彩强度的三束电子从显示屏幕的左上角开始,逐行
或隔行向下扫描。当色电子束轰击屏幕上一点时,对应的荧光体发光,混合成一个像素 点。扫描一帧的速率称为刷新速率(refresh rate),也可称为帧率或垂直扫描速率。刷 新速率太低,会使人感到屏幕显示闪烁、不稳定。目前 PC 显示器一般采用逐行扫描的 方式,其屏幕刷新率在 70Hz 以上。 显示卡是显示系统的核心,它决定着显示的分辨率、显示速度和效果。显示卡上都 设有一块与屏幕显示位置对应的存储区,用来存放当前屏幕显示的数据。因此,显示存 储区的容量决定了最大显示分辨率及显示深度。 以 640×480 的分辨率、256 色显示(显示
深度为 8bit) ,则一屏显示数据的容量为: 640×480×8(bit)=300(KByte)
网域构成 网络可以把不同地域的 MPC 或其它计算机联成一个整体。单机上配上网卡;通过 网线与集线器(Hub)相连。一个集线器一般有多个端口,每个端口可以连结一台单机, 由此就可以构成一个局域网。 集线器相当于局域网的总线,其数据率一般为 10Mb/s,因此网间的数据交换比单 机内部速度慢,同时一个集线器连接的单机越多,速度就越慢,因为所有的单机都共享 10Mb/s 的传输率。除了集线器以外,还可以采用交换机(Switch Hub)来连结各个单 机。集线器的所有端口都共享 10Mb/s 的数据传输率,而交换机的每个端口都具有 10Mb/s 的数据率,有的还提供 100Mb/s 的端口。显然采用交换机进行单机间的通讯 其速度要快许多,当然其价格也贵许多。 实际中常根据数据传输流量的需要设计网域间的连接关系
。从一个高校普通实验室的网域构成
可看出数字媒体传播的硬件条件和构成。 在这个例子中, 实验室本身构成一个局域 网,其交换机(Switch Hub)联接整个文科楼的网络,实验室交换机通过 10Mb 光缆与 校园网及 INTERNET 相连。 显然与接在交换机端口上的 MPC 相比, 接在 Hub 上的 MPC 上网的速率要慢一些。
当用户借助于 MPC 获取或传播数字媒体信息时,传播速度一般按如下顺序递减: 本地机---〉局域网---〉校园网---〉国内网域---〉国外网域
色调、亮度和饱和度
从人的视觉系统看,色彩可用色调、饱和度和亮度来描述。人眼看 到的任一彩色光都是这三个特性的综合效果,这三个特性可以说是色彩 的三要素,其中色调与光波的波长有直接关系,亮度和饱和度与光波的 幅度有关。 当人眼看到一种或多种波长的光时所产生的色彩感
觉,我们称之为 色调或色相。与绘画中的色相系列不同的是,计算机在图像处理上采用 数字化,可以非常精确地表现色彩的变化,色调是连续变化的。用一个 园环来表现色谱的变化,就构成了一个色彩连续变化的色环。 亮度或明度是光作用于人眼时所引起的明亮程度的感觉,是指色彩 明暗深浅的程度,也可称为色阶。亮度有两种特性:同一物体因受光不 同会产生明度上的变化;强度相同的不同色光,亮度感不同。 饱和度指色彩纯粹的程度。淡色的饱和度比浓色要低一些;饱和度 还和亮度有关,同一色调越亮或越暗越不纯。
三原色相混合而成白光,而两种色光相混合而成白光,这两种色光互为补色。
HSI 色彩空间 HSI 色彩空间是从人的视觉系统出发,用色调(Hue)、色饱和度(Saturation 或 Chroma)和亮度(Intensity 或 Brightness)来描述色彩。HSI 色彩空间可以用 一个圆锥空间模型来描述。用这种描述 HSI 色彩空间的圆锥模型相当复杂,但确 能把色调、亮度和色饱和度的变化情形表现得很清楚。 圆锥空间模型:HSI 色彩空间模型
(A)HSI 圆锥空间模型
(B)线条示意图: 圆锥上亮度、色度和饱和度的关 系。
(B)线条示意图: 圆锥上亮度、色度和饱和度的关系。
(C)纵轴表示亮度: (D)圆锥纵切面: 亮度值是沿着圆锥的 描述了同一色调的不 同 轴 线度量的, 沿着圆锥轴线上 亮度和饱和度关系。 的点表示完全不饱和的颜 色,按照不同的灰度等级, 最亮点为纯白色、 最暗点为 纯黑色。 YUV(Lab)色彩空间
(E)圆锥横切面: 色调 H 为绕着圆锥截 面度量的色环, 圆周上的颜 色为完全饱和的纯色, 色饱 和度为穿过中心的半径横 轴。
回页首
在现代彩色电视系统中, 通常采用三管彩色摄像机或彩色 CCD (点耦合器件) 摄像机,它把摄得的彩色图像信号,经分色、分别放大校正得到 RGB,再经过矩 阵变换电路得到亮度信号 Y 和两个色差信号 R-Y、B-Y,最后发送端将亮度和色 差三个信号分别进行编码,用同一信道发送出去。这就是我们常用的 YUV 色彩 空间。 采用 YUV 色彩空间的重要性是它的亮度信号 Y 和色度信号 U、 是分离的。 V 如果只有 Y 信号分量而没有 U、V 分量,那么这样表示的图就是黑白灰度图。彩 色电视采用 YUV 空间正是为了用亮度信号 Y 解决彩色电视机与黑白电视机的兼 容问题,使黑白电视机也能接收彩色信号。 根据美国国家电视制式委员会制定的 NTSC 制式标准,当白光的亮度用 Y 来 表示时,它和红、绿、蓝三色光的关系可用如下式的方程描述: Y=0.3R+0.59G+0.11B 与 YUV 色彩空间类似的还有 Lab 色彩空间,它也是用亮度和
色差来描述色 彩分量,其中 L 为亮度、a 和 b 分别为各色差分量。 CMY 色彩空间
彩色印刷或彩色打印的纸张是不能发射光线的,因而印刷机或彩色打印机就 只能使用一些能够吸收特定的光波而反射其它光波的油墨或颜料。油墨或颜料的 三基色是青(Cyan)、品红(Magenta)和黄(Yellow),简称为 CMY。青色对 应蓝绿色;品红对应紫红色。理论上说,任何一种由颜料表现的色彩都可以用这 三种基色按不同的比例混合而成,这种色彩表示方法称 CMY 色彩空间表示法。 彩色打印机和彩色印刷系统都采用 CMY 色彩空间。 色彩空间的变换 RGB,HSI,YUV,CMYK 等不同的色彩空间只是同一物理量的不同表示法, 因而它们之间存在着相互转换关系,这种转换可以通过数学公式的运算而得。例 如,CMY 为相减混色,它与相加混色的 RGB 空间正好互补。 实际应用中,一幅图像在计算机中用 RGB 空间显示;用 RGB 或 HSI 空间编 辑处理;打印输出时要转换成 CMY 空间;如果要印刷,则要转换成 CMYK 四幅 印刷分色图,用于套印彩色印刷品。 图像分辨率与显示分辨率 显示分辨率是确定屏幕上显示图像的区域的大小。显示分辨率有最大显示分 辨率和当前显示分辨率之别。最大显示分辨率是由物理参数,即显示器和显示卡 (显示缓存)决定的。当前显示分辨率是由当前设置的参数决定的。 图像分辨率是确立组成一幅图像的像素数目, 图像分辨率用 dpi dot per inch, ( 每英寸点数)表示,是图像像素密度的度量方法。对同样大小的一幅原图,如果 数字化时图像分辨率高,则组成该图的像素点数目越多,看起来就越逼真。图像 分辨率在图像输入/输出时起作用;它决定图像的点阵数。而且,不同的分辨率会 造成不同的图像清晰度。 按照不同的图像分辨率来扫描图像,可以看出图像分辨率与显示分辨率的关 系和不同。如果图像的点数大于显示分辨率的点数,则该图像在显示器上只能显 示出图像的一部分。只有当图像大小与显示分辨率相同时,一幅图像才能充满整 屏。 图像深度与色彩类型 图像深度是指位图中记录每个像素点所占的位数, 它决定了彩色图像 中可出现的最多颜色数,或者灰度图像中的最大灰度等级数。图像的色彩 需用三维空间来表示,如 RGB 色彩空间,而色彩的空间表示法又不是唯 一的,所以每个像素点的图像深度的分配还与图像所用的色彩空间有关。 以最常用的 RGB 色彩空间为例,图像深度与色彩的映射关系主要有真彩 色、伪彩色和调配色。 真彩色是指图像中的每个像素值都分成 R、G、B 三个基色分量,每 24 基色分量用 8bit 来记录其色彩强度,共可
记录 2 =16M 种色彩。这样得到
的色彩可以反映原图的真实色彩,故称真彩色。 伪彩色图像的每个像素值实际上是一个索引值或代码, 该代码值作为 色彩查找表中某一项的入口地址,根据该地址可查找出包含实际 R、G、 B 的强度值。这种用查找映射的方法产生的色彩称为伪彩色。从 16 色标 准 VGA 调色板的定义可以看出这种伪彩色的工作方式。同一幅图像,采 用不同的调色板显示可能会出现不同的色彩效果。 调配色是通过每个像素点的 R、G、B 分量分别作为单独的索引值进 行变换,经相应的色彩变换表找出各自的基色强度,用变换后的 R、G、 B 强度值产生的色彩。调配色的效果一般比伪彩色好,但显然没有真彩色 的效果。 图像压缩的基本概念 数字图像由于数据量很大,不仅占用存储空间,而且影响传输。因此,图像 处理的重要内容之一就是图像的压缩编码。图像的压缩基本基于如下两点: 图像信息存在着很大的冗余度,数据之间存在着相关性,如相邻像素之 间色彩基本相同。 人的视觉对于边缘急剧变化不敏感,人眼具有对图像的亮度敏感高、对 色度敏感性低的特点。 根据这两点特征就可以压缩图像数据,而且由此发展出图像压缩的两类基本 方法:一种是将相同的或相似的数据或数据特征归类,使用较少的数据量描述原 始数据,达到减少数据量的目的。这种压缩一般为无损压缩。第二类方法是利用 人眼的视觉特性有针对性地简化不重要的数据,以减少总的数据量。这种压缩一 般为有损压缩,只要损失的数据不太影响人眼主观接收的效果,就可采用。 图像压缩的主要参数之一是图像压缩比,定义为压缩前的图像数据量与压缩 后的图像数据量之比:
显然,压缩比越小,压缩后的图像文件数据量越小,图像质量有可能损失越 多。但压缩比并不是一个绝对的指标,压缩的效果还与压缩前的图像效果及压缩 方法有关。 行程编码 有些图像,尤其是计算机生成的图形往往有许多颜色相同的图块。在这些图 块中,许多连续的扫描行都具有同一种颜色,在这种情况下就可以不需要存储每 一个像素的颜色值,而仅仅存储一个像素值以及具有相同颜色的像素数目。这种
编码称为行程编码,或称游程编码,常用 RLE(Run-Length Encoding)表示。 通过一个 RLE 行程编码的实例,可知该压缩编码技术相当直观和经济,运算 也相当简单,因此解压缩速度很快。RLE 压缩编码尤其适用于计算机生成的图形 图像,对减少存储容量很有效,但对自然图像来说就完全不同。 增量调制编码 自然图像往往具有这样的特点:在比较大的范围内,图像的颜色虽不完
全一 致,但变化不大。因此,在这些区域中,相邻像素的像素值相差很小,具有很大 的相关性。在一幅图像中,除了轮廓特别明显的地方,大部分区域都具有这种特 点。增量调制编码(Delta Modulation Encoding)就是利用图像相邻像素值的相关 性来压缩每个像素值的位数,达到最终减少图像存贮容量的目的。 用增量调制编码压缩图像时,不存贮扫描行上每个像素的实际值,而仅存贮 每一行上第一个像素的实际值。其后,依次存贮每一个像素的像素值与前一个像 素值之差值,即增量值。由于差值较小,所以可用较少的位数来表示和记录,这 样就节省了存储空间。 图像文件的一般结构 一般的图像文件结构都包含有文件头、文件体和文件尾等三部分。
文件头的主要内容包括产生或编辑该图 像文件的软件的信息以及图像本身的参数。这些参数必须完整地描述图像数据的 所有特征,因此是图像文件中的关键数据。当然,根据不同的文件,有的参数是
可选的。 文件体主要包括图像数据以及色彩变换查找表或调色板数据。这部分是文 件的主体,对文件容量的大小起决定作用。如果是真彩色图像,则无色彩变换查 找表或调色板数据,对于 256 色的调色板,每种颜色值用 24bit 表示,则调色板的 数据长度为 256×3(Byte)。 文件尾是可选项, 可包含一些用户信息。 有的文件格式不包括这部分内容。 由于文件体数据量较之文件头与文件尾要大得多,而文件体中色彩变换表或调色 板所占用的空间一般也比图像数据小得多,因此图像文件的容量一般能够表示图 像数据的容量(压缩或无压缩)。 上图只是一个大概的图像文件结构说明,实际的结构根据不同的格式其中的 条目要细得多,结构也复杂得多,各个条目所占空间及条目间的排列顺序也大不 相同。目前还没有非常统一的图像文件格式。但大多数图像处理软件都与数种图 像文件格式相兼容,也即可读取多种不同格式的图像文件。这样,不同的图像格 式间可相互转换。 回页首 常用的图像文件格式 几乎所有的图像文件都采用各自简化的格式名作为文件扩展名。从扩展名就 可知道这幅图像是按什么格式存贮的,应该用什么样的软件去读/写。 BMP 格式: 这是一种与硬件设备无关的图像文件格式,使用非常广。它采用位映射存贮 格式,除了图像深度可选以外,不采用其它任何压缩,因此,BMP 文件所占用的 空间很大。BMP 文件的图像深度可选 1bit、4bit、8bit 及 24bit。BMP 文件存储数 据时,图像的扫描方式是按从左到右、从下到上的顺序。 PCX 文件: 这是 PC 画笔的图像文件格式。PCX 的图像深度可选为 1、4
、8bit。由于这 种文件格式出现较早,它不支持真彩色。PCX 文件采用 RLE 行程编码,文件体中 存放的是压缩后的图像数据。因此,将采集到的图像数据写成 PCX 文件格式时, 要对其进行 RLE 编码;而读取一个 PCX 文件时首先要对其进行 RLE 解码,才能 进一步显示和处理。 TIFF 文件: TIFF(Tag Image File Format)文件是由 Aldus 和 Microsoft 公司为扫描仪和 桌上出版系统研制开发的一种较为通用的图像文件格式。TIFF 格式灵活易变,它 又定义了四类不同的格式:TIFF-B 适用于二值图像;TIFF-G 适用于黑白灰度图 像;TIFF-P 适用于带调色板的彩色图像;TIFF-R 适用于 RGB 真彩图像。TIFF 支持多种编码方法,其中包括 RGB 无压缩、RLE 压缩及下面要介绍的 JPEG 压缩
等。 GIF 文件: GIF (Graphics Interchange Format) CompuServe 公司在 1987 年开发的图像 是 文件格式。GIF 文件的数据是经过压缩的,它采用了可变长度等压缩算法。GIF 的图像深度从 1bit 到 8bit,也即 GIF 最多支持 256 种色彩的图像。GIF 格式的另 一个特点是其在一个 GIF 文件中可以存多幅彩色图像,如果把存于一个文件中的 多幅图像数据逐幅读出并显示到屏幕上,就可构成一种最简单的动画。 JPEG 文件: JPEG(Joint Photographic Experts Group)是由 CCITT 和 ISO 联合组成的一个 图像专家组。 该专家组制定的第一个压缩静态数字图像的国际标准, 简称为 JPEG 算法。 JPEG 采用对称的压缩算法, 也即在同一系统环境下压缩和解压缩所用的时 间相同。采用 JPEG 压缩编码算法压缩的图像,其压缩比约为 1:5 至 1:50,甚至 更高,是目前压缩质量最好的算法。从实例中可以看出不同压缩比及其压缩效果。 平板扫描仪
平板扫描仪在很多方面像复印机。把要 扫描的图片放置在扫描仪的玻璃板上,扫描仪提供光源给图片,通过光条和镜头 将图片曝光,光线从图片上反射进扫描仪的光学系统,在此系统中不同层次的光 得以处理,以数字的形式重新组合后送计算机屏幕显示,并以图像文件的形式保 存在磁盘上。 扫描仪一般通过一个专用的扫描仪接口卡与计算机相联系,不同的扫描仪配 有不同的扫描仪驱动软件,通过软件驱动程序使计算机能识别扫描仪并与之建立 起通信联系。扫描仪一般都配有相应的扫描应用软件,用户通过软件来选择扫描 时的工作参数,控制扫描仪的工作,扫描软件还可以对图像作一些预处理,生成 的数字图像可按不同的文件格式存贮下来。
主窗口与工具箱
PHOTOSHOP 的主窗口主要由菜单项、工具箱、图像编辑窗、各种控制板和 状态栏组成。其中工具箱、各控制板以及状态栏都有显现和隐藏两种状态,通过 Window
s 菜单来切换。 状态栏显示当前图像的各种参数值和状态。 利用各种工具, 并配合菜单和控制板的操作,可对编辑窗中的图像进行不同的编辑和绘图处理。 菜单 PHOTOSHOP 的菜单项按其功能,可分为对图像的操作、对图层的操作、特 技处理、对编辑视图控制及帮助信息五大类。 工具箱 工具箱罗列出常用的编辑工具,当前选择的工具可以通过 A 控制板中的 Option 选项来调整各项参数。双击工具箱中某一工具,即可打开其相应的参数控 制板。 控制板 控制板的作用是显示和控制各种编辑状态和工具的参数。控制板分为 A、B、 C、D 四块,每块上有不同的控制栏目,可以分别控制和调整。点击控制板右上 角的三角图标,可控制弹出式菜单,选择对当前栏目的编辑;控制板下方排列有 不同的编辑按钮,可对当前栏目进行快捷编辑。 回页首 基本图像变换与操作 图像变换与操作是指对编辑窗口中当前显示的图像内容进行处理,涉及的菜 单项包括 File、Edit 和 Image。 文件的操作及格式的变换 任何一幅图像的参数基本都包括图像分辨率、图像尺寸、象素深度(色彩模 式)和文件格式等。如果创建一幅新的图像(New),需要指定图像的各种参数, 还包括图纸的背景颜色等。当操作打开(Open)一幅已有图像文件时,系统会自 动识别这些参数,并在预览窗口显示出该图像小样及文件容量。 图像文件打开后其参数可在状态栏中查看,点击状态栏中的三角图标,可控 制状态栏中显示的不同信息内容。当信息内容为图像文件容量时,鼠标点在容量 栏处,同时按 Alt,则可显示当前图像的尺寸、分辨率、通道数、色彩模式等信息; 若同按 Shift,可显示图像打印的位置预览。包括文件大小、图像尺寸、分辨率、 等等。 PHOTOSHOP 支持的图像文件格式有许多,除了其专用的 PSD 和 PDD 格式 以外,还包括 BMP,GIF,JPEG,PCX,TIFF 等标准格式和其他一些图像格式。 PSD 是 PHOTOSHOP 特有的格式,包括各种编辑的中间状态和信息,因此文件的 容量很大,而且一般的图像软件也不支持这种格式。在图像编辑的过程中,系统 会自动把图像格式转换成 PSD 格式,并按该格式保存。如果要转换格式,必须采 用 File/Save as a copy 菜单项,把图像内容复制到一个新文件中,文件的格式、
路径、文件名都可以重新选择。 图像重采样 菜单项 Image/Image size 的功能为图像的重采样,通过改变图像的像素大小 或分辨率,进而改变图像文件大小或图像打印输出的幅面。 色彩模式转换 PHOTOSHOP 能利用很多色彩模式来显示、 存储和打印图像, 通常分为灰度、 调配色、色彩空间和多通道四种系列,可
通过 Image/mode 菜单选择和转换。 图像的旋转和色调调整 菜单项 Image/Rotate canvas 可控制整体图像的旋转和翻转。菜单项 Image/Adjust 可控制调整当前图层的色彩、色调、对比度等。 回页首 图层的概念与编辑 图层的概念 PhotoShop 将一个图像按不同的图层(layer)来记录和编辑处理,一个图层 就是一个相对独立的图像单元,每层可以独立选择和编辑处理,而决不会影响到 其他的图层信息。各层之间可按不同的透明度和前后顺序叠在一起。多图层的图 像在保存时,若想保存各图层及全部信息,必须存为 PSD 格式。对图层的操作可 通过图层菜单(Layer)和图层控制板进行。 图层控制板 打开一个图像文件的同时,图层控制板内会自动列出所有图层,最底层往往 是背景。 图层编辑功能 通过菜单项 Layer, 图层控制板上的弹出式菜单, 以及控制板底边的快捷按钮, 可以对图层进行各种编辑操作,主要包括: 新建、复制、删除当前图层。新建图层时,可以指定图层名称、透明度、 混合模式等参数,一般新建图层会放在当前图层之上。用鼠标拖拽需删除的图层 至下方的“垃圾桶”,即可删除该层。 图层的移动。包括图层在图像平面内的移动和图层间的前后顺序移动。 用工具箱中的移动工具可移动当前图层及其关联图层;在图层控制板中,拖拽要 移动的图层至理想位置,松开鼠标即可改变图层间的前后关系。 图层色彩调整。用 Image/adjust 菜单项可以调整当前图层的各种色彩效 果。
图层的变形。用 Layer/transform(PhotoShop 5.0 中为 Edit/transform) 菜单项可以将当前图层进行各种拉伸、旋转和变形。 工具箱 类型 图标 功能 可移动整个图层或选择区在图像中的平 移动图像 面位置。 当编辑窗口无法显示整个图象时,可移 徒手移动 动图像与窗口的相对位置,以便在窗口 中显示出其他图像部分。 按矩形、椭圆形、单行、单列定义选择 几何区 区。 绳索 魔棒 喷枪 画笔 渐变 选取不规则的范围。 根据设定的容差值,选取颜色相近的连 续像素的范围。 可模拟喷枪绘出柔边的线条。 可选择不同的笔刷,产生笔触感柔和的 颜色。 可建立两种或两种以上颜色的渐变效 果。 名称
移动
选择区 定义
油漆桶 将前景色填充在选定的范为内。 吸管 可吸取图象中的任意颜色,作为前景色 或背景色。
绘 画 绘 图
橡皮擦 擦拭图象, 使擦过的地方显示出背景色。 图章 聚焦 可将局部的图象复制到其它地方。
缩放
可使图象的局部或边缘产生模糊或锐化 的效果。 可改变图象中特定区域的明暗度或颜色 色调 饱和度。 可在图象上画出不同粗细的线条或带箭 直线 头的直线。
定义矢量路径,可精确调整。路径可以 钢笔 转换成选择区,也可据此划线。 在不改变图象原有比例的情况下,改变 显示缩放 屏幕显示的比例。
文字 前景色/ 背景色 显示模式
文字 前景色/ 背景色
在图象中加入各种文字的效果。 可提供绘图工具所使用的颜色。
提供了不同的显示模式,如标准屏幕、 显示模式 全屏幕、黑底屏幕等模式,还可选择快 速蒙版模式或标准模式。
注明:工具箱中的工具图标右下角如有一个小三角,则可进一步弹出其展开 条选择其他同类工具。