多媒体计算机系统组成
第四章 多媒体计算机系统组成
4.1 概 述
多媒体计算机系统由硬件系统和软件系统组成。其中硬件系统主要包括计算机主要配置和各种外部设备以及与各种外部设备的控制接口卡(其中包括多媒体实时压缩和解压缩电路) ,软件系统包括多媒体驱动软件、多媒体操作系统、多媒体数据处理软件、多媒体创作工具软件和多媒体应用软件。
(1多媒体硬件系统是由计算机存储系统、音频输入/输出和处理设备、视频输入/输出和处理设备等选择性组合而成。
(2)多媒体驱动软件
多媒体驱动软件是多媒体计算机软件中直接和硬件打交道的软件。它完成设备的初始化,完成各种设备操作以及设备的关闭等。驱动软件一般常驻内存,每种多媒体硬件需要一个相应的驱动软件。
(3)多媒体操作系统
多媒体操作系统简言之就是具有多媒体功能的操作系统。多媒体操作系统必须具备对多媒体数据和多媒体设备的管理和控制功,具有综合使用各种媒体的能力,能灵活地调度多种媒体数据并能进行相应的传输和处理,且使各种媒体硬件和谐地工作。多媒体操作系统大致可分为两类:一类是为特定的交互式多媒体系统使用的多媒体操作系统。如Commodore 公司为其推出的多媒体计算机Amiga 系统开发的多媒体操作系统Amiga DOS 。另一类是通用的多媒体操作系统。如目前流行的Windows 9x、Windows NT系列。
(4)多媒体处理软件
多媒体数据处理软件是专业人员在多媒体操作系统之上开发的。在多媒体应用软件制作过程中,对多媒体信息进行编辑和处理是十分重要的,多媒体素材制作的好坏,直接影响到整个多媒体应用系统的质量。
常见的音频编辑软件有Sound Edit 、Cool Edit 等,图形图像编辑软件有Illustrator 、CorelDraw 、Photoshop 等,非线性视频编辑软件有Premiere ,动画编辑软件有Animator Studio和3D Studio MAX等
(5)多媒体创作软件
多媒体创作软件是帮助开发者制作多媒体应用软件的工具,能够对文本、声
音、图像、视频等多种媒体信息进行控制和管理,并按要求连接成完整的多媒体应用软件。如Authorware 、Director 、FLASH 等。
(6)多媒体应用系统
多媒体应用系统又称多媒体应用软件。它是由各种应用领域的专家或开发人员利用多媒体开发工具软件或计算机语言,组织编排大量的多媒体数据而成为最终多媒体产品,是直接面向用户的。多媒体应用系统所涉及的应用领域主要有文化教育教学软件、信息系统、电子出版、音像影视特技、动画等。
4.2多媒体存储系统
数字化的多媒体信息量非常大,要占用巨大的存储空间,光存储技术的发展为存储多媒体信息提供了保证。光盘存储器具有存储容量大、工作稳定、密度高、寿命长、介质可换、便于携带、价格低廉等优点,已成为多媒体信息存储普遍使用的载体。
(1)光盘存储原理
光存储技术是通过激光在记录介质上进行读写数据的存储技术。其基本原理是:改变一个存储单元的某种性质(如反射率、反射光极化方向等) ,使其性质的变化反映被存储的二进制数0、1。在读取数据时,光电检测器检测出光强和光极性的变化,从而读出存储在介质上的数据。
光盘系统由光盘驱动器和光盘盘片组成。光学存储的基本特点是用激光引导测距系统的精密光学结构取代硬盘驱动器的精密机械结构。光盘驱动器的读写头是用半导体激光器和光路系统组成的光学头,光盘盘片采用磁光材料。驱动器采用一系列透镜和反射镜,将微细的激光束引导至一个旋转光盘上的微小区域。高能量激光束可以聚焦成约1μm 的光斑。
光盘的物理结构
基片上的凹槽
光盘如何存储数字信息:光盘的信息是沿着盘面由内向外螺旋形信息轨道(光道) 的一系列凹坑的形式存储的。光道上不论内圈还是外圈,各处的存储密度是一样的。光道的间距为1.6μm ,光道宽度为0.6μm ,光道上凹坑深约为0.12μm 。记录数字信息的时候,在由凹坑到凸区或者凸区向凹坑跳变的时候记录为1,其它为0,因此光盘记录信息需要经过调制,不能出现连续的1。
光盘系统的技术指标
✓ 存储容量 存储容量是指能存储在光盘中的信息容量。目前光盘 常用的容
量为650MB 。
✓ 平均存取时间 是在光盘上找到需要读写的信息的位置所需要的时间,为平均寻道时间、平均等待时间及光头稳定时间的和。
✓ 数据传输率 数据传输率一般是指单位时间内光盘驱动器读取出的数据量。
该数值与光盘转速和存储密度有关。对于CD-ROM ,其数据传输率已从初期的150KB /s 提高到3600KB /s 。
✓ 接口标准 目前常用的光盘驱动器接口标准有SCSI 和IDE 两种。
(2)光盘分类
✓ CD-DA (红皮书):也叫Audio-CD ,即CD 唱片,存放音乐与歌曲。
✓ CD-ROM 与CD-ROM/XA(黄皮书):由CD-DA 中发展而来,存放计算机
数据,其中CD-ROM/XA是扩展形式,与CD-I 兼容,是扩展的音频、文本和图形混合格式。
✓ CD-I (绿皮书):用于存放用MPEG 算法压缩的立体声视频信号,且具有交
互能力,称为交互CD 。
✓ CD-V (蓝皮书):存放电视的模拟信号和数字控制信号
✓ CD-R (橙皮书):分为两个部分,BOOK1定义了CD-MO ,BOOK2定义了
CD-R(CD-WO)。
✓ V-CD (白皮书):存放了以MPEG-1算法压缩的立体声数字视频信号。
(3)CD-DA 光盘(数字音频光盘)
CD-DA 即激光唱盘,物理规格为直径12cm ,内径1.5cm ,重量14g 。这种光盘常采用常线速(CLV )伺服方式,逆时针旋转,其螺旋线光道等长分段,每段为一个扇区。每个扇区都存放一定量的数据块,并以一个特定的地址标记,单
位为“分”、“秒”、“扇区”。1分=60秒,1秒=75扇区,可存放74分钟高音质非压缩的音频信号。
编码 凹坑到岸及岸到凹坑的转变编码为1,没有变化时编码为0,凹坑长为0.3um 的倍数。
音频数据率CD-DA =
16(bits/样本)×2声道×44100(样本/秒))=1,411,200 bits /秒
容量CD-DA =74分钟×1,411,200(比特/秒)≈747MB
协议规定序列中至少有两个岸和两个凹坑连续地出现,因此两个1之间至少有两个0。凹坑或岸不允许太长,必须保持最大间隔,至多10个0可以连在一起。因此将8比特字编码成14比特值,使之满足最小、最大间隔。两个连续地调制符号(14比特)之间插入3个附加比特,以便得到需要的最小、最大间隔。
音频数据 = 12字节×2声道 =12×(14+3)×2=408bits
错误检测 = 4 ×(14+3) =68bits
错误纠正 = 4 ×(14+3) =68bits
控制显示字节= 1×(14+3) =17bits
同步样式(12个1,12个0和3个填充比特)=27bits
一帧合计共588bits 一个扇区2352字节数据
CD-DA 的区域组成
引入区域——CD-DA 目录
程序区域——CD-DA 上所有轨道存放实际数据
引出区域——CD-DA 尾部
一张CD-DA 最多99个不同长度的轨道组成,一个轨道一首歌曲。每个轨道有几个索引,IP0标记每个轨道的开始,IP1定义了每个轨道中音频数据的开始。IP0~IP1之间有两到三秒的前置空隙。
(4)CD-ROM (只读光盘)
CD-ROM 轨道分成音频类型和数据类型,通常一个轨道只能包含音频或只能包含数据。混合模式盘可将数据轨道定位在CD-ROM 开始部分,后面紧跟上音频轨道。每2352字节定义为一个物理块,块传输速率:75块/秒。
模式1:2352个字节为1块,共333,000块
容量= 333,000块×2048字节/块≈660MB
数据率= 2048字节/块× 75块/秒≈150K 字节/秒
模式2:2352个字节为1块,共333,000块
容量= 333,000块×2336字节/块≈742MB
数据率= 2048字节/块× 75块/秒≈175.2字节/秒
模式1和模式2的不同之处:
✓ 用户数据量不一样。模式1为2048字节,模式2为2336字节。
✓ 存储数据的类型不同。模式1用于存放对错误极为敏感的数据,如计算机程
序等。
✓ 误码率不同。模式2的数据经过4个字节的检验误码率为1/109,模式1通
过2级校验误码率可以降到1/1012 。
CD-ROM/XA——CD-ROM 扩展结构
扩展的目的:在一个轨道中能够存储不同媒体的块,能做到多 个媒体的并行输出。 解决了与CD-I 的
兼容问题。
模式1:将8个没用字节用
于子头(SUBHEADER )进
一步说明 扇区中的数据类
型与格式。
模式2:添加8个字节的子
头,保留4个字节的错误检
测,数据字节只有2324个。
CD-ROM 光盘的制作过程:
数据准备
主盘制作
复制光盘
(5)CD-WO (一次写多次
读)
✓ 基底和反射层之间有一个记录层,该层通
过强热量产生不可逆的修改,它改变了激
光束的反射特性。另外用金膜做反射层,
具有良好的抗腐蚀性和很高的广反射率。
✓ 将CD 分为多个时间段,每段有自己的引
入区和引出区以及目录表,可以有效地解
决数据分次录入的问题。
目前市场上能看到的CD-WO(CD-R)主要有以下的品种:
绿盘——记录层的染料采用某种绿色染料,这是最早的CD-WO
使用的染料层,
预计使用年限可达75年。
金盘——Kodak 推出的CD-WO 盘的一种,记录层采用金色的染料层,声称这种盘比绿盘具有更高的质量,寿命可长达100年,该盘面上有一个附加涂层,能更加提高耐磨度。
蓝盘——记录层使用某种蓝色染料,比绿色和金色染料更耐紫外线辐射,并有更低的块错误率。
(6)可擦写光盘
可擦写型的光盘能够多次进行读写, 从技术上说主要有两种 :
✓ 相变型(PCD )光盘 采用晶体——非晶体作为制作材料,在激光束的热力
作用下产生非晶体态和晶体态的互换,晶体态与非晶体态、分别表示“0”和“1”。
✓ 磁光型光盘(MOD ) 主要由各种易于在垂直于表面方向磁化的介质制成,
该介质在外磁场的作用下可具有一定的方向性,这种方向性在激光束的热力作用下可发生翻转,方向性的正负分别代表二进制代码“0”和“1”。
(7)Video-CD (激光视盘)
Video-CD 标准是目前流行的视频光盘标准,它描述一个使用CD 格式和MPEG-1标准的数字电视播放系统。 光道的结构由MPEG-Video 扇区和MPEG-Audio 扇区组成,数据按ISO/IEC11172的规定编码,交错地存放在光道上。
(8)DVD 光盘
1995年12月,九家主要的电子公司(东芝、松下、索尼、菲利普、时代华纳、先锋、JVC 、日立和三菱电子)达成协议,共同推进一种新的光盘技术,这就是DVD ,旨在支持多媒体和正片长度的电影的发布。
DVD 盘片尺寸与CD 相同。不同的是DVD 光道之间的间距由以前的1.6μm 缩小到0.74μm ,而记录 信息的最小凹坑凸区长度由原来的0.83μm 缩小到0.4μm ,因此DVD 盘容量提高到4.7GB ,双层双面的DVD 可达17GB 。DVD 信号的调制方式和错误校正方法也做了相应的修正以适合高密度的需要。
基本类型:
DVD 光盘的基本类型DVD-ROM ——电脑软件只读光盘,用途类似CD-ROM ; DVD-Video ——家用的影音光盘,用途类似LD 或Video CD;
DVD-Audio ——音乐盘片,用途类似音乐CD ;
DVD-R(或称DVD-Write-Once) ——限写一次的DVD ,用途类似CD-R ; DVD-RAM(或称DVD-Rewritable) ——可多次读写的光盘,用途类似MO
DVD 盘都由上下两片片基组成,每片片基上最多可以容纳两层数据,DVD 光头能够通过调整焦距来读取这两层数据。在制作过程中,把数据读取面向外,两片片基粘合在一起,就成了一盘完整的DVD 盘。
D5:DVD-5的简写,即单面单层(SS-SL或Single Side Single Layer),最大4.7G ,一面数据,另一面一般印刷了文字或图案。
D9:DVD-9的简写,即单面双层(SS-DL或Single Side Double Layer) ,最大8.5G ,一面数据,另一面一般印刷了文字或图案。
D10:DVD-10的简写,即双面单层(DS-SL或Double Side Single Layer),最大9.7G ,两面都是数据面。
D18:DVD-18的简写,即双面双层(DS-DL或Double Side Double Layer),最大17G ,两面都是数据面。
(9)蓝光DVD
蓝光(Blu -ray )或称蓝光盘(Blu -ray Disc ,缩写为BD )利用波长较短(405nm )的蓝色激光读取和写入数据,而传统DVD 光头发出红色激光(波长为650nm )来读取或写入数据,通常来说波长越短的激光,能够在单位面积上记录或读取更多的信息。因此,蓝光极大地提高了光盘的存储容量 ,能够在一张单碟上存储25GB 的文档文件。这是现有(单碟)DVD 的5倍。在速度上,蓝光允许1到2倍或者说每秒4.5至9兆的记录速度。蓝光产品的巨大容量为高清电影、游戏和大容量数据存储带来了可能和方便,也得到了世界上170多家大的游戏公司、电影公司、消费电子和家用电脑制造商的支持。
4.3多媒体功能卡
1.声卡
声卡是多媒体计算机必备的部件之一,用来处理各种类型数字化声音信息。PC 进入多媒体时代,其实标志是英国的ADLIB AUDIO公司研发的并于1984年推出的ADLIB 声卡。 1989年,Creative Labs(创新实验室)发布了 Creative Labs SoundBlaster Card (创新声霸卡)。
(1)声卡的组成:
✓ Wave 合成器 Wave 合成器的模/数转换和数/模转换是声卡上数据处理器
件。
✓ MIDI 合成器 标准的多媒体计算机通过MIDI 合成器播放MIDI 文件
✓ 混音器 声卡上的混音器芯片可以对以下音源进行混合:数字化声音(DAC),
调频FM 合成音乐(FM)CD音频(CD-ROM),线路输入(AUX),话筒输入(MIC)及PC 声音输出(SPK)。
✓ MIDI 接口 声卡能够接收、录制及输出MIDI 信号。
✓ CD-ROM 接口 CD-ROM 接口提供了从CD-ROM 的CD-DA 的输出信号到
声卡音源输入的通路,CD-ROM 将音频信号直接通过声卡的功放送到扬声器。
✓ DSP 数字信号处理器 用作对数字音频信号的实时压缩和解压缩,以及
用于语音朗读、语音识别等特殊音频信号的处理。
(2)声卡的指标:
● 声音采样 ● 声道数目
● 三维音效 ● SNR 信噪比
● MIDI 波表和复音效果 ● THD+N 总谐波失真
● 双工 ● FR 频率响应
三维音效就是表现三维的音响效果。现在较流行有Direct Sound 3D、A3D 和EAX 等,基本原理都是利用一定的函数算法欺骗我们的耳朵,让我们产生比较真实的三维听觉效果。
✓ DS3D :是Microsoft DirectX的一个组件,DS3D 的作用在于帮助开发者定义
声音在3D 空间中的定位和声响,然后交由DS3D 兼容的声卡通过各种算法加以实现。
✓ A3D (Aureal 3D) :A3D由美国Aureal 公司所开发,A3D1.0版包括A3D
Surround 和A3D Interactive两个重要应用领域,强调的是只需在立体声硬件环境下就可以得到真实的声场模拟。
✓ EAX (Enviromental Audio):是创新公司开发的环境音效技术,它建立在DS3D
之上,通过它可以在游戏中实现环境音效以及声音的准确定位。先已发展到EAX4.0版。
复音效果是指MIDI 乐曲在一秒钟内发出最大声音数目,对声卡而言指音效芯片最多可同时处理多少个MIDI 乐器的讯号 。现在波表声卡大多提供64以上复音值,而多数MIDI 复音数都没有超过32,所以不会发生音色丢失现象。
声卡双工就是指在放音同时,也能够采集录音,这也许在一般情况下注意不到,但是当使用网络电话,如Ip -phone 等软件时候就感觉到了
信噪比,是一个评价设备抑止噪声能力的重要指标,通常用有用信号和噪声信号的功率比值来表示,单位是分贝。SNR 值当然是越大越好,现在声卡信噪比都在80分贝以上 。
总谐波失真, 用来评价声卡保真度的,它比较声卡输入信号和声卡输出信号波形吻合程度。THD+N数值越低表示失真越小,其中+N 表示考虑了噪声的影响。 有的输出在波峰弧度较大,听起来为“暖声”,而有的声卡在波峰比较尖锐,听起来为“冷声”。
频率响应,是对声卡ADC 和DAC 转换器频率相应能力的评价,一般来讲频率响应曲线,在人听觉范围内20Hz ~20KHz ,保持" 平滑直线式" 比较好,通常功率增益和衰减保持在+/-3dB 范围内。
后三项指标是评价一个声卡好坏最关键的指标。
2.显卡
显示卡/图形卡(graphics card)在PC 系统中起着举足轻重的作用。它接受电脑产生的数字信息,然后把它转化为人类可以看见的信息。在大多数的电脑里,显示卡把数字信号转换为模拟的信号,然后在显示器上显示出来 。
(1)显卡的组成
✓ 图形处理器(GPU ) ---- 图形处理器是显示卡的大脑
帧缓冲:芯片简单地控制显示卡上的存储芯片,并且把信息发送到数字-到--模拟 的转换器(DAV :数模转换器)。它不会处理任何图象数据,并且在今天已经非常罕见,不再使用了。
图形加速器:在这个配置里面,显示卡的芯片基于电脑的命令,并对其进行补偿。这是今天大部分流行显示卡非常通用的配置。
图形协处理器:采用该类型处理器的显示卡可以处理所有的图形任务,而不
需要电脑CPU 的任何辅助。图形协处理器通常都在最高端的视频卡里面采用。 现在市场上的显卡大多采用nVIDIA 和ATI (已被INTEL 收购)两家公司的图形处理芯片。
✓ 显示存储器
与主板上的内存功能一样,显存也是用于存放数据的,只不过它存放的是显示芯片处理后的数据。显存越大,显示卡支持的最大分辨率越大。
显示内存的种类主要有SDRAM ,SGRAM ,DDR SDRAM 等几种。显示内存的处理速度通常用钠秒数来表示,这个数字越小则说明显存的速度越快。现在的3D 显卡一般使用双部分(dual-ported)的配置。
双部分的显示卡可以在存储器的一部分进行写,而在另外一部分进行读操作,可以有效地减少刷新图象所需要的时间。
✓ 图形 BIOS
主要用于存放显示芯片与驱动程序之间的控制程序,另外还存有显示卡的型号、规格、生产厂家及出厂时间等信息。打开计算机时,通过显示BIOS 内的一段控制程序,将这些信息反馈到屏幕上。早期显示BIOS 是固化在ROM 中的,不可以修改,而现在的多数显示卡则采用了大容量的EPROM ,即所谓的“快闪BIOS ”(Flash -BIOS ),可以通过专用的程序进行改写或升级。
✓ 数模转换器
它的作用是将显存中的数字信号转换为显示器能够显示出来的模拟信号。RAMDAC 的转换速率以MHz 表示,它决定了刷新频率的高低。其工作速度越高,频带越宽,高分辨率时的画面质量越好. 该数值决定了在足够的显存下,显卡最高支持的分辨率和刷新率。
✓ 显示接口
显示卡使用标准的接口,负责向显示器输出相应的图像信号,通常是15针CRT 显示器接口,称为视频图形阵列(VGA)。。不过有些显示卡加上了用于接液晶显示器LCD 的输出接口,用于接电视的视频输出,S 端子输出接口等插座。 ✓ 电脑(BUS )接口
常见的有AGP 接口和PCI 接口两种。加速图形端口(AGP) 使视频卡可以直接访问系统的内存,直接的内存访问可以获得比周边组件的连接(PCI)总线适配卡插槽获得更高的峰值带宽。这样使图形处理芯片访问系统内存的时候,CPU 可以专注于其它的任务。
PCI Express是新一代的总线接口,而采用此类接口的显卡产品,已经在2004年正式面世。PCI Express 采用了目前业内流行的点对点串行连接,比起PCI 以及更早期的计算机总线的共享并行架构,每个设备都有自己的专用连接,不需要向整个总线请求带宽,而且可以把数据传输率提高到一个很高的频率,达到PCI 所不能提供的高带宽。采用PCI Express X16,即16条点对点数据传输通道连接来取代传统的AGP 总线,双向数据传输带宽有8GB/s之多,相比之下, AGP 8X数据传输只提供2.1GB/s的数据传输带宽。
3.视频卡
视频卡也叫视频采集卡 ,是对模拟视频图像进行捕捉并转化为数字信号的工具。
视频采集卡的主要功能是从动态视频中实时或非实时捕获图像并存储。它可以将摄像机、录像机和其它视频信号源的模拟视频信号转录到计算机内部,也可
以用摄像机将现场的图像实时输入计算机。视频采集卡能在捕捉视频信息的同时获得伴音,使音频部分和视频部分在数字化时同步保存、同步播放。
采集、量化成数字信号,然后压缩编码成数字视频序列。大多数视频卡都具备硬件压缩的功能,在采集视频信号时首先在卡上对视频信号进行压缩,然后才通过PCI 接口把压缩的视频数据传送到主机上。
按用途分类:
✓ 广播级视频采集卡——采集的图象分辨率高,视频信噪比高,缺 点是视频
文件庞大,每分钟数据量至少为200MB 。是视频采集卡中最高档的,用于电视台制作节目。
✓ 专业级视频采集卡——分辨率与广播级是相同的,但压缩比稍微大一些,此
类产品适用于广告公司、多媒体公司制作节目及多媒体软件。
✓ 民用级视频采集卡 ——动态分辨率一般最大为384X288,PAL 制25帧每秒。 按连接方式分类:
✓ 外置式的电视接收盒
✓ 内置式的ISA /PCI 接口视频接收卡
4.4多媒体外围设备
1.扫描仪
扫描仪是20世纪80年代中期出现的光机电一体化高科技产品,可以将各种形式的图像信息输入到计算机中。其基本原理是将反映图像特征的光信号转换成计算机可以接受的电信号。市场
上有多种品牌的扫描仪,其中以
Microtek (全友)、Uniscan (清
华紫光)等较为出名。
扫描仪由CCD(Charge
Coupled Device,电荷耦合器件
阵列) 、光源及聚焦透镜组成。
CCD 排成一行或一个阵列,阵
列中的每个器件都能把光信号
变为电信号。 扫描仪内发出光
照射原件,反射光线经一组平面
镜和透镜导向后,照射到CCD 的光敏器件上。来自CCD 的电量送到模数转换器中,将电压转换成代表每个像素色调或颜色的数字值。
扫描仪的分类
✓ 按扫描方式分类 按扫描方式扫描仪分为四种:手持式、平板式、胶片式
和滚筒式。
✓ 按扫描幅面分类 幅面表示可扫描原稿的最大尺寸,最常见的为A4和A3
幅面的台式扫描仪,此外,还有A0大幅面扫描仪。
✓ 按接口标准分类 扫描仪按接口标准分为三种:SCSI 接口、EPP 增强型并
行接口、USB 通用串行总线接口
✓ 按反射式或透射式分类 反射式扫描仪用于扫描不透明的原稿,它利用光源
照在原稿上的反射光来获取图形信息;透射式扫描仪用于扫描透明胶片,如胶卷、X 光片等。
✓ 按灰度与彩色分类 扫描仪可分灰度和彩色两种。 扫描仪的技术指标
✓ 光学分辨率(水平):是扫描仪物理上所能够捕捉到的真实的分辨率,平板
式扫描仪的光学分辨率=CCD 的点数/扫描仪的最大扫描宽度。用每英寸点数DPI(Dot Per Inch)表示。
✓ 机械分辨率(垂直):指的是带动感光元件(CCD)的步进电机在机构设计上每
英寸可移动的步数。
✓ 插值分辨率(最大): 是在采集数据的基础上通过软件计算得到的数据。 ✓ 色彩位数: 表示扫描仪在采样时,它捕捉的每个象素上检测出的最大颜色
或灰阶级。
✓ 密度范围: 也称之为动态范围,表示对透明原稿的光阻能力或反射原稿的
光吸收能力。表示扫描仪能够探测到的最淡颜色(DMIN )和最深颜色(DMAX )之间的差值。
✓ E.D.I.D 技术:是目前平板式扫描仪重最先进的扫描结构,可以有效的消除“牛
顿环”并增加扫描仪得动态范围。
✓ 扫描速度:扫描速度不能仅看扫描仪将一页文稿扫入计算机的速度,而应考
虑将一页文稿扫入计算机再完成处理总共需要的时间。
✓ 鲜锐度:是指图片扫描后的图像清晰程度。
2.数码照相机
数码相机作为新一代的影像器材,具有传统相机不具备的许多优势。其原发数字性图形文件,具有数字处理的先天优势,可以直接把拍摄的图片保存为电子文档,并且其记忆体存储方式使后期彩扩成本大为降低。而更重要的是拍摄的图片可以在计算机上任意修改、加工以及传递。
A 、数码照相机的结构:
✓ CCD 矩形网格阵列 数码照相机的关键部件是CCD 。数字相机的CCD 阵列是排成一个矩形网格分布在芯片上,形成一个对光线极其敏感的单元阵列,使照相机可以一次摄入一整幅图像。
✓ 模数转换器 相机内的A/D转换器将CCD 上产生的模拟信号转换成数字信号,变换成图像的像素值
✓ 存储介质 数字照相机内部有存储部件,通常存储介质由普通的动态随机存取存储器、闪速存储器或小型硬盘组成。
✓ LCD 取景器 大多数数字相机有两个取景器。除了与传统相机一样的光学取景器外,还有一块可供取景用的LCD 显示屏来显示镜头内的景像。
✓ 接口 图像数据通过一个串行口或SCSI 接口或USB 接口从照相机传送到计算机。
B 、主要技术指标
✓ CCD 像素数:数码相机的CCD 芯片上光敏元件数量的多少称之为数码相机
的像素数,是目前衡量数码相机档次的主要技术指标。
✓ 最大分辨率:最终得到的图片可能的最大分辨率。
✓ 色彩深度:色彩深度用来描述生成的图像所能包含的颜色数。数字照相机的
色彩深度有24Bit 、30Bit 、高档的可达到36Bit 。
✓ 存储容量:常见的有CompactFlash 、SmartMedia 、MemoryStick 甚至软盘,
应尽可能选择能采用更高容量存储介质的数码相机。
✓ 照片类型:数码相机如今主要使用两种格式图片文件,分别是 TIFF 和
JPEG 。
3.摄像头
摄像头作为一种视频输入设备,从诞生到今天已经很久了。在过去摄像头被广泛的运用于视频会议、远程医疗及实时监控。近年以来,随着互联网技术的发展,网络速度的不断提高,再加上CCD /CMOS 成像器件技术的成熟并大量用于摄像头的制造上,这使得它的价格降到普通人可以承受的水平。
摄像头基本有两种:一种是数字摄像头,可以独立与微机配合使用,另一种是模拟摄像头。
数字摄像头是一种数字视频的输入设备,利用光电技术采集影像,通过内部的电路把这些代表像素的“点电流”转换成为能够被计算机所处理的数字信号的0和1。不过数字摄像机大都使用了CMOS 作为感光器件,分辨率都在640x480左右,一般在352x288时能够达到每秒30帧左右。接口一般采用USB 。
模拟摄像头多为CCD 的,按不同档次分辨率不同。模拟摄像头要与电脑配合工作,需要有视频捕捉卡或外置捕捉卡。 技术参数:
✓ CCD 和CMOS :CMOS (Complementary Metal -Oxide Semiconductor ,附
加金属氧化物半导体元件),主要应用于较低影像品质的产品中。
✓ 像素:一般来说,像素较高的产品其图像的品质越好,现在30万像素的产
品已经成为主流。但另一方面像素相对记录的数据量也会大得多,
✓ 接口:接口卡、并口和USB 口
✓ 视频捕获速度 :目前数字摄像头的视频捕获都是通过软件来实现的,对电
脑的要求非常高。比较现实的是在320×240分辨率下依靠硬件与软件的结合有可能达到标准速率的捕获指标。
4.触摸屏
触摸屏最早出现于20世纪70年代,90年代随着多媒体的应用更加成熟。它的特点是直观方便,即使没有接触过计算机的人也能使用,是多媒体系统交互操作的理想设备。
触摸屏的分类
✓ 红外线触摸屏:在屏幕四周放置红外发射管和接受管,形成一个红外线阵列,
通过用户触摸时挡住的横竖红外线检测位置。分内置式和外挂式2种。 ✓ 电阻式触摸屏:是一块覆盖电阻性栅格的玻璃,上面涂有一层导电性的聚酯
薄膜。当屏幕被触摸,会产生线形变化的电压阶梯,可以计算出精确位置。
✓ 电容式触摸屏:由一个模拟感应器和一个双向控制器组成,通过用导电体接
触导电涂层,电容变化,电压场也变化
✓ 表面声波触摸屏:在玻璃的每个角上装有2个声波发射器和2个接受器,当
人触摸到屏幕时接收的脉冲信号就会有一段缺口。通过声波的传输速度可以计算出位置。是所有触摸屏中反应速度最快的。
✓ 矢量压力测力触摸屏:在CRT 外面盖上一块四角装有应力计的平板玻璃。
控制器读取每个角记录的电气特性变化,计算触压位置。这种触摸屏的分辨率较低。
触摸屏的支持软件
✓ 设备驱动程序:简化触摸屏的编程。输入方式一般是2类——字符输入模式
和坐标位置输入模式。
✓ 仿真程序:一般提供MOUSE 防真程序,可以使得用MOUSE 作为交互输入
设备的应用程序可以不作任何修改直接将触摸屏作为交互设备。
✓ 软件辅助开发工具:是第三方厂家为开发人员提供的一种应用程序,用于开
发基于触摸屏的应用。
4.投影设备
目前投影机主要通过三种显示技术实现,即CRT 、LCD 、DLP 投影技术。 CRT 技术成熟,显示的图像色彩丰富,还原性好,具有丰富的几何失真调整能力,但其重要技术指标图像分辨率与亮度相互制约,直接影响CRT 投影机的亮度值;LCD 投影机体积小、重量轻、操作携带方便,价格比较低廉。但其光源寿命短,色彩不很均匀,分辨率较低,最高分辨率为1024×768,多用于临时演示或小型会议;DLP 数码投影机 DLP(Digital Light Porsessor)投影技术是显示领域划时代的革命,它以DMD(Digital Micormirror Device) 数字微反射器作为光阀成像器件,DLP 投影机清晰度高、画面均匀,色彩锐利,三片机亮度可达2000ANSI 流明以上,可随意变焦,调整十分便利,分辨率高。
投影机安装方式分为桌式正投、吊顶正投、桌式背投、吊顶背投。正投是投影机与观众在一侧;背投是投影机与观众分别在屏幕两侧。
投影机后要选择一张合适的屏幕来搭配,求得最佳的投影效果。根据屏幕类型分反射式、透射式两类,反射式用于正投,透射式用于背投。正投投幕有手动挂幕和电动挂幕类型;双腿支架幕;三角支架幕, 金属平面,弧面幕。背投幕有多种规格的硬质背投幕和软质背投幕;硬质幕的画面效果要优于软质幕。从质地上分为玻璃幕、金属幕、压纹塑料幕等,视角亮度、亮度增益和面料都是不一样的。
✓ ANSI 流明:美国国家标准学会(ANSI)针对投影机的亮度作了规定的测试标
准,在确定了分辨率、色温、场频和对比度的情况下,从9个区域测量亮度,求得的平均值为ANSI 流明。
✓ 对比度:对比度反映了一个画面明暗变化的范围大小。和亮度一样,对比度
也有几种测量方法。ANSI 对比度的测量规定在规定色温下将画面分为16个区域,求得数值的平均值。
4.5高级多媒体设备
1、显示设备
多通道显示设备 头盔显示器 立体显示系统
2、交互设备
数据手套 力反馈器 多指点触摸设备 3、数据采集设备
三维扫描仪 动作捕捉设备(惯性、电磁式、光学) 眼动仪
小 结:本章全面介绍了多媒体计算机系统的构成。主要对硬件设备进行了详细的介绍,其中包括光盘的读写方式、结构、规格、格式等;3种主要的多媒体功能卡;一些常用的多媒体周遍设备。这一章的知识当做常识了解就可以了。
第五章 多媒体节目的制作
(这一章要求了解有哪些多媒体制作编辑软件)
5.1多媒体节目的制作流程
多媒体节目与其他类型的软件相比,特点是以内容情节为导向的,而其他的软件如文本处理软件、数据库管理系统一般是工具性的软件。多媒体节目的内容是软件本身所提供的,用户可以尽可能地阅读、观赏、倾听、浏览节目所提供的内容,因此设计制作一个多媒体节目就像是在编导一部电影。
(1)选题
明确使用对象,了解用户需求
(2)编辑多媒体脚本(总体设计)
✓ 指定节目目标、大纲与表现手法
✓ 流程图与故事分镜头表
✓ 节目系统功能规划
✓ 交互式功能规划
✓ 定义制作环境平台与播放系统
✓ 屏幕画面设计
✓ 使用者界面设计/交互式设计
✓ 各类媒体脚本撰写
✓ 商品化包装设计
✓ 设计文件的撰写与评估
(3)组织资源
获取节目所需求的各种素材,包括图片、声音、文字、视频信息
(4)编辑多媒体资源
使用各种工具软件来修改组合素材以达到预期的目的
(5)系统制作
用专门软件将各种资源联结起来,构成情节,并附加交互功能
(6)测试、优化、生产、发行
俄亥俄州Cedarville 大学的教授Wes Baker认为,根据项目的范围和内容以及所需人员的构成,一个多媒体开发团队应该包含18种不同的角色:
执行总监 制作人/项目经理 创意导演/多媒体设计师 艺术导演/视觉设计师 画家 界面设计师 游戏设计师 主题设计师 指导者/培训者 脚本编写者 动画师(2D/3D) 声音制作师 作曲师 视频制作师 多媒体程序员 HTML 程序员 律师 媒体采集 市场总监
5.2文本素材的获取
✓ 在著作工具中直接输入(适合少量文字)
✓ 利用文字处理软件载入(适合大量文字录入)
✓ 利用OCR 技术(光学字符识别技术,需要使用扫描仪)
✓ 利用语音识别(需要话筒和声卡)
✓ 利用手写体识别技术(需要手写板的支持)
5.3音频素材的获取与创作
声音是多媒体的又一重要方面,它除了给多媒体带来令人惊奇的效果外,还最大限度地影响展示效果,声音可使电影从沉闷变得热闹,从而引导、刺激观众的兴趣。
在多媒体中声音有两类,音乐和音效。音乐除了我们熟悉的普通音乐外,还有电脑特有的MIDI 音乐,要为多媒体作品创作音乐是困难的,我们做的是将已存在的音乐编辑、加工、合成。
音频数据来源:能作为音频数据来源的有立体声混音器(Stereo Mixer)、麦克风(Microphone)、线入(Line-In )、CD 模拟声音输入(CD Player)、视频(Video )等。
(1)硬件篇:
✓ PC 电脑
✓ 具有较高信噪比的声卡(质量好一点的声卡)
✓ MIDI 输入接口和设备
✓ 真实的回放音箱
(2)软件篇
✓ 音序器软件(如Cakewalk 9)
MIDI 输入:可以用用外接的MIDI 键盘录入MIDI 信号和或者用鼠标直接点击录入MIDI 信号,可以输入多个音轨。
编辑和操作MIDI 音轨:对刚才输入的音符进行长短修改、音高编辑等操作修改音轨属性(包括静音、独奏、音量、相位等参数),多音轨相互联系、区别 。 ✓ MIDI 效果器(如Style Enhancer,Guitar Pro 3 )
MIDI 技巧:为MIDI 信号添加逼真、富于变化的人性化的真实效果。 在Cakewalk 9中将MIDI 转化为WA V
✓ 多轨音频编辑软件(如Vegas )
音频合成:将导出的WA V 音频音轨混合再作进一步处理
人声录制:加上麦克风录制的人声或者用其他乐器通过声卡Line In 接口录制音频信号
✓ 音频效果器(如Waves 3.0)
加入各种音效:作用于音频Wav 事件的效果设置,优化音频效果
✓ 后期处理软件(如T-Racks 2.0,)
最终合成:利用自身配备的EQ 均衡器、电子管压缩器和限制器起到最好的暖声效果,改变“数码之声”的冰冷、机械化 。
5.4图像/形素材的获取与创作
创建每个多媒体项目都会包含图形元素:背景、人物、界面、按钮... ,多媒体产品不能缺少直观的图象,就象报刊离不开文字一样,图形图像是多媒体最基本的要素。
电脑美术创作是一个特殊的行业,在艺术领域中日显其风采。越来越多的人员由传统的美术创作方式转变为电脑创作。
扫描仪、数码相机、数位板等都属于图像的输入设备
图象处理软件一般都包括以下功能:
(1)图像处理
✓ 色彩、亮度的处理:图像软件通常都提供不同的调节方案,包括亮度、对比
度、色饱和度等等。
✓ 滤噪或加噪:一般来讲图像软件通常都提供对画面的滤噪声或加噪声功能。 ✓ 效果处理:图像软件通常提供一些画面平滑处理、轮廓加强及产生浮雕效应
等效果处理。
✓ 画面效果:提供一些特殊的画面效果,如运动模糊、透过玻璃的效果、马赛
克效果、各种模拟绘画效果(如钢笔画、水彩画、油画、印象派画) 等。
(2)格式转换
✓ 图像颜色数的转换,如24位图像转化为8位图像。
✓ 彩色图像转成黑白灰度图像或二值图像。
✓ 调色板的生成与调整。
✓ 图像分辨率的调整。
✓ 图像存储时压缩及压缩图像的读取(即解压缩) 。
✓ 各种图像存储格式之间的转换。
✓ 电子分色的能力,产生各分量颜色的图像。
(3)图像编辑
✓ 对整幅图像或图像某一部分的旋转、平移、缩放等几何变换。
✓ 图像的切割、拷贝与粘贴。
✓ 具有一定的文字处理能力,如字体、大小、颜色的选择。
✓ 具有多层的UNDO 能力。
(4)图像绘制
✓ 各种形状的工具:提供绘制各种形状的工具,如直线、曲线等各种几何图形,
以及橡皮、填充、刷子等基本的辅助工具。
✓ 各种画笔:对各种笔的模拟,如油画笔、水笔、毛笔、蜡笔、喷枪等。 ✓ 模拟绘画:提供一些模拟的绘画手段,如滴水、吹气等。
✓ 纸张效果:提供不同的纸张的纹理效果与吸水性能等特性。
✓ 选取颜色:图像软件通常都提供选取颜色的功能,可选取画面上任一点的颜
色。
5.5 动画素材的获取与创作
电脑动画分为二维动画与三维动画,高品质的多媒体作品中离不开大量的使用动画场面,因而动画的创作也是多媒体产品必不可少一部分。
在各类动画当中,最有魅力并动用最广的当属三维动画。二维动画可以看成一个分支,它的制作难度及对电脑性能的要求都远远低于三维动画。现在三维动画软件功能愈来愈强大,操作起来也是相对容易,这使得三维有更广泛的运用。 三维动画的制作过程
✓ 二维/三维造型
二维造型——>拉伸、旋转
简单实体造型
实体变形、裁剪、运算(并交差)
面片造型
MESH 造型:通过修改实体的面改变形状
NUBUS 造型
✓ 场景设置
场景是用户使用创造力排列一个或多个三维网状对象的地方。用户可以想象自己是一个导演,场景是舞台,可以将物体放在任何地方,也可以建立及调整灯光作特殊效果,也可以在这里安置摄像机。一般三维软件都会提供多种观察方式来编辑对象和场景。
✓ 材质编辑
主要给用户提供不同方式的贴图功能,也就是赋予对象表面以图像效果,使对象更加真实。可以建立以下种类的贴图:
Texture Mapping (纹理贴图)
Bump Mapping (凹凸贴图)
Mip Mapping (Mip贴图)
Video Texture Mapping ( 视频材质贴图)
✓ 动画设计(中间画面生成技术)
关键帧方法:动画设计者提供一组关键帧,软件通过插值自动产生中间帧。 算法生成:动画物体的运动是基于算法控制和描述的,给定时刻物体的参数按照给定的物理定律改变。
基于物理的生成:对象模型中不仅包含几何造型信息,还有行为造型信息,动画运动和变化的控制方法中引入了物理推导的方法,使物体的运动更接近于真实。
✓ Shading(着色处理)
Flat Shading (平面着色) 是最简单也是最快速的着色方法,每个多边形都会被指定一个单一且没有变化的颜色。
Gouraud Shading (高氏着色) 将每个多边形上的每个点赋以一组色调值,同时将多边形着上较为顺滑的渐变色。
Phone Shading (补色着色) 找出每个多边形顶点,然后根据内插值的方法,算
出顶点间连线上像素的光影值,接着运用线性的插值处理,算出其他所有。 Scanline Renderer (扫描线着色) 是一种基于一组连续水平线的着色方式,由于它渲染速度较快,一般被使用在预览场景中。
Ray-Traced (光线跟踪着色) 真实按照照射光线的入射路径投射在物体上,最终反射回摄象机得到每一个象素的真实值,得到的图象效果优质
Radiosity (辐射着色) 通过制定在场景中光线的来源并且根据物体的位置和反射情况来计算从观察者到光源的整个路径上的光影效果。反射、吸收、折射等情况都被计算在内。
5.6视频素材的获取与创作
数字视频是将传统模拟视频片段捕获转换成电脑能调用的数字信号,因为视频是我们利用摄像机直接从实景中拍摄的,比较容易取得,经过编辑再创作后成为我们需要的数字视频,也就是电影文件,数字视频总能使多媒体作品变得更加生动、完美,而其制作难度一般低于动画创作。
Digital Video, 一种应用数字视频格式记录音视频数据的摄像机, 既DV 摄像机。Desktop Video ,桌面视频编辑,是指基于个人PC 的非线性视频编辑系统, 相对于专业的视频剪辑。 DV 是消费类数字视频的统一标准。这个标准在 1993年9月由世界主要录像机生产商组成的“高清晰度数字录像机协会”联合制定。 DV 电影制作步骤 :
收集素材—>影片剪辑—>特效合成—>填加音效—>输出成品
素材包括视频、图片、静帧、声音、二维/三维动画,还有文字信息等
摄像头、摄象机、电视接收机、激光视盘等设备都可以作为视频数据的获取工具,当然,有些设备还需要相应的视频捕捉卡或者连接线的支持。
线性编辑:即基于磁带的电子编辑。其根本特点是:素材的的搜索、录制必须按时间顺序进行,需反复前后卷带以寻找素材,因此较麻烦、费时间、易损坏磁带、损失图像质量,并且限制了艺术创作思路。
非线性编辑(Nonlinear Editing System):是使用数字存储媒体进行数字音视频编辑的后期制作系统。 非线编辑可以使用非线性操作系统(整机) ,还可以把视频通过接口上载到计算机中再用软件进行。
编辑数字视频的流程:(以Premiere 为例)
(1)输入要编辑的各个视频段、音频段或者图像;
(2)对视频进行剪辑;
(3)对各个视频段或图像应用过渡方法;
(4)对视频片段使用图像滤波(处理);
(5)设计画面运动方式;
(6)最后生成一定格式的电影文件输出。
面向流程的合成:面向流程的软件把合成画面所需要的一个个步骤作为单元,每一个步骤都接受一个或几个输入画面,对这些画面进行处理,并产生一个输出画面。通过把若干步骤连接起来,形成一个流程,从而使原始的素材经过种种处理,最终得到合成结果。擅长制作精细的特技镜头 。
面向层的合成:面向层的合成把合成画面划分为若干层次,每个层次一般对应一段原始素材。通过对每一层进行操作,比如增加滤镜、抠像、调整运动等,使每一层画面满足合成的需要,最后把所有层次按一定的顺序叠合在一起,就可以得到最终的合成画面。具有较高的制作效率 。
合成技术
✓ 通道提取:分离画面元素的方法,也叫做抠像。最常见的如蓝屏幕技术,在
拍摄人物或其他前景内容,然后利用色度的区别,把单色背景去掉。
✓ 跟踪和稳定 :为了保证不同镜头拍摄到的画面一致,计算机自动地分析在
一系列图像上某个特征区随时间推进发生位置变化。跟踪得到一系列的位移数据。然后把另外一个画面中的物体按照这个不断变化的位置贴到刚才跟踪的画面上。
✓ 数字复制和场景延伸 :有成千上万人的大场面是好莱坞大片的招牌菜之一。
数字复制和场景延伸常常结合使用,得到气势恢宏的大场面。
✓ 光效、粒子系统、手工绘制等
5.7多媒体编著工具
多媒体编著工具是一种高级的软件程序或命令集合。这些命令可以支持各种各样的硬件设备与文件格式,讲图形、文字、动画、视频等视听对象组合在一起,更进一步提供各种对象显示的顺序及一个导航的结构。通常包括制作、编辑、输入输出各种形式的数据以及将各种数据组合成一个连续性序列的基本工作环境。
(1)以卡或者页为基础的编著工具
在这种系统中,文件与数据是用书的页或一叠卡片来组织的。这种系统最适合制作一系列类似的文件、一堆卡片式的数据或百科全书之类的节目。例如PC Windows 上的ToolBook 就是用书(book )及页(card )来组织的。
(2)以图符为基础,基于事件的编著工具
这种工具中数据是以对象或事件的顺序来组织的,并且以流程图为主干,将各种图表、声音、控制按钮等一个个安排在流程图中,形成完整的系统。一般是将各种多媒体数据制作交给其它软件来做,它只做集成和组织的工作。
(3)以时间为基础的编著工具
在这种工具中数据或事件是以一个时间顺序来组织的。这种顺序的排列以帧为单位,就象是电影中的一张张连在一起的底片一样,可以按顺序来放映节目。
(4)以传统语言为基础的编著工具
这类多媒体软件源于传统语言如C 、BASIC 等,为了让用户可以由以往传统的程序升级到可以加入多媒体元素的环境,所以这些软件在程序结构中提供一些可以直接调用的工具,如绘图工具、按钮工具及显示的舞台等。程序员可以利用这些轻松的设计多媒体程序。也就是现在所说的程序集成开发环境。
小 结:这一章主要介绍了多媒体节目的整个开发过程。在节目开发过程中会遇到各种素材(包括声音、图像、文本、视频、动画)的收集以及编辑创作等问题。为此,我们介绍了很多相关的软件,希望能引起大家对这些工作的兴趣,至少可以做为业余爱好。