云计算作业
第⼀一章 习题
1.1简要地定义以下在计算机体系结构、并⼀行处理、分布式计算、互联⼀网技
术、信息服务领域代表最近相关进展的基本技术:
a. ⼀高性能计算(HPC)系统
b. ⼀高吞吐量计算(HTC)系统
c. 对等(P2P)⼀网络
d. 计算机集群与计算⼀网格
e. ⼀面向服务的体系结构(SOA)
f. 普适计算与互联⼀网计算
g. 虚拟机和虚拟基础设施
h. 公有云与私有云
i. 射频识别(RFID)
j. 全球定位系统(GPS)
k. 传感器⼀网络
l. 物联⼀网(IoT)
m. 信息物理系统(CPS)
1.2在下⼀面两个问题中选出唯⼀一的正确答案:
1.2009年最快的计算机系统排名Top500中,哪个体系结构占主宰地位?
a. 对称共享内存多处理器系统
b. 集中式⼀大规模并⼀行处理器(MPP )系统
c. 协同计算机集群
2. 在由服务器集群形成的云中,所有服务器必须采⼀用下⼀面哪种⼀方式?
a. 所有云机器必须构建在物理机上
b. 所有云机器必须构建在虚拟机上
c. 云机器可以是物理机也可以是虚拟机
1.3越来越多的⼀工业和商业组织采⼀用云系统。关于云计算,回答以下问题:
a. 列出并描述云计算系统的主要特点。
b. 讨论云计算系统中的关键技术。
c. 讨论云服务提供商最⼀大化收⼀入的不同⼀方式。
1.4将左侧术语缩写和系统模型同右侧的描述匹配起来,将描述的标号填⼀入
术语前的空格中。
Globus___ BitTorrent___MapReduce___EC2____TeraGrid____EGEE____
Hadoop____SETI@home____Napster____BigTable____
(a )由Apache 倡导和维护的⼀用于编写和运⼀行⼀面向⼀大量分布式数据应⼀用程 序的可扩展软件平台
(b )通过集中式⼀目录服务器进⼀行MP3⼀音乐分发的P2P ⼀网络
(c )⼀谷歌⼀用于超⼀大数据集分布式映射和压缩的编程模型与相关实现
(d )由USC/ISI和阿贡国家实验室联合开发的⼀用于⼀网格资源管理和作业调
度的中间件库
(e )⼀谷歌⼀用于管理可能扩展到超⼀大规模的结构化数据的分布式存储程序
(f )使⼀用多⼀文件索引的P2P ⼀文件共享⼀网络
(g )计算机集群节点容错和主机故障恢复的关键设计⼀目标
(h )作为开放⼀网格标准的服务体系结构说明
(i )⼀一个允许⼀网络应⼀用开发者有效获取云资源的弹性且灵活的计算环境
(j )⼀用于在寻找地外⼀文明中进⼀行分布式信号处理的超过300万台台式计算 机的P2P ⼀网格
1.5考虑4个异构内核标记为A 、B 、C 和D 的多核处理器。假设核A 和核D 有
相同的速度。核B 运⼀行速度⼀比核C 快2倍,核C 运⼀行速度⼀比核A 快3倍。假设所有4
个内核同时执⼀行下⼀面的应⼀用程序且在所有核运⼀行过程中没有缓存未命中情况。 假设应⼀用程序需要计算数组中256个元素的平⼀方。假设核A 或核D 在1个单元时 间能计算1个元素的平⼀方。因此,核B 需要1/2个单元时间,核C 需要1/3个单元时 间计算⼀一个元素的平台。给出4个核的分⼀工:
核A 32个元素
核B 128个元素
核C 64个元素
核D 32个元素
a. 计算使⼀用4核处理器并⼀行计算256个元素平⼀方的总运⼀行时间(单元时 间)。4个核速度不同。⼀一些快的核完成任务后可能会空闲下来,⼀而其他核仍 进⼀行计算直到所有平⼀方算完。
b. 计算处理器利⼀用率,所有核⼀工作(⼀非空闲)总时间除以执⼀行上⼀面应⼀用程 序时处理器中所有核总运⼀行时间。
1.6考虑在SPMD (单程序多数据流)模式的n 台相同Linux 服务器组成的集
群上并⼀行执⼀行⼀一个使⼀用MPI 代码的C 程序。SPMD 模式意味着相同的MPI 程序同 时运⼀行在所有服务器上但处理相同负载的不同数据集。假设25%的程序执⼀行是 MPI 命令的执⼀行。为简单起见,假设所有MPI 命令消耗相同的执⼀行时间。运⼀用 Amdahl 定律回答下列问题:
a. 给定MPI 程序在4服务器集群上的总执⼀行时间是T 分钟,在256个服务器的
集群上执⼀行相同MPI 程序的加速⼀比是多少?假定程序执⼀行是⼀无死锁的并且忽略 计算中所有其他运⼀行时开销。
b. 假设所有MPI 命令现在通过⼀用户空间消息句柄采⼀用动态消息效率提升了2
倍。提升使所有MPI 命令的运⼀行时间减少了⼀一半。安装了这种MPI 改进的256个 服务器集群,相对于原来加速⼀比是多少?
1.7考虑⼀一个计算两个⼀大规模的N ×N 矩阵乘法的程序,其中N 是矩阵⼀大⼀小。 单服务器上串⼀行乘法执⼀行时间是T1=cN 3 分钟,其中c 是由所⼀用服务器决定的常 量。⼀一个MPI 并⼀行程序在⼀一个n 服务器集群系统完成执⼀行需要Tn=cN 3 /n+dN 2 /n 0.5
分钟,其中d 是⼀一个由所使⼀用MPI 版本决定的常量。假定程序的串⼀行瓶颈是0 (α=0)。Tn 中的第⼀二项表⼀示n 个服务器总的消息传递开销。
对于给定集群配置:n=64个服务器,c=0.8,d=0.1。回答如下问题。a 和b
部分有⼀一个相应于矩阵⼀大⼀小N=15 000的固定负载。c 和d 部分有⼀一个相应于矩阵 ⼀大⼀小N ⼀′=n 1/3 N=64 1/3 ×15 000=4×15 000=60 000的扩展负载。假设⼀用相同的集群配
置来处理两个负载。那么,系统参数n 、c 和d 保持不变。运⼀行扩展负载,开销 也会随着矩阵N ⼀′的增⼀大⼀而增长。
a. 使⼀用Amdahl 定律,计算n 服务器集群相对单服务器的加速⼀比。
b.a 部分使⼀用的集群系统效率是多少?
c. 使⼀用Gustafson 定律计算相同集群配置下执⼀行扩展的N ⼀′×N ⼀′矩阵计算的加速
d. 计算在64处理器集群上运⼀行c 部分扩展负载的效率。
e. ⼀比较以上运算加速⼀比和效率结果并评价它们的影响。
1.8⼀比较传统计算集群/⼀网格和近年来兴起的计算云之间的相似和不同。考 虑下⼀面列出的所有技术和经济因素。针对这些年构建的实例系统或平台回答下 列问题,并讨论两个计算范式在将来可能的融合点。
a. 硬件、软件和⼀网络⼀支持
b. 资源分配和供给⼀方法
c. 基础设施管理和保护
d. 计算服务效⼀用⼀支持
e. 操作和耗费模型应⼀用
1.9针对PC 和HPC 系统,回答下列问题:
a. 解释为什么个⼀人计算机和⼀高性能计算近期的变⼀革超过过去30年的变⼀革。 b. 讨论处理器架构的破坏性改变的缺陷。为什么内存墙是性能可扩展的主 要问题?
c. 解释为什么x86处理器仍然主宰着PC 和HPC 市场。
1.10多核和众核处理器已经⼀广泛应⼀用于台式计算机和HPC 系统中。针对先 进的处理器、内存设备和系统互连设备回答下列问题:
a. 多核CPU 和GPU 在体系结构和使⼀用⼀方⼀面的不同之处是什么?
b. 解释为什么并⼀行编程模型⼀无法匹配处理器技术的进步。
c. 针对核⼀心扩展与有效编程和使⼀用多核的不匹配之间的问题给出建议,并 ⼀面对似是⼀而⼀非的解决⼀方法捍卫你的观点。
d. 解释为什么闪存SSD 在⼀一些HPC 和HTC 应⼀用中可以得到更好的加速⼀比。 e. 说明InfiniBand 和以太⼀网将继续主宰HPC 市场这个预测是合理的。
1.11在图1-6中,你了解了现代处理器的5个分类。表1-9中刻画了设计这些 处理器的5个微体系结构。评价它们的优缺点并给出每个处理器分类中两个商 业处理器的例⼀子。假设⼀一个单核超标量处理器和三个多线程处理器,上述处理 器分类是⼀一个多核CMP 并且每个核⼀心处理⼀一个线程。
?
表1-9现代处理器5个微体系结构⼀比较
???
Computer School, NUDT. Spring, 2013 21
?????????????????????????????
?????????????
?
1.12讨论下列领域的主要优点和缺点:
a. 为什么云计算系统中虚拟机和虚拟集群备受推崇?
b. 建⼀立合算的虚拟云系统需要哪些突破?
c. 云平台对于HPC 和HTC 在⼀工业界的未来有什么影响?
1.13描述下列三个云计算模型:
a. 什么是IaaS (基础设施即服务)云?给出⼀一个例⼀子。
b. 什么是PaaS (平台即服务)云?给出⼀一个例⼀子。
c. 什么是SaaS (软件即服务)云?给出⼀一个例⼀子。
1.14简要解释下⼀面的云计算服务。在每个服务类别下给出两个云提供商的
a. 应⼀用云服务
b. 平台云服务
c. 计算和存储服务
d. 分配云服务
e. ⼀网络云服务
1.15简要解释下列分布式计算系统中⼀网络威胁和安全防御相关的术语: a. 拒绝服务(DoS )
b. ⼀木马
c. ⼀网络蠕⼀虫
d. 服务欺诈
e. 授权
f. 认证
g. 数据完整性
h. 保密性
1.16针对绿⼀色信息技术和分布式系统节能,简要回答下列问题:
a. 为什么数据中⼀心运⼀行中能量消耗是关键问题?
b. 动态电压频率缩放(DVFS )技术的构成?
c. 基于现有绿⼀色IT 研究的进展进⼀行深度研究,并写⼀一篇关于数据中⼀心设计 和云服务应⼀用的报告。
1.17⼀比较GPU 和CPU 芯⼀片各⼀自的优势和弱点。特别地,讨论节能、可编程 性和性能之间的权衡。并⼀比较各种MPP 架构在处理器选取、性能⼀目标、效率和 封装的约束。
1.18⼀比较三种分布式操作系统:Amoeba 、DCE 和MOSIX 。调研它们最近的
进展和对集群、⼀网格和云中应⼀用的影响。讨论每个系统在商业或实验性分布式 应⼀用中的适应性。并讨论每个系统的局限以及它们为什么不如商业系统成功。