XXGb口网络性能分析报告
XXGb
口网络性能分析报告
1 2
目录
3
4
概述 . ........................................................................................................................................................... 3 GPRS 承载性能分析 . ................................................................................................................................ 3 2.1 Attach 附着性能 ........................................................................................................................ 3
2.1.1 Attach 流程介绍 ................................................................................................................ 3 2.1.2 Attach 性能分析 ................................................................................................................ 4 2.2 PDP 激活性能 . ........................................................................................................................... 6
2.2.1 PDP 激活流程介绍 . ........................................................................................................... 6 2.2.2 PDP 激活性能分析 . ........................................................................................................... 6 GPRS 业务性能分析 . ................................................................................................................................ 9 3.1 WAP1.x 业务性能分析 . ........................................................................................................... 10
3.1.1 Connect 性能 . ................................................................................................................... 12 3.1.2 Get 性能 ........................................................................................................................... 12 3.1.3 Post 性能 .......................................................................................................................... 15 3.2 WAP2.x 业务性能分析 . ........................................................................................................... 15
3.2.1 Syn 性能 . .......................................................................................................................... 17 3.2.2 Get 性能 ........................................................................................................................... 18 3.2.3 Post 性能 .......................................................................................................................... 20 总结 . ......................................................................................................................................................... 21
1 概述
随着数据业务的网络规模和用户群体不断发展扩大,用户对数据业务网络性能的要求也越来越高,如何更好地提高用户的感知成为现代数据业务网络优化的重要课题。本次研究通过采集拉萨全网4个BSC (BSC101、BSC201、BSC202、BSC203)晚忙时(22:00-23:00)的数据,利用广州公司自主研发的信令分析工具M-TRiX 对采集数据进行统计处理,分析拉萨现网的GPRS 承载性能和业务性能,并根据出现的问题提出相应的优化建议。
此次分析主要包括GPRS 承载性能和GPRS 业务性能两个方面,承载性能主要从Attach 附着和PDP 激活两个方面进行分析,业务性能从两种不同的WAP 协议栈分别考虑。从整体上分析拉萨现网的网络性能状况。
2 GPRS 承载性能分析
2.1 A ttach 附着性能 2.1.1 Attach 流程介绍
在ATTACH 过程中,由MS 发出附着请求,当SGSN 收到请求后,向HLR 发送鉴权消息信息,当得到HLR 回复鉴权消息确认信息后向MS 发送Authentication and Ciphering Request 消息,MS 在收到此消息后在上行方向回复Authentication and Ciphering Response消息,SGSN 收到后返回一个附着接受或者拒绝的消息,如果接受附着,MS 再返回一个附着完成消息,如果SGSN 拒绝手机附着,那么在附着拒绝消息里则包含着拒绝的原因。
一次正常的附着过程信令如图所示:
Attach 附着过程是为了建立终端MS 到核心网网元SGSN 的逻辑连接,在手机Attach 以后,即进入Ready 这样一种移动性管理状态,当Ready 计数器超时后MS 将进入Standby 状态,此时HLR 里记录用户的所在路由区,并且可以Paging 用户。
2.1.2 Attach 性能分析
分析拉萨晚忙时(22:00-23:00)的采集数据,得到拉萨现网ATTACH 附着性能相关KPI 指标如下:
分析上表可知,采集时段共进行了145806次Attach 附着,其中128706次附着成功,附着的成功率并不高,仅有88.27%,主要原因是Attach 附着被拒绝的占比较高,达到了8.53%。时延方面,拉萨全网Attach 时延为1.2s ,性能良好。由于Attach 每重发一次需要15秒钟时间,重发比例高与Attach 时延有着直接的关系,将直接影响用户的感知度,从拉萨全网的情况来看,重发率仅有1.09%,属于合理范围内。
在MS 通过BSS 向SGSN 发送ATTACH 请求后,SGSN 会响应ATTACH Accept消息,
然后用户侧发送ATTACH Complete,完成三次交互过程,ATTACH 过程建立,当在这个过程中存在异常时,网络会下发ATTACH Reject消息来终止MS 的附着请求。
根据以上分析可知,拉萨全网的Attach 附着被拒绝的次数较多,以下是对进一步分析Attach Reject 原因的进一步分析:
从上表可见,Attach Reject原因为GPRS services not allowed在全网占有较高的比例,达到95.08%,这种原因主要是由于用户有GPRS 功能的手机但没有开通GPRS 业务,或者用户欠费导致。其次,Attach Reject原因中Protocol error, unspecified的占比也较高,这种原因主要是由于网络遇到了无法解析的情况,出现这种情况的原因可能是手机终端问题、无线环境问题或者链路传输的问题等导致信令解析失败。
以下是上发GPRS services not allowed拒绝原因超过100次的用户IMSI :
建议拉萨移动检查这些用户的GPRS 功能开启情况和欠费情况,并通过主动联系这些用户缴费或开通GPRS 功能。
2.2 P DP 激活性能 2.2.1 PDP 激活流程介绍
在移动台发起梦网访问之前,首先要获得PDP 激活成功,获取IP 地址。PDP 激活属于移动性管理方面的业务,在协议上需要GMM/SM来实现,而此协议在LLC 层之上,所以仍然需要建立分组数据传输才可以实现,也就是说,PDP 激活过程也同样跟其他数据业务一样,在空口存在相同机制的TBF 建立过程。
在PDP 激活过程中,Gb 口以下看到的主要是Activate PDP Context Request和Activate PDP Context Accept 两条信令。PDP 激活成功和时延指在手机发出Activate PDP Context Request 后收到Activate PDP Context Accept信令的时间。
2.2.2 PDP 激活性能分析
分析拉萨晚忙时(22:00-23:00)的采集数据,得到拉萨现网PDP 激活性能相关KPI 指标如下:
分析上表可知,采集时段共进行了202332次PDP 激活,但只有160399次激活成功,PDP 激活成功率较低,仅为79.28%,主要是由于网络中出现了大量的PDP_Reject的情况。时延和重发率方面,PDP 激活平均时延只有0.15s ,重发率也只有0.3%,性能指标较为理想。
进一步分析拉萨全网的PDP Reject 原因分布情况,结果如下:
从上表可知,Requested service option not subscribed是拉萨四个局 PDP 激活中的主要拒绝原因,占比达到了96.34%,这种原因主要是由于用户对手机的设置行为不当,如对手机设置了静态IP 地址、设置了非法的APN 、APN 设置与签约数据不一致或者受限制的漫游用户等,其他拒绝原因占比较小。 APN 分析
以下是拉萨全网挂表期间不同APN 的用户数统计:
从上表可知,设置cmwap 和cmnet 的用户数较多,说明APN 设置错误并不是激活成功率低的主要原因。但也有部分用户设置了错误的APN ,建议主动联系这部分用户,提醒修改APN 的设置。 用户行为分析
根据以上的分析可知,晚忙时时段拉萨存在较多的PDP 激活失败的情况,进一步分析PDP 激活失败的用户情况如下:
PDP激活被拒绝用户
列表.xls
可以看到,拉萨现网PDP 激活成功率不高主要是由于部分用户在晚忙时断进行了大量的PDP 激活,且由于终端设置的问题,这些激活均被拒绝。建议拉萨移动检查其中拒绝次数较多的用户的签约数据设置情况,是否与用户设置的相一致,并主动联系用户修改终端设置。
以下是激活次数超过1000次的用户列表:
可以看到,这些用户在短短的两个小时内进行了超过1000次的PDP 激活,显然这并
不是正常的用户行为,很可能是由于手机终端软件中毒或被安装了流氓后台软件。统计这些用户被拒绝的总次数,达到了22706,已经超过了全网总拒绝次数的一半,特别是排在第一位的用户,在两小时内进行了多达16011次的激活,且都被拒绝。这些用户不仅严重影响了拉萨现网的网络性能指标,更造成了网络资源的巨大浪费。建议拉萨移动尽快联系这些用户,排查终端问题,并检查终端设置(包括IP 地址,APN 、代理等)和HLR 签约数据是否一致,进行相应的修正。
3 GPRS 业务性能分析
现网中用户在使用数据业务的过程中均采用WAP 协议。WAP 协议按照版本可以分为WAP1.x 与WAP2x 。其中WAP1.x 中的各种信令流程主要基于WSP 和WTP 协议,而WAP2x 过程则基于TCP 和HTTP 协议。其协议栈如下:
WAP1.x 协议栈可以运行于不同的承载网络之上,根据承载提供的不同的服务级别进行补偿或容忍。WDP 、WTLS 、WTP 和WSP 提供了Internet 协议栈相应层次类似的功能,但其对标准Internet 协议并不具有互操作性,WAP1.x 则在应用环境中作为协议网关代理,同时也为WAE 包含的WML 与Internet 协议下的HTML 间的内容进行编码与解码。
WAP2.x 版本除继续支持WAP1.x 协议栈的基础上,更关键部分就是通过包含无线TCP 机制、传输层安全机制和管道TLS 、无线超文本传输协议机制Wireless Profiled - HTTP等协议,增加了对标准Internet 协议支持的WAP2.x ,支持两套相互独立的协议栈,应用能
在新旧协议栈任一个上执行。在无线终端可以进行IP
连接时,在WAP 环境中引进了对Internet 协议的支持,可以与标准的Internet 协议实现交互操作。
在WAP1.x 中,首先由移动台发起建立到WAP 网关(10.0.0.172)的连接信令,然后收到网关的Reply ,而WAP2.x 在HTTP 承载的过程中,由于用到无线可靠传输,其建立与网关连接过程则为TCP 三握手可靠连接。故WAP1.x 与WAP2.x 的信令流程不尽相同,两者的分析过程也不尽相同。
分析拉萨现网中WAP1.x 和WAP2.x 协议栈的使用情况,结果如下:
从上图可以看出,拉萨现网使用的协议栈主要是WAP2.x ,占比达到96.54%。此次业务性能的分析主要分别针对这两种WAP 协议版本结合现网数据进行详细分析及评估。
3.1 W AP1.x 业务性能分析
以下是对使用WAP1.x 协议栈一次WAP 页面访问的主要信令流程(以登陆移动梦网主页为例):
▲ 表示该信息为上行消息 ▼ 表示该信息为下行消息 ▲ Connect:
该消息是移动台发起的应用层第一条用来建立到WAP 网关(10.0.0.172)连接信令,它的主要作用就是连接WAP 网关,建立通道,并同时上传终端的相关能力和参数:如移动台的Capabilities ,SDU SIZE,支持的消息格式等信息。 ▼ Connect Reply:
该消息是WAP 网关对Connect 消息的回应,表示连接成功。 ▲ Ack:
该消息是移动台对Connect Reply的回应,至此,到WAP 网关的建立成功。 ▲ Get http://wap.monternet.com:
该消息是通过WSP 层的GET 消息来表示想获取地址为http://wap.monternet.com的内容。
▼ Reply 200 OK:
该消息是服务器发向移动台的消息,表示移动台请求页面的数据已发送完毕。 ▲ Ack:
该消息是移动台对Reply 200 OK消息的回应,至此,WAP 页面访问完成。 实际的抓包情况如下:
3.1.1 Connect 性能
分析拉萨晚忙时(22:00-23:00)的采集数据,得到拉萨现网WAP1.x Connect 性能相关KPI 指标如下:
分析上表可知,拉萨全网的WAP1.x Connect 成功率达到96.10%,时延为1s 左右,性能指标良好,但重发率较高,达到13.35%,对用户感知有所影响。
造成CONNET 消息重发存在较多的原因,包括终端的接收性能,PCU 资源拥塞等。以下是重发次数较高的小区列表:
3.1.2 Get 性能
Get 成功率分析
分析拉萨晚忙时(22:00-23:00)的采集数据,得到拉萨现网WAP1.x Get性能相关KPI 指标如下:
分析上表可知,拉萨全网的Get1.x 成功率较高,达到96.94%。时延也只有535ms ,重发率为1.61%,各项性能指标较为理想。
下面对在Get1.x 过程中产生的Abort
进行归类分析,如下表:
从上表看到,在Get1.x 过程中,拉萨全网产生Abort 的原因都是以Peer request、Session disconnected 和User request居多,这三种Abort 原因都是由用户(user )发起的。
Get Reply状态码分析
对四个局进行了分析统计,得出Get Reply状态码分别如下表所示:
主要状态码的原因分析如下表所示:
3.1.3 Post 性能
分析拉萨晚忙时(22:00-23:00)的采集数据,得到拉萨现网WAP1.x Post 性能相关KPI 指标如下:
分析上表可知,拉萨全网的WAP1.x Post 成功率达到98.00%,指标良好,时延和重发率方面,Post 平均时延为930ms ,重发率为3.39%,均在合理范围内。
3.2 W AP2.x 业务性能分析
以下是对使用WAP2.x 协议栈一次WAP 页面访问的主要信令流程(以登陆移动梦网主页为例):
▲ SYN:
是客户端向服务器发送的一个同步数据包请求建立连接。 ▼ SYN,ACK:
服务器收到同步请求数据包(SYN )后,会对客户端进行一个同步确认。 ▲ ACK:
客户端收到这个同步确认数据包后,再对服务器进行一个确认。
由于手机终端与WAP 网关建立连接, WAP2X 是应用TCP 和HTTP 协议的,所以这里三条消息是移动台和WAP 网关之间通过TCP 的三次握手来建立连接。 ▲ Get http://wap.monternet.com HTTP/1.1:
该消息是通过HTTP 层的GET 消息来表示想获取地址为http://wap.monternet.com的内容。 ▼ ACK:
该消息是服务器对移动台的访问请求的一个回应,表示已收到移动台Get 请求信息。 ▼ TCP segment of a reassembled PDU:
该信息是移动台请求页面的内容太大,网络需要将其分为多个segment 下发。
▲ ACK:
该信息是移动台对收到的segment 回复ACK 信息确认。 ▼ HTTP/1.1 200 OK
该信息是服务器发向移动台的消息,表示移动台请求页面已下发完毕。 ▲ ACK
该信息是移动发对服务器下发的200 OK消息的回应,至此,WAP 页面访问完成。 实际的抓包情况如下:
3.2.1 Syn 性能
分析拉萨晚忙时(22:00-23:00)的采集数据,得到拉萨现网WAP2.x Syn性能相关KPI 指标如下:
分析上表可知,拉萨全网WAP2.x SYN同步请求总次数为1576397,收到Reply 次数为1531843,成功率达到97.17%,延时也只有207ms ,性能指标良好,但重发率达到了11.46%,重发率对用户连接延时有所影响,但根据延时统计情况来看,重发率对延时指
标并没有造成太大的影响。
通过跟踪信令流程发现重发的原因主要有两种,一种是短时间内连续发Syn 同步消息,另一种是SGSN 以上的网元不响应用户发起的连接请求,从而导致用户不断上发Syn 消息。第一种情况在短时间内重发多次Syn 同步消息,并不是正常的用户行为,主要造成的原因是用户终端性能问题;对于SGSN 以上往远不响应用户连接请求的情况,具体原因较难定位,需要对BSC 以上的设备做进一步的分析。
以下是两种重发原因出现的次数统计:
由上表可知,用户短时间内重发多次Syn 同步消息是造成重发率高的主要原因,因此可以定位主要的原因在用户终端上,由于Connect2x 是处于连接阶段,在连接阶段用户并不会上报手机终端型号,只有在Get 和Post 消息里面才有用户的终端型号,由于有重发现象的用户很可能一直连接不上网关而导致无法进行后续的Get 和Post 动作,终端类型无法精确统计。
统计现网中用户级别的重发情况,结果如下:
SYN消息重发用户统
计.xls
可以看到,一些用户的重发次数非常高,这显然不是正常的用户行为,建议联系这些用户,并对用户的终端问题进行排查。
3.2.2 Get 性能
Get 成功率分析
分析拉萨晚忙时(22:00-23:00)的采集数据,得到拉萨现网WAP2.x Get
性能相关KPI 指标如下:
分析上表可知,在晚忙时拉萨全网发起的Get 请求达到了1783371次,其中1596824次回复了Response ,成功率为89.54%,相对较低。平均延时在1.1s 左右,重发次数达到153224次,重发率为8.59%。
以下是Get 消息无回应的小区以及无回应的次数:
GET无回应小区.xls
Response 状态码分析
对四个局进行分析统计,得出Get Response状态码分别如下表所示:
主要状态码的原因分析如下表所示:
3.2.3 Post 性能
分析拉萨晚忙时(22:00-23:00)的采集数据,得到拉萨现网WAP2.x Post 性能相关KPI 指标如下:
分析上表可知,在采集时段拉萨全网一共发送了280987次Post 消息,收到回应Response 的次数为248412,成功率为88.41%,相对较低,时延在1.8s 左右,重发次数为21984,重发率为7.82%,总体性能一般。
4 总结
根据以上对拉萨现网GPRS 的承载性能和网络性能的分析,总体来说拉萨整体网络性能较为良好,部分指标较差,最主要的原因是用户端的问题,具体分析结果如下: 采集时段Attach 的成功率并不高,仅有88.27%,主要原因是Attach 附着被拒绝的占
比较高,达到了8.53%,大部分被拒绝的原因是用户有GPRS 功能的手机但没有开通GPRS 业务,或者用户欠费导致,时延为1.2s ,重发率为1.09%,性能指标良好。 采集时段PDP 激活成功率较低,仅为79.28%,主要是由于网络中出现了大量的PDP-_Reject的情况,造成的原因主要是用户的终端可能感染手机病毒或被安装了后台流氓软件,同时用户的终端设置与签约数据也不一致,导致部分用户进行了大量的PDP 激活,但却因为设置问题都被拒绝。时延和重发率方面,PDP 激活平均时延只有0.15s ,重发率也只有0.3%,性能指标较为理想。
WAP1.x 业务性能较为良好,除Connect 性能指标中重发率较高外,经分析主要是用
户终端问题,其他性能指标均比较良好,Connect 、Get 和Post 成功率均在96%以上,时延指标和重发率也较为理想。
WAP2.x 业务性能较为一般,Syn 消息成功率较高,达到97.17%,Get 和Post 消息成
功率相对较低,均在90%左右,但并不存在严重的网络问题。各个消息时延指标相对良好,但重发率稍高,总体性能一般。