SAS软件课程案例教学内容的设计与组织
青年师教济经统计核课心培训
程
AS软S件课程例教学内案的设计与组容织—
暨CF—P项S目数据持与支管理S的S编A实现
程
北东经财学大计学院 江统•西昌南
玉环孙
201年73月23日
青年教
经济师统核计课程培心
基训内容本
、SAS软件一应用程课绍介
二
、教案学例容内设的
三计案例教学、的课堂织
四、组FPC项S目据支数与管理的持ASS编实程
现
、一AS软S件用应课程介 绍课程名称SA:软件应用
课S性程:质业必专修课研(生究次层)
分学数2 :总时:学6
课程主3内容要
在:绍介AS系S统基本的编语程句及以主统计分析要功 实能现程的基过础上,基多于项际实用应例案, 从据数析分应的需用出求发,出提或探讨体的具决 解方,案养学生培对统技能和理计知识的融论会通 及贯活灵用应能。
力
二
、学案教内例容设的计
教 案例可学分为以解讲例和实验案例两大案。
类 解讲例案 师在课教上向学堂讲生解介绍的案和
例
,既可以针只对课内授中的容些知识某点,
可也为复以杂综合性案例的
; 实案例 验教师由布置生学堂或课后随成的完
案例作业,一般相
对简单、任务求具要体明确
。
二、教案例内学容的设计
教 学案例素材的来:源 教 自师己所承或熟担的悉研项究
教师所目承或担与的社参会实践部委门托横的向题
课教师 自己完所成的学术论 文一些接直的数整理据分与析求需 借可鉴其的他例资料
案
教师要非※常熟各案悉例材素的容内,最好有能身体
切会、至甚肤切疼之
二、教
案例学内容设的
计. 一门课程可以1设计6 8-个典型的 实验案(不例过
多宜,由教师)导指学按生照实任际需求逐务一完, 实验成例案内容应的学给留生发挥主观有能性的空间动
2. 讲解案;例以可尽能可事先的多计设些一,内的容广度、
度深和度都可难以当适加;
大. 3案例容内尽应能可地留保真实复、的客杂情境观不,
宜事过先的人多为美化”。“
三、案
例学教的堂组织课
.1 讲解对例案介绍的和实验案例的置,应布随着教学进
度循,序进渐地由到难、易单由一任务项目过渡到 综合项目
2;. 在布置验案实例前,事应先详介细绍一与些项实该
验案
内例或任容需务相求的近解讲案例以,供学在完
生实成验案例过中程直接考和参借鉴;3.
通过开点评公、体或分组讨论集的式形反,馈生完学
成的实验例案业情作况分析,存在的不足需和进步 一善之完;处
三、
案例学的教课组堂
织
4.讲 解和评实验案例时点,发启和导引生“学实从需
际求
发出,体具题问具分析”(体以适当地可在实验案
例中
置设些一陷小)阱;5
.允许 鼓和励学生依
照点和评馈反果结修改,完善实和
验案例作
,给学业生提供一步进高的机提会动力和
6.; 培学养生养成“在他站的角度思人考问题和理问处题
的”维思方以及踏实式真认“工作态的”度
;、案三例学教的堂组课织
7. 为提了高教效果和效率学可,灵活以用运媒多、机体、房
络网课多堂信息化种学手教段;
. 8外另案,教例对教师的综学素质合出提更高了的求。
要师教要不需完善和断化优己自知的识结构,提自高身 科的研力能,断不积社会累践实经,验“时俱与进、” “学生共进”与。
四、CFSP目数据支项与持理管的SAS编程现实
FPCS目项介 简 SISS数据部工概作 览 CI模式A下据支持数管与的理SS编A程实 现典型例案 : 据质量数查的数据支核及持SS编程A现实 FCPS210家庭成0员关系数库的据解分 CF PS211追0调查数访的预加载据 综合案: 例 CPFS2010庭成员关家数系库的据建构整理
与http//www.:isss.de.unc
成
于2立006年9,是月京大北学会社科的学数调据查台和平开中展社国会 问题实研究证的学科平台。 跨 承担“国中家庭态动踪跟调查”和“国中康健养老踪追调查社会”调项查目。 目是收集反映我的民国状生况高的质量微观据数用以分析社会,生方民的面问题 为政,策定提供依据,制时同动推会社、经济、育教跨学科研等工究作。 拥有 一专业支化社的科学调会查伍队,用计算机辅助调利查统系(CAI)保 证调查据的质量。 数 家专者利用数学撰写据研究告,报出已三期版《国民中生报告,》即出版将《中 国入状收况报》、《告中教国发育展告报、《中》家庭动国报告态》等
。
CPSF目简项
介thp://wtw.iswssedu.cn.in/dx.ephpc?aid=t17actio&ni=nex
d
CFPS项目北京由大中学社会国科学调中心实查,施通过态动跟搜踪个 集体、庭、社区家个三面的层数,据映中反国社、会济经、人口教育、和 健的变康,迁为术研究学和政决策提供策数据支。 项持采目用算计机助辅访技面(C术PIA,依)托laisB系e统荷兰统计(局 开)发成数据面完、接收访、汇、总核查等作,并工SA以S B解I决方 案(usBneis Isneltlignee)c 作质量为督的数导平台和据报平台。告
项经费由目98 5期二计支持,2划00年开始5备筹,2006年成调立查中
机心,2构00、20890两年北在京上海、广东、三地进行了小本的样索探
调性。查021年,0用分层、多阶采段概、率与模成比规的抽样方法例在,全国2
5个省区、106区县个6、0个村居内4正实施式了访初基线)数据 (集,采际调查规实模约 为4196,0 家户、 庭752,00人。 现已功完成成
012年2追访查调
。CFPS样
省本分区布
FPCS问卷类型及查内调
容
查的内容模块调 设、人口、施政治境环村居委会、、重大事、件源资交通、经村 居问卷济、医 疗卫、财生、政受访者、村面貌居受访、作 合宅类住、居住户数型、居住时间国籍、经济联、系,确认访 住户受过问滤 家庭卷 经济同体、社会共关系不同住关、、姓名、性系、出生别时间 家、庭成问卷 受员教程度、婚姻育态、状业职状态设施 环境、活环生境、社关系会、住、房租出收、、支出入、 家庭卷问耐 用品、物业经农济受、合访作非农经营、、出外工 打代答出生:、居、住康健教育、期待早期教育、、母父价、评职业期待、养育观 、生养理由、成念就念;自答观就:学早 、儿问卷少期工 、作语运言用交友、、康、自尊量表健亲、关子系成、 量就表、值量价表抑郁、表量、受合作访、基测试、上准、时学 间利用手、网络 出生、特机殊历经兄弟、姐妹教育期待、、语运用、婚姻、言 职、退休、业入、收暇闲、社关会系、成就表、价量值量、表 成人问卷抑 量郁表、康、健烟、酒访采作、合基测准、上学、时试间利、用 手机网路 卷问型
C类PSF项基本工目流作
程研
部究 据数 部行部 执术技 部设部质•
卷电子化设问 计 •员访培材料开 训 发• 控方案质定与制实 •施 本维样 •护 查调信息系统建 设 • 调查技支术 持•中 心网环络 管理境 督导•员招访 与培募管训 •理 目项执行• 项 目度、质进 、人量、关 员管系理• 抽样方案计设• 样 本发 •放 报系统告理 •管 质控数据置配• 访状态核查 问• 传宣
•
作简报
工•学术简报
•问卷 据管数理
•数 发布与服务
据
政部 设备行管
理财务支付管
理 人管员理 常日助服务
辅
据数工部概作
览—
—章鱼式
模
数据
部工作概 览参 与计阶设
段问 题号设计题 考虑问 间题的属从系 关考虑同相题的合并分析问 考 为以后模块虑内充补问题预空留间 量名变计设 考虑使用者的方便 虑考题设问的清计晰 问访统系测试的 从数的角据来发度现设计的上题
数问部据工作览概 参与 抽样阶
各段类本的编码 样 原样本数据库始建的立 样本信息 提的取
参访与问段阶
样本发放、挂解 废卷识 标 卷数问质据核查量 管 数据理终最结果码的代核
查
数部据作工概览 数据 仓库管理的
查调问数据 卷村居问 卷 住 户过滤问 卷庭家员问成 卷家 庭卷问 成问卷人 少儿问卷 问管访理数据 I数据 M 采访用数时据 质核查数量 据地实核查 话核电 查 录音核 查 件核软 查访员 察数观据 络观联 察 问观察访
样本息数信据 访员信息数据
AC模I式 下据数支持管理与S的SA程实现
编
——于基SS编程A
C
A模式I应下S用A系S统与参数支据持管与理的优
势
SSA统系是全领球先的商业智能软件数和据处及统理领域计 的国际标准件软
备具完的数据存取备与据管理数能 具有高效功、活处灵理海数据的能量力
可以
现各种复实的杂据分析数程
过编语言程谨 可以严实时示程序显行的执程及结果 过重复可验证析分与输出果 S结SA序程重可复利用共及
享
CIA模下式SA编程的技术S求需
够综能运合各种S用SA编程程过、句语、选
项够灵活能用运各种ASS编程巧 技熟悉目项查调问的内容 熟卷项目悉数据库的构 架确准理数据管理和解数整理的据务需求 具任创有新的编程性路
思很多数据理管任没有务规常的析程序分模支持块也,没有
可
借以鉴处的规理范,往需要依往分析赖员对任务人要求
清晰把的握通,过编程灵活来现。
实写编AS程序的基本S则原
方准法,编确思路清程
晰 运行速高度效 灵运用活和宏aray数组语r句简重复性的文本化
过程
和 序易程于阅读和解理 输 结果和呈出现式友方
好
案
例1数据:质量核查数的据持支及ASS编实现
程FPSC2010量监督报告质AS编程S方案
FCPS021质控1所需加数据提取载S的S程A序明
说 于基数据分析进数行据质核量的查目的针对:问卷据数
及
员行为数访,基于据统分析技术计与数质据评量判准标 实,时控调监查执行各个环节的,监测关数据键的异常况 情异常变和,动据依现的发响数影据量的问题质及时更正,设计 环和实节施环中节的疏忽不足和
设。部要质提求取FPC20S11控质需所的载数加包据括:质控
数据电、话查、家核问庭卷录音核、成查人卷问音核录查、 少儿问卷音核录查
C。FSP2100质量监督报S告A程S序总
汇选项
回无答率的般计算一公:
式不知n道 n绝回拒答 应n未填答填 p 全n - 部不适n
用明:
说 算口径:计以掉不适用去情后况全的部样单本数为分元,母
不以知道拒、绝回答应、填填未三种回答无况情的样单 元本的数合计分为。子
一般用“-”1示表知道、“-不2表示拒绝回答、“-”9
”
表示填未应填答“-8”、表示不适用
。
案【例a1】选项 在全部卷上的无问回率答纵向(计算
计)的是算某一选项在全部卷中的问有效回观测数占答
全部应回
观测答的比重,数反受访映者回该答项选的难时 程度。
易无 答回率过的选项高,可既是能于题由本身目好理不
解或过敏感于也,可是能题表目述在疏忽。存
【
案例b】 1卷问全部选在项的上回无率(答向计
横
算)
计算是每的份问一中卷效回答有项占全部应选回答选项
的
比,重映每一份问卷所反关注项选的体总回无答情况。
是 评价查调数质据、评价访员量问访作质工和量发劳
务报核的依据酬
。
【例案1a CF】SP210分0卷问型困类难问题选项无答回的计算率n 知道 n拒不绝答 回 n填未应答填 p 全n部 -n不用适主体 序:
程C*FPS2100卷问中特定项的选无回答率困(问难); %题macorn oanwsre var)(;
adat nonswaer_va&; rstec fp2010s&.daasett(ke pe=v&r);awhe er& vr^= -a 8 i;f &ar iv (n-,-12) htne va&=r.; ropc mean maxdsce3= nmiss nnopirt;no tpuu ott=umae_&narvn =nn miss=nissm; vr avar ;&r un d;aat oannwsr_&eavr._;p atrtbiv arl egth=n$6 ; s1e meta_n&vra;p =misn/(s+nmiss)n var="&v;r"a k;ee vap pr;r u;n poc arpendpb sa=e%sbstr(udat&sea,t9_)naonwse; runr ;%endmno nawsre;
【
例1a】案 CPS201F0问分类型困卷难题选项无问回率的计答算
完
整的SAS序程 (OWRD式)格 志日窗口的显结示
果
输出结
果
案例【b】 CF1SP210每份0问在卷选问定题的上回无率答
n知不 道 拒绝回n 答 应n填填未 p 答全部 -nn不适 用体程序(主住以过滤问户为例卷)/
计*算每一份住户过滤问卷无的回率答/ *atad noesc_r;se cfts2p100.cfps0120crs(ekp=easplmidesiwe rsubcsrbied isrc4__1a-cr4sa__ s5rc_a5_-s1c5_a_5 rsrc6a__-1cr6_sa_5 cs7_r_a-scr71a__5; arra)y 1(20)xs rc4_a_1sc-4_ar5_s cr_5_a1s-c5_a_r s5r6ca_1_-sc6r__5a sc7_r_1a-scr_a_5;7x 1 f n有效 0 n无 效 d io=1to 02 ;px 有回率答 n效有 n效无 ffix (i1=-8) htn xe(1)=. i; i xf(1i=)-1or x(i)1=- the2n 1x(i)0=;i fx 1()^=.ior x1( i)^0=then x 1i)=1;(e dn p;1=me-anof( cs4_a_r-1crs4a__5 csr_5a_1-cs5_a_5 srr6_a_1-ccs6_r_a s5cr_a7_-1sc7r__5a) ; *计算/回答无*/ 率=num(os sfr4_a_1c-cr4_s_a5s r5ca_1_sc-5_a_r5s r6ca_1_sc-6_ra_ s5cr7a_1_sr7c_a_5)/;*计有效算个值*/ 数ur;n
【
例1案】b FPC2S10每份问0卷在定选问题上的无答率
回
整完的SS程A序 (ORWD式格)日志 窗的显示口果结输 出果结
案2例:FPS20C1家0庭成员系关数据库分的解
FCP2S10家0庭卷(一问简)要设计明
说 的目是家庭以调查为单位调查,了解受家户访中的家庭员关成以系及
庭成员家的性别年、、龄婚状况姻、教受育度等自程然信息。
为保证问 卷查的调率(尽可效获取能庭家员关系成详细信息,又的避
向受免访重复者问)询谢宇教,授门专设计了3张庭家员关成系调表查, T即1(同住表庭成家表)、员T表(2家成庭员系亲直属系表)关和T3表 家庭(员成同住不直系亲列属表。
)逐登一每记一家庭位 成员姓的名个人和编 码。 1** 表该示 员 与家成有庭血 缘/姻/ 领养婚系,关进入需T2 表 3;* * 表示 成该员 与庭家没血有 缘 婚/ 姻/ 领 关养系,不进 入T表 2系根统据 T 表1信息自 的
动生姓成名初列始表 逐一,确认编为码1*的* 庭家员成的上代一下/代一 系亲属直内,容括其包父亲、 母亲配偶、、 孩1-孩 10 的名姓所、的在 调表(查T1/3)T以在及(T 1/T3)表中索的引 系统 根 据 2 表T中 所列填的全部 不同住系直属的 信亲息自生动姓成名 始初列(表编 为 码**)2,后 逐然填一列基其 本息信
案2例CFPS:2010庭成家关系数员据库的解分CF
PS0210庭家卷问(一简)设计说要明
T-13表中同T住庭成员家其直系及属亲信采息集的流程先逐:一查T调1
表
中编码为**1家庭的员成个的信息人,后然T在表中2让,一每家庭
成员“轮位流坐庄”,一逐登其直系亲属记;2T表所列的不出住同直系亲属,
进入3表,T逐一再充补记每个人登个的信人息
。 表设T计优势:只的需T1对表所列出的中住同有血缘/婚姻、/领养系关
的家成庭员T3和中表出列的住家庭成同员的同不住系直亲属逐一调, 个人信查息然后再依据,2T中所给表的出各系直亲在T属表1和3T表的位中置 索,引后期在据处理时数匹加载配即完可。成
庭家关数系库据解与重构的目的分依:T1表、T3表据T2之间的与应关
对
系,其将分解成家庭层和个面层人两面数据库,个以方直便开展个接人 面家庭结层等社构会题的问究研
。案例2:CFP
201S家0成庭关员数据系库分的
分解解庭成家员关数据系的难库:点
原数库据包中大含量统自系动加载的变,量逻关辑复系杂
。
量变名称为多动加载,自很难文生由,变义量接的匹配直系关不明确。 原
数始库据,家庭中员成大最设预人数为5人,0如果解分时直接转置
,造会成大的量所观测有为均-8“不(用)”的空适观记录。
测 需逐要一配匹每一个访受家户中一每家位庭成员全的1部3名直亲系属
的相信息关,匹配过程杂复
。解分的后人个面数据库层,中有91个别分映“反住”与同“同不住
”两类庭成员个人信家息变的量,需事要逐先进行一判断,于对适不用的情 需要况先事接赋值“直8”-
。
案2例CFP:S2100家庭成员关数系据的分解
分解库家庭成员系数据关的库思:
路 过通将据库数出导成xceel格式并后置,转逐观一各察家户在49个88
变量上的个体具测观值,顺各个变理量之间逻辑的匹配系关
。 依T2据中表出的每名给系亲属所直的表(在1/TT3及)表中的索在,
引
计算出各庭家员的成每直名系亲属个的人编码
。 利用SA宏、arrSy语a,句写编各庭家员直成亲属系息的匹配信程序,
保
程证高效序准确的、行运。
为方便 据数使用开展家者庭系关问的研题,究为31位系亲直均增加
“是属同住”、“是否有否效个有问人卷及“在个人问”
卷中应对样本 编码”的三综个变量合(谢应老师宇的求要。)
确 分认解的后家庭层面个和层人面两数据库应包含的变个量表(列庭家
层面共18
变个量个人,面共层有50个变量)。
4案例:2CFP2S001庭成员关家系数库的据解分
完的整ASS程序(
WORD式格)
日
志窗口显结示(果部)
案分例2:CPS20F01家庭员成关数系库据的解分
过数据集(程分)
部
例案:C3FPS201追1访查调据数的加预载
C
FPS0112预加载项列表导入
样需要的本段字
难点分
析
:载加内容涉及CFS2P01调查0住的过户问滤卷家、庭口人确
问认、卷人问卷成少和问卷。
儿 有既庭层面的家加载项,又有人个面层的载加。项 加 内容并不载简单的能各从卷中直接提问取,有需要构
的成逻造数辑组有的需要根据,类各卷问之间对应关系的 断判赋,值的还需有要先解再匹分。
配
例3:C案PS20F1追1调访数据的查加预载
解决路:
思 一理逐各解预加个载的含义项 ; 一逐找各个预加到项所载应的对FCP20S1数0据库及对变应
量者计或算方法; 分从对别数应库中据取提计或算预载加变量信的息; 将全部加预变载量按照家层面和个人层面庭行进类;归 把个人层面加载的变,量按照家分解户“逆思的维”, 换转到家层面; 庭 按照加载格式顺序要求和依,匹配、次并合各个变量信 的; 息按 加载照任务要,求出加载输息信
。
案3例C:FS2011追访调P查据的数预载加
完
整ASS程序(WO
D格R)
式输
结出
果
程数过据(集分)
综合部案:CFPS例2010庭家成关员系数库的据构建与整
理
数据库立
添加建变标签 添加变量值量标签 合并放性开问 数题库据 放开性题编问码 庭家成员系数关 据分库解多 次数层据合库
并据清理
删数无效除测 观找查遗失测 观修输入改误错处 关理键量变 失 清缺冗理变量余核查可 变疑值 核量变量查逻辑 系
定关稿理
整订变量修标签 义缺定失 调值变整量顺 序充补权变量重生 数据成布发版
文
准件
备变列量表 数据用说使 明编码手
册据库整理基数流程
本
综案合:C例FP2S001家庭成员系数据库关构的建整理与T2 001 总行运程序
2T010P0_ 问数据库卷并
合 T2001_P1 T2100_P2 2T10_0P3 2010_PT T2401_0P5 T2 10_0P
6T0210_7
P T0210P_ T2010_89P
* /庭家人确口问卷认基数础据合并库 0*/v 并IM数据合关信相息 /合并*I数M据关信息相1*v/ 数据理清/ 修改*员录入错误,删除空值访观测v2* /访员样 调用本错清误 /* 理样代本调码用误错理 清v*3 /合并业职编到码家庭员成 /*库并合职编业码v */ 4基逻于关辑系核查的配清匹理/ *逻辑核查修 正5v/ *补计算加载的充关相量信变 /*为息t1
表
成员充索补v6引* 家庭/员成库变量分u解napc /*k家成庭员变库量分解per sv_0/*匹 清理 /*对配人个和库per库进s行配清理匹*/ reprofilte/*删除 敏信感息生成p,er全国数据报s告版*
/青
年师教经济计统核心程培课训
批请评指,正谢!谢东
北财经学统计大院 孙学玉环yhsu [email protected]
o
西•江昌南
20
317月年23日