天津市中学生英语写作诊断数据分析报告
批改网作为国家社科重大委托项目『语言大数据与文化价值发现』的英语语料数据收集平台,已经在全国范围内收集大学和中学学生作文超过1.2亿篇次。其中大学学生作文数据来自全国2,200所高校,包括清华大学、北京大学、复旦大学、南京大学等国内众多知名高校的教学数据。自2014年12月开始,该平台开始收集北京、广东、天津、江苏、四川、山东等省份的中学数据,截至目前包括人大附中、天津一中、成都七中、江苏二十九中在内的1,500多所学校的9,617位老师共布置作文15,796篇,159,303位学生共提交作文442,030篇,累积修改3,008,922次,平均每篇修改6.81次。
本数据概要分析对象为天津市 16 所中学的老师所布置的 246个题目下 7,771 篇学生作文,学生累积修改次数达到 60,013 次, 平均每人每篇作文修改 7 次左右。其中南开区 9 所中学的老师引用布置作文题目 77 次,学生提交作文达到 2,063篇,累计修改达到 11,763次, 平均每篇修改 7.42 次。
1
自主学习
修改次数占比
7.1
平均修改次数
学生在多次修改中会形成一个自主学习的过程,以天津市为例:学生提交作文总次数为67,784次,平均每篇作文修改次数为7.1次,85%的学生都至少提交了2次作文,修改5次以内的学生占40%,1%的学生修改次数超过50次。
平均分
初版 终版
平均提高近3分
平均提高近1
分
注:批改网的原始机器分是未经教师选择的打分公式调和的原始分值,可作为体现学生写作情况的一个客观指数。
成长案例
天津市育红中学 高一 孙同学 指导:王老师 修改次数:30次 分数变化:50~71.5
维度数据变化
通过观察学生作文初版与终版维度数据可以发现: 词汇方面:
词汇丰富度、平均词长、平均词汇难度测量值均有提升,证明学生在终版作文中词汇的使用比初版作文丰富,使用单词难度略有提升
初版 终版
平均词长
注:平均词长:指作文中词汇平均长度,计算公式为:sum(单词长度) / 单词频数
词汇丰富度
词汇丰富度:该维度的计算公式为: ttr = 形符频数 / sqrt(2 * 类符频数)
初版 终版
初版
终版
词汇平均难度
词汇平均难度:该数值代表文中各级词汇的使用比重,代表文中词汇的难度级别
句子方面:
平均句长和从句密度测量值均略有提升,说明学生在不断调整自己的句式结构合理性,通过使用从句使文中句式更加丰富。
平均句长
初版
终版
注:平均句长取决于构成句子的单词数量
从句密度
初版
终版
注:从句密度 = 作文从句数 / 作文句子数
篇章方面:
文章长度增加,同时学生使用连词的数量变多,说明学生在写作过程中注意到使用衔接词可提升文章结构的连贯性。
初版 终版
文章长度
注:文章长度是指 文章包含的单词个数
平均段落数
注:段落数是指一篇
初版 终版
作文包含的段落个数
初版 终版
篇章连词数
注:篇章连词数是指 一篇文章中连词的数量
错误修正
南开区
部分错误初终版
天津市
50.46 % 48.83%
43.78% 35.51% 51.64%
57.68% 53.13% 55.38% 47.75% 63.46% 50.00% 53.78% 55.37%
33.56% 49.62% 45.33%
3000 2000 1000 0 1000 2000 3000
注:以上数据为各类错误出现的次数,数值为各类错误修正率。
南开区与天津市整体上常见错误趋势相同,动词错误、拼写错误与主谓一致错误是中学生进行英语写作时最常发生的错误,搭配错误是相对修正率较低的错误类型。南开区与天津市中学整体修改状况良好,各类错误修正率均在50%左右。在名词错误上修正率最高,天津市达到63.46%,南开区修正率也过半,达到51.64%。
以主谓一致错误为例,学生常犯的错误有: 1. 名词作主语时主复谓单/主单谓复的主谓一致错误
My interpersonal skills is not good so I only have one friend till now. 批改提示:请检查is ,确认主谓一致。
宋同学 天津市NO.009中学 高一 My First Memory of My School
2. 动名词作主语的主谓一致错误
As a family member, assuming family obligations are their duty. 批改提示:请检查are their duty,确认主谓一致。
孙同学 天津市NO.009中学 高三 中国春节体验
3. 不定式作主语的主谓一致错误
In short, to help others make the world better. 批改提示:请检查help ,确认主谓一致。
张同学 天津市NO.007中学 高二 寒假作业 4. 代词作主语的主谓一致错误
I am readly to help others and is good ai Chinese. 批改提示:请检查is ,确认主谓一致。
白同学 天津市NO.003中学 高二 A Welcome Letter
个人诊断
天津某中学 高一年级某班 作文号:4040** 答题学生人数:78人
班级平均值
最高分同学 A 同学
A 同学与班级平均水平相比,在不同维度上都有一定差距。例如,A 同学词汇丰富度较低,即词汇使用较单一,建议扩大词汇的使用量,这一点可以从同班同学的作文中学习积累。
注:以上为A 同学文章中未使用但在班级内使用频次较高的词汇。
高低分对比
高低分组部分错误对比
以上为高低分组作文在不同类型错误频次上的对比。可以看到,低分组学生作文在拼写上犯错最多,且相较于其他类错误,拼写类错误在高低分组出现的频次差距最大。而在动词错误上,高低分组错误频次差距较小。
高低分组维度对比
4.06
4.56
9.46
11.69
4.89
5.36
12.26
18.33
1.15 13.5
7.08
0.47
平均词长 词汇丰富度 词汇难度 平均句长 从句密度 篇章连词数
从高分组与低分组的对比中可以看到,两组学生作文在从句密度以及篇章连词数上差距最大,低分组学生写作时使用连词较少。在句长以及词汇丰富度上,高低分组之间也有较大差异。
注:高低分组数据分析对象为天津市中学高分top1000以及低分top1000的作文。