关于牙膏销售量的数学模型课程设计
统计12-1 李本恩
一、 课题名称:牙膏销售量的影响因素 二、 课题条件
参考文献::《MATLAB 从入门到精通》 三、 设计任务
本文从收集有关牙膏的销售量开始,从牙膏销售量和价格、广告投入之间的关系出
发,分别通过对这三个方面的深入研究从而制定出各自的最佳方案,最后再综合这 三个主要因素,进一步深入并细化,从而求得最优解。
四、论文内容
摘要内容 :本文从收集有关牙膏的销售量开始,从牙膏销售量和价格、广告投入
之间的关系出发,分别通过对这三个方面的深入研究从而制定出各自的最佳方案, 最后再综合这三个主要因素,进一步深入并细化,从而求得最优解。 模块Ⅰ中,我们假设在x 1和x 2对y 的影响独立 ,从而得到了方程 y =β0+β1x 1+β2x 2+β3x 2+ε
模块Ⅱ中,我们假设x 1和x 2对y 的影响有交互作用,进一步得到新的方程
2
y =β0+β1x 1+β2x 2+β3x 2+β4x 1x 2+ε
2
关键词:线性回归模型 相关系数
问题重述:某大型牙膏制造企业为了更好的拓展产品市场,有效地管理 库存,公司董事会要求销售部门根据市场调查,找出公司生产 的牙膏销售量价格,广告投入等之间的关系,从而预测出在不 同价格和广告费用下的销售量。为此,销售部的研究人员收集 了过去30个销售周期(每个销售周期为4周)公司生产的牙 膏销量,销售价格,投入的广告费用,以及同期其他厂家生产 的同类牙膏的平均销售价格,见表1。试根据这些数据建立一 个数学模型,分析牙膏销售量与其他因素的关系,为制定价格 策略和广告投入策略提供数据依据。
(其中价格差指其他厂家平均价格与公司销售价格之差) 1. 实验设计方案 1) 前期分析:
由于牙膏是生活必需品,对大多数顾客来说,在购买同类产品的牙膏时更多的会在意不同品牌之间的价格差异,而不是它们的价格本身。因此,在研究各个因素对销售量的影响时,用价格差代替公司销售价格和其他厂家平均价格更为合适。
记牙膏销售量为y ,其他厂家平均价格与公司销售价格之差(价格差)为x 1
公司投入的广告费用为x 2 , 其他厂家平均价格与公司销售价格分别为x 3和x 4 ,x 1=x3-x 4。基于上面的分析,我们尽利用x 1和x 2来建立y 的预测模型。
2) 模型假设:
1 在一定时期内假设市场总需求量没有太大的变化。 2 同类产品在一定时期内价格无明显变化。
3 通过调节本公司的价格调整都能够达到理想的价格差 3) 建立模型:y =β0+β1x 1+β2x 2+β3x 2+ε
4) 编写程序:[b,bint,r,rint,stats]=regress(y,x,alpha)
5) 对结果进行分析,讨论诸如:结果的合理性、正确性,算法的收敛性,模型的适用性和通用性,算法效率与误差等。
2. 基本模型
为了大致分析y 与x 1和x 2的关系,首先利用散点图观察销售量y 与价格差x 1及y 与广告投入量x 2之间的关系。
y 与x 1的关系: y 与x 2的关系:
2
图1 y对x 1散点图(1) 图2 y对x 2的散点图 模型
y =β0+β1x 1+ε (1)
从图(1)发现,随着x 1增加,y 的值有明显的线性增加趋势,图中直线用线性
拟合的(其中ε是随机误差)在图2 中,当x 2增大时,y 有向上弯曲增加的趋势,图中的曲线用二次函数模型:
2
y =β0+β2x 2+β3x 2+ε(2) 拟合。
综上分析,结合模型(1)和(2)建立如下回归模型
2
y =β0+β1x 1+β2x 2+β3x 2+ε (3)
2
其中,y 是建立的模型,我们用y =β0+β1x 1+β2x 2+β3x 2对y 进行估计,其中
∧
β0, β1, β2, β3是我们待估计的参数。
3. 模型求解
利用MATLAB 统计工具箱中的命令regress 求解,使用格式为: [b,bint,r,rint,stats]=regress(y,x,alpha)
得到模型(3)的回归系数的估计值及其置信区间(置信水平α=0. 05)、检验统计量R 2, F , P ,S 2的结果见下表2
4. 结果分析
由表中的数据显示,R 2=0.9054指因变量的y 的90.54%可由模型确定,F 值远远超过F 检验的临界值,p 远远小于α,因而模型(3)可用。
表2的回归系数给出了模型(3)中β0,β1,β2,β3的估计值
β0=17.3244,β1=1.3070,β2=-3.6956,β3=0.3486。检查它们的置信区间发现,只有β2的置信区间包含零点(但区间右端点距零点很近),表明回
2归变量x 2(对因变量y 的影响)不是太显著的,但由于x 2是显著的,我们
∧∧∧∧
仍将变量x 2保留在模型中。
5. 销售量预测
经回归系数的估计值代入模型(3),即可预测公司未来某个销售周期牙膏的销售量y ,将预测值记为y ,得到模型(3)的预测方程:
2
y =β0+β1x 1+β2x 2+β3x 2 (4) ∧
∧
∧∧∧∧
只需知道该销售周期的价格差x 1和投入的广告费用x 2,就可以计算预测值
y 。
∧
公司无法直接确定价格差x 1,只能制定公司的牙膏销售价格x 4,但是其它厂家的平均价格一般可以通过根据市场情况及原材料的价格变化等估计。模型中用
价格差做为回归变量的好处在于公司可以更灵活地来预测产品的销售量或市场需求量,因为其它厂家的平均价格不是公司所能控制的。预测时只要调整公司的牙膏销售价格达到设定的回归变量价格差x 1的值。
回归模型的一个重要应用是,对于给定的回归变量的取值,可以以一定的
置信度预测因变量的取值范围,即预测区间。
6. 模型改进
模型(3)中回归变量x 1,x 2对因变量y 的影响是相互独立的,即牙膏销售量y 的均值和广告费用x 2的二次关系由回归系数β2,β3确定,而不依赖与价格差x 1,同样,y 的均值与x 1的线性关系由回归系数β1确定,不依赖于x 2。根据经验可参想,x 1和x 2之间的交互作用会对y 有影响,简单的用x 1,x 2的乘积代表他们的交互作用,将模型(3)增加一项,得到:
2
y =β0+β1x 1+β2x 2+β3x 2+β4x 1x 2+ε (5)
2在这个模型中,y 的均值与x 2的二次关系为β2x 2+β3x 2由系数β2,+β4x 1x 2,
β3,β4确定,并依赖与价格差x 1。
下面让我们用表1的数据估计模型(5)的系数。利用MATLAB 的统计工具箱得到的结果见表3.
验统计量R 2, F , P ,S 2的结果见下表1
表3与表2的结果相比,R 2有所提高,说明模型(5)比模型(3)有所改进,相信模型(5)更符合实际。
用模型(5)对公司的牙膏销售量做预测,仍设在某个销售周期中,维持产品的价格差X1=0.2元,并投入X2=6.5百万元的广告费用,则该周期牙膏销售量y 的估计值为y =β0 + β1x 1 +β2x 2+β
∧
∧∧∧∧
2
3x 2 +β4x 1x 2 =29.1133 + 11.134 ×0.2 –
∧
7.608×6.5 + 0.6712 ×6.52 -1.4777 ×0.2 ×6.5 =8.3253百万支,置信度为
95%的预测空间为[7.8953,8.7592],与模型(3)的结果相比,y 略有增加,而预测区间长度短些。在保持广告费用x 2=6.5百万元不变的条件下,分别对模型(3)和(5)中牙膏销售量的均值y 与价格差x 1的关系作图,见图3和图
4
∧
∧
∧
∧
图3 模型(3)y 与x 1 的关系 图4 模型(5)y 与x 1 的关系 在保持价格差x 1=0.2元不变的条件下,分别对模型(3)和(5)中牙膏销售量的均值y 与广告费用x 2的关系作图,见图5和图6
∧
图5 模型(3)y 与x 2 的关系 图6 模型(5)y 与x 2 的关系
∧
∧
可以看出,交互作用项x 1x 2加入模型,对y 与x 1的关系稍有影响,而y 与
x 2 的关系有较大变化,当x 2 6以后y 上升则快得多。
∧
∧
∧∧
进一步讨论: 为了解x 1和x 2之间的相互作用,考察模型(5)的预测方程 y =29.1133+11.1342x 1 -7.6080x 2 +0.6712x 22 -1.4777x 1x 2 (6) 如果取价格差x 1 =0.1元,代入(6)可得
∧
y
∧
x 1=0.1 =30.2267 -7.7558x 2 +0.6712x 22 (7)
再取x 1 =0.3元,代入(6)可得
y
∧
x 1=0.3 =32.4536 -8.0513x 2 +0.6712x 22 (8)
它们均为x 2的二次函数,其图形见图7,且
y
∧
x 1=0.3 -
y
∧
x 1=0.1 = 2.2269-0.2955x 2 (9)
由(9)式可得,当x 2
y
∧
x 1=0.3 >
y
∧
x 1=0.1,即若广告费
用不超过大约7.5百万元,价格差定在0.3元时的销售量,比价格差定在0.1元的大 ,也就是说,这时的价格优势会使销售量增加。
图7 y 与x 2 的关系((7)与(8)的图形)
∧
附录:源程序
x1=[-0.05;0.25;0.60;0;0.25;0.20;0.15;0.05;-0.15;0.15;0.20;0.10;0.40;0.45;0.35;0.30;0.50;0.50;0.40;-0.05;-0.05;-0.10;0.20;0.10;0.50;0.60;-0.05;0;0.05;0.55];
y=[7.38;8.51;9.52;7.50;9.33;8.28;8.75;7.87;7.10;8.00;7.89;8.15;9.10;8.86;8.90;8.87;9.26;9.00;8.75;7.95;7.65;7.27;8.00;8.50;8.75;9.21;8.27;7.67;7.93;9.26]; aa=polyfit(x1,y,1); y1=polyval(aa,x1); plot(x1,y1,x1,y,'ro')
%图1:Y对X1的散点图
x1=[-0.05;0.25;0.60;0;0.25;0.20;0.15;0.05;-0.15;0.15;0.20;0.10;0.40;0.45;0.35;0.30;0.50;0.50;0.40;-0.05;-0.05;-0.10;0.20;0.10;0.50;0.60;-0.05;0;0.05;0.55];
x2=[5.50;6.75;7.25;5.50;7.00;6.50;6.75;5.25;5.25;6.00;6.50;6.25;7.00;6.90;6.80;6.80;7.10;7.00;6.80;6.50;6.25;6.00;6.50;7.00;6.80;6.80;6.50;5.75;5.80;6.80];
y=[7.38;8.51;9.52;7.50;9.33;8.28;8.75;7.87;7.10;8.00;7.89;8.15;9.10;8.86;8.90;8.87;9.26;9.00;8.75;7.95;7.65;7.27;8.00;8.50;8.75;9.21;8.27;7.67;7.93;9.26]; aa=polyfit(x2,y,2); x3=5.25:0.05:7.25; y2=polyval(aa,x3); plot(x2,y,'ro',x3,y2)
%图2:Y对X2的散点图d
x4=[ones(30,1),x1,x2,x2.^2]; [b,bint,r,rint,stats]=regress(y,x4) %表2
x5=[ones(30,1),x1,x2,x2.^2,x1.*x2]; [b,bint,r,rint,stats]=regress(y,x5) %表3
x1=[-0.05;0.25;0.60;0;0.25;0.20;0.15;0.05;-0.15;0.15;0.20;0.10;0.40;0.45;0.35;0.30;0.50;0.50;0.40;-0.05;-0.05;-0.10;0.20;0.10;0.50;0.60;-0.05;0;0.05;0.55]; ytu3=17.3244+1.307*x1+(-3.6956)*6.5+0.3486*6.5*6.5; plot(x1,ytu3) grid on %图3
x1=[-0.05;0.25;0.60;0;0.25;0.20;0.15;0.05;-0.15;0.15;0.20;0.10;0.40;0.45;0.35;0.30;0.50;0.50;0.40;-0.05;-0.05;-0.10;0.20;0.10;0.50;0.60;-0.05;0;0.05;0.55];
ytu4=29.1133+11.1342*x1+(-7.608*6.5)+0.6712*6.5*6.5+(-1.4777)*6.5*x1; plot(x1,ytu4) grid on %图4
x2=[5.50;6.75;7.25;5.50;7.00;6.50;6.75;5.25;5.25;6.00;6.50;6.25;7.00;6.90;6.80;6.80;7.10;7.00;6.80;6.50;6.25;6.00;6.50;7.00;6.80;6.80;6.50;5.75;5.80;6.80]; ytu5=17.3244+1.307*0.2+(-3.6956)*x2+0.3486*x2.*x2; bb=polyfit(x2,ytu5,2); xtu5=5.25:0.05:7.25;
ytu51=polyval(bb,xtu5); plot(xtu5,ytu51) grid on %图5
x2=[5.50;6.75;7.25;5.50;7.00;6.50;6.75;5.25;5.25;6.00;6.50;6.25;7.00;6.90;6.80;6.80;7.10;7.00;6.80;6.50;6.25;6.00;6.50;7.00;6.80;6.80;6.50;5.75;5.80;6.80];
ytu6=29.1133+11.1342*0.2+(-7.608*x2)+0.6712*x2.*x2+(-1.4777)*x2*0.2; bb=polyfit(x2,ytu6,2); xtu6=5.25:0.05:7.25; ytu61=polyval(bb,xtu6); plot(xtu6,ytu61) grid on %图6
x2=[5.50;6.75;7.25;5.50;7.65;6.50;6.75;5.25;5.25;6.00;6.50;6.25;7.00;6.90;6.80;6.80;7.10;7.00;6.80;6.50;6.25;6.00;6.50;7.00;6.80;6.80;6.50;5.75;5.80;6.80]; xtu7=sort(x2);
ytu7=30.2267-7.7558*xtu7+0.6712*xtu7.^2; plot(xtu7,ytu7) grid on hold on
ytu8=32.4536-8.0513*xtu7+0.6712*xtu7.^2; plot(xtu7,ytu8) hold off
%图7
经过讨论和模型的改进,可以预测出在不同价格和广告费用下的牙膏销售量。