PCA算法的数学知识---特征值分解和奇异值分解

01-06

PCA 算法的数学知识---特征值分解和奇异值分解： 1）特征值：

如果说一个向量v 是方阵X 的特征向量，将一定可以表示成下面的形式：

Xv =λv

这时候λ就被称为特征向量v 对应的特征值，一个矩阵的一组特征向量是一组正交向量。特征值分解是将一个矩阵分解成下面的形式： X =Q ∑Q -1

其中Q 是这个矩阵X 的特征向量组成的矩阵，Σ是一个对角阵，每一个对角线上的元素就是一个特征值。

首先，要明确的是，乘以一个矩阵其实就是一个线性变换，而且将一个矩阵乘以一个向量后得到的向量，其实就相当于对这个向量进行了线性变换。如果我们想要描述好一个变换，那我们就描述好这个变换主要的变化方向就好了。分解得到的Σ矩阵是一个对角阵，里面的特征值是由大到小排列的，这些特征值所对应的特征向量就是描述这个矩阵变化方向（从主要的变化到次要的变化排列）。通过特征值分解得到的前N 个特征向量，就对应了这个矩阵最主要的N 个变化方向。我们利用这前N 个变化方向，就可以近似这个矩阵（变换）。也就是：提取这个矩阵最重要的特征。

总结一下，特征值分解可以得到特征值与特征向量，特征值表示的是这个特征到底有多重要，而特征向量表示这个特征是什么，可以将每一个特征向量理解为一个线性的子空间，我们可以利用这些线性

的奇异值之和的99%以上了。也就是说，我们也可以用前r 大的奇异值来近似描述矩阵，这里定义一下部分奇异值分解：

X n *p ≈U n *r ∑r *r V T

r *p

r 是一个远小于n 、p 的数，右边的三个矩阵相乘的结果将会是一个接近于X 的矩阵，在这儿，r 越接近于p ，则相乘的结果越接近于X 。而这三个矩阵的面积之和（在存储观点来说，矩阵面积越小，存储量就越小）要远远小于原始的矩阵X ，我们如果想要压缩空间来表示原矩阵X ，我们存下这里的三个矩阵：U 、Σ、V 就好了。奇异值与主成分分析（PCA ）：

PCA 的全部工作简单点说，就是对原始的空间中顺序地找一组相互正交的坐标轴，第一个轴是使得方差最大的，第二个轴是在与第一个轴正交的平面中使得方差最大的，第三个轴是在与第1、2个轴正交的平面中方差最大的，这样假设在N 维空间中，我们可以找到N 个这样的坐标轴，我们取前r 个去近似这个空间，这样就从一个N 维的空间压缩到r 维的空间了，但是我们选择的r 个坐标轴能够使得空间的压缩使得数据的损失最小。

假设矩阵每一行表示一个样本，每一列表示一个特征，用矩阵的语言来表示，对一个n* p的矩阵X 进行坐标轴的变化，P 就是一个变换的矩阵，从一个p 维的空间变换到另一个p 维的空间，在空间中就会进行一些类似于旋转、拉伸的变化。

X n *p P p *p = X n *p

而将一个n * p的矩阵X 变换成一个n* r的矩阵，这样就会使得本来有p 个特征的样本，变成了有r 个特征了（r

X n *p P p *r = X n *r

但是这个跟奇异值分解（SVD ）什么关系呢？之前谈到，SVD 得出的奇异向量也是从奇异值由大到小排列的，按PCA 的观点来看，就是方差最大的坐标轴就是第一个奇异向量，方差次大的坐标轴就是第二个奇异向量…我们回忆一下之前得到的SVD 式子：

X n *p ≈U n *r ∑r *r V r T *p

在矩阵的两边同时乘上一个矩阵V ，由于V 是一个正交的矩阵，所以V 转置乘以V 得到单位阵I ，所以可以化成后面的式子 X n *p V p *r ≈U n *r ∑r *r V r T *p V p *r

X n *p V p *r ≈U n *r ∑r *r

将后面的式子与X * P那个n * p的矩阵变换为n * r的矩阵的式子对照看看，在这里，其实V 就是P ，也就是一个变化的向量，即一组新的坐标基，也叫主成分矩阵，而U n *r ∑r *r 相当于原数据在新坐标基下的

坐标，叫做得分矩阵。这里是将一个n * p的矩阵压缩到一个n * r的矩阵，也就是对列进行压缩。

如果我们想对行进行压缩（在PCA 的观点下，对行进行压缩可以理解为，将一些相似的样本合并在一起，或者将一些没有太大价值的样本去掉）怎么办呢？同样我们写出一个通用的行压缩例子：

P r *n X n *p =X r *p

这样就从一个n 行的矩阵压缩到一个r 行的矩阵了，对SVD 来说也是一样的，我们对SVD 分解的式子两边乘以U 的转置U' U r T *n X n *p ≈∑r *r V r T *p

这样我们就得到了对行进行压缩的式子。可以看出，其实PCA 几乎可以说是对SVD 的一个包装，如果我们实现了SVD ，那也就实现了PCA 了，而且更好的地方是，有了SVD ，我们就可以得到两个方向的PCA ，如果我们对X T X 进行特征值的分解，只能得到一个方向的PCA 。

与《PCA算法的数学知识---特征值分解和奇异值分解》相关的范文

07-14 新课程理念下课堂教学的几点思考

　　随着新一轮国家课程教材改革实验的逐步实施，基础教育的课程环境得到了极大的改善。数学成为开发儿童潜能的重要工具，动手实践、自主探索、合作交流成为数学主要的学习方式，情感、态度、价值观已成为数学教学的重要目标，这一切使数学课堂教学发生了深刻的变化。有些教师意识到新课改的重要性，并尝试将这些理论应用于自己的课堂教学中，可是由于种种原因却遭到了失败，于是这些教师宁可对这种教学采取敬而远之的态度。我们 ...

08-16 第八册数学教学计划-

一、教学内容乘法，升和毫升，三角形，混合运算，平行四边形和梯形，找规律，运算律，对称、平移和旋转，倍数和因数，用计算器探索规律，解决问题的策略，统计，用字母表示数，整理与复习。二、教学目标 1、知识与技能方面（1）使学生联系已有的知识和经验，经历从具体问题中抽象数量关系并探索算法和运算律的过程，掌握有关的计算方法和运算顺序，发现并初步理解一些简单的运算规律；初步认识自然数的一些特征；初步理解 ...

02-11 第八册数学教学计划

07-03 二年级数学下册教学计划

一、教学内容这册教材包括下面一些内容：解决问题、表内除法（一）、图形与变化、表内除（二）、万以内数的认识、克和千克的认识、万以内的加法和减法（一）、统计、找规律、总复习等。这册教材的计算教学内容是万以内的加、减法笔算和表内除法。这两部分内容都是进一步学习计算的重要基础。因此，表内除法同20以内的加、减法一样，是小学数学的重要基础知识，是小学生需要掌握的除法是人们在日常生活中解决问题时经常用到的数 ...

10-07 六年级下册数学复习整理和复习建议

六年级下册数学复习整理和复习建议　　一、整理和复习内容　　系统的、全面的回顾与整理小学数学的全部内容。　　二、整理和复习目标　　 1．比较系统地掌握有关整数、小数、分数和百分数、负数、比和比例、方程的基础知识；能比较熟练地进行整数、小数、分数的四则运算，能进行整数、小数加、减、乘、除的估算，会使用学过的简便算法，合理、灵活地进行计算；会解学过的方程；养成检查和验算的习惯。　　 2．巩固常用计 ...

08-17 三年级数学教学总结

三年级数学教学总结一、基本情况分析：三年级二班有学生60名，经过训练，大部分学生的学习习惯和行为习惯有了较大的进步，上课能懂得怎样听讲，知道按老师的要求完成作业，能上课积极举手回答问题，同学之间能互相帮助,互相学习,互相团结。个别学生知识的掌握较差，有些学生现在还是不会阅读课本，注意力不集中，理解能力较差，因此，在今后的教学中，要注意学生学习习惯的培养等。二、取得的成绩和经验： 1．学生经历 ...

09-09 2014年秋季学期一年级数学上册教学计划

20XX年秋季学期一年级数学上册教学计划一、教材简析：这一册教材包括下面一些内容：数一数，比一比，10以内数的认识和加减法，认识图形，分类，11～20各数的认识，认识钟表，20以内的进位加法，用数学，数学实践活动。本册以基本的数学思想方法为主线安排教学内容。在认识10以内的数之前，先安排数一数、比一比、分一分、认位置等内容的教学；在10以内加、减法之前，先安排分与合的教学。通过数一数，让学生 ...

04-30 高一下学期数学教学计划

一、上学期教学回顾高一共四个教学班，共计160余人。杨文国带高一（一）班，高一（二）班；张忠杰带高一(三)班和高一（四）班。其中各班期末八校联考的成绩分别为：50.6分，32.8分，27.2分，34.5分，总平36.9分。学期中途因张忠杰离开学校导致频繁更换老师，（三）班、（四）班的成绩因而受到影响。期末由王山任（三）班、(四)班的数学老师。上学期工作在学生学习的落实环节上做得不太扎实，这将是 ...

04-28 小学数学下册教学计划

小学数学下册教学计划一、学生情况分析：一年级现34名学生，班额较大，学生存在着很多问题。主要原因学生自主探究问题的能力弱，缺乏分析问题、解决问题及灵活运用知识的能力。有的学生缺乏良好的学习习惯、审题能力及认真听题的习惯。二、教学内容：本册教材包括下面一些内容：位置，20以内的退位减法，图形的拼组，100以内数的认识，认识人民币，100以内的加法和减法（一），认识时间，找规律，统计，数学实践 ...

01-06 一年级数学教学计划

20xx-20xx学年第一学期一、情况分析我班有学生32人。男生24人，女生8人。刚进入学校的孩子活泼好动，天真烂漫，大多数学生思维活跃，学习数学的兴趣较浓，有着良好的家庭教育和学习爱好。通过入学测试全部达到了入学要求。虽然他们有着强烈的好奇心和求知欲。但是，他们不懂得怎样去学习，也不会学习；有些同学学习能力差，注意力容易分散，所以教师要有层次、有耐心得进行引导，教给学生们学习的方法，培养他 ...

随机推荐

猜你喜欢

PCA算法的数学知识---特征值分解和奇异值分解

·教育局长在庆祝教师节上的讲话

·大班9月家长会发言稿

·机械设备租赁协议

·化学发光及生物发光的原理及其应用

·蔡礼旭:做事选人要谨慎--学佛网

·党的任务.基本路线.基本纲领

·促使员工变身内训师的3个关键途径

·2013年南宁市高新技术产业发展情况分析及对策

·中医中药的好处

·论"首次销售原则"在数字图书馆的应用

·话剧团2014年度党风廉政建设和目标任务完成情况自查报告

·2012年高三英语教学计划

·妇联主席三八讲话

·君晟头脑风暴约会首次会议纪要20161030

·国庆节眼镜店活动方案2015

·北邮2016期末书法艺术赏析网上选修课满分答案

·2012年防寒防冻安全措施

·武汉家庭装修施工标准合同范本

·医院安全生产工作预案

·高速公路工程决算编制与咨询14-05-25