矩阵的奇异值分解（SVD）（理论）-低调大师

矩阵的奇异值分解（SVD）（理论）

2017-12-17 856

　　矩阵的奇异值分解(Singular Value Decomposition,SVD)是数值计算中的精彩之处，在其它数学领域和机器学习领域得到了广泛的应用，如矩阵的广义逆，主分成分析(PCA),自然语言处理(NLP)中的潜在语义索引（Latent Semantic Indexing）,推荐算法等。
　　鉴于实际应用，本次分享中的数域为实数域，即我们只在实数范围内讨论。我们假定读者具有大学线性代数的水平。那么，矩阵的奇异值分解定理如下：

（定理）（奇异值分解定理）任意一个m×n矩阵A可分解为

A = P D Q

其中P是m×m正交矩阵，D是m×n对角阵，Q是n×n正交矩阵。

证明：矩阵ATA是n×n对称矩阵，因为(ATA)T=AT(AT)T=ATA.又因为

x T （ A T A ） x = (A x) T (A x) \geq 0,

所以ATA是半正定矩阵，从而，ATA的特征值为非负数。
　　假设ATA的特征值为σ21,σ22,...,σ2n,其中，σ21,σ22,...,σ2r都是正的，σ2r+1,σ2r+2,...,σ2n都是0，r为ATA的秩。设{u1,u2,...,un}为ATA的标准正交特征向量集，则

A T A u i = σ 2 i u i (i = 1, 2, . . ., n)

于是(Aui)T(Aui)=uTi(ATA)ui=uTiσ2iui=σ2i.当i≥r+1时，σi=0,从而Aui=0.

　　用{uT1,uT2,...,uTn}作为行构成一个n×n矩阵Q.接着，定义

v i = σ - 1 i A u i (1 \leq i \leq r) .

当1≤i,j≤r时，vi构成一个标准正交系，这是因为

v T i v j = σ - 1 i (A u i) T σ - 1 j (A u j) = (σ i σ j) - 1 (u T i A T A u j) = (σ i σ j) - 1 (u T i σ 2 j u j) = δ i j,

其中δij为Kronecker符号，即当i=j时，δ=1,当i≠j时，δ=0.

　　我们选择额外的向量vi使得{v1,v2,...,vm}为Rm的标准正交基。设P是m×m矩阵，其列是v1,v2,...,vm.设D是m×n对角阵，σ1,σ2,...σr在其对角线上，其余地方均为0.于是有

A = P D Q .

这是因为(PTAQT)ij=vTiAuj,当j≥r+1时，该式为0，当j≤r时，该式为vTiσvj=σjδij,从而PTAQT=D.又因P,Q为正交矩阵，因此

A = P D Q .

　　证毕。
　　在上面证明中，我们称实数

σ1,σ2,...,σn(取非负数)为矩阵A的奇异值，它们是

ATA的特征值的非负平方根。定理中的分解

A=PDQ就是一个奇异值分解。由上面的证明，我们可以知道：矩阵的奇异值分解并不唯一，因为

σ1,σ2,...,σn的次序及

vr+1,vr+2,...,vn的选择并不唯一。

　　在Python中的Numpy模块中，已经实现了矩阵的奇异值分解。以下为示例的应用代码：

import numpy as np
#generate a random 3*4 matrix 
A =  np.random.randint(5, size=(3, 4))
#parameter full_matrices: control the size of P and Q
#d returns as numpy.ndarray, not matrix 
P,d,Q = np.linalg.svd(A, full_matrices=True)
print('A:',A)
print('P:',P)
#D return as diagonal 3*4 matrix
D = np.zeros(12).reshape(3,4)
for i in range(len(d)):
    D[i][i] = d[i]
print('D:',D)
print('Q:',Q)
#check if P*D*Q == A
print('P*D*Q:',np.dot(P,np.dot(D,Q)))

输入结果如下：

　　至于如何用原始算法来实现矩阵的SVD，也是需要考虑的，有机会的话，可以交流哦~~
　　本次分享到此结束，欢迎大家批评与交流~~

参考文献：

SVD 维基百科：https://en.wikipedia.org/wiki/SVD
数值分析机械工业出版社作者：萨奥尔(Timothy Sauer) 译者：裴玉茹
numpy的svd实现函数： https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.svd.html
奇异值分解(SVD)原理与在降维中的应用：https://www.cnblogs.com/pinard/p/6251584.html
奇异值分解SVD应用——LSI：http://blog.csdn.net/abcjennifer/article/details/8131087
论文：CALCULATING THE SINGULAR VALUES AND PSEUDO-INVERSE OF A MATRIX, G. GOLUB AND W. KAHAN, J. SIAM llrM,B. AfeArd.Ser. B, Vol. 2, No. 2, 1965

微信关注我们

原文链接：https://yq.aliyun.com/articles/615261

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2017深度学习NLP进展与趋势

在过去几年中，深度学习（DL）在图像识别和语音处理等领域取得了巨大的进步。它在自然语言处理（NLP）中的应用起初并不令人兴奋，但是随着技术的进步它也为一些常见的NLP任务提供了最先进的解决方案。命名实体识别（NER）、词性（POS）标签、情感分析通过神经网络模型获得了更好的解决。在这篇文章中，我将回顾2017年DL在NLP领域的贡献。或许说是我想和大家分享一下我最喜欢的技术方案。2017年，DL在NLP中的使用不断扩大，在某些情况下产生了惊人的结果，所有迹象都表明这一趋势还会延续。 1.从word2vec到预训练模型词嵌入是与NLP有关的DL最有名的技术。他们遵循哈里斯的分配假说，根据这个假说，具有相似含义的词通常会出现在可比较的语境中。关于词嵌入的详细解释，我建议你阅读加布里埃尔·莫尔德基（Gabriel Mordecki）的文章

2017-12-17

607

上海作为全球最繁华的都市之一，其城市轨道交通极其发达。然而现有的地铁线路网络复杂，购票步骤繁琐，难以满足乘客智能化、自动化语音购票的强烈需求。基于此诉求，阿里巴巴达摩院携手上海地铁，开展地铁语音售票概念机研制，通过完全自然的语音交互，实现了乘客指定站点购票、模糊地名查询购票等操作，为市民提供智能、高效的购票服务。本文邀请到iDST智能语音交互团队负责人鄢志杰，与其深入探讨了下一代语音人机交互方案背后的项目背景、技术解读、功能实现、落地应用等细节问题（鄢志杰将在云栖社区主办的云栖大会北京峰会开发者进阶专场上进行分享，对人工智能、智能语音交互技术感兴趣的读者可以来现场与专家互动）。阿里巴巴iDST智能语音交互负责人鄢志杰项目背景作为全球最繁华的都市之一，上海的城市轨道交通工作日客流量超过1100万，位居全国之首，世界第二；截至目前，上海地铁已有16条线路、374个站点，线路总长617公里（含磁悬浮），而预计到2020年将达到800公里。如此繁重的客流压力下，自然带来了技术升级的智能化购票需求。鄢志杰表示，以往乘客需要依次选择线路、站点、购票张数，购票步骤极为繁琐；而且在乘客事先无...

2017-12-18

665

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。