目录:
定义-主成分分析(PCA)是什么意思?
主成分分析(PCA)是一种用于从较大的数据集中识别较少数量的不相关变量(称为主成分)的技术。 该技术被广泛用于强调变化并捕获数据集中的强模式。 主成分分析是由卡尔·皮尔森(Karl Pearson)在1901年发明的,是一种用于预测模型和探索性数据分析的工具。 主成分分析被认为是一种有用的统计方法,并用于图像压缩,面部识别,神经科学和计算机图形学等领域。
Techopedia解释了主成分分析(PCA)
主成分分析有助于使数据更易于浏览和可视化。 它是一种简单的非参数技术,用于从复杂而混乱的数据集中提取信息。 主成分分析集中于最大方差量和最少的主成分数。 与主成分分析相关的独特优势之一是,一旦在相关数据中找到了模式,就也支持数据压缩。 一种是利用主成分分析来消除变量的数量,或者是与观测值的数量相比预测变量太多时,或者避免多重共线性。 它与规范相关分析密切相关,并利用正交变换将包含相关变量的观测值集转换为称为主成分的值集。 主成分分析中使用的主成分数小于或等于较少的观察值。 主成分分析对最初使用的变量的相对比例很敏感。
主成分分析已广泛用于许多领域,例如市场研究,社会科学以及使用大型数据集的行业。 该技术还可以帮助提供原始数据的低维图片。 在主成分分析的情况下,只需极少的精力即可将复杂而令人困惑的数据集减少为简化的有用信息集。
