R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

析构季风
• 阅读 191

全文链接:http://tecdat.cn/?p=32747

原文出处:拓端数据部落公众号

随着我国经济的快速发展,上市公司的经营绩效成为了一个备受关注的话题。本文旨在探讨上市公司经营绩效的相关因素,并运用数据处理、图示、检验和分析等方法进行深入研究,帮助客户对我国45家上市公司的16项财务指标进行了因子分析与聚类分析。

分析脉络如下:

  • 数据预处理(包括缺失值,异常值,标准化这些)
  • 数据图示
  • 相关性检验正态性检验
  • 做因子分析和聚类分析

查看数据

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

读取到r软件中:

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

数据预处理(包括缺失值,异常值,标准化

首先,在进行数据分析前,需要对数据进行预处理。数据预处理包括缺失值的处理、异常值的排除、标准化处理等。另外,为了减少数据误差,需要对数据进行标准化处理。

data=na.omit(data)

标准化和可视化

其次,在数据处理完成后,需要对数据进行图示。通过绘制散点图等图示,可以直观地了解各项指标的数值分布和趋势变化。同时,图示也有助于发现数据中的异常点和趋势漂移等问题。

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

数据的标准化及适用性检验

然后,进行相关性检验和正态性检验等统计方法。相关性检验可以通过计算相关系数的方法来判断各项指标之间的联系程度。而正态性检验则可以通过绘制概率图、矩阵图等方法,来判断数据是否符合正态分布。通过这些检验方法,可以更准确地分析数据,并确定适当的分析方法。

相关性检验

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

正态性检验

shapiro.test(data[,2])

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

信度检验结果

信度检验结果是指对某种测量工具(例如问卷、测试等)进行信度检验后得到的结果。信度检验是一种评估测量工具稳定性和一致性的方法,通常使用统计学方法来计算测量工具的内部一致性或者重测信度。通过信度检验,可以确定测量工具的可靠性和准确性,从而确定测量结果的可信度。信度检验结果可以帮助研究者评估测量工具的质量,以确保研究结果的可靠性和有效性。
R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

KMO检验:

KMO检验是一种用于评估数据是否适合进行因子分析的统计方法。KMO(Kaiser-Meyer-Olkin)检验的主要目的是测量数据集中各个变量之间的相关性,以确定是否存在足够的共性方差,从而确定是否适合进行因子分析。KMO值介于0和1之间,通常认为KMO值大于0.6表示数据适合进行因子分析。如果KMO值低于0.6,则表明数据不适合进行因子分析,需要重新考虑数据收集和分析方法。

kmores=kmo(data\[,2:17])\
kmores\$overall

<!---->

## [1] 0.5985173

因子分析和聚类分析

接下来,进行因子分析和聚类分析。因子分析旨在寻找出反映上市公司经营绩效的主要因素,并通过统计方法进行因素提取和旋转。而聚类分析则是将样本进行分类,以便于对不同类别的上市公司进行比较分析。

因子分析

因子分析是一种统计方法,用于确定多个变量之间的关系。它将一组相关变量分解为更少的未观察到的变量,称为因子,这些因子可以解释原始变量的方差。因子分析可用于数据降维、变量选择和构建模型等应用。它在社会科学、市场研究和心理学等领域得到广泛应用。
R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

旋转成份矩阵

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

因子得分排名

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

K-means聚类分析上市公司经营绩效

K-means聚类分析是一种常用的无监督学习方法,用于将一组数据分成K个不同的类别。该算法通过迭代的方式将数据点分配到不同的类别中,并且通过计算每个类别的中心点来更新类别的位置。K-means聚类分析的目标是最小化每个数据点到其所属类别中心点的距离平方和,从而使得每个类别内部的数据点尽可能的相似,不同类别之间的数据点尽可能的不同。该算法的优点是简单易懂,计算速度快,适用于大规模数据集的聚类分析。

在上市公司经营绩效的分析中,可以将公司的各项经营指标作为输入数据,通过K-means聚类算法将公司分成若干类别,同一类别内的公司具有相似的经营绩效表现。这样可以帮助投资者或经营者更好地了解市场上不同公司的经营状况,从而做出更明智的投资或经营决策。

memb <- hmod\$cluster

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

群集成员

cludata

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

plot(data[,2:17],mem

R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据
综上所述,我国上市公司经营绩效实证研究涉及到数据预处理、图示、检验和分析等多个方面。其中,数据预处理和图示为分析提供了基础和依据,检验和分析则为研究提供了科学性和可靠性保障。通过本文的研究,可以更深入地了解上市公司经营绩效的相关因素,为政府部门和企业提供决策参考。


R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据

最受欢迎的见解

1.matlab偏最小二乘回归(PLSR)和主成分回归(PCR)

2.R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析

3.主成分分析(PCA)基本原理及分析实例

4.R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归

5.使用LASSO回归预测股票收益数据分析

6.r语言中对lasso回归,ridge岭回归和elastic-net模型

7.r语言中的偏最小二乘回归pls-da数据分析

8.R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

9.R语言主成分分析(PCA)葡萄酒可视化:主成分得分散点图和载荷图

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Jacquelyn38 Jacquelyn38
4年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
PhoneGap设置Icon
参考:http://cordova.apache.org/docs/en/latest/config\_ref/images.html通过config.xml中的<icon标签来设置Icon<iconsrc"res/ios/icon.png"platform"ios"width"57"height"57"densi
Wesley13 Wesley13
3年前
Java获得今日零时零分零秒的时间(Date型)
publicDatezeroTime()throwsParseException{    DatetimenewDate();    SimpleDateFormatsimpnewSimpleDateFormat("yyyyMMdd00:00:00");    SimpleDateFormatsimp2newS
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这
美凌格栋栋酱 美凌格栋栋酱
4个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(