SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
Meta 分析入门教程
Mplus中介和调节教程
大学生问卷互填群
Meta分析辅导+代找数据
SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
R语言快速入门视频教程
LCA潜在类别分析和Mplus应用
Amos结构方程模型数据分析入门教程
倒U关系回归分析中介效应和调节效应分析SPSS视频教程
统计咨询(图文问答)

pandas教程:[25]插值法填补缺失值

使用插值法可以计算缺失值的估计值,所谓的插值法就是通过两点(x0,y0),(x1,y1)估计中间点的值,假设y=f(x)是一条直线,通过已知的两点来计算函数f(x),然后只要知道x就能求出y,以此方法来估计缺失值。当然我们也可以假设f(x)不是直线,二是其他函数。

  • 引入相关模块并创建一个数据框
    数据框的内容为:
  • 使用插值法估计缺失值
    输出结果为:
  • 我们可以计算一下缺失值实际上上前一个值和后一个值得平均数,因为interpolate()假设函数是直线形式

  • 假如index是数字,我们还可以根据数字来进行插值,用到参数method=’values’
    比较一下插值的结果与上一个结果的不同之处这时候索引的数值实际上就是用于估计y的x值

  • 同样道理,如果index是时间,我们可以用method=time来达到同样的效果
    输出结果为:

转载请注明来自DataScience.

邮箱: 675495787@qq.com

SPSS实例:[22]如何将几个变量相加减乘除

如何计算几个变量之间的和?如何计算几个变量的乘积?或者是差、商?我们都可以使用spss菜单中的compute方法,这是spss的最基本的功能,只是大家很少去用就忘记了,下面我就干呢大家一起温习一下如何计算变量之间的和。

  • 我们打开spss的数据,在菜单中依次点击:transform–compute variables
  • 在打开的对话框中,我们输入变量名称,也就是几个变量相加后得到的一个变量的名字,然后点击【type&label】
  • 输入标签【几个变量的和】,标签是对变量的解释,点击【继续】
  • 接着我们选中一个想要计算的变量,点击【添加】按钮
  • 添加过来就是一个变量名,我们输入“+”号,然后再选入第二个变量
  • 最后形成三个变量相加,点击ok按钮就可以计算新的变量了
  • 切换到变量视图下,看看是不是多了一个变量,这就是计算得到的和

转载请注明来自DataScience.

邮箱: 675495787@qq.com

spss怎么合并变量

合并变量是合并数据的一种方法,比如我今天给被试测量几个变量,过几天再测了几个变量,这些数据合并在一起就是合并变量,这不是将case合并,这是关键,下面我来演示一下这个过程。
方法/步骤

  • 打开spss以后,先要打开第一个要合并的数据,然后合并变量如图所示,在菜单栏上执行:data–merge file–addvariable
  • 打开合并变量对话框,点击浏览选项,找到要合并的第二个文件
  • 找到要合并的第二个文件,然后点击open
  • 回到合并变量对话框,点击continue按钮,进行下一步设置
  • 在这里,我们先看到右边的列表指的是合并变量以后的数据,左侧的列表显示的是被排除的变量,这些变量之所以被排除是因为两个数据表出现了相同的变量。
  • 要想合并变量必须制定关键变量,也就是key variables,因为我们的关键变量是id,这个id在new active dataset中,先选中id,然后点击如图所示的按钮,让id变为排除变量
  • 接着在排除变量中,选中id,点击如图所示的按钮,将其添加到关键变量中
  • 点击ok按钮,开始合并变量,一般会弹出警告框,点击ok即可。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

ipython教程:设置Notebook

我们有两种方式来设置你的ipython notebook,一种方式是通过命令行启动notebook服务器的时候,在ipython notebook后面添加一个参数来设置notebook服务器;另一种方式是创建一个ipython_notebook_config.py文件来写入你的设置参数。今天我们就讲一下后者。

  • 这个文件应该放在你的ipython的文件夹下的profile文件夹。通过命令ipython locate来找到这个ipython_notebook_config.py文件放在哪里。
  • 这样你可以打开这个文件夹,看看里面都有什么:所有的配置文件都放在了profile_default文件夹。如果没有看到这个文件夹,你可以使用ipython prifile create来创建
  • 当然你可以给你的profile文件夹起个名字,比如就叫profile_aaa,你可以这样写命令:ipython profile create aaa
  • 如果你想要使用aaa这个profile,我们在启动ipython notebook的时候使用命令:ipython notebook –profile==aaa

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Excel2013:[50]powerview报告怎么做

Poverview报告是Excel2013的新功能,很多人可能还没见过,我用powerview的主要目的就是查看和筛选数据,其实这些功能在没有powerview之前也可以实现,现在有了它,我们就更方便了。下面来看看我们是如何使用powerview报告的。

  • 我们来看一下表格中的数据,有三列,分别是地区、销售额、成绩
  • 选中表格中的所有数据,然后在菜单栏上执行:插入–powerview报告
  • 你可能会看到一个启动提示,点击启用
  • 如果你第一次使用,可能还没有安装silverlight,点击这个链接,然后浏览器会自动下载silverlight,之后你安装上它,然后点击【重新加载】(如下图)就可以了
  • 这就是插入的powerview报告,乍看起来没什么,我们接着往下看
  • 将成绩拖入到【筛选器】
  • 假如我们只勾选成绩为合格和不及格的数据,左侧的数据就会只显示这两个的数据
  • 接着,我们插入一个柱状图,选择【簇状柱形图】
  • 原先的表格就变成了柱形图,同样可以进行筛选
  • 假如我们还想使用表格,还可以在菜单栏中选择【表】
  • 好了,教程就到这里了,想学习Excel数据分析的,请关注我的百度经验,每天都会有新教程。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

SPSS因素分析中如何旋转因子与分析结果

因子分析要求提取出的公因子有实际意义,但是大部分因子分析的结果中,各因子和原始变量之间额关系并不明显,为了使因子载荷矩阵中系数更加显著,可以对初始因子载荷矩阵进行旋转,使因子和原始变量间的关系进行重新分配,相关系数向0–1分化。
工具/原料

  • spss20.0
    方法/步骤

  • 如图所示,先要打开因素分析的主对话框,在菜单栏上执行:analyse–dimension reduction–factor

  • 打开因素分析对话框以后,我们先将要进行因素分析的6个变量放入到variables框中
  • 点击rotation按钮,打开因素旋转对话框
  • 在这里,首先要设置因素旋转的方法,这里有5种方法,一般蕞常用的是最大方差旋转,也就是varimax方法;其他方法在【注意事项】里介绍。点击continue按钮返回
  • 回到了主对话框,点击ok按钮开始处理数据并输出结果
  • 我们看到的第一个结果是communalities,叫做变量共同度,extraction列表显示的是我们提取的因素能够解释多少自变量,值越接近1越好(最大值是1)。
  • 我们看到这这个表格指的是因子载荷矩阵,他显示出三个因子再原始变量上的载荷,根据这个表格我们能够求得各个变量的标准分数的表达式,不是因子的表达式啊哦!!
  • 这个表格是最重要的表格,显示了在旋转因子以后 三个因子再原始变量上的载荷,根据这个表格我们能够求得各个变量的标准分数的表达式,不是因子的表达式啊哦!!

注意事项

  • 介绍一下因子旋转的方法:

  • varimax方法:方差最大正交旋转,是最常用的方法,如果你不懂各种方法的原理,你只要用这个方法就不会有太大的误差。

  • quartimax是四次方最大正交旋转,该方法倾向于减少和每个变量有关联的因子数,从而简化对原变量的解释

  • equamax是平方最大正交旋转,该方法介于上面两种方法之间。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Excel2013:[57]文本日期互转

Excel中日期格式是一个非常头疼的问题,很多时候我们都搞不清楚自己的数据是日期格式还是文本格式,更别提两者的相互转化了。今天我们详细讲解一下这个问题,以及这两种格式如何互转。

  • 如何判断自己的数据是日期格式还是文本格式?大部分人都回答错误!因为大部分人都知道查看单元格格式可以知道!这是及其错误的,比如,有一个单元格,里面填写了一个字符“a”,通过设置单元格格式,你将这个单元格设置为数字格式,试试看。一个字母竟然可以成为一个数字格式。这就是说虽然我们可以任意设置单元格的格式,但是当Excel无法转换格式的时候,就保留了原先的格式。
  • 所以,当我们想知道一个单元格是文本还是日期时,看单元格格式是不保险的。比如这一列日期,你可以在自己的电脑上录入这一列数据。我们将A列设置为日期格式,但是这一列数据仍然是文本,Excel并没有转换格式。因为Excel并不认识这种日期格式,所以就无法将其转换为日期,仍然保留了文本格式,虽然Excel显示的是日期格式。
  • 除了Excel不识别的日期格式外,还有一种情况可以造成Excel无法将文本转换为日期:在下面这种情况下,我们先设置c列为文本,然后设置d列默认格式为常规。在两列都输入同样的“2013-1-1”,你会发现他们的不同:C列数据保持了你输入的内容不变;D列内容自动转换格式为Excel默认的日期格式。这说明你预先设置了c列的格式为文本,导致后面再输入数据都按照文本来保存数据了。
  • 如何鉴别到底是日期格式还是文本格式?很简单。当单元格为日期时,你在格式设置下啦菜单中,可以看到短日期和长日期格式不同,短日期下面显示2013/1/1,长日期下显示2013年1月1日。
  • 如果单元格为文本格式,你会发现,短日期和长日期显示相同的格式,说明Excel并没有正确的识别日期。
  • 现在我们有一列文本格式的日期,想要转换为日期格式
  • 先将这一列设置为日期格式
  • 按下ctrl+F,利用替换,将“.”替换为“-”,这样可以将Excel不认识的格式转换为它认识的格式
  • 结果就是这样了:显然Excel自动识别了日期。
  • 但是有时候单元格内不是2013.1.1这种形式,而是2013-1-1,也很简单
  • 还是用这个方法,先将该列设置为日期格式,然后将“-”替换为“/”即可
  • 反过来,有些时候我们必须将日期格式转换为文本格式,还是这一列数据,它现在是日期格式
  • 在B2单元格输入公式:=TEXT(A2,”yyyy-m-d”),按下回车看一下结果
  • 向下拖动单元格右下角,可以快速填充以下的单元格,完成日期向文本的转换。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

SPSS实例:[12]回归模型中如何增加交互项

通常我们在回归分析中需要用到两个自变量之间的交互项来检验两个变量之间的交互效应,那么这个交互项是从哪里来的呢?其实就是两个变量的乘积,具体方式是:

  • 打开数据,在菜单栏上执行:转换–计算变量
  • 打开计算变量的对话框,我们设置目标变量名称,你随便起一个英文的名字,然后设置这个变量的标签,为了以后处理数据方便,你一定要添加一个自己看得懂的标签,点击继续。
  • 然后在这里输入两个变量相乘的公式,如图所示就是变量P1Q01和P1Q02的乘积
  • 点击ok就可以运行程序,得到一个新的变量,也就是交互项
  • 用syntax的话更简单,下面的代码可以实现同样的效果。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Excel2013:[1]两类数据绘制在同一张图上

假如我有两个曲线要画在同一张图上,而且不能同时绘制出两条曲线,只能一条一条的绘制,如果你想要将两条曲线放到一张图上,你可以先绘制一条,然后再添加数据源。我们看看下面的案例吧。

  • 我们看下面的表格,有三列数据,自变量X和两个因变量y1和y2,我们要用散点图表示x和y1的关系,同时要用散点图表示x和y2的关系,如何将两个散点图绘制在一个图上呢?
  • 先绘制第一条曲线,选中x和y1两列数据,然后选择一个散点图,如图所示
  • 在图表上右键单击,点击【选择数据】
  • 我们看到打开了【数据源】对话框。点击【添加】按钮
  • 编辑数据系列,你可以看到我用不同颜色表示出了不同的数据源,你按照箭头来操作就可以了
  • 这是我设计好的数据系列,点击确定
  • 回到了数据源对话框,我们点击确定按钮
  • 这时候已经出现了两条曲线,我们点击【添加】按钮,如图所示
  • 选择添加【图例】,这样你就可以知道这两条曲线分别代表的是谁了。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

python 线性代数:[10]求方阵的特征值特征向量

求方阵(矩阵)的特征值和特征向量用的是python中的numpy.linagl.eig方法,它需要一个二维数组作为参数,输出一个一位数组(元素为特征值)和一个二维数组(特征向量组),我们还是在例子中学习一哈:

  • 先引入numpy模块
  • 创建一个对角矩阵,关于diag的用法可以看我前几篇文章
  • 求矩阵x的特征值和特征向量,特征值保存在a中,特征向量保存在b中
  • 使用循环的方法,我们来验证一下特征值和特征向量,验证的方法是特征值和特征向量的定义法:

  • 设A为n阶矩阵,若存在常数λ及非零的n维向量x,使得

  • Ax=λx,

  • 则称λ是矩阵A的特征值,x是A属于特征值λ的特征向量。

  • 这是我今天犯的错误:
  • 这是今天用到的所有代码:

  • import numpy

  • x=numpy.diag((1,2,3))

  • x

  • array([[1, 0, 0],

  •    [0, 2, 0],
    
  •    [0, 0, 3]])
    
  • a,b=numpy.linalg.eig(x)

  • a

  • array([ 1., 2., 3.])

  • b

  • array([[ 1., 0., 0.],

  •    [ 0.,  1.,  0.],
    
  •    [ 0.,  0.,  1.]])
    
  • for i in range(3):

  • if numpy.dot(x,b[:][i])==a[i]*b[:][i]:

  • print ‘正确’

  • else:print ‘错误‘

  • SyntaxError: EOL while scanning string literal

  • for i in range(3):

  • if numpy.dot(x,b[:][i])==a[i]*b[:][i]:

  • print ‘正确’

  • else:print ‘错误’

  • Traceback (most recent call last):

  • File “<pyshell#38>”, line 2, in

  • if numpy.dot(x,b[:][i])==a[i]*b[:][i]:
    
  • ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

  • for i in range(3):

  • if (numpy.dot(x,b[:][i])==a[i]*b[:][i]).all():

  • print ‘正确’

  • else:print ‘错误’

  • 正确

  • 正确

  • 正确

转载请注明来自DataScience.

邮箱: 675495787@qq.com