SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
Mplus中介和调节教程
大学生问卷互填群
Meta分析辅导+代找数据
SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
R语言快速入门视频教程
LCA潜在类别分析和Mplus应用
Amos结构方程模型数据分析入门教程
倒U关系回归分析中介效应和调节效应分析SPSS视频教程
统计咨询(图文问答)

pandas教程:[30]直方图

上一篇文章介绍了用python.pandas绘制柱形图,今天介绍的直方图与柱形图看起来很像,但是直方图更多用于连续数据而不是分类或者离散数据,下面看看具体的过程:

  • 引入相关模块
  • 创建一个数据框,查看一下其中的数据
    这是数据:
  • 假如我们绘制a列数据的直方图,可以直接使用hist()方法

  • 这是输出的plot.png图(很多人问我为什么要输出图片,直接show()一下图片不好么?我这么做是有用意的,我倾向于用Python做一些数据分析软件,输出图片后可以将其导入word或者excel中,生成数据分析报告,因此show()是没用的)

  • 我们可以同时绘制所有列的直方图,得到的是一个numpy.ndarray对象,其元素是matplotlib.axes.AxesSubplot对象
    输出的结果:
    如果你使用的Python(x,y)这样的集成平台,那么去掉print后(df.hist(color=’k’, alpha=0.5, bins=50))可以直接看到有四个图输出,但是如果你是一个程序员我不建议你使用Python(x,y),我也是一样,从来都不用它,所以我们无法直接看到这些图,除非你show或者savefig
  • 我们经常用到by参数来设定分组

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Excel2013:[9]隐藏公式同时保护不被修改

以前跟大家分享过如何隐藏公式,但是无法保护公式不被修改,所以就造成了很多问题,很多人向我吐槽,其实我们可以利用前面的方法保护公式不被修改,这样别人既看不到你的公式也不能修改你的公式,具体的方法如下:

  • 假如我们要保护这个单元格中的公式,我们怎么弄?
  • 先按下Ctrl+a,选中所有单元格,然后设置单元格格式
  • 先取消隐藏了所有的单元格,取消勾选隐藏,然后点击确定按钮。
  • 找到你要隐藏和保护的单元格,选中他们,然后锁定和隐藏
  • 回到这里,我们保护一下工作表,设置一个密码
  • 在这里输入密码,点击确定按钮。
  • 好了,以后别人想要看你的公式是不太容易的奥。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

spss19.0如何破解

spss19.0是现在主流的统计软件,受到各种社会学科的研究生、研究员的欢迎,今天我也要用到spss于是跟大家分享一下,如图安装和破解该软件。
方法/步骤

  • 先去网上下载原版spss19.0,然后进行安装,网站资源很多,这里不提供下载链接
  • 安装好了以后,来到开始菜单,找到spss,它一般在所有程序–ibm spss statistics中
  • 右键单击该快捷方式,在打开的右键菜单中,选择【属性】
  • 找到安装的起始位置,把图中所示的路径复制下来
  • 在网上搜索【spss19.0破解补丁】,下载下来以后,打开该补丁就会看到这个界面,我们将刚才复制得到的路径粘贴在这,然后点击确定按钮。
  • 弹出是否替换文件,这里要选择【全部选是】
  • 当你看到这个界面的时候说明破解已经完成。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

spss中如何进行样本和总体平均数的比较

假设我们现在有几台机器生产的产品是否合格,需要进行检验。我们知道合格的产品直径是322,于是将各个机器生产的产品的直径与这个数字进行比较就知道这个机器是否合格了,我们通过这个例子来说明如何进行样本和总体平均数的比较。
方法/步骤

  • 拿到数据以后先来分析一下数据适用于那种处理方法,这个步骤很关键,我们现在要使用的处理方法是one-sample T test,它适合一个样本的平均数和总体平均数之间的比较,看他俩之间是否有差异,而总体的平均数是已知的。

  • 先分离一下数据,让spss知道哪些数据是一个组的,比如我今天处理的数据有8个分组,每个分都要跟总体的平均数(322)进行比较,看有没有差异,在菜单栏上执行:data–split file
  • 打开split file 对话框,我们勾选【compare groups】,然后将machine number这个变量添加到分组变量中,也就是说一个机器的型号作为一个分组。点击ok按钮
  • 数据分离以后,我们在菜单栏上执行:analyze—compare means—one–sample T test
  • 打开如图所示的对话框,我们将disc brake diameter 这个变量放到被检验的变量中,也就是对这个变量的平均数进行比较,下面的test value中填写322,我们前面说过322就是总体平均数,然后点击options
  • 打开options对话框,然后设置置信区间为95%,如果你对研究的结果要求严格,你可以设置为99%,点击继续按钮。
  • 我们会看到两个表格,第一个表格可以叫做描述统计,对各个组的基本参数进行描述
  • 第二个表格最关键,我们看sig这一列,凡是数值小于0.05的数据都算是有显著差异,有的人规定要小于0.01,这要看你对研究的要求了。图示中圈出来的数据都是有显著差异的,都可以认为这几台机器是不合格的。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Python教程:[68]字典排序方法大全

怎样对字典进行排序?其实和列表有点类似,方法差不多,但是有细微的差别。鉴于前几篇文章都写的是列表排序,所以有些内容不不详细讲了,不知道的可以翻看前几篇文章。我在文章中也会提示哪篇文章可以看。

  • 先创建一个字典a,字典a有三个元素
  • 我们使用key进行排序,注意这是第一个参数用的是a.items,而列表排序的时候用的是列表本身,不是其元素。我们看这种方法返回了一个列表b,而不再是字典了。列表排序这篇文章详细讲解了key的用法【http://jingyan.baidu.com/article/90808022a546b8fd90c80f48.html】
  • 注意看下面这个方法,有略微的区别,但是返回的b都是一样的
  • 我们也可以使用更加高效也更加简洁的方法:引入itemgetter
  • 假如我们想要使用字典的值进行排序,就写参数key=itemgetter(1)
  • 假如要用字典的键进行排序,可以使用itemgetter(0)

转载请注明来自DataScience.

邮箱: 675495787@qq.com

spss析因设计的操作和分析方法

工具/原料

  • spss20.0
    方法/步骤

  • 首先要先正确的录入数据,如图所示,主题熟悉度和生词频率是两个自变量,阅读成绩是因变量

  • 打开方差分析对话框,如图所示执行:analyse–GLM–univariate
  • 将自变量和因变量放入各自的对话框,如图所示,点击model,打开model设置对话框
  • 在model对话框,我们勾选全因素设计,如图所示,然后点击continue按钮
  • 返回到主菜单,点击ok按钮,开始输出结果
  • 我们看到下面这个表格,主要参考的指标是sig值,显然,sig值小于0.05就认为结果显著,从表中的数据你可以很容易看出结果了。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Python教程:[39]从文件引用自定义类函数

python可以将自己编写的类放在py文件中,然后由其他程序调用,很多人都不知道这个该怎么调用,都来问我,这里就给大家讲一下如何在shell中从文件引用自定义类和函数,希望对大家有帮助,下面是具体的过程:

  • 第一步将你编写的文件声明编码类型
  • 然后将你编写的文件保存为py格式的文件,看好你保存的路径,后面会用到这个路径
  • 引入sys模块,然后向path中添加路径,也就是上一步提到的途径
  • 引用的方法是from 文件名 import 类名
  • 调用的方法是:这样我们就建立了一个列content
  • 调用自定义的函数也是同样的方法。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

DataNitro:[3]Cell对象属性

datanitro的Cell对象也就是单元格对象,我们今天学习一下Cell对象所具有的一些属性:

  • name:我现在打开datanitro的Shell,下面的截图欧式在shell中的。创建一个Cell对象很简单,就是输入Cell的两个参数,也就是它的地址就可以创建该对象,如果我们直接print该对象,就会输出它的name属性

  • 我们还可以将Cell的地址写成字符串形式:‘A1’

  • value:Cell的值,它可以自动识别Cell的数据类型,如果是日期,就会返回date数据
  • vertical/horizontal:他们用于批量赋值,或者获取多个Cell组成的range对象。我们将一个列表赋值给Cell.vertical,就会在该cell的下方依次将列表中的元素赋值给多个单元格
    例如Cell(‘E1’).vertical=[2,2,2,2,1]的效果是:
    print Cell(‘E1’).vertical会输出单元格E1以下非空单元格的值
  • cellrange:代码多个单元格构成的区域:CellRange(‘B1:B5’).value=[1,2,3,4,5]可以给这个区域赋值

  • Table:它代表一个二维表,Cell(‘A10’).table代表以A10为左上角,以向右第一个不为空的单元格为有边界,以向下第一个不为空的单元格为下边界的矩形区域。

  • formula:我们还可以直接向单元格输入公式
  • comment:Cell(‘A17’).comment=u’这是注释’,它的效果如下:
  • color:单元格颜色:例如:Cell(‘A20’).color=’red’ #还可以用black, white, red, blue, green, yellow, purple, gray, silver, maroon, olive, lime, teal, aqua, navy, and fuchsia等颜色词

  • font:字体:例如:

  • #font

  • Cell(‘A21’).value=u’字体’

  • Cell(‘A21’).font.size=9

  • Cell(‘A21’).font.color=’blue’

  • 以下属性可以使用True or False

  • Cell(‘A21’).font.bold=True #粗体

  • Cell(‘A21’).font.italic=True #斜体

  • #Cell(‘A21’).underline=True #下划线

  • #Cell(‘A21’).strikethrough=True

  • #Cell(‘A21’).subscript=True

  • #Cell(‘A21’).superscript=True

  • 最后也是最重要的一个属性:df,它可以让我们将pandas的DataFrame对象直接输入到excel,例如:

  • #df

  • import pandas as pd

  • df=pd.DataFrame([[1,2,3],[4,5,6]])

  • Cell(‘A19’).df=df

  • 下一篇介绍一下datanitro的一些方法

转载请注明来自DataScience.

邮箱: 675495787@qq.com

pandas教程:[8]数据分组

使用groupby()可以给数据分组,数据分组的好处是你可以一次性计算得到所有分组中的统计量,比如想计算男女学生的平均成绩分别是多少,可以先按照男女分组,然后计算平均数,我们不用计算完女生然后在计算男生,实际上是一次性完成的,这就是分组的好处。

  • 先引入模块,并创建一个DataFrame
  • 打印出DataFrame来查看一下结果
  • 我们可以以A列进行分组,使用groupby
  • 打印出来的grouped.first()为每一组的第一行数据
  • 我们还可以以两列以上进行分组,groupby参数为一个列表
  • 打印出来的是这样的情况,last表示每一组的最后一行数据
  • 我们还可以根据列来分组,先创建一个get_type函数,如果列名为abem中之一,就分为组别vowel,反之为consonant
  • 打印第一组看看分组情况。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Python教程:[51]删除文件及文件夹

假如有一个txt文件,我想要使用python命令删除它,怎么弄?这里用到了Python的os模块,我们使用例子来说明如何如何删除文件及目录。

  • 在d盘下有一个tt文本文件,我们来删除它
  • 首先引入os模块
  • 使用os下的remove命令来删除该文件,参数是r’d:/tt.txt’,通常路径字符串都是用r字符串
  • 现在改文件已经被删除,现在我们再运行一下该命令,看看有什么提示错误
  • 这就是提示的错误,为了写出更见健壮的程序,我们通常要在删除文件前,先检验该文件是否存在。
  • 使用path.exists命令来检验文件是否存在,参数仍然是路径字符串
  • 配合if语句,我们就可以写出一个健壮的删除文件的命令。
  • 上面讲到了如何删除文件,下面说一下如何删除文件夹。我们用到了rmdir方法,它可以直接删除空文件夹
  • 假如文件夹非空,会提示这样的错误:

  • Traceback (most recent call last):

  • File “<pyshell#8>”, line 1, in

  • os.rmdir(r'd:/tt/')
    
  • WindowsError: [Error 145] : ‘d:/tt/‘

  • 假如文件夹不存在,会提示这样的错误:

  • Traceback (most recent call last):

  • File “<pyshell#16>”, line 1, in

  • os.rmdir(r'd:/tt/')
    
  • WindowsError: [Error 2] : ‘d:/tt/‘

  • 怎么删除非空文件夹?我们用到了shutil模块
  • 用rmtree命令可以直接删除文件夹,包括内部文件

转载请注明来自DataScience.

邮箱: 675495787@qq.com