SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
Mplus中介和调节教程
大学生问卷互填群
Meta分析辅导+代找数据
SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
R语言快速入门视频教程
LCA潜在类别分析和Mplus应用
Amos结构方程模型数据分析入门教程
倒U关系回归分析中介效应和调节效应分析SPSS视频教程
统计咨询(图文问答)

Excel2013:[24]柱形图如何添加基准线

看下面的图,为了一眼看到与几个线的差距,我给柱形图添加了一个基准线,这个基准线怎么做的呢?其实是又添加了一列数据作为及格线,然后又给他添加了一个趋势线,就成了现在的及格线,下面是具体的过程:

  • 我们本来要绘制的柱形图只有一列数据,也就是得分这一列数据,为了画基准线,我们增加一个及格线
  • 假如及格线都是4,我们快速填充好
  • 选中两列数据,添加柱形图
  • 插入的柱形图是酱紫的
  • 我们点击蓝色的柱子,然后右键单击,从菜单中选择【设置数据系列格式】
  • 在右侧打开一个对话框,我们设置系列重叠为百分之百
  • 现在图变成了这个样子
  • 接着选中红色的柱子
  • 在右侧的属性窗口设置:填充为无,边框为实线,设置一下边框颜色
  • 现在变成了酱紫
  • 接着我们还是选中红色柱子
  • 右键单击,然后选择【添加趋势线】
  • 出来的效果图就是酱紫了。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

numpy函数:[10]ones和empty创建数组

使用ones可以创建任意维度和元素个数的数组,其元素均为1。empty函数的使用方法一样,只是它创建的是数组所有元素均为空,所以它是速度最快的创建数组的方法。

  • 先从numpy中引入所有
  • 接着,我们使用ones创建一个包含5个元素的一维数组,其元素均为1
  • ones创建的数组数据类型默认为浮点型,我们可以通过第二个参数来设置其数据类型
  • 假如我们创建一个2维数组,就要用到列表作为参数。三维数组以此类推
  • 多维数组也可以改变数据类型
  • 接着我们用empty试试创建数组
  • 和ones的使用方法是一样的。empty创建的数组中,包含元素均为无意义的数值

转载请注明来自DataScience.

邮箱: 675495787@qq.com

spss多重共线性的诊断方法

spss诊断多重共线性是在多重线性回归的时候容易出现的一个问题,他指的是多个变量可能高相关,造成了模型方程的不稳定,一般是在方程求出来以后,发现方程的问题,然后进行的方程的诊断,下面是诊断多重共线性的步骤:
方法/步骤

  • 多重共线性的诊断是在回归中进行的,所以先打开回归的对话框:analyse–regression–linear,打开线性回归对话框
  • 将自变量因变量都放到各自的位置,然后点击statistic
  • 在该对话框中,有一个多重共线性诊断的选项,勾选他,如图所示,点击continue按钮,返回主对话框
  • 点击ok按钮,开始输出诊断结果
  • 我们先来看这两个参数,特征根(Eigenvalue):多个维度特征根约为0证明存在多重共线性;条件指数(Condition Index):大于10时提示我们可能存在多重共线性
  • 接着来看相关系数矩阵,找到数值接近1的相关,这也提示出可能存在多重共线性。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Excel2013:[49]日期坐标轴删除周六日

如果坐标轴是日期类型的数据,那么Excel会自动的填充缺少的日期,这样的图表看起来就不是连续的,在某些日期中就会出现空白,我们看一下下面的例子就知道了。

  • 我们来看一下,由于商店在周六日休息,所以在周六日就没有营业额,我们使用这样的数据来插入一个直方图
  • 在菜单栏选择【插入】【直方图】
  • 我们看一下插入的数据,系统自动填充了没有的日期,造成这种难看的直方图
  • 我们下面来改善这种情况,先选中横坐标
  • 在坐标轴上右键单击选择【设置坐标轴格式】
  • 在设置窗口,我们看到了,默认的选项是【根据数据自动选择】,我们将其更改为【文本坐标轴】,这样它就不会自动填充没有的日期了
  • 这是更改后的直方图,空白数据已经被删掉了。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

DataNitro:[4]CellRange对象

CellRange在之前介绍过,我们大概也知道CellRange就是几个单元格组成的区域,今天来系统地看一下CellRange有哪些方法和属性。

  • 创建或者获取一个CellRange,我们可以用这些写法:注意print只是我为了输出这些CellRange的名字,与今天的学习内容无关。下面三种写法意义相同。
  • 上一种写法代表了一个连续区域,下面的写法代表不连续区域:
  • 通过名称获取一个区域:
  • 我们还可以指明区域所在的sheet
  • 迭代的方式输出所有单元格:
  • 一个区域内包含多少单元格:可以用len()
  • 像列表一样,我们可以使用索引来得到区域内任意一个单元格:
  • 这篇文章略去的属性有:

  • value,formula,color,hyperlink,comment,font,row,col,position,name,sheet,table,这些与Cell属性相同,参考上一篇文章

  • 合并两个区域,用加号就好了

  • 将Cell添加进CellRange
  • 将Cell从CellRange中删除:
  • 其他方法:

  • 如:claer,copy_from,copy_format_from,is_empty,set_name等

  • #可以参考Cell的方法

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Python教程:[20]urlsplit和urlparse的区别

urlsplit和urlparse非常相像,用法基本一致,但是他们有略微的不同,split函数在分割的时候,path和params属性是在一起的,我们看下面的例子。

  • 先用urlparse函数来分割url
  • 将结果打印出来
  • 我们看到输出的结果,有params这一项
  • 接着使用urlsplit函数,可选参数不能输出,所以只能再前面加了以井号
  • 我们比较一下两个结果

  • urlparse函数

  • urlsplit函数

转载请注明来自DataScience.

邮箱: 675495787@qq.com

网页数据采集:[3]python如何利用抓包数据

上次我们教大家如何使用httpwatch来进行抓包,其实这不重要,重要的是如何使用获得的数据包,你能读懂数据包吗?好吧,我们今天就是用python来示范一下如何使用数据包。

  • 先来设置两个url地址,第一个用于第一次访问,这样可以获得网站服务器发来的cookie,第二个网址是用于登陆的地址
  • 引入两个模块,cookielib和urllib2
  • 接着,我们安装一个cookie处理器,代码如下,这个代码很多人不太能读懂,其实你会用就可以了,他们就是这个固定的形式,顶多改改变量的名字。你复制下来以后自己用就可以了,用多了,你再去看代码的意义,你就都懂了。
  • 然后我们先访问一下网站,获得一个cookie,你不用管这个cookie该怎么弄,前面设置的cookie处理器会自动处理。
  • 接着,我们写一下postdata,也就是你要post的数据,因为我们打算登陆网站,所以postdata里肯定有用户名和密码,那么怎么知道该怎么写postdata呢?看你抓包得到的post数据。下面第一幅图是httpwatch抓包截图,点击postdata,看到post的数据,然后我们看第二幅图,就是python的写法。你自己感受一下。
  • 写完postdata以后,我们 要将postdata转码一下,让服务器可以解读postdata数据
  • 接着设置headers信息,headers也是抓包得到的。同样的方式,你去写header内的信息
  • 然后我们通过request方法来登陆网站,并返回数据,返回的数据存储在request中
  • 通过rulopen方法和read方法来读取数据,并打印出来。
  • 我们看到输出的结果,这说明我们虽然正确的模拟了登陆网站需要的post信息,但是没有考虑到登陆网站是需要验证码的,后期我们会看到如何处理验证码,如果你拿这个教程去处理没有验证码的登陆问题,那么你现在已经成功了。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

pandas教程:[31]箱形图

箱形图用于显示数据的一些基本的统计量:中位数、平均数、四分位数等,我们来看一个关于箱形图的介绍:

  • 下面我们用Python.pandas来绘制箱形图,先引入相关的模块
  • 配置画板
  • 先绘制一个简单的箱形图,用到了ax参数指定在哪里绘图
    生成的plot.png如下图:
  • 有时候我们需要分组显示箱形图,比如数据中有的来自于男性、有的来自于女性,我们先生成一个列表示男女
  • 以性别进行分组,然后绘制箱形图
    生成的plot1.png如下图所示:左边的是a列数据,右边是b列数据

转载请注明来自DataScience.

邮箱: 675495787@qq.com

python教程:[75]HTMLParser采集网页数据

HTMLParser是python自带的处理html文件的模块,用起来非常简单,但很有实用价值,下面我们通过一个简单的例子来说明它的工作机制,然后对它所包含的所有方法进行一个说明。

  • 先看一个简单的例子,我们先引入HTMLParser,然后声明一个类,继承自HTMLPaerser,然后定义了一个方法,这个方法继承自HTMLParser
  • 这一段代码的运行结果是:从结果中我们可以看到feed方法是将要处理的html字符串传递给HTMLParser,处理的过程是从前到后逐个处理html文件的标签,当遇到一个标签的时候,就调用handle_starttag方法,我们写的这个方法就是将tag名打印出来,所以就出现了下面这个结果:
  • feed()和handle_starttag()已经说了,这里不再重复

  • handle_endtag():处理结束标签,比如就是一个结束标签,当遇到结束标签的时候调用该方法

  • handle_data():处理数据,比如这是数据,“这是数据”就是data,当遇到data的时候调用该方法。

  • handle_entityref():处理“>”“>”“>”这样的字符串,他们各有自己指代的字符,处理的方法是使用name2codepoint将其转换,就可以知道gt原来是>的意思

  • handle_charref()处理十进制或十六进制“>”这样的字符串,可以将其转换为&gt

  • handle_comment()处理内的内容

  • handle_decl()处理html文档类型声明,例如

  • 大部分方法都列在上面了,还有一些不常用就没有写,这些相信已经够你用了。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Excel2013:[20]如何删除数据透视表

我们创建了一个数据透视表,然后突然发现创错误,需要删除数据透视表,怎么办?其实有两种方法,第一种就是删除数据透视表所在的工作表,第二种就是删除透视表而不删除工作表。第一种我常用,因为我建立的数据透视表通常是在新建的工作表当中,但是有时候,我们的数据透视表所在的工作表还有其他内容,无法删除,所以就需要第二种方法,下面是具体的步骤:

  • 直接删除工作表,很简单,右键单击工作表,在右键菜单中,选择【删除】
  • 方法二呢复杂一点:选中数据透视表的一个单元格
  • 在菜单中出现了【分析】标签,我们切换到【分析】标签下
  • 在这个菜单中,找到【选择】,点击它,打开一个下拉菜单
  • 我们选择【整个数据透视表】
  • 选中了数据透视表以后,我们点击【delete键】,删除之

转载请注明来自DataScience.

邮箱: 675495787@qq.com