深入浅出统计学的读后感10篇【美高梅59599】

深入浅出统计学的读后感10篇【美高梅59599】

美高梅59599 1

《深入浅出统计学》

《深入浅出统计学》是一本由Dawn
Griffiths著作,电子工业出版社出版的平装图书,本书定价:89.00元,页数:677,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。

大纲

1.统计学的作用
2.集中趋势的量度
3.分散性与变异性的量度
4.概率计算
5.离散概率分布的运用
6.排列与组合
7.几何分布、二项分布和泊松分布
8.正态分布的应用
9.超越正态分布的应用
10.统计抽样的应用
11.总体和样本的估计
12.置信区间的构建

《深入浅出统计学》读后感:通俗易懂,适合非统计学人士

统计学的作用

1.统计学可以帮助企业做出客观的决策,能够进行精准地预测
2.统计学能够使我们个人避免遭人愚弄

  1. 信息与数据的区别:
    • “数据”是指所收集的原始事实与数字。
    • “信息”是指加入了某种意义的数据
      例如 ,数字5、6、7 只是数字,并不知道有何含义——数据
      告诉这几个数代表三个孩子的年龄,数据有意义了——信息

优点:

集中趋势的量度
  1. 均值
    容易受异常值和偏斜数据的影响
  2. 中位数
  3. 众数

此书比较通俗易懂,适合非专业人士的统计学入门;

分散性和变异性的量度

1.极差
区分数据集分散程度,最大值-最小值

2.四分位数

  • 将数据一分为四,最小的四分位数为下四分位数,最大的四分位数为上四分位数。
  • 四分位距:中间的四分位数即中位数。
  • 四分位的优点是:与全距相比,较少受到异常值的影响。只关注居于数据中央的50%的数据,这样才能排除异常值的干扰。

3.十分位数,百分位数
第K百分数数即位于数据范围K%处的数值

4.可用箱线图绘制各种“距”

5.方差
方差是衡量数据分散性的一种方法,是数值与均值的距离的平方数的平均值

美高梅59599 2

计算方差常用公式

6.标准差
标准差是描述典型值与均值距离的一种方法,标准差越小,数值离均值越近。
度量数据的分散性

7.标准分
对不同数据集中的数值进行比较的一种方法,这些数据集的均值和标准差互不相同。

美高梅59599 3

标准分求解

书中的很多案例和习题比较好,能从简单的角度阐述复杂的概率统计的理论知识;

概率统计
  1. 众数
  2. 概率

美高梅59599 4

概率计算公式

3.条件概率

美高梅59599 5

条件概率

4.全概率公式

美高梅59599 6

与A一起发生,不与A一起发生

5.贝叶斯公式

美高梅59599 7

贝叶斯公式

美高梅59599 8

树轴法

本书比较内容相对连贯,读下去一气呵成

离散概率分布的应用

1.期望:描述的是概率分布

美高梅59599 9

期望

2.方差和标准差——度量一些特定数值的概率的分散情况的方法

方差越高,表示你的整体收益变化越大,整体的赢钱数额更不可预期,整体收益的可靠性越低。方差越小,每一局的平均收益就越接近期望值。

美高梅59599 10

方差

3.线性变换
如果成本+1,奖赏变为5倍,期望和方差成线性变化

美高梅59599 11

线性变换

4.独立观测的期望和方差

美高梅59599 12

独立观测

缺点:

排列与组合
  1. 排位方式

美高梅59599 13

image.png

2.按类型排序

美高梅59599 14

image.png

3.排列
从N个对象中取出R个对象进行排序,并得出排序方式总数目

美高梅59599 15

排列

4.组合
从N个对象中选取r 个对象,不必知道所选对象的确切顺序

美高梅59599 16

组合

有少许印刷错误

几何分布、二项分布、泊松分布
  1. 概率的几何分布
    几何分布的应用条件:进行多次互相独立的试验,每一次试验都存在失败或成功的可能性。

美高梅59599 17

几何分布

美高梅59599 18

需要试验r次以上

美高梅59599 19

需要试验r次或不到r次

美高梅59599 20

期望值

美高梅59599 21

方差

2.二项分布
二项分布使用的条件:进行一系列独立试验,每一次试验成功的概率都相同,且试验次数有限。

美高梅59599 22

二项分布

美高梅59599 23

image.png

美高梅59599 24

期望值

美高梅59599 25

方差

3.泊松分布
使用条件
在遇到独立事件时,若已知 r
且你感兴趣的是一个特定时间区间内的发生次数,使用泊松分布
描述了事件在特定区间内的发生次数
在特定条件下可以用来近似代替二项分布

美高梅59599 26

泊松分布

美高梅59599 27

期望与方差

美高梅59599 28

代替二项分布

《深入浅出统计学》读后感:期望,均值,方差~好吧我撕开了读的

正态分布的应用
  1. 对于离散概率分布来说,我们关心的是取得一个特定数值的概率;而对于连续概率分布来说,我们关心的是取得一个特定范围的概率

2.概率密度函数的总面积必须是1
3.正态分布函数

美高梅59599 29

image.png

4.概率密度计算的方法:

  • 确定分布和范围(计算标准差和方差)
  • 使其标准化

美高梅59599 30

标准化

  • 美高梅59599,查找范围

吞不太认同这种毁书的阅读方式,可这个厚度真不合适地铁,撕开后还是很有成果的,新问题是如何装订回去?

超级正态
  1. 知道x和y 的概率分布,就能算出x+y的概率分布

美高梅59599 31

x+y的概率分布

美高梅59599 32

x+y的均值

美高梅59599 33

x+y的方差

2.x属于正态分布,ax+b属于整天分布,则ax+b的概率分布

美高梅59599 34

image.png

3.如果X1, X2, ….Xn为X的独立观测结果,且X符合正态分布,则:

美高梅59599 35

独立观测的期望值

4.正态分布代替二项分布

美高梅59599 36

image.png

如果用正态分布近似代替二项分布,则需要进行连续性修正,这样才能得到较为准确的结果。因为二项分布是离散型而正态分布是连续型

  • 计算p(x>=a)时,离散数字x是a-0.5
  • 计算p(x<=a)时。离散数字x是a+0.5

5.正态分布代替泊松分布

美高梅59599 37

image.png

用正态分布近似代替泊松分布,要进行连续型修正
6.总结

美高梅59599 38

image.png

正题:均值是发生了的期望的话,方差计算的一致性就可以解释了,现在再开始几何分布的期望速算方式就好理解点儿了,这次是要feel几何分布的方式不是推理

抽取样本

1.样本

  • 无偏样本
  • 偏倚样本
  • 抽样空间中条目补全
  • 抽样单位不正确
  • 抽样单位未出现在实际样本中
  • 样本缺乏随机性

2.如何选择样本

  • 简单随机抽样
  • 分成抽样
  • 整群抽样
  • 系统抽样
  • 重复抽样
  • 不重复抽样

《深入浅出统计学》读后感:苏格拉底助产术之统计入门

总体和样本的估计

1.均值

  • 总体均值:
![](https://upload-images.jianshu.io/upload_images/3225209-001dfdf01be23e01.png)

总体均值
  • 样本均值

美高梅59599 39

样本均值

  • 点估计量:根据样本数据得出的对你所认为的总体均值的最佳猜测值

美高梅59599 40

点估计量

2.总体方差:比样本方差偏大

美高梅59599 41

总体方差

3.预测总体比例:比例算法用于解决二项分布问题

美高梅59599 42

总体成功比例的点估计量

美高梅59599 43

样本成功比例

4.抽样分布的概率

  • 例如:Z个球,红球的比例为40%, 现在取出100个球,
    里面有40个红球的概率
  • 随机变量X代替样本中红球的个数,则样本中红球的比例为Ps =
    X/n,n为取出的球数
  • 每个样本中,红色球的数量符合B(n,p), 成功比例为Ps=X/n
  • 期望:
![](https://upload-images.jianshu.io/upload_images/3225209-705886f41e52e9b5.png)

期望

美高梅59599 44

image.png

  • 方差:

美高梅59599 45

image.png

美高梅59599 46

image.png

  • 比例标准误差:

美高梅59599 47

image.png

n越大,比例标准误差越小

美高梅59599 48

image.png

  • 连续性修正

美高梅59599 49

image.png

5.中心极限定理:如果从一个非正态总体X中取出一个样本,且样本很大,则抽取n个样品的分布也近似为正态分布

美高梅59599 50

image.png

美高梅59599 51

image.png

  • 中心极限定理的作用
    对于二项分布,总体均值为np,方差为npq, 如果带入抽样分布,则
![](https://upload-images.jianshu.io/upload_images/3225209-e1400b12c726c791.png)

image.png



对于泊松分布,均值和方差都为r,则得:



![](https://upload-images.jianshu.io/upload_images/3225209-be8bd2385025646a.png)

image.png

这是一本非常适合入门的统计书:

置信区间的构建

1.求解置信区间步骤

  • 选择总体统计量
  • 求出其抽样分布
  • 决定置信水平
  • 求出置信上下限

2.置信区间计算的简单算法

美高梅59599 52

image.png

3.置信区间简明算法——t分布
当n很小时,t分布给出的置信区间比正态分布的置信区间更宽,着使它更适合小样本

美高梅59599 53

image.png

《漫话统计学》
我们调查一件事,调查总体与样本

数据分为
不可测量的数据——分类数据(因人而异)

可测量的数据——数值数据 ( 有具体可衡量的数值)

组、组中值、次数、相对次数、次数分布表、直方图、变量、组距、组中值

算数平均数、arithmetic mean 几何平均数、 geometric mean
调和平均数harmonic mean

中位数median

标准差 :表示一组数据“平均离散程度”的指标 standard Deviation

描述统计学和推断统计学
第三章:掌握数据整体的状态

将问卷调查转变成次数分布表
第四章:标准计分和离差

离差;Deviation Score

标准差: Standard deviation

标准化: Standardization

标准计分:standard score (数据-平均数)/标注差
第五章:求机率

机率密度函数:Probability Density Function 简称:pdf
正态分布函数
以平均值为中心呈左右对称

受到平均值和标准差的影响

面积=比例=机率

标准正态分布表记录对应横轴的可读之机率的表

卡方分布
卡方分布表则记录对应机率之横轴刻度的表 x^2

t分布

f分布

excel 中的分布与对应的函数

美高梅59599 54

双变量的相关分析

美高梅59599 55

相关系数 :correlation coefficient

共变异数:covariance

变异数:variance

相关比:correlation Ratio
数值数据和分类数据是用“相关比” 其值 介于0和1之间

克莱姆相关系数 (独立系数)
分类数据和分类数据之间的相关程度,介于0和1之间
第八章:深入理解独立性检验 (卡方检验)

美高梅59599 56

20170527154429.png

P值和“检验”的顺序

独立性检验和齐性检验

1.内容轻重得当,可高效窥见统计学全貌:

可视化;

度量集中与分散;

概率计算、描述与预测;

用样本预估总体(抽样分布、点估计量、置信区间)、以及进行假设检验;

多变量之间的独立性、相关性、线性回归、非线性回归。

2.叙事方式采用苏格拉底助产术,引导读者思考得出结论,学习效果好。

TW,head first 系列的叙事风格非常值得学习,尤其在这轮内容消费的浪潮下。

《深入浅出统计学》读后感:有趣且清晰的入门书目

本科时上过统计和测量的课,还有spss,stata这些课程,考研时专业课里也有教育统计,但我觉得到看这本书之前都没有学明白统计的一些基本概念。之前的学习方式都是从干巴巴的概念入手,加以枯燥的题目训练,本科的时候不知道学这些有什么用,后来也是想起来头就痛。

这本书非常适合像我这样文科背景数学小白的学生来作为入门的自学教材,相见恨晚啊。书看起来很厚,专心读的话很快就可以读完。我重点看的是后半部分,跟国内的统计教材一个很大的不同是排版比较愉快友好,虽然人像的插图有点突兀==
另外很重要是基本都是以情景例子引入,然后提问,这才符合人类的学习规律好嘛,要是大学老师也这样教我早该学会了啊==
然后还会有问题的系统的思路和解法,最后还会有小结。不过觉得还是自备笔记本边看边总结好。

不足的地方觉得主要是内容还是比较浅的,不过对于基础又重要的概念理解和入门应当是足够了的。要去继续发现好教材啦~

《深入浅出统计学》读后感:深入浅出统计学

样章试读请到下面的链接下载:

目录 http://goo.gl/tlCLf

序言 http://goo.gl/65x6e

第一章 http://goo.gl/WTnC9

第二章 http://goo.gl/5WUhT

若下载遇到问题,请邮件联系:[email protected]。谢谢!

《深入浅出统计学》具有深入浅出系列的一贯特色,提供最符合直觉的理解方式,让统计理论的学习既有趣又自然。从应对考试到解决实际问题,无论你是学生还是数据分析师,都能从中受益。本书涵盖的知识点包括:信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区
间的构建、假设检验、卡方分布、相关与回归等等,完整涵盖AP
考试范围。本书运用充满互动性的真实世界情节,教给你有关这门学科的所有基础,为这个枯燥的领域带来鲜活的乐趣,不仅让你充分掌握统计学的要义,更会告诉你如何将统计理论应用到日常生活中。

《深入浅出统计学》读后感:非常适合入门

前面有一位豆友说这本书非常不适合入门,从我个人感觉,还是一本比较漂亮的入门书。在数据分析那本书的书评里面,我提到两点,一个是简单易懂,一个是系统全面。至少第一点是比较符合的,第二点也差强人意吧。

这本书的前半部分,一直到第7章吧,对于学过概率的人来说,基本上意义不大。不过对于一些概念,有了重新和深入的理解,比如均值和平均数的差异,贝叶斯方法用条件概率树来解释确实一目了然,容易理解。

真正收获比较大的是第二部分,虽然里面提到的各种分布:几何、二项、泊松、正态,以及抽样统计、置信区间,假设检验等各个概念前几天看别的统计学书的时候也看过,也大概知道怎么算(虽然基本都用SPSS算的),但是个人通过这本书里面的动动脑、动动笔里面的内容一路根着做下来,对于统计这个事情本身有一个比较全面系统的理解。

书的主要内容,目录体现得很明显了。我个人理解的统计这个事情主要有以下几点:

1
我们对于世界和事物是难以看到本质的。(透过现象看到本质只是一种美好的愿望)

2
在信息无法全面掌握的情况下,我们可以根据获得的部分数据来猜测事情背后的原因。

3
一般来说,对于大量的总体数据,可能遵守二项、泊松、正态等分布,在遵守这些分布的情况下,我们可以计算一些概率或者事情的可能。

4
那么对于猜测的规律是不是靠谱,或者我们作出的结论是否可行,可以采用假设检验来一定程度上进行检验。

5 除了单变量的以外,我们还可以关注多个数据间的关系。

6 非线性关系以及更多。

admin

网站地图xml地图