通识教育 - 数据素养学习平台

15

12月

通识教育

数据美国

根据地区、行业、职业、教育背景做了初步的分类，可进入任何你想了解的部分。来源网址：https://datausa.io/

15

12月

通识教育

如何进行数组切片

数组切片In:#类似列表操作进行索引和切片data3 = np.array([1,2,3,4,5])print(data3)print(data3[0])print(data3[2:4])print(data3[2:])print(data3[:4])Out:[1 2 3 4 5]1[3 4][3 ...

15

12月

通识教育

如何识别多重共线性？

如果两个自变量之间的相关系数显著地不等于零，这两个自变量就有广义的共线性。如果线性关系的F检验显著但是单个回归系数都不显著，可能是由于多重共线性。如果有单个回归系数显著但是检验不显著，可能是由于多重共线性。如果某些回归系数的正负号与通常的认识相反，可能是由于多重共线性。

15

12月

通识教育

英国开放式数据研究所

网站汇集了各类商业和非商业组织以及围绕特定部门的政府机构来帮助人们识别和处理数据网络。来源网址：https://theodi.org/

15

12月

通识教育

如何创建矩阵

创建矩阵In:#方法一、通过将二维列表传给Numpy来创建矩阵print(np.array([[1,2],[3,4]]))#方法二、传入一个元组来描述矩阵的维度print(np.ones((3,2))) #3行2列矩阵print(np.zeros((3,2))) print(np.random.ra...

15

12月

通识教育

多重共线性

狭义的多重共线性（multicollinearity）：自变量的数据存在线性组合近似地等于零，使得解线性方程组求解回归系数时结果不稳定，回归结果很差。广义的多重共线性：自变量之间存在较强的相关性，这样自变量是联动的，互相之间有替代作用。甚至于斜率项的正负号都因为这种替代作用而可能是错误...

15

12月

通识教育

亚马逊开放数据集

亚马逊提供的各种类型的开放数据集，包括电商交易，比特币交易等来源网址：https://aws.amazon.com/cn/opendata/?wwps-cards.sort-by=item.additionalFields.sortDate&wwps-cards.sort-order=des...

15

12月

通识教育

如何进行矩阵运算

矩阵运算In:#相同大小矩阵的加减乘除data5 = np.array([[1,2],[3,4]])data6 = np.ones((2,2))jia1 = data5 + data6cheng1 = data5 * data6print(jia1,'',cheng1)Out:[[2...

15

12月

通识教育

残差

残差在数理统计中是指实际观察值与估计值（拟合值）之间的差。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话，我们可以将残差看作误差的观测值。它应符合模型的假设条件，且具有误差的一些性质。利用残差所提供的信息，来考察模型假设的合理性及数据的可靠性称为残差分析。有多少对数据，就有多少个残...

15

12月

通识教育

Open Data 500

Open Data 500是首个以开放政府数据来产生新的业务和开发新的产品和服务的综合研究性美国公司。来源网址：http://www.opendata500.com/us/

15

12月

通识教育

矩阵切片和聚合

矩阵切片和聚合In:#可以在不同维度上使用索引操作来对数据进行切片data12 = np.array([[1,2],[3,4],[5,6]])print(data12)print(data12[0,1]) #1行2列数据print(data12[1:3]) #2-3行print(data12[0:2...

15

12月

通识教育

DW检验

DW检验用于检验随机误差项具有一阶自回归形式的序列相关问题，也是就自相关检验。(1)如果0<DW< L D ，则拒绝零假设，扰动项存在一阶正自相关。DW 越接近于0，正自相关性越强。(2)如果L D <DW< U D ，则无法判断是否有自相关。(3)如果U D <DW&...

15

12月

通识教育

Open Data Inception

最完整的超过128个国家的经济数据，能够精确查找GDP, CPI, 进口，出口，外资直接投资，零售，销售等深度数据。来源网址：https://opendatainception.io/

15

12月

通识教育

矩阵转置和重构

矩阵转置和重构In:#NumPy数组的属性T可用于获取矩阵的转置print('转置前：',data12)print('转置后：',data12.T)Out:转置前： [[1 2] [3 4] [5 6]]转置后： [[1 3 5] [2 4 6]]In:#在较为复杂的...

15

12月

通识教育

拟合优度检验

主要是运用判定系数和回归标准差，检验模型对样本观测值的拟合程度。当解释变量为多元时，要使用调整的拟合优度，以解决变量元素增加对拟合优度的影响。假定一个总体可分为r类，现从该总体获得了一个样本——这是一批分类数据，需要我们从这些分类数据中出发，去判断总体各类出现的概率是否与已知的概率相符。譬如要检验一...

15

12月

通识教育

CEIC

最完整的超过128个国家的经济数据，能够精确查找GDP, CPI, 进口，出口，外资直接投资，零售，销售等深度数据。来源网址：https://www.ceicdata.com/zh-hans

15

12月

通识教育

六大类分析方法

要使各种结构化的、非结构化的、海量的数据实现标准化、信息化，能够提供业务绩效评估、业务决策支持等要求，我们首先需要进行数据分析。针对不同数据分析对象所采用的6大类分析方法，每类里面包含各种小方法。常见的六大类分析方法主要包含:分解主体分析、钻取分析、常规比较分析、大型管理模型分析、财务和因子分析、专...

15

12月

通识教育

拟合优度

拟合优度（Goodness of Fit）是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数（亦称确定系数）R²。R²最大值为1。R²的值越接近1，说明回归直线对观测值的拟合程度越好；反之，R²的值越小，说明回归直线对观测值的拟合程度越差。来源：百度百科来源网址：https://baik...

15

12月

通识教育

世界银行数据库

世界银行数据库列出了世界银行数据库的七千多个指标，也可以按照国家、指标、专题和数据目录浏览数据。来源网址：https://data.worldbank.org.cn/?year_high_desc=false

15

12月

通识教育

分解主题分析方法之营销主题

所谓分解主题分析，是指对于不同分析要求，我们可以初步分为营销主题、财务主题、灵活主题等，然后将这些大的主题逐步拆解为不同小的方面来进行分析。1.营销主题针对销售业务的分析，可以分解为客户分析、品类分析、区域分析、消费频率、价值链分析、促销、渠道、经销商、门店分析、同比环比、社交大数据分析、行业市场分...