返回信息流就拿第一章线性模型来说
比如下面这一段话
However, coefficient estimates for Ordinary Least Squares rely on the independence of the model terms. When terms are correlated and the columns of the design matrix X have an approximate linear dependence, the design matrix becomes close to singular and as a result, the least-squares estimate becomes highly sensitive to random errors in the observed response, producing a large variance. This situation of multicollinearity can arise, for example, when data are collected without an experimental design.
基本看不懂在讲什么??
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #26951同步于 2017/11/23
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
为什么看sklearn的官网那么晦涩难懂?
chhaapspey
2017/11/23镜像同步11 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
说的是用最小二乘的时候,模型项(自变量)之间需要是独立的。如果自变量间是相关的话,X矩阵的列向量将会相互依赖,X变成奇异矩阵。此时,最小二乘会对随机误差非常敏感。这就是情形叫多重共线性。
举个例子,假如你要做收入跟智商、学历之间的回归。因为智商跟学历是相关的,你要回归出来的系数会非常敏感,依赖于随机误差。
可以看看《Deep Learning》的第一部分。实在不行就从头学学线性代数、概率论和数理统计等等。。
【 在 gurity 的大作中提到: 】
: 大神 补基础有什么好书看嘛
: