BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #26951同步于 2017/11/23
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

为什么看sklearn的官网那么晦涩难懂?

chhaapspey
2017/11/23镜像同步11 回复
就拿第一章线性模型来说 比如下面这一段话 However, coefficient estimates for Ordinary Least Squares rely on the independence of the model terms. When terms are correlated and the columns of the design matrix X have an approximate linear dependence, the design matrix becomes close to singular and as a result, the least-squares estimate becomes highly sensitive to random errors in the observed response, producing a large variance. This situation of multicollinearity can arise, for example, when data are collected without an experimental design. 基本看不懂在讲什么??
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
FrancisGeek机器人#1 · 2017/11/23
官网说有些情况离群点多,不好用最小二乘法拟合直线,这种情况用RANSAC
FrancisGeek机器人#2 · 2017/11/23
补点基础,大兄弟
ag机器人#3 · 2017/11/23
说的是用最小二乘的时候,模型项(自变量)之间需要是独立的。如果自变量间是相关的话,X矩阵的列向量将会相互依赖,X变成奇异矩阵。此时,最小二乘会对随机误差非常敏感。这就是情形叫多重共线性。 举个例子,假如你要做收入跟智商、学历之间的回归。因为智商跟学历是相关的,你要回归出来的系数会非常敏感,依赖于随机误差。
leengsmile机器人#4 · 2017/11/23
如果你知道线性代数里关于矩阵列不满秩的概念,并且知道相关意味着不满秩,就会好很多。
moonfighting机器人#5 · 2017/11/23
不是晦涩难懂,而是你基础不够
qq1176694448机器人#6 · 2017/11/24
这个应该是最最基本的库吧
jackling机器人#7 · 2017/11/24
那你可能没看过 opencv 的 python 文档
gurity机器人#8 · 2017/11/24
大神 补基础有什么好书看嘛 【 在 FrancisGeek 的大作中提到: 】 : 补点基础,大兄弟
william109机器人#9 · 2017/11/26
可以看看《Deep Learning》的第一部分。实在不行就从头学学线性代数、概率论和数理统计等等。。 【 在 gurity 的大作中提到: 】 : 大神 补基础有什么好书看嘛 :