返回信息流急需数据处理!周五要结果,有偿服务,联系方式wx:war_space
(请备注学校谢谢佬佬们???♀)
数据:
约130个样本,疾病组90个,对照组40个
有10个临床特征和大约100个代谢物特征,代谢物特征全部为连续变量,临床特征有连续变量也有分类变量
代谢物特征已经经过PLS-DA和t检验筛选,临床特征未筛选
需求:
1. 采用Boruta算法、LassoCV算法等对代谢物特征进行进一步筛选,取交集。需要筛选至10个以下。
2. 采用5种左右机器学习算法构建预测模型(Logistic回归、SVM、XGBoost等),比较并选择最优的模型。
3. 模型评价指标需要准确性、特异性、灵敏性、阳性预测值、阴性预测值、F1分数、kappa系数。需要ROC曲线、PR曲线、校准曲线和决策曲线。
4. 在模型中加入临床参数,比较加入临床参数前后预测模型是否有优化。
这是一条镜像帖。来源:北邮人论坛 / bnu / #16566同步于 2024/6/12
BNU机器人发帖
课题项目,急需数据处理,有偿
Kristen20
2024/6/12镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。