当前位置:网站首页>【机器学习】实验2布置:基于回归分析的大学综合得分预测
【机器学习】实验2布置:基于回归分析的大学综合得分预测
2022-08-02 06:36:00 【Can__er】
ML_class
学堂在线《机器学习》实验课代码+报告(其中实验1和实验6有配套PPT),授课老师为张敏老师。课程链接:https://www.xuetangx.com/training/ML080910036802/1048372?channel=i.area.page_course_ad。
持续更新中。
所有代码为作者所写,并非最后的“标准答案”,只有课程设计被扣了1分,其余皆是满分。仓库链接:https://github.com/W-caner/ML_class。 此外,欢迎关注我的CSDN:https://blog.csdn.net/Can__er?type=blog。
部分数据集由于过大无法上传,我会在博客中给出下载链接。如果对代码有疑问,有更好的思路等,也非常欢迎在评论区与我交流~
Exp2:基于回归分析的大学综合得分预测
一、案例简介
大学排名是一个非常重要同时也极富挑战性与争议性的问题,一所大学的综合实力涉及科研、师资、学生等方方面面。目前全球有上百家评估机构会评估大学的综合得分进行排序,而这些机构的打分也往往并不一致。在这些评分机构中,世界大学排名中心(Center for World University Rankings,缩写CWUR)以评估教育质量、校友就业、研究成果和引用,而非依赖于调查和大学所提交的数据著称,是非常有影响力的一个。
本任务中我们将根据 CWUR 所提供的世界各地知名大学各方面的排名(师资、科研等),一方面通过数据可视化的方式观察不同大学的特点,另一方面希望构建机器学习模型(线性回归)预测一所大学的综合得分。
二、作业说明
使用来自 Kaggle 的数据,构建「线性回归」模型,根据大学各项指标的排名预测综合得分。
基本要求:
- 按照 8:2 随机划分训练集测试集,用 RMSE 作为评价指标,得到测试集上线性回归模型的 RMSE 值;
- 对线性回归模型的系数进行分析。
扩展要求:
- 对数据进行观察与可视化,展示数据特点;
- 尝试其他的回归模型,对比效果;
- 尝试将离散的地区特征融入线性回归模型,并对结果进行对比。
注意事项:
- 基本输入特征有 8 个:
quality_of_education,alumni_employment,quality_of_faculty,publications,influence,citations,broad_impact,patents; - 预测目标为
score; - 可以使用 sklearn 等第三方库,不要求自己实现线性回归;
- 需要保留所有数据集生成、模型训练测试的代码;
边栏推荐
猜你喜欢
![[数据集][VOC]眼睛佩戴数据集VOC格式6000张](/img/66/37f76d9ce5d5f68d6ea0e18710fa04.png)
[数据集][VOC]眼睛佩戴数据集VOC格式6000张

Clapper that can interact with the audience in real time

The second day HCIP

张驰咨询:企业实施精益管理的最大障碍,只把精益作为一种工具和方法

武汉高性能计算大会2022举办,高性能计算生态发展再添新动力

2022夏暑假每日一题(六)

CAT1 4G+Ethernet development board Tencent cloud mobile phone WeChat applet display temperature and delivery control

结构体大小计算--结构体内存对齐

实例031:字母识词

SphereEx苗立尧:云原生架构下的Database Mesh研发实践
随机推荐
数据库概论之MySQL表的增删改查2
【图像去噪】基于matlab双立方插值和稀疏表示图像去噪【含Matlab源码 2009期】
2022年8月计划,着重ue4视频教程
request.getSession(), the story
解决C#非静态字段、方法或属性“islandnum.Program.getIslandCount(int[][], int, int)”要求对象引用
chrome 插件开发指南
docker 安装mysql
“蔚来杯“2022牛客暑期多校训练营5,签到题KBGHFCD
论文《Deep Multifaceted Transformers for Multi-objective Ranking in Large-Scale E-commerce Recommender》
Ue after video tutorial first
【暑期每日一题】洛谷 P1192 台阶问题
分离轴定理SAT凸多边形精确碰撞检测
C# FileInfo class
CAT1 4G+Ethernet development board Tencent cloud mobile phone WeChat applet display temperature and delivery control
解决:- SPY: No data found for this date range, symbol may be delisted报错
request.getSession(),的故事
How does abaqus quickly import the assembly of other cae files?
技术管理三级跳
实例026:递归求阶乘
(Notes are not completed) [Graph Theory] Traversal of graphs