当前位置:网站首页>【机器学习】实验2布置:基于回归分析的大学综合得分预测
【机器学习】实验2布置:基于回归分析的大学综合得分预测
2022-08-02 06:36:00 【Can__er】
ML_class
学堂在线《机器学习》实验课代码+报告(其中实验1和实验6有配套PPT),授课老师为张敏老师。课程链接:https://www.xuetangx.com/training/ML080910036802/1048372?channel=i.area.page_course_ad。
持续更新中。
所有代码为作者所写,并非最后的“标准答案”,只有课程设计被扣了1分,其余皆是满分。仓库链接:https://github.com/W-caner/ML_class。 此外,欢迎关注我的CSDN:https://blog.csdn.net/Can__er?type=blog。
部分数据集由于过大无法上传,我会在博客中给出下载链接。如果对代码有疑问,有更好的思路等,也非常欢迎在评论区与我交流~
Exp2:基于回归分析的大学综合得分预测
一、案例简介
大学排名是一个非常重要同时也极富挑战性与争议性的问题,一所大学的综合实力涉及科研、师资、学生等方方面面。目前全球有上百家评估机构会评估大学的综合得分进行排序,而这些机构的打分也往往并不一致。在这些评分机构中,世界大学排名中心(Center for World University Rankings,缩写CWUR)以评估教育质量、校友就业、研究成果和引用,而非依赖于调查和大学所提交的数据著称,是非常有影响力的一个。
本任务中我们将根据 CWUR 所提供的世界各地知名大学各方面的排名(师资、科研等),一方面通过数据可视化的方式观察不同大学的特点,另一方面希望构建机器学习模型(线性回归)预测一所大学的综合得分。
二、作业说明
使用来自 Kaggle 的数据,构建「线性回归」模型,根据大学各项指标的排名预测综合得分。
基本要求:
- 按照 8:2 随机划分训练集测试集,用 RMSE 作为评价指标,得到测试集上线性回归模型的 RMSE 值;
- 对线性回归模型的系数进行分析。
扩展要求:
- 对数据进行观察与可视化,展示数据特点;
- 尝试其他的回归模型,对比效果;
- 尝试将离散的地区特征融入线性回归模型,并对结果进行对比。
注意事项:
- 基本输入特征有 8 个:
quality_of_education
,alumni_employment
,quality_of_faculty
,publications
,influence
,citations
,broad_impact
,patents
; - 预测目标为
score
; - 可以使用 sklearn 等第三方库,不要求自己实现线性回归;
- 需要保留所有数据集生成、模型训练测试的代码;
边栏推荐
- PMP新考纲考试内容介绍
- [Dataset][VOC] Eyewear dataset 6000 in VOC format
- .NET静态代码织入——肉夹馍(Rougamo) 发布1.1.0
- 专家见解|经济低迷期把握创新机会的 3 大方法
- Specified URL is not reachable,caused by :‘Read timed out
- .NET Static Code Weaving - Rougamo Release 1.1.0
- 堡垒机、堡垒机的原理
- [Dataset][VOC] Male and female dataset voc format 6188 sheets
- Wuhan 2022 organizing of the high-performance computing added new ecological development of high-performance computing
- 实例030:回文数
猜你喜欢
_2_顺序表
aTrust项目的相关操作与分享
Neo4j 中文开发者月刊 - 202207期
结构体大小计算--结构体内存对齐
2022.07.31(LC_6133_分组的最大数量)
CAT1 4G+Ethernet development board Tencent cloud mobile phone WeChat applet display temperature and delivery control
实验7 MPLS实验
看图就懂|衡量业务增长健康的销售指标如何选择
Kind of weird!Access the destination URL, the host can container but not
How the Internet of Things is changing the efficiency of city operations
随机推荐
数据库概论之MySQL表的增删改查1
“蔚来杯“2022牛客暑期多校训练营5,签到题KBGHFCD
正则表达式的理解学习
Revitalize rural circular economy and digital chain to link agricultural "ecological chain"
【暑期每日一题】洛谷 P1255 数楼梯
love
(笔记整理未完成)【图论】图的遍历
Vscode connect to remote server "Acquiring the lock on the/home / ~ 'problem
HCIP day 3 experiment
Day 4 of HCIP
【云原生】如何快速部署Kubernetes
结构体大小计算--结构体内存对齐
第06章 索引的数据结构【2.索引及调优篇】【MySQL高级】
入门opencv,欢笑快乐每一天
FaceBook社媒营销高效转化技巧分享
aTrust项目的相关操作与分享
数据库概论-MySQL的数据表的基本操作
张驰课堂:六西格玛培训工具——箱线图
实验8 VLAN综合实验
提交代码流程