详情

教育大数据背景下基于广西高校学生“行为画像”的精准资助模型探究

申报人:张韵 申报日期:2024-05-30

基本情况

2024年批次
教育大数据背景下基于广西高校学生“行为画像”的精准资助模型探究 学生申报
创新训练项目
教育学
教育学类
学生来源于教师科研项目选题
一年期
本项目以广西区高校教育精准扶贫工作为背景,通过挖掘学生在校期间的生活消费、学业发展、勤工助学等行为数据刻画高校学生的行为画像,抽取家庭经济困难生的特征数据,基于深度神经网络算法构建高校精准资助模型,为广西高校资助育人工作提供现代化工作模式,为家庭经济困难的学生提供全方位、多渠道、立体化的资助模式提供保障。

        作为团队主要成员参与2023年大学生创新训练项目、北控水务杯第六届中国国际“互联网+“生态环境创新创业大赛、广西“第二届大学生环保科普创意”大赛和2024年创新创业金种子培育项目等学科竞赛。

    主持参与厅级课题1项,作为负责人主持校级课题3项,参与校级课题1项,其中,重点课题1项,公开发表学术论文3篇,获专利授权1项。

       指导老师自工作以来一直从事学生资助工作,对学生资助工作有着较为深入的了解,也做了大量的研究工作,有着较为扎实的理论基础和丰富的工作经验。课题负责人熟悉国家各项资助政策及体系,对高校资助效果有一定见解,并且对相关大数据的分析技术有着较深的掌握,有着利用大数据建立分类模型的能力。同时,能够获得资助工作及学生受助效果的一手资料,对学生资助工作有着全面的了解和深刻的思考,具备一定的科研能力。

校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
张韵 环境科学与工程学院 水文与水资源工程 2022 统筹协调
陈逸飞 环境科学与工程学院 地下水科学与工程(创新班) 2023 数据分析
林琳 环境科学与工程学院 水文与水资源工程 2023 内容排版
马翠翠 环境科学与工程学院 环境工程(实验班) 2023 数据搜集
江亚涛 环境科学与工程学院 给排水科学与工程 2022 模型构建

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
董翼 环境科学与工程学院

立项依据

      大数据背景下,信息化被广泛应用到我国各个领域建设中,进一步加快了高校管理现代化。随着教育大数据作用逐渐凸显和智慧校园日趋成熟,数据驱动的创新素养培育模式逐渐得到应用,以大数据技术为基础的“用户画像”为学生培育提供了新思路和新方法。本项目依托大数据技术和智慧校园平台,通过数据分析和挖掘技术,整合教育领域的各类数据资源,将学生的行为标签化,提供总结性描述,形成学生“行为画像”,从而更加深入地了解学生的行为和需求,为学生提供个性化服务和精准的教学管理。为高校提供科学准确的教育管理模式,以推动人才培养模式变革,提高教育管理决策水平,助力教育减负增效,促进教育公平并提升教育质量。

       本项目以高校学生行为数据为研究对象,探索以各类行为数据构建学生“行为画像”的路径。重点包括学生数据汇总与筛选,从多元的数据库中筛选初可用于参与构建学生“行为画像”的数据;数据的分析与建模,对提取到的各类数据进行特征处理,模式识别等处理,以拟合出不同学生的特征和行为模式,完成构建“行为画像”;模型的应用和监测,基于学生“行为画像”,制定相关资助方案与试行各项资助策略,同时持续对“行为画像”模型拟合度与可行性进行监测与评估,进行持续优化改进。主要研究内容如下:

(1) 数字化时代高校学生资助工作研究现状

(2) 教育大数据背景下高校学生行为画像的精准资助模型构建

(3) 学生行为画像在精准资助中的应用意义

国外研究:目前,发达国家利用学生“行为画像”对高校学生进行资助的研究与实践相对较早,理论体系也更为完善,尤其在家庭经济困难学生识别、困难程度的分级以及精准资助等领域有着许多借鉴之处。如美国高校常通过学生“行为画像”为学生本人量身定做“资助包”(邓兰君2022),联邦、州政府资助办把每个申请资助学生的申请材料汇总,通过采集系统提交各个高校,高校根据政府的反馈信息,为每个学生建立一个资助数据档案,并提供多种助学金、贷款以及勤工助学项目,让学生根据自己的实际情况进行选择。英国高等学校(Ariane de Gayardon2020)对包含学生贷款类型、学生家庭、个人消费情况等进行分析来获取每个学生的家庭收入、家庭财富指标(房屋所有权,私立教育,不在贫困地区生活,社会阶层)、父母教育、种族等相关信息,以更好地对困难学生进行资助。从日本高校来看,其资助工作凭借分析在校生与寄宿生之间的支出的相对差异性、学生费用支出类型、学生获取学费渠道信息,来对处境不利的学生给予及时援助(岛一则,2019)。

国内研究:相比于发达国家,国内学生“行为画像”技术起步较晚,从2005年开始,用户画像技术才逐渐发展起来,但仅限于在商业领域应用,在高校中的运用屈指可数。目前我国仅北京邮电大学、北京交通大学、华东大学、电子科技大学等少部分高校将学生“行为画像”技术应用于学生资助工作领域(黄山,2019)。如北京邮电大学高校学生行为分析主要实现了对于学校业务系统产生的异构数据的储存,将校园内部的结构化和非结构化数据存储在统一的大数据处理平台上(Zhang H2015Raghupathi W2014),实现对家困生的分析挖掘。苏州大学在对学生行为数据使用过程中,通过K-means聚类分析挖掘算法实现了对学生数据进行不同维度的聚类分析,同时将学生数据中的学业数据、奖学金数据、贫困生数据及竞赛数据综合到一起,建立数据挖掘模型,对学生进行多维度的分析(Chen X W2014)。北京交通大学对于学生数据的处理方面,则关注学生的学习和生活数据,将数据挖掘、数据分析及数据仓库三种技术结合到一起,进行深入的研究,构建数据分析的模型,建立基于数据的决策支撑系统(Aiyer A2011)。可以看出,在大数据背景下依托学生“行为画像”,做到真正以学生实际情况为依据进行帮扶的资助体系,能有效提高精准资助水平,充分发挥出资助育人成效。


创新点:

1)将大数据视域下的大学生行为画像分析模型引入到高校精准资助工作中;

2)创新贫困大学生行为画像的构建:包括基础数据集选择、多源异构数据预处理、画像标签的设计和行为画像构建;

3)选取有效适用的机器学习模型和算法进行多标签多特征映射学习,建立高校精准资助预测模型。

短期上,基于大数据的学生“行为画像”模型可以简化资助工作程序,科技赋能可以极大提高政策执行效率;根本上,基于大数据的学生“行为画像”模型可以成为广西资助育人实践困境突破的转型路向。

项目特色:

1)将数据挖掘技术引入到资助工作,优化精准资助工作体系,提高资助工作的精准性;

2)基于深度神经网络算法构建高校精准资助模型,为广西高校资助育人工作提供现代化工作模式。

技术路线:

               summernote-img

 

 

1 教育大数据背景下基于广西高校学生“行为画像”的精准资助的一般过程

 

本项目以大数据为驱动,构建“学生信息量化数据模型”,基本思路如下:

1)有效整合涵盖学生的校园大数据。通过对高校学生的学业数据、消费数据、勤工数据、门禁数据、上网数据和生活数据等学生行为特征数据进行清洗、抓取和标签化后,利用数据挖掘技术和算法优化来描绘高校学生在学业生活中的行为模式和生活习惯。

2)数据分析和归类。预处理多源异构数据,进行贫困学生画像标签设计和行为画像构建,生成大学生的个体行为画像。

3)建立学生之间和资助之间的相似性度量。通过多特征多标签映射学习得到精准资助预测模型,确定资助对象和资助策略,增强资助工作的精确性。

4)通过学生反馈情况对资助形式和内容进行参数优化和调整,提升优化资助策略。

本项目通过探索构建集精准资助、科学辅助决策与智能模型服务于一体的高校数据治理与分析新模式,着力解决数据碎片化、不一致、不规范等问题,为广西高校资助工作提供科学数据支撑与有效决策依据。

拟解决的问题:

1)帮助资助管理部门客观了解学生的真实需求。通过大数据分析,高效地融合高校大学生的学习生活、日常行为、服务需求等信息,直观地反映出大学四年来受资助学生的成长轨迹,并从分析结果中总结得出一些相关性的结论和关联规则,发现学生行为数据背后隐藏的行为规律和特征。

2)为学校资助管理决策提供科学依据。通过收集家庭经济困难学生在校内产生的所有数据资源,如学生个人信息、特长爱好、性格特征,甚至包括社交、日志信息等各种信息资源,构建学生行为画像,充分利用数据库优势对各类数据源的定位和连接,实现数据的采集、传输和汇聚,为高校资助工作提供科学数据支撑与有效决策依据。

3)推动广西高校资助工作与教育工作科学接轨。促进高校资助从保障性资助向发展性资助转型,建立一个多维度、客观、动态的学生“行为画像”系统,精准识别家庭经济困难学生,形成困难库名单,“点对点”进行帮扶。

4)促进高校学生“量身定制式”教育的开展。在全校范围内,各级学生管理与服务相关部门可以实现数据资源共享。同时,各部门(如勤工助学服务中心、心理健康教育中心、后勤管理中心、就业指导中心等)可以通过“行为画像”系统掌握困难生的特征和类型,有针对性地给予学生更多的关注、引导、扶持。

本项目拟将数据挖掘技术引入到资助工作,以此提升高校管理服务水平,优化精准资助工作体系,提高资助工作的精准性,确保教育公平,优化助学资源配置,靶向实施资助育人政策。

预期成果:

本项目以广西区高校教育精准扶贫工作为背景,利用学生“行为画像”技术进行教育大数据分析,通过模型构建,优化广西高校学生精准资助工作机制,解决当前教育资助工作中存在的精准识别问题,有效确保高校资助工作的及时性与管理决策的科学性。本项目预计取得以下具体成果:

1)精准资助识别模型

构建包含学生个人信息、家庭经济状况、学业成绩等多维度特征的综合评价体系。开发基于机器学习或深度学习的识别模型,实现对潜在受助对象的快速、准确筛选。

2个性化资助方案

结合学生的学习需求、职业规划和家庭经济状况,设计差异化的资助组合,如奖学金、助学金、学费减免等。

制定动态调整机制,根据学生学业进展和家庭经济变化灵活调整资助金额和形式。

3实践指导

编制操作手册和培训材料,指导学校和教师有效实施精准资助策略。

4学术论文与专利申请

在国内外学术期刊发表1-2研究论文,分享精准资助模型的理论框架、实证分析和应用案例。对关键技术和创新点进行专利申请,保护研究成果的知识产权。

20246-7月:准备工作,查阅相关理论文献资料;

20247-8月:制定模型构建计划;

20248-10月:数据整理分析形成报告;

202411-12月:形成初期理论成果;

20251-3月:撰写论文;

20253-5月:完成相关理论成果1-2篇,进行公开发表;

20256月:项目评估和结题。

1)学院目前已初步建立高校学生精准资助的“智慧平台”,处在不断完善,测试阶段。“智慧平台”通过大数据精准识别、资助家庭经济困难生,并对资助工作进行实时动态管理。目前,智慧平台已经成功识别并资助了大量家庭经济贫困生,并收集大量学生行为数据,为构建数字模型提供了数据支持。主要为四个方面:

1)通过精准识别家庭经济困难学生,推进资助对象识别的指标化;

2)运用大数据技术按照家庭经济困难学生个体和地域的区别进行差异化资助,推进资助行为的差异化;

3)通过大数据对资助工作动态管理,推进资助工作的精细化;

4)建立量化评价标准和多元监管体系,推进资助考核科学化。

                                                       summernote-imgsummernote-img

2 大数据工作室立项

                                                    summernote-img summernote-img

                                                    summernote-img  summernote-img

3 精准资助平台

2当前,我国高等教育领域已经积累了大量关于数字化转型的理论研究和实践经验,桂林理工大学经过近几年的信息化建设,内容已经覆盖了网络基础设施、网络安全、数据安全、校园一卡通等学校各个领域,管理信息系统已涉及人事系统,学工系统,教务系统,财务系统,资产系统,统一认证中心,迎新招生,一站式服务大厅,一卡通,图书馆,数据中心,上网认证系统,门禁系统等多个管理信息系统,精准资助方面拥有丰富的案例和数据支撑,提升“行为画像”数据源多源性,项目研究提供了坚实的研究基础。

已具备的条件:

1)项目指导教师自工作以来一直从事学生资助工作,对学生资助工作有着较为深入的了解,也做了大量的研究工作,有着较为扎实的理论基础和丰富的工作经验。项目指导教师熟悉国家各项资助政策及体系,对高校资助效果有一定见解,并且对相关大数据的分析技术有着较深的掌握,有着利用大数据建立分类模型的能力。同时,能够获得资助工作及学生受助效果的一手资料,对学生资助工作有着全面的了解和深刻的思考,具备一定的科研能力。目前,主持参与厅级课题1项,作为负责人主持校级课题3项,参与校级课题1项,其中,重点课题1项,公开发表学术论文3篇,获专利授权1项。指导教师在实际工作中积累了较为扎实和先进的工作理论和实践经验,对教育大数据在学生资助工作中的应用研究工作有着较为深刻的认识和思考,从而为本项目的研究工作奠定了良好的基础。

2)项目团队的成员都是学院资助助理,对资助助理的工作内容、程序和流程等方面有着较清晰的了解,具备处理学生资助事务的能力。本团队成员对本项目研究充满积极与热情,能够充分发挥主观能动性,为本项目研究提供了充足动力。

3)我们的学院拥有大数据工作室,为我们的研究项目提供优越的数据收集、分类和管理环境。通过利用大数据技术和工具,我们可以更加高效地收集学生数据,并对数据进行深入分析,形成全面的学生“行为画像”。

同时本项目依托学校丰富的图书资料、网络资源等有利条件开展理论研究,为项目研究的开展提供可靠有力的数据和理论保证。

尚缺少的条件:

1)高校资助基本上仍采用人工表格采集和整理分析的方式,与资助相关的信息效率较差,而建立困难学生信息库是本项目的前提。

2)此外,数据搜集的全面性和准确性影响着精准资助预测模型的精确度,如何同高校学生工作处、教务处、信息化建设处和财务处等部门获取数据资源支持存在一定困难。

3)大量教育机构和厂商均按照自身标准操作,导致学生“行为画像”概念、定位模糊,其构建、产品产出体系碎片化,如何对学生信息资源进行整合和大数据共享带来了一定难题,阻碍了高校对学生“行为画像”在学生资助工作中的深度运用。

解决办法:

通过挖掘学生在校期间的生活消费、学业发展、勤工助学等行为数据刻画高校学生的行为画像,抽取家庭经济困难生的特征数据,基于深度神经网络算法构建高校精准资助模型,为广西高校资助育人工作提供现代化工作模式,为家庭经济困难的学生提供全方位、多渠道、立体化的资助模式提供保障。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 5000.00 2500.00 2500.00
1. 业务费 4700.00 2350.00 2350.00
(1)计算、分析、测试费 0.00 0.00 0.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 200.00 校外调研 100.00 100.00
(4)文献检索费 0.00 0.00 0.00
(5)论文出版费 4500.00 发表论文版面费用、编审费等 2250.00 2250.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 300.00 问卷印刷、发放和邮寄 150.00 150.00
结束