详情

遗脉相承·数智非遗

申报人:陈灿瑛 申报日期:2024-05-31

基本情况

2024年批次
遗脉相承·数智非遗 学生申报
创新训练项目
工学
计算机类
学生自主选题
一年期
本项目聚焦于桂林非物质文化遗产资源,是对非物质文化遗产数据进行整合与标准化处理,并利用知识图谱技术进行深度挖掘的研究。通过搭建一个交互式的桂林非物质文化遗产知识平台,将关键信息高度组织化,再利用数字资源融合与可视化技术实现桂林地区非遗文化多元信息的可视化展示,促进桂林非遗的活态传承,提高社会关注度,为非遗保护与传承提供解决方案,并运用现代信息技术助力桂林国际旅游城市建设和旅游文化资源可持续发展。

主持完成厅局级项目卷积神经网络的农作物病虫害图像分类识别方法研究、基于卷积神经网络的农作物病虫害图像检测方法研究。作为主要参与人参与面向肿瘤潜在致病性关联预测的稀疏异构数据核心融合及复杂特征自动学习研究,基于三维码的智AGV动态柔性系统,多维度智慧街面巡防系统研发与应用示范。

在项目实施过程中提供技术和文档撰写指导

区级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
陈灿瑛 计算机科学与工程学院 网络工程 2022 统筹安排各项工作
陈嘉美 计算机科学与工程学院 计算机科学与技术(应用) 2022 调研工作
黄文楠 计算机科学与工程学院 计算机科学与技术(应用) 2022 测试工作
董承鑫 计算机科学与工程学院 计算机科学与技术(应用) 2022 创新开发平台
梁海静 计算机科学与工程学院 计算机科学与技术(应用) 2022 整理资料及介绍

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
王宇 计算机科学与工程学院

立项依据

20232月,中共中央、国务院联合发布了《数字中国建设整体布局规划》提出要推动文化数字化的发展,深入实施国家文化数字化战略,建设国家文化大数据体系,形成独具中国特色的中华文化数据库。文化遗产作为人类文明的重要载体,不仅体现了丰富的历史、文化、科学和艺术内涵,同时也是国家的重要象征。非物质文化遗产(以下简称非遗)是一个国家和民族数千年历史文化的沉淀,更是一笔丰厚的文化财富。目前,我国关于非遗保护面临传统文化与现代技术融合、文化符号提取困难、项目认知度低等一系列问题。

桂林是一座有着丰富历史文化底蕴的城市文化历史悠久、源远流长。而当今时代,越来越多年轻人缺乏对非遗保护普及以及传承的知识,非遗数字化呈现方式尚较为空缺,保护与传承力度尚需继续推进和发展。本项目旨在梳理广西壮族自治区桂林市非物质文化遗产数据,利用现代信息技术赋能地区非遗资源保护和传承,利用数据融合、知识图谱等信息技术,在非遗数据整合、标准化知识图谱构建以及可视化技术展示等方面开展研究通过搭建基于知识图谱的交互式知识平台,提取和传承桂林非遗中的关键文化符号,同时提供非遗资源的详细介绍、历史背景、传承现状等信息,支持个性化查询和推荐。

用户可以利用平台便捷地获取相关的非遗知识和信息,与其他用户进行交流和分享,形成活跃的非遗社区。通过对非遗文化符号的深入挖掘和整理,更好地理解和传播桂林非遗独持的文化价值。后期平台还可以与教育机构、文化机构等合作,通过信息平台的推广和教育活动,将非遗的保护和传承纳入教育体系和社会文化活动中,提高公众对非遗的认知度和参与度,激发人们对本士文化的自豪感和认同感,增强民族文化自信。

该平台不仅可以为研究人员、学者和公众提供一个简单、灵敏准确的数据查询图谱结构,方便人们高效地获取、浏览、体验和研究桂林非物质文化遗产信息。而且有助于推进广西文化教育和少数民族优秀文化保护传承,传承优秀文化基因,保护中华优秀传统民族文化,为桂林非遗的科学化保护和发展提供知识理论依据和技术发展支持,助力地域文化的多样性和可持续发展。

1)桂林地区非遗数据整合与标准化

梳理广西壮族自治区桂林市各类非遗资源(如非遗项目、传承人、技艺特点、传承谱系等信息的整合),通过爬虫技术完成异构数据采集、整理,按照不同类型数据,通过标准化处理形成统一的数据格式,以便于存储、数据清洗、查询与分析。

2)桂林地区非遗知识图谱构建

利用知识图谱技术非遗数据关联和整合,形成语义网络。主要完成从结构化、非结构化或者半结构化的数据中,提炼实体、关系和属性等知识要素,进行形式化表示和储存。通过知识建模、知识表示、知识储存等技术,构建出符合桂林地区非遗数据的知识图谱。

3)桂林地区非遗信息展示与资源融合

提供友好的用户交互界面,搭建知识图谱展示平台方便用户(研究人员、管理人员及公众)能够方便地展示非遗信息。将非遗数据与数字资源进行融合,拟结合百度地图等数字产品,搭建非遗资源的数字资产库和传承弘扬集中展示区,以图形可视化方式全面、系统地展示非遗知识图谱,如非遗的地理分布、技艺特点、传承人信息等内容,直观展现非遗文化的丰富性和多样性,增强用户体验感,易于大众的理解和传播促进非遗的创造性转化和创新型发展。这有助于让非遗文化更好地融入现代社会,让更多人了解和欣赏非遗的独特魅力,吸引人关注和参与非遗的保护、传承和发展,让非遗文化在新时代焕发出新的生机和活力。

随着科技水平的不断提高,数字化越发普及,非物质文化遗产的传承与保护也随之产生新的生存方式新的发展方向。在国内外,对非物质文化遗产进行数字化的储存和保护,已经是一个普遍的现象通过科技手段,对非遗的起源、背景、发展、历史意义等进行科普展示,使人们能够在手机、电脑上与非遗文化进行交互,非遗文化更好地融入到人们的生活中。

国内对此相关研究有MedKGGPT模型,CNN-BiLSTM-Att_CRF模型,数据库与B/S结构相结合的设计开发、前后分离架构、联合分析法、知识图谱嵌入技术、多源知识融合等对数据的采集、展示、实体联系、准确性和完整性、捕捉语义信息等提供了处理方法。但在传播方式知识产权保护力度上,如智能化与个性化传播、社区化与互动化传播、智能化与个性化传播完善法律法规、提高技术保护手段等方面还有较大的发展空间。

国外对此相关研究有Dlemb算法,BioKG2vec算法,PEKGQA模型,MedTKG,多视图语义驱动模型(MvSD),Trans系列模型,图卷积网络(GCN),神经张良网络(NTN)等复杂关系的处理、数据分析、实体对齐、数据异常检测、知识图谱补全等提供了处理方法但在数据质量与精度如数据清洗与整合、关系抽取文化传播上,如跨语言知识图谱、文化敏感性技术和成本挑战上,如可扩展性、实时性、人工成本等方面还有很大进步空间。

1.创新点

1模式创新:通过非遗数字化全方位关联展示模式,打破虚拟数据与现实实体的界限,实现逻辑数据可视化的精彩展示,强化与用户交互体验感、获得感、幸福感,充分感受桂林非遗独特的魅力,为桂林的非物质文化遗产数据搭建一个基于知识图谱的交互型平台,运用现代信息技术实现桂林非物质文化遗的保护和传承。

2技术创新:应用爬虫技术完成数据的采集,如团扇、油茶、桂剧等桂林地区非物质文化遗产,整理搭建非遗数字数据知识图谱展示平台,并利用知识图谱技术完成数据的关联、整合,完成形式化和存储,实现平台功能的区域特色差异化数据采集与处理。

2.项目特色

桂林,以独特的地理位置及桂林山水甲天下的美闻名于世界,独具特色的多种少数民族在此大放光彩桂林在长期的发展与积淀中形成了历史底蕴深厚、文化内涵丰富、技艺精湛及独具民族特色的非物质文化遗产项目项目有助于推动非遗融入日常生活,走进大众视野,增强文化传播力。建设过程中本项目不同用户群体的体验需求,达到人人参与非遗保护共享共建桂林非遗成果,展现桂乡人文之美,让中华优秀传统文化在桂林活态呈现,脉相承。

1.技术路线


利用信息技术赋能平台建设,通过数字化、智能化手段助力桂林非遗数据的知识图谱构建,助力文化的传承和保护,推进非遗领域与数字技术的跨界应用与推广,实现非遗资源数据的构建、智能管理,可以有效增强桂林非遗的生命力和传承力。系统主要实施技术路线如图
所示。

summernote-img

1)研究内容

数据抽取:利用百度百科和相关文献等材料,运用爬虫技术,如爬取结构化数据、使用API接口获取数据、使用爬虫工具抓取数据等收集桂林非遗文化遗产相关数据。

知识抽取:通过属性抽取等技术从现有的桂林非物质文化遗产多源异构数据源中自动抽取信息获得候选知识单元,从各种类型的数据源当中提取出实体属性以及实体间的相互关系,基于此形成本体化的知识表达。如从线上线下收集的广泛信息源当中采集特定的实体属性信息(桂林团扇、油茶、桂剧等的历史、文化、艺术、实用等属性),利用语义、关键字、词频等对文本加以挖掘与处理技术实现非遗属性合理抽取。

知识融合:进行数据整合分析,运用实体消歧等技术消除错误数据碎片产生的矛盾和歧义,利用合并外部知识库或者合并关系数据库的方法进行知识融合。如将整理好的数据文本中抽取到的实体对象,链接到建立的桂林非物质文化遗产数据库中,对应正确的实体对象通过实体消歧,根据当前的语境来准确建立各个非物质文化遗产实体之间的实体链接,可以用聚类法来实现实体消歧,同时解决一些同名实体产生歧义的问题。

知识加工:从原始数据集中提取实体,关系与属性等知识要素,经过数据融合,消除实体指代项与实体对象之间的歧义,得到一系列基本事实表达。如通过实体并列关系相似度计算实体上下位关系抽取本体的生成来对桂林非物质文化遗产的构建以及本体抽取。使用深度学习关系推理技术、基于概率图模型、知识表达算法等技术填充已有知识图谱中的残缺关系,实现知识填充对知识的可信度进行量化,通过舍弃置信度较低的知识来保障知识库的质量。

2.拟解决的问题

结构化数据和半结构化数据的获取采用合适的数据挖掘方法实现直接从文本种挖掘实体属性和属性值之间的关系模式,实现属性名和属性值在文本中的定位。

使用聚类法解决同名实体产生歧义的问题,通过构建模型实现知识加工本体抽取和知识推理。

3.预期成果

搭建基于桂林地区非物质文化遗产数据的可视化知识图谱平台。

撰写基于桂林地区非物质文化遗产数据的可视化知识图谱结题报告。

 


120245-6月,阅读非物质文化遗产保护、知识抽取、融合、加工等方面相关文献,撰写研究方案。

220247月,阅读相关技术文献对前人的研究进行系统梳理。

320248-9月,梳理广西壮族自治区桂林市各类非遗资源,通过爬虫技术完成数据的采集与整理。通过标准化处理将不同类型数据形成统一的数据格式,并进行存储、数据清洗、分析。

4202410-12月,利用知识图谱技术从现有的桂林非物质文化遗产数据源中形成本体化的知识表达并对数据进行处理以达到知识融合,从本体抽取、知识推理等方面来对事实表达进行加工后形成可视化知识图谱界面。

520251-2月,搭建基于桂林地区非物质文化遗产数据的可视化知识图谱平台,优化数据的可视化展示。

620253-4月,整理已有成果,撰写基于桂林地区非物质文化遗产数据的可视化知识图谱结题报告。

1.与本项目有关的研究积累和已取得的成绩

1桂林市有着丰富的非遗文化,具备开展该项目研究的资源基础。我校图书馆藏书近30万册,图书种类齐全、数量充足,且相关研究资料、参考文献丰富,可满足本项研究的需要,为项目研究提供了保障。

2本项目充分调研,梳理相关研究文献,通过知识图谱、数据融合等技术进行对非遗文化信息的处理展现。本项目研究合理,目标内容清晰,实施的可操作性较强,阶段实施过程与目标明确,完成项目的可行性有充分保障。

3指导教师和项目团队前期已经开展了基于知识图谱技术的相关研究工作,有较好的技术基础和工作经验。


1.已具备的条件,尚缺少的条件及解决方法

1已具备的条件

团队成员是计算机类专业大二年级学生,本团队指导老师从事相关研究工作,具备非遗文化与新兴计算机技术相结合的研究背景,具备项目开展所需要的组织能力。通过课程学习及实习经历,团队成员掌握了扎实的专业知识与实际操作技能,具备编码、平台搭建、数据处理等能力。团队成员在专业学习中受训于多元课程及多段实习,有一定的实践经验及拥有良好的创新意识。团队成员熟悉调研方法,掌握查阅文献的方法,具有自学能力,能有效开展项目研究。

2尚缺少的条件:

非遗数据集的采集和梳理和搭建桂林地区非遗数据知识图谱平台,并对非遗数据进行可视化展示。

3解决方法:

利用爬虫技术爬取桂林地区非遗数据,并对异构数据整理和清洗。爬虫、知识图谱、图形可视化展示相关知识的深入学习。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 1000.00 模型构建与实验 1000.00 0.00
1. 业务费 1000.00 1000.00 0.00
(1)计算、分析、测试费 1000.00 模型构建与实验 1000.00 0.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 0.00 0.00 0.00
(4)文献检索费 0.00 0.00 0.00
(5)论文出版费 0.00 0.00 0.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 0.00 0.00 0.00
结束