详情

机器视觉赋能高校图书馆智能化转型研究

申报人:郑焱缤 申报日期:2024-05-28

基本情况

2024年批次
机器视觉赋能高校图书馆智能化转型研究 学生申报
创新训练项目
工学
计算机类
学生自主选题
一年期
随着机器视觉和人工智能技术的迅猛发展,智慧图书馆已经成为现代图书馆发展的重要方向,但在算法优化、大规模数据处理和隐私保护等方面仍存在诸多挑战。本项目旨在探索机器视觉在高校图书馆智慧化转型中的作用,以提升图书馆的资源管理效率、提供个性化服务并优化用户体验,推动图书馆的智慧化发展。 通过深入研究机器视觉技术在图书馆中的应用,本项目希望能够显著提高图书馆的服务质量和运行效率,有效解决人力资源不足的问题,进一步促进图书馆的智慧化进程。

第十二届中软杯全国二等奖

第十二届中软杯南部赛区二等奖

第十一届泰迪杯数据挖掘全国三等奖

蓝桥杯AI办公省三等奖

全国大学生英语竞赛优秀奖

1、发表学术论文4篇:发表了《一种改进的KNN案例推理检索算法》、《公安院校学生警察职业认同调查研究——以广西警察学院为例》、《我国公共图书馆员的职业认同》、《基于案例推理的时间限制进食治疗肥胖方法研究》等文章。

2、专利5项:《一种基于区块链智能合约的线上快速身份认证系统及方法》、《一种基于人工智能和区块链技术EOS.IODPOS分叉预测模型方法》、《一种基于藏经典文献中多样性字体的计算机表达方法》等。

3、主持参与课题4项:《新时代背景下计算机应用技术专业工学一体技能人才培养研究》、《基于 1+X 证书制度的校企联动教学模式校本课程设计与实践研究》、《学生食堂安全管理及食品安全信息化平台建设》等。

本项目得到指导老师的积极支持和关注。指导老师对项目的研究目标、方法论和预期成果给予了充分的认可,并提供了必要的指导和建议。指导老师在项目立项阶段就参与了讨论和制定研究计划,为研究方向的选择和方法的确定提供了重要的指导意见。在项目实施过程中,指导老师将会给予及时的指导和反馈,对研究中遇到的问题提供解决方案,并提供必要的资源支持,如实验设备、数据等。指导老师还会定期组织讨论会和进展报告,促进团队成员之间的交流和合作,确保项目进展顺利,为项目的成功实施奠定坚实的基础。

校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
郑焱缤 南宁分校 计算机工程与技术 2022 理论研究、软件设计
朱树杰 南宁分校 计算机工程与技术 2022 理论研究、实践分析
万以勒 南宁分校 计算机工程与技术 2022 数据收集、实践分析
杨勇智 南宁分校 计算机工程与技术 2023 理论研究、实践分析
乔萱 南宁分校 计算机工程与技术 2022 理论研究、硬件设计

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
廖江福 南宁分校
江华 南宁分校

立项依据

1、探索机器视觉在高校图书馆智慧化转型中的赋能作用,以提升图书馆的资源管理效率,提供个性化的服务和优化用户体验;

2、围绕基于视觉的图书馆导航、图书盘点、上架、采编加工等某一领域的机器人或设施设备开展研究;

3、通过研究机器视觉在图书馆相关领域的应用,探索图书馆智慧化转型的理论机制和实践路径。

1、收集、标注图书馆相关领域的图像数据集;

2、开发和改进图书馆领域相关的机器视觉算法;

3、针对图书馆导航、图书盘点、上架、采编加工等某一领域的机器人或设施设备展开研究,结合实际需求设计技术方案、图纸等;

4、探索机器视觉赋能高校图书馆智慧化转型的理论机制和实践路径。

   随着机器视觉、人工智能等技术的快速发展,使得智慧城市、智慧校园、智慧图书馆得到了快速发展和完善。芬兰奥卢大学图书馆学者Aittola2003年首次提出了智慧图书馆的概念[1],将其定义为一系列不受空间限制、可感知的移动图书馆。国内对智慧图书馆的研究始于2010年,华侨大学图书馆学者严栋发表论文《基于物联网的智慧图书馆》[2]。近年来,很多专家学者将机器视觉技术应用到图书识别[3,4]、页面检索[5]、书脊分割[6, 7, 8]、自主导航机器人[9],在推动图书馆智慧化转型中起到重要作用。    目前机器视觉在推动图书馆智慧化转型上取得了很多成果,但在算法的准确性和稳定性仍需要进一步提高,以保证在复杂的图书馆环境中的有效应用;图书馆中的图书、读者和设备等信息量庞大,这对机器视觉技术的大规模数据处理提出了挑战。如何高效地处理和分析大量的图像数据,以实现快速准确的图书识别和信息检索仍然需要深入研究。基于视觉的导航、盘点和上架机器人对于复杂多变的图书馆环境适应性还不够强,对于图书辨识算法在复杂图书封面、变形、污损、光线变化等情况下的识别率还有提升的空间,操作灵活性和自适应性需要提升,便于适应不同尺寸、形状和摆放方式的图书。此外,在应用机器视觉技术的过程中,隐私和安全问题是一个重要考虑因素[10]。例如,人脸识别技术的应用可能引发个人隐私泄露和数据安全风险。因此,需要在技术应用过程中充分考虑隐私保护和数据安全等问题。

 

参考文献:

[1] Aittola M , Ryhnen T , Ojala T .SmartLibrary – Location-Aware Mobile Library Service[J].Springer Berlin Heidelberg, 2003.

[2] 严栋.基于物联网的智慧图书馆[J].图书馆学刊,2010,32(07):8-10.

[3] 刘玉杰,李伟.基于自动定位分割的图书识别框架[J].计算机辅助设计与图形学学报,2012,24(11):1464-1470.

[4] 刘铭,杨雨航,邹松霖等.增强边缘检测图像算法在多书识别中的应用[J].吉林大学学报(工学版),2022,52(04):891-896.

[5] 刘乐元,赵毅,陈靓影.基于卷积神经网络的图书页面检索方法[J].华中科技大学学报(自然科学版),2017,45(11):22-28+67.

[6] 姬晓飞,张可心,唐李荣.改进Deeplab v3 plus网络的图书书脊分割算法[J/OL].计算机应用,1-7.

[7] 曾文雯,杨阳,钟小品.基于改进Mask R-CNN的在架图书书脊图像实例分割方法[J].计算机应用研究,2021,38(11):3456-3459+3505.

[8] 曾文雯,杨  阳,钟小品.一种用于在架图书书脊语义分割的山字形网络[J].图像与信号处理, 2020, 9(4):8.

[9] 姜微,熊茂华,马玮鸿等. 一种基于视觉检测的自主导航图书馆机器人用底盘[P]. 广东省:CN215793165U,2022-02-11.

[10] A D J , B D S .Measuring the smartness of a library[J].Library & Information Science Research, 42(3).

 

1、将机器视觉技术与高校图书馆智慧化转型相结合,探索图书馆资源管理、服务创新等方面的应用。通过引入机器视觉技术,提供独特的解决方案,以适应图书馆转型过程中的需求。

2、致力于利用机器视觉技术实现个性化服务,通过读者身份识别、自助借还、图书快速查找等技术,为读者提供便捷的服务体验。通过智能推荐等方式,满足读者的个性化需求,提升用户体验和满意度。

3、强化图书馆资源管理效率:通过机器视觉技术对图书馆资源进行快速识别、分类和定位,实现图书馆资源管理的自动化和智能化。这将大大提高资源管理的效率,减少人工操作的时间和成本,从而为图书馆管理人员提供更多的时间和精力进行其他重要工作。

通过以上创新点的实现,该项目有望为高校图书馆提供先进的技术支持,推动图书馆智慧化转型,全面提升图书馆的服务水平和效率。

1、技术路线

数据准备:采集、整理和标注图书数据集。

算法研究:基于深度学习和计算机视觉技术,进行图书辨识算法的研究与优化。

图像处理与特征提取:利用图像增强、降噪和特征提取等技术,提高图像数据质量,增强算法对图书的识别能力。

技术方案设计:基于机器视觉算法,设计和开发具备适应性和灵活性的图书采编、上架、分拣或盘点等方面的技术方案。

2、拟解决的问题

使用机器视觉算法促进高校图书馆智慧化转型,解决高校图书馆信息资源管理效率低、个性化服务差、用户体验差等问题;围绕基于视觉的图书馆导航、图书盘点、上架、采购加工等某一领域的机器人或设施设备开展研究,解决图书馆人力成本和效率的问题,为学生提供更便捷的服务;通过研究机器视觉在图书馆相关领域的应用,解决图书馆智慧化转型的理论机制和实践路径的探索问题。

3、预期成果

1)优化改进的图书识别相关的算法、技术方案、源代码等;

2)发表相关论文一篇;

3)撰写研究报告一份;

4)申请软著一项;

 

第一阶段(2024.06-2024.07):调研高校图书馆在图书采编加工、上架、分拣、盘点等方面的现状、痛点和难点,撰写调研报告;

第二阶段(2024.08-2024.09):进行图书数据集的收集和处理,建立初始的数据集;

第三阶段(2024.10-2024.12):开展图书辨识算法优化和研究,通过模型训练和调优提高算法准确性;

第四阶段(2025.01-2025.03):研究图像处理与特征提取技术,提高图像数据质量和算法对图书的识别能力;

第五阶段(2025.04-2026.05):设计和开发具备适应性和灵活性的图书采编、上架、分拣或盘点等方面的技术方案,撰写研究总结报告。

1、与本项目有关的研究积累和已取得的成绩

前期工作基础

1)项目组前期已对机器视觉技术在图书馆环境中的应用潜力和可行性展开研究和探索;

2)收集和整理了相关的文献和研究成果,了解目前已有的机器视觉算法和技术,以及它们在图书识别、盘点和上架等方面的应用;

3)基于YOLOv8算法和Python编程环境搭建了基础的图书书脊实例分割测试环境。

4)项目组已通过网络收集到一些图书书脊的数据集,以供进行机器视觉算法的训练和测试。

已取得的成绩

论文:

1)何美洁,吴立霞,廖江福.公安院校学生警察职业认同调查研究——以广西警察学院为例[J].西部学刊,2023,No.186(09):137-143.

2)孙宝贵,车文刚,廖江福.一种改进的KNN案例推理检索算法[J].计算机工程与科学,2021,43(12):2263-2271.

3)朱倩倩,车文刚,苗晗,廖江福.藏经典文献中多样性字体计算机表达的方法研究[J].信息技术,2020,44(05):145-149.

专利:

1)廖江福,陈佳,何首武,谭鸿健,何美洁,彭纬婷,朱倩倩.一种基于区块链智能合约的线上快速身份认证系统及方法:广西壮族自治区,CN116418560A[P].2023-07-11

2)朱倩倩,车文刚,苗晗,廖江福.一种基于藏经典文献中多样性字体的计算机表达方法:云南省,CN111274762A[P].2020-06-12

3)苗晗,车文刚,朱倩倩,廖江福.一种基于正态分布的藏文雕刻字体多样性表达方法:云南省,CN111274763A[P].2020-06-12

4)廖江福,车文刚,任晓峰,俞勇,朱倩倩,苗晗.一种基于人工智能和区块链技术EOS.IODPOS分叉预测模型方法:云南省,CN110766338A[P].2020-02-07

5)朱倩倩,车文刚,苗晗,廖江福.一种基于加权随机分布模型的藏文字体多样性表达方法:云南省,CN110728273A[P].2020-01-24


已具备的条件

1)学校图书资料丰富。课题负责人所在学校图书馆资料相当丰富,现有馆藏纸质图书、电子图书、数据库多种,形成了涵盖哲、经、法、文、理、工等学科门类相结合的多科性、多层次、多载体且特色明显,能有效支撑科学研究和人才培养的藏书体系。

2)软硬件设备齐全。负责人所在学院大数据中心研究室现有面积200平方米,配备有相应的计算机、网路、服务器等设备,可以开展相应的科学研究,为本项目的设立实施提供了必要条件。

3) 桂林理工大学南宁分校计算机应用学院拥有一批理论水平高、学术造诣深、实践经验丰富的师资力量。系里有优秀的学术团队,包括软件技术学术团队、大数据技术学术团队、网络学术团队及数据库学术团队,具有较好的科研平台及团队。

尚缺少的条件及解决方法

需进一步收集图书馆环境的图像和视频数据,涵盖不同图书封面、形状、摆放方式以及污损等情况,以用于算法的鲁棒性和适应性测试。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 5000.00 2000.00 3000.00
1. 业务费 5000.00 2000.00 3000.00
(1)计算、分析、测试费 0.00 0.00 0.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 500.00 拟用于组织学术研讨,进行考察调研、参会学习等相关内容的会议费用 500.00 0.00
(4)文献检索费 500.00 拟用于支付项目研究所需的资料费、文献检索费等费用 500.00 0.00
(5)论文出版费 4000.00 拟用于支付项目研究所需的论文出版费、软著申请费等费用 1000.00 3000.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 0.00 0.00 0.00
结束