详情

深海智眸——基于深度学习的水下图像增强模型

申报人:罗皓仁 申报日期:2025-05-23

基本情况

2025年批次
深海智眸——基于深度学习的水下图像增强模型 学生申报
创新训练项目
工学
计算机类
学生来源于教师科研项目选题
一年期
随着水下图像增强技术的发展,其在海洋科学研究、水下工程作业等领域的重要性日益凸显。然而,水下特殊光学环境导致图像对比度降低、颜色失真等问题,限制了其应用。本项目基于人工智能和深度学习理论,运用卷积神经网络(CNN)和生成对抗网络(GAN),旨在优化水下图像质量,提升色彩校正和细节恢复,为水下目标探测、海洋生物监测等提供技术支持,推动水下图像增强技术的实际应用与发展。
2024.4~2025.3参加国家级大创(数界智导—AI驱动的个性化大学数学辅导平台项目);
2024年7月获得电工杯数学建模比赛国家级二等奖;
2024年8月获得互联网+区级银奖;
广西自然科学基金项目(2019JJB170007)
指导教师的研究方向为深度学习与计算机视觉领域,能够对项目提供相应的理论和技术指导,确保该项目的顺利实施。
国家级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
罗皓仁 数学与统计学院 信息与计算科学 2023 统筹全局
莫家康 数学与统计学院 信息与计算科学 2023 算法设计
付裕彬 数学与统计学院 信息与计算科学 2022 算法实现
黎晋铭 数学与统计学院 信息与计算科学 2022 算法实现
李家庆 数学与统计学院 信息与计算科学 2021 算法设计

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
林彬 数学与统计学院
罗旋 土木工程学院

立项依据

本项目开始初期明确研究问题以及目的,随后进行调研,进行相关文献的梳理数据集的收集,基于深度学习理论,使用PyTorch框架生成对抗网络,获得模型后经过一系列的模型检测,得到一个针对水下图像增强的优化模型。拟定的研究路线如图1
summernote-img
图1 研究路线图
在当今科技飞速发展的时代,水下图像在海洋科学研究、水下工程作业、军事侦察以及水下生态保护等诸多关键领域中都占据着举足轻重的地位。但水下特殊的光学环境,致使水下图像面临着诸多严峻挑战。水体对不同波长光线的差异性吸收以及悬浮微粒引发的光散射现象,使得水下图像常常呈现出对比度锐减、颜色严重偏离真实、细微结构与纹理模糊难辨等突出问题,极大地限制了水下图像在各领域中的有效运用与深入分析,水下图像拍摄时光线的传播和悬浮微粒对水下拍摄的影响如图2。
summernote-img
图2水下图像拍摄时光线的传播和悬浮微粒对水下拍摄的影响
本研究聚焦于水下图像增强技术,致力于深入探索创新的方法与策略,力求突破现有技术的局限。通过对光在水下传播特性的深度剖析,构建精准的成像模型,进而针对性地研发出具有高度适应性与卓越性能的图像增强算法。在色彩校正方面,精心设计出能够精确补偿水体对颜色吸收影响的机制,以还原图像真实色彩;在对比度提升维度,运用先进的变换域处理技术与自适应对比度拉伸策略,显著增强图像中不同物体与区域之间的视觉差异;于细节恢复层面,借助先进的多尺度分析工具与锐化增强手段,成功恢复被模糊的边缘与纹理信息。
最终实现水下图像在视觉效果上的显著优化,在图像质量评价指标体系中取得优异表现。所获增强后的水下图像将为水下目标精准探测与识别、海洋生物多样性细致监测与评估、海底地质地貌精确测绘与分析等一系列水下核心任务提供坚实的数据基础与有力的视觉支撑,有力促进水下相关领域的前沿技术创新与科学探索迈向新的高度,填补当前水下图像增强技术在实际应用场景中与理想效果之间的差距,为人类更好地认识与开发利用海洋资源贡献重要力量。
1.水下图像退化机制建模与分析
深入探究水体光学特性,包括不同深度、水质(如浑浊度、浮游生物含量等)对光线传播的影响,建立精确的水下图像退化模型。通过对光吸收、散射等物理过程的数学描述,为后续基于GAN的增强算法提供理论依据与数据模拟基础,以便生成更贴合实际退化情况的训练数据对。
2.生成对抗网络架构设计与优化
  生成器设计:构建专门针对水下图像增强的生成器网络结构,采用多层卷积神经网络与上采样层相结合的方式。引入残差网络结构来缓解梯度消失问题,使网络能够更好地学习到从退化水下图像到清晰自然图像的映射关系。在网络层中合理运用归一化技术,确保生成图像的稳定性与质量。判别器设计:设计一个有效的判别器,能够准确区分真实的高质量水下图像与生成器生成的图像。判别器采用多层卷积下采样结构,提取图像的多尺度特征,通过全连接层输出鉴别结果,为生成器提供对抗训练的反馈信号,促使生成器不断优化生成图像的质量。损失函数定制:制定适用于水下图像增强任务的损失函数。除了常规的 GAN 对抗损失外,引入感知损失,衡量生成图像与真实图像在特征空间的差异,使生成图像在语义和视觉感知上更接近真实图像。
3.训练策略
采用交替训练的方式对生成器和判别器进行训练。先固定判别器参数,训练生成器使其生成的图像能够和判别器达到抗衡;然后固定生成器参数,训练判别器提高其判别准确性。在训练过程中,逐步降低学习率,采用早停法防止过拟合,确保网络收敛到稳定且有效的状态。
水下图像增强技术是提高水下图像质量的关键技术,对于水下机器人、海洋生物观察、水下考古等领域具有重要意义。以下是水下图像增强技术在国内外的研究现状和发展动态。
国外在水下图像增强领域的研究较为深入,特别是在深度学习技术的应用上。例如,Wang等人提出了一种端到端的水下图像增强网络UIE-Net,该网络包括颜色校正子网络(CC-Net)和去雾子网络(HR-Net),能够同时学习颜色校正和去雾任务的有效特征表示。此外,Li等人提出了基于水下场景先验的水下图像增强CNN模型UWCNN,这些研究展示了深度学习在水下图像增强领域的应用潜力。
国外研究者在水下图像增强领域不断探索新的算法和模型。例如,Peng等人提出了基于物理模型的单图像去雾方法,通过场景环境光差异来恢复水下图像。Guo等人使用多尺度密集生成对抗网络进行水下图像增强,提高了图像的视觉效果。此外,还有研究者利用卷积神经网络(CNN)和生成对抗网络(GAN)等技术,通过学习水下图像和真实图像之间的映射关系,实现图像质量的提升。
国内在水下图像增强领域的研究也取得了一定的进展。例如,陈从平等提出了一种有效的低对比度水下图像增强算法,通过改进Retinex算法和颜色校正来提高图像质量。贾芃等人提出了基于HSI色彩空间的改进Retinex水下图像增强算法,通过调整色彩空间中的色调、饱和度和亮度分量来增强图像。
总体来看,无论是国内还是国外,水下图像增强技术的研究都在不断深入,特别是深度学习技术的应用,为水下图像增强领域带来了新的发展机遇。未来的研究可能会更加注重算法的实时性和鲁棒性,以及多模态数据的融合和利用,以适应更复杂的水下环境和应用需求。
参考文献:
[1]Zhang, D. W. (2017). Underwater Image Enhancement via Minimal Color Loss and Locally Adaptive Contrast Enhancement. IEEE Transactions on Image Processing , 26(9), 4320-4330.
[2]Cong, R., Zhang, Y., Zhang, C., Li, C., & Zhao, Y. (2024). Research Progress of Deep Learning Driven Underwater Image Enhancement and Restoration. IEEE Transactions on Pattern Analysis and Machine Intelligence .
[3]Wang, Y., Diao, M., & Han, C. (2017). Underwater image enhancement and color correction model based on homomorphic filter [J]. Computer Engineering and Applications, 54(11), 30-34+80.
[4]Li, J., Skinner, K. A., Eustice, R. M., et al. (2018). WaterGAN: unsupervised generative network to enable real-time color correction of monocular underwater images [J]. IEEE Robotics and Automation Letters, 3(1), 387–394.
[5]杜守庆,陈明,王俊豪. 基于多尺度特征提取的水下图像增强模型[J]. 渔业现代化,2022, 49(4): 70-79.
[6]郝志成,吴川,杨航,& 朱明. (2016). 基于双边纹理滤波的图像细节增强方法 [J]. 中国光学, 9(4), 423-431.
[7]陈从平,贾芃,& 田会娟. (2019). 基于HSI色彩空间的改进Retinex水下图像增强算法 [J]. 智能系统学报, 14(2), 258-264.
summernote-img
图3创新点
1.水下图像增强技术与深度学习算法的集成
将水下图像增强技术与深度学习算法相结合,实现在水下复杂环境中的图像质量提升和细节恢复。通过深度学习算法实时分析水下图像,自动调整图像的对比度、亮度和色彩,实现清晰、真实的水下视觉体验。
2.自适应水下环境光照与色彩校正
利用深度学习算法,使系统能够识别不同的水下光照条件和色彩失真,自动调整图像处理参数。结合水下环境特性和图像质量要求,设计自适应的图像处理算法,确保在不同水下环境中都能获得高质量的图像输出。
3.深度学习图像去噪与增强技术
在水下图像增强系统中集成深度学习去噪与增强技术,实现精准的图像质量提升。利用先进的神经网络模型对水下图像进行特征提取和优化,提高图像的清晰度和细节表现力。系统还具备深度学习进行图像增强功能,可在水下环境中承担监控、探索和研究任务,提供高质量的水下视觉信息。
summernote-img
图4技术特色
1.高自动化与可扩展性:项目算法具备高自动化程度,易于扩展和调整,以适应更复杂或特化的任务。
2.实时性与轻量级模型:项目设计了轻量级模型,拥有较高的处理速度,适用于实时水下图像增强。项目结合了物理模型和数据驱动学习网络,提高了水下图像增强的准确性和效率。项目注重图像的感知质量,优化了人眼对图像质量的感受。项目制定了多模式的水下图像感知质量目标函数,约束整体模型训练方向。
3.端到端增强网络:项目实现了端到端的水下图像增强网络,提高了训练的收敛速度和精度。项目采用了自适应直方图均衡化技术,提高了图像对比度和可见性。
(五)技术路线、拟解决的问题及预期成果
1、技术路线
本项目将采用Python语言进行编程,利用Pytorch深度学习框架构建水下图像增强的项目平台。项目将以卷积神经网络(CNN)为基础,结合深度学习技术,通过图卷积神经网络(GNN)的输出来训练生成器。通过对抗训练,生成器和判别器将相互竞争,生成器试图生成越来越逼真的图像,而判别器则努力区分生成的图像和真实图像。随着训练的进行,生成器将不断优化其参数,以生成在视觉上或统计上与真实图像难以区分的水下图像,这将显著提高水下图像的质量,拟定的技术路线如图2所示:
summernote-img
图5技术路线图
2、拟解决的问题
(1)图像质量退化:水下图像常常受到低对比度、颜色失真、模糊、亮斑和高噪声等问题的影响,这些问题严重限制了水下图像在各领域中的有效应用。
(2)成像环境复杂:水下环境中的浑浊度、光照不均匀、悬浮颗粒物以及水体对光线的吸收和散射,都对成像质量构成挑战。
(3)实际应用场景的挑战:水下图像增强技术在实际应用中,如水下目标检测、生物多样性监测、地貌测绘等,面临着与理想效果之间的差距,需要更多的研究和实践来缩小这一差距。
项目研究进度安排如表1所示。
表1 项目研究内容及阶段目标
时间 主要工作内容 阶段目标
初期
(2025.4-2025.5) 完成申报书的书写
确保申报书的内容准确详尽,能够清晰地阐明项目的目标、意义和预期成果,同时精心制作答辩PPT以生动地展示项目的亮点和价值,为立项答辩做好充分准备。
完成项目申报立项答辩等工作;
前期
(2025.6-2025.8) 理论研究与编码
这一阶段需要深入水下图像增强的价值影响因素、作用机制分析,理解前人的研究成果和方法,进行理论推演以及初步的代码运行,为后续的研究工作奠定基础。
完成相应运行环境的安装;
完成初步的实验项目;
中期
(2025.9-2025.2) 撰写论文并投稿
在这个阶段,需要选择适合项目成果发表的期刊,并着手撰写论文或专利申请,以向学术界或专业领域推广项目研究成果。 持续优化项目成果,完善论文或专利申请,力求在学术期刊或专利局取得发表或申请的机会,以确保项目研究的成果能够得到更广泛的认可和应用;
后期
(2026.3-2026.4) 整理并撰写结题报告
需要对整个研究过程进行总结和回顾,撰写结题报告,系统地总结项目的研究内容、成果和经验教训。 完成项目的结题;
1.第十二届“挑战杯”广西大学生课外学术科技作品竞赛桂林理工大学冠军争夺赛亚军
2.SCI二区论文1篇, IF 5.0:Jiaqing Li (李家庆), Chaocan Xue, Xuan Luo, Yubin Fu (付裕彬), Bin Lin. Robust Underwater Object Tracking with Image Enhancement and Two-Step Feature Compression, Complex & Intelligent Systems, 2025, 11: 1-14.
3.黎晋铭研究积累和已取得的成绩
① 2023RoboMaster超级对抗赛全国三等奖(负责深度学习部分)。
② 第九届全国应用型人才综合技能大赛“工业美”全国二等奖(负责深度学习部分)。
③ 2023.05-2024.04:参与自治区级大学生创新创业训练计划项目,已结项。项目执行过程中撰写的学术论文“深度学习在建筑设计领域的应用进展”(第二作者),已录用。
④ 2024年全国大学生数学建模竞赛全国二等奖。
⑤ 2024RoboMaster超级对抗赛全国三等奖(负责深度学习部分)。
⑥ 2024年在《现代信息科技》发表《基于Chinese Clip模型和Prompt提示机制的图文检索方法》期刊一篇(已录用)
(1)已具备的条件
项目组成员已初步熟知相关卷积神经网络与生成对抗网络的理论,对python语言有所了解,数统学院高性能实验中心能够为本项目提供实验所需的高性能GPU等硬件设备但是在具体编程实现上有所欠缺。将不断进行模型的搭建与实验,构建优化模型。
(2)尚缺少的条件。
具体编程实现上有所欠缺。
(3)解决方法。
将不断进行模型的搭建与实验,构建优化模

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 10000.00 3700.00 6300.00
1. 业务费 10000.00 3700.00 6300.00
(1)计算、分析、测试费 1300.00 计算与分析测试 600.00 700.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 1200.00 项目调研或参与学术会议等产生的差旅费 600.00 600.00
(4)文献检索费 2500.00 用于查阅相关资料 2500.00 0.00
(5)论文出版费 5000.00 项目成果相关的论文审稿及版面费、专利申请等费用 0.00 5000.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 0.00 0.00 0.00
结束