裂缝智探——AI智能监测

申报人：郑斯棋申报日期：2024-05-31

基本情况

所属批次:

2024年批次

项目名称:

裂缝智探——AI智能监测学生申报

项目类型:

创新训练项目

所属学科门类:

理学

所属专业类:

数学类

项目来源名称:

学生自主选题

项目归属学院:

项目期限:

一年期

项目简介:

传统的裂缝检测技术需要大量的人力和物力投入，但是这些方法的测量精度会受到多种自然环境因素的影响，这使得裂缝检测变得更加困难和不可靠。因此，开发一种能够在不受外界环境影响的情况下既经济又高效的新型裂缝检测技术，准确地评估建筑物的裂缝情况，这对于保障公共安全和建筑物的长期使用至关重要。由此，裂缝智探——AI智能监测应运而生，以人工智能为基础方向，运用一些算法解决了这一问题。

负责人曾经参与科研的情况:

参与了区级2023大创项目并结题

指导教师承担科研课题情况:

指导教师张彦海正在承担国家自然科学基金一项，

项目编号：12061027，

项目名称：少值互相关函数与最优（负）循环码的构造，

研究期限：2021/01-2014/12，

项目金额：32万元。

指导教师范金梅硕士研究方向：代数学表示论；

博士研究方向：信息安全与密码。

科研项目：主持国家自然科学基金，少值互相关函数与最优（负）循环码的构造；主持广西自然科学基金青年基金，三值或四值互相关函数与至多四重量线性码的构造；主持广西中青年教师基础能力提升项目，低相关序列的构造及相关编码、序列集的研究，已结题；主持桂林理工大学博士启动基金，循环码的构造研究，在研；参与广西自然科学基金项目，函子范畴中的相对同调代数研究，在研；参与国家自然科学基金，加权变指数空间中p(x)-Laplace系统解的存在性与动力学，在研等等

指导教师对本项目的支持情况:

指导教师张彦海曾担任深圳中兴研发部门经理十几年，参与大型研发项目多项，具有丰富的实战经验，能为本项目提供产品设计指导与项目运作建议。此外，指导教师张彦海来校之后已发表SCI论文两篇，正在投递SCI论文两篇，取得使用新型专利一项，正在投递专利三项，发表软件著作权四项，参与国家自然科学基金一项，具有扎实的研究基础，能为本项目提供强有力的理论支撑。

指导教师范金梅近年发表学术论文10篇，发表教改论文4篇，参与编写教材3部。主持国家自然科学基金项目1项，主持广西自然科学基金项目1项，主持教育厅项目1项，参加国家自然科学基金项目2项，参与区一流本科课程1项，参与8项校级教改项目，曾获桂林理工大学教师教学比赛一等奖，首届全区高校大学数学课程教学创新示范交流活动一等奖。为本项目提供多种数据分析方法。

项目级别:

校级

项目成员

序号	学生	所属学院	专业	年级	项目中的分工	成员类型
1	郑斯棋	数学与统计学院	信息与计算科学	2022	总体规划与协调、项目统筹	第一主持人
2	张棋程	数学与统计学院	信息与计算科学	2022	ppt的制作与优化	成员
3	黄铭宇	数学与统计学院	信息与计算科学	2022	功能设计与APP的开发	成员
4	周安年	数学与统计学院	信息与计算科学	2022	项目策划书撰写	成员
5	温勇清	数学与统计学院	信息与计算科学	2022	财务分析、行业与发展	成员

指导教师

序号	教师姓名	所属学院	是否企业导师	教师类型
1	张彦海	数学与统计学院	否	第一指导教师

立项依据

研究目的:

开发一种能够在不受外界环境影响的情况下既经济又高效的新型裂缝检测技术，准确地评估建筑物的裂缝情况

研究内容:

计算机视觉是一种利用计算机和相应的算法来模拟和实现人类视觉功能的领域。它涉及将数字图像或视频作为输入，通过各种图像处理和模式识别技术进行分析和理解，从而使计算机能够“看懂”图像并做出相应的决策或行动。形象地说，就是给计算机安装上眼睛（照相机）和大脑（算法），让计算机能够感知环境。对于裂缝这一背景而言，亦可运用计算机视觉，实现裂缝监测的自动化，提高监测效率和精度。

目标提取是一种基于目标的几何和统计特征的图像分割技术。它将目标的分割和识别整合在一起，使得系统能够在保持准确性和实时性的同时进行有效的目标检测。图像目标检测的主要任务是精确地定位图像中的目标，并对其进行分类。

（1）YOLO算法(You Look Only Once)

YOLO算法(You Look Only Once)使用深度神经网络进行对象的位置检测以及分类，采用直接预测目标对象的边界框的方法，是一阶段法。它将对象检测重新定义为一个回归问题，只需要对图片进行一次扫描，将候选区和对象识别这两个阶段合二为一，从而达到目标检测的目的。其主要的特点是速度快、准确率高，提高了对目标进行特征提取和分类的速度。YOLO算法是基于R-CNN模型，针对目标检测设计的CNN进行特征提取，采用全链接层对识别出的目标进行分类和以及位置检测。YOLO的网络模型结构由输入层、卷积层、池化层和全链接层构成，如图2-1所示。

图2-2 YOLO网络模型

输入层对原始图片进行剪裁、分割等操作，并由CNN将原始图片的数据进行某种处理得到特征图。接下来由卷积层对特征图进行卷积运算，网络有24个卷积层，使用1×1降维层，后面是3×3卷积层，它们提取输入层的特征信息以便于后续操作。池化层存在于卷积层之间，它通过在特征空间内对输入的数据进行最大值池化处理。在最后一个池化层后面是两个全连接层。最后是输出层，它将全链接层输出的数据进行分类处理并继续输出，输出的特征图的个数即为目标图像的分类数，在最后的输出结果中包含了原始图像中物体的分类结果和其位置信息编码，通过特定的解码方式就能在原始图像中显示出检测结果。

图2-3 CNN模型

YOLO算法的检测流程是先将输入的图像划分成S*S个网格（S=7），每个单元格负责预测中心落在该格内的目标，然后每个网格预测B个边界框和这个边界框是物体的概率，每个边界框会预测出5个值：x，y，w，h，置信度Pr(Object)*loU(truth&pred)，计算目标边框的中心点坐标、宽高、置信度评分。最后，每个网格预测分别属于C个类的概率，即在网格中含有物体的条件下，该物体属于某一类别的概率。计算目标边框类的相关置信度。

（2）Canny边缘检测算法

Canny边缘检测算法首先对图像进行高斯滤波处理，以此来去除噪声，然后计算图像梯度，以确定边缘的方向和强度，最后通过非极大值抑制和双阈值处理，将边缘信息提取出来，如图所示：

图2-4 Canny边缘算法

Canny准则：

（a）不漏检真实存在的边缘点，也不把非边缘点作为边缘点检出，使得输出的信噪比最大；

（b)检测到的边缘点的位置距实际边缘点的位置最近，使得输出的图像定位精度高；

（c）每一个实际存在的边缘点和检测到的边缘点是一一对应关系，也就是单边缘响应准则。

以Canny准则为基础，利用泛函数求导的方法可导出一个由边缘定位精度和信噪比乘积组成的表达公式，而这个表达公式近似于Gauss函数的一阶导数。在实际应用中可以选取Gauss函数的一阶导数作为阶跃型边缘的次最优检测算子。利用二维Gauss函数的圆对称性和可分解性，可以容易计算出Gauss函数在任意方向上的导数与图像的卷积。因此，实际中Canny算法的基本思想是：先对待处理的图像选择一定的Gauss滤波器进行平滑滤波；然后，采用一种称之为“非极值抑制”技术，对平滑后的图像处理后，得到最后所需的边缘图像。其检测检测结果如图所示：

图 2-5原始图像 图 2-6 Canny算法检测结果

YOLO算法是一种用于目标检测的深度学习算法，它可以同时进行目标分类和定位。边缘检测算法则是一种用于图像处理的算法，它可以检测图像中的边缘。将YOLO 算法与边缘检测算法结合起来在目标识别和边缘分割方面取得更加精确的结果。本次研究中的研究对象为裂缝，而裂缝往往可以被视为边缘，从而我们选择结合YOLO 算法与边缘检测算法Canny算子，对裂缝进行更加精确的识别。具体来说，可以将 YOLO 算法用于目标检测，然后使用边缘检测算法对检测到的目标进行边缘分割。这种结合的方式可以提高目标检测的精度，因为边缘检测算法可以提供更加准确的目标边界信息，从而帮助 YOLO 算法更好地定位目标。同时，边缘检测算法也可以帮助 YOLO 算法更好地识别目标的形状和特征，从而提高目标分类的精度。

（3）BP神经网络模式识别

当前BP神经网络的主要应用领域有：模式识别、图像处理、信息处理、智能控制、故障检测、企业管理、市场分析等；其釆用误差反向传播算法,且具有分布式的信息存储方式,大规模并行处理,自学习和自适应性等的特点。BP神经网络采用基于梯度下降的最优方法这一基本原理，其连接权值具有一定的可调性，BP神经网络分布式的信息存储方式，使其具有较强的容错性和联想记忆功能，这样如果某一部分的信息丢失或损坏，网络仍能恢复出原来完整的信息，系统仍能运行。其通常由输入层、隐含层和输出层组成，层与层之间全互连，每层节点之间不相连。这一过程就是算法的正向传播，算法的另一种阶段是反向传播，其在输入层得不到期望输出时才会进行。并且通过修改权值来使误差信号最小，网络的权值由误差反馈进行调节，通过权值的不断修正使网络的实际输出更接近期望输出。

图2-7 BP神经网络模型

（a）初始化：置所有的加权系数为最小的随机数。

（b）提供训练集：给出输入向量，，和期望的输出向量，，，。

（c）计算实际输出：按式（5-7）和（5-8）计算输出神经元的输出。

（d）按式（5-9）计算期望值与实际输出的误差。

（e）按式（5-10）和（5-11）调整输出层的加权系数，和阈值。

（f）返回步骤（c），直到误差满足要求为止。

我们对网络进行训练，分类器的训练主要依靠样本来提供信息，样品的好坏也会影响到BP神经网络的分类效果。训练好的BP神经网络分类器，能够较为有效的提取裂缝的特征及分类裂纹类型。

图2-8 裂缝检测流程图

图2-9 裂缝检测流程图

（4）U-Net

U-Net作为一种有效的深度学习架构，在图像分割任务中具有广泛的应用，主要应用领域包括但不限于以下几个方面：医学影像分割、地质图像分割、工程结构检测、遥感图像分割、生物图像分割等；U-Net的收缩路径和扩展路径之间存在跳跃连接，这种U形结构有助于在解码阶段传递更多的上下文信息，有助于准确地恢复细节信息。在U-Net中，收缩路径的每个阶段的特征图都与扩展路径相应的阶段的特征图连接在一起，这种跳跃连接有助于避免信息丢失，从而提高分割的准确性。U-Net在训练时可以有效地利用有限的标注数据，通过数据增强技术和迁移学习等方法，可以在小样本数据集上取得较好的性能。

U-Net

U-net结构

裂隙的形态简单，结构固定。因此语义信息单一，不需要去筛选过滤无用信息。于是我们采用U-net提取裂纹的特征及分类裂纹类型。轻量化的U-net对数据量的需求量小、精度高、鲁棒性好和泛化能力强，使得在裂纹检测中能更快速地判别出裂纹的类型。

通过以上主要裂缝检测算法的分析可知，四种算法的对比如表所示。

算法	特点
YOLO算法	1.可以快速地检测出裂缝的位置和分类。 2.适用于多样化的裂缝检测任务。 3.具有较高的实时性和效率，适用于需要快速响应的裂缝检测应用场景。
Canny边缘检测算法	1.可以有效地识别裂缝的边缘轮廓。 2.可以快速应用于裂缝检测任务。 3.可能会受到图像中其他边缘和噪声的干扰，从而影响裂缝检测的准确性。
BP神经网络模式识别	1.以从裂缝图像中学习各种特征，包括纹理、形状等，从而提高裂缝检测的准确性。 2.需要大量标注的裂缝图像数据进行训练。 3.训练过程通常需要较长的时间，尤其是在深层网络结构下，需要更多的计算资源。
U-Net	1.U-Net结构通过引入跳跃连接和上采样路径，有助于在小样本数据集上训练出稳健的模型。 2.采用了U形结构，使得网络能够充分利用不同层次的特征信息，从而提高了分割的准确性。 3.采用端到端的训练方式，直接从原始图像到分割结果的输出，简化了整个训练流程，减少了人工干预的需要，提高了训练效率。 4.网络结构相对简单，可以根据具体任务的需求进行灵活调整和扩展。

四种算法的对比

国、内外研究现状和发展动态:

目前常用的裂缝检测手段主要是专业人员使用专业仪器进行检测或使用传统工具，如钢尺、裂缝显微镜、裂缝测宽仪等工具进行宽度测量。

（1）人工运用钢尺进行测量，精确度较差，因人为目视读数而无法准确把握裂缝的宽度来进行工程分析，在紧急情况下，很可能导致工程事故。

图2-22 市面上的钢尺

（2）裂缝显微镜是用于检测石头和其它材料的裂缝宽度的裂缝读数显微镜，自带冷光源，在无光线的情况下能看到的裂缝宽度，但精度有限，测量范围有限。

2024-02-23 15:01:28.904000

图2-23 裂缝显微镜

（1）专业人员使用的裂缝测宽仪器、放大仪相较于其他测量工具有了很大的提高。但是大批量地投入使用，存在成本费用较高的问题。同时，对于此设备对于适用人群有很大限制，普及能力较弱，对于老旧危楼的居住居民带来极大不便。目前，裂缝测宽仪等工具主要为专业人员及单位所购与使用。

2024-02-23 15:16:31.125000 2024-02-23 15:16:31.182000

产品	钢尺	裂缝显微镜	裂缝测宽仪	基恩士	本产品
使用环境	室内明亮照光环境	有无光线均可	室内明亮照光环境	室内明亮照光环境	不限制环境
数据采集方式	人工测量	人工测量	人工测量判读或自动测量判读数据	固定式激光传感器扫描	通过用户手机拍照、连接城市摄像头采集，方便、一键式数据大量采集更新
范围	仪器测量范围内	仪器测量范围内	仪器测量范围内	采集器覆盖范围内	无范围限制
裂缝检测	专业人员检测	专业人员检测	专业人员检测	建筑专家诊断	智能识别
获取数据速度	较慢	较快	较快	周期长	周期短
使用成本	较低	较低	约3000元/台大量投入使用成本较高	单个检测仪器3万至10万不等，单人配套完整检测设备至少30万，基本不具备普遍使用可能性	个人用户20元/月无限次检测企业用户享受首年8万元使用授权费，企业员工都可使用

图2-24 某品牌裂缝基础测宽仪的价格

表2-3 同类型产品对比

由上表可以看出，人工检测手段具有检测速度慢，检测难度大，设备价格高、专业检测人员数量有限等局限性，从而无法满足大量房屋裂缝的监测要求。裂缝检测工作面临的严峻形势和肩负的艰巨任务使得人工的检测手段越来越力不从心，而选择我们裂缝智探——AI智能监测技术无疑是在市面上最好的选择。

创新点与项目特色:

算法创新、数据处理、云端集成、多场景适用等。

当前现阶段我们已经开发“裂缝网”网站，主要用于实现利用监控摄像头、无人机、手机监测建筑裂缝的变化并实现裂缝数据的实时存储与分析。

技术路线、拟解决的问题及预期成果:

裂缝智探——AI智能监测的未来发展将是一个融合了尖端科技与创新理念的项目。随着深度学习和机器视觉技术的不断进步，未来的裂缝探测产品预计将达到前所未有的智能化和自动化水平。这些高级系统将能够进行实时监测，以精确识别和定位结构中的裂缝，并利用趋势分析预测裂缝的发展路径，从而在问题恶化之前采取预防措施。

裂缝智探——AI智能监测将可能整合更多种类的传感器和先进的数据分析工具，提供更为全面和深入的结构健康监测。例如，通过结合无人机技术，可以轻松检查那些人工难以到达的结构部位，而物联网（IoT）技术的应用则能够实现设备间的实时数据交换和协同工作。此外，随着人工智能算法的持续优化，未来的系统不仅在识别精度上会有显著提升，其数据处理速度和响应能力也将大幅度增强。

在应用方面，裂缝智探——AI智能监测的未来发展潜力巨大，可能将在以下领域进行应用：

基础设施监测: 随着深度学习和图像处理技术的不断进步，裂缝智探——AI智能监测将能够更准确地监测桥梁、道路、隧道等基础设施的健康状况。未来的系统将更加自动化，能够实时分析数据并预测潜在风险，从而提前进行维护和修复，极大提高公共安全。

建筑健康监测: 在建筑领域，裂缝智探——AI智能监测将帮助建筑师和工程师更好地理解建筑物的结构完整性。通过持续监测，可以及时发现问题并采取措施，以保证建筑物的长期安全和耐用性，为城市建设提供坚实的安全保障。

文物保护: 对于文化遗产的保护，裂缝智探——AI智能监测将提供一种非侵入式的监测方法。这将有助于保护和修复古迹和文物，为文化遗产的保护提供了新的解决方案。

珠宝行业: 在珠宝行业，裂缝智探——AI智能监测将提高宝石裂缝检测的精确度。这不仅能够保护消费者的利益，还能够帮助珠宝设计师优化设计，减少裂缝的发生，提升珠宝的整体质量和市场价值。

随着技术的不断发展和创新，裂缝智探——AI智能监测将在更多领域发挥其重要作用，为社会的可持续发展做出贡献，同时也为人类生活的各个方面带来更多安全和便利，我们可以期待一个更加智能、互联的世界，而裂缝智探——AI智能监测将成为推动社会可持续发展的重要力量。

项目研究进度安排:

获取更多的信息和意见，增加裂缝的知识和认识，提高裂缝的关注和重视

提高裂缝检测的准确性和效率：不断改进和更新本产品的算法和模型，提高裂缝检测的精度和速度，减少裂缝检测的误差和延迟，提升裂缝检测的质量和水平。

扩大裂缝检测的覆盖范围和应用场景：不断优化和完善本产品的功能和界面，提高本产品的兼容性和适应性，支持更多的摄像头和手机型号，适应更多的网络环境和光照条件，满足更多的用户需求和使用场合。

增强裂缝检测的知名度和信誉度：不断推广和宣传本产品的优势和特色，提高本产品的知晓度和认可度，积累和维护本产品的用户和合作伙伴，建立和保持本产品的品牌和口碑。

保护裂缝检测的知识产权和技术秘密：不断申请和注册本产品的专利、软件著作权、商标等，保护本产品的创新成果和技术优势，防止本产品的仿制和侵权，维护本产品的合法权益和市场地位。

拓展裂缝检测的相关领域和新技术：不断探索和研究本产品的潜在市场和新需求，将本产品的技术应用于其他领域和行业，如珠宝裂缝检测、建筑结构检测等，增加本产品的附加值和竞争力，同时引入和融合新的技术和理念，如云计算、大数据、物联网等，提升本产品的智能化和创新性。

已有基础:

与本项目有关的研究积累和已取得的成绩:

1）与本项目有关的研究积累和已取得的成绩：（a）住户和游客对于古建筑是否出现裂缝关注程度不高，对于建筑物出现裂缝而可能导致的危害了解不多甚至是不了解。

图4-14 住户、游客对于古建筑是否出现裂缝的反馈

（b）对于裂缝检测技术大多数人停留在人工检测阶段，对于人工智能化裂缝检测技术了解程度及其信任度皆较低。

（c）大部分用户对于捕裂科技产品网站以及手机软件测评价格接受度较高。

图4-15 住户对于“裂缝智探”平台的需求度

（3）调研反馈

从调查整体情况来看，团队成员发现人们对于建筑物裂缝检测技术的了解程度不高，关注古建筑及周围建筑物裂缝的人群不多。由此，对于产品前期推广方式可以为在线下举办一些宣传推广活动，通过播放裂缝网站使用指南视频、拍摄裂缝照片等方式，让群众初步了解捕裂科技，现场体验裂缝网站的运作以及手机APP的操作方法，并为他们提供免费试用产品的机会，

用小奖品来吸引群众，从而起到产品宣传推广和普及的作用，让群众了解认识并相信我们的产品和技术。

已具备的条件，尚缺少的条件及解决方法：1）资金来源

（a）前期团队投资40000元的创业基金

（b）计划向银行借款，筹资 20万元人民币用于本项目。

（2）资金分配

（a）技术开发费用 30%

（b）市场推广 25%

（c）租赁费用 10%

（d）工资薪酬 15%

（e）预留资金周转 20%

图7-2 投入分配图

（3）成本预测

（a）需要办公的电脑、场所、桌椅(总计5万左右)；

（b）托管的服务器等，价格几千到上万不等；

（c）域名注册300元 / 5年；

（d）IOS系统和Android系统，价格几千到上万不等；

（e）服务器、带宽租赁费用 4000/年；

（f）UI设计，0.5万，包括界面设计及后期完善。

（4）推广费用

媒体广告(60%)

（a）行业APP广告直投 推广费用总投入的20%

找出一些有流量，有影响力的相关行业网或是相关网站，在他们网站上直接投放广告。

（b）长尾关键词优化（网站SEO）推广费用总投入的15%

根据APP的定位列出尽可能多的长尾关键词，这些关键词必须跟APP的方向、产品或是服务相关，相结合，然后我们可以针对这些关键词做一些SEO优化。

（c）移动终端 推广费用总投入的20%

选择热点综合性新闻APP进行广告投放

（d）报纸推广费用总投入的5%

户外广告(30%)

（a）大型广告屏 推广费用总投入的15%

（b）小区电梯内广告 推广费用总投入的15%

精准销售

（a）微信精准推送 推广费用总投入的10%

发动创业团队朋友圈进行裂缝智探——AI智能监测手机应用下载、试用链接安装推广，吸引更多用户尝试安装APP产生数据，可以搞一些有偿活动进行业务推广。

（b）微博推送

精准销售预算的60%用于利用大V进行信息广告推广，快速宣裂缝智探——AI智能监测手机应用。

（c）抖音博主合作

与家装、设计类博主合作，通过短视频的方式提高大众认知度，直接更加直接定位有需要人群

图7-3 推广方式占比

三、股权分配

图7-4 股权分配

为了鼓励更多有创业精神的合作伙伴，创业团队股权分布情况：创始团队占50%，运营团队占27%，融资股份占20%，其他占3%。

创始团队：创始团队控制50%股份，拥有公司各项重大事物决策权，在对公司发展规划拥有绝对的主动权与主导权。

运营团队：运营团队控制27%股份，使运营团队拥有更强的团队意识，增加团队积极性及工作效率。

融资股份：融资股份占20%，给予相对较多的份额吸引其他投资方投资。

其他：其他占3%，主要用于其他方面的投资融资开展副业。

已具备的条件，尚缺少的条件及解决方法:

基于数字图像处理的裂缝检测技术

基于计算机断层扫描(CT)的裂缝检测技术

基于结构光的裂缝检测技术

基于超声波的裂缝检测技术

经费预算

开支科目	预算经费（元）	主要用途	阶段下达经费计划（元）
开支科目	预算经费（元）	主要用途	前半阶段	后半阶段
预算经费总额	7300.00	完成创新项目	2210.00	5090.00
1. 业务费	5500.00	调研交通、论文版面	1160.00	4340.00
（1）计算、分析、测试费	500.00	计算数据	250.00	250.00
（2）能源动力费	200.00	数据额分析	100.00	100.00
（3）会议、差旅费	1600.00	电费交通住宿	700.00	900.00
（4）文献检索费	200.00	购买书本	110.00	90.00
（5）论文出版费	3000.00	版面期刊	0.00	3000.00
2. 仪器设备购置费	500.00	购买设备	250.00	250.00
3. 实验装置试制费	500.00	使用装置设备	300.00	200.00
4. 材料费	800.00	购买材料	500.00	300.00

结束

详情