基于深度学习的可解释特征准确预测混凝土抗压强度

helloworld_38131402
• 阅读 66

基于深度学习的可解释特征准确预测混凝土抗压强度

Accurate prediction of concrete compressive strength based on explainable features using deep learning

作者:

Ziyue Zeng(Key Laboratory of Advanced Civil Engineering Materials of Ministry of Education, Tongji University, Shanghai 201804, China)

GZheyu Zhu(School of Materials Science and Engineering, Tongji University, Shanghai 201804, China)

Wu Yao(School of Materials Science and Engineering, Tongji University, Shanghai 201804, China)

Zhenhua Wei(Department of Ocean Science and Engineering, Southern University of Science and Technology, Shenzhen 518055, China)

Xingquan Guan(Department of Civil and Environmental Engineering, University of California, Los Angeles, CA 90095, USA)

期刊:Construction and Building Materials

原文连接:https://doi.org/10.1016/j.conbuildmat.2022.127082

Q1

文章提出的工程问题是什么?

有什么实际工程价值?

混凝土年产量达数十亿吨,是迄今为止人类历史上使用最多的建筑材料。在建筑行业,混凝土配合比和强度设计基于一系列试错测试,以确定配合比对一个参数的属性依赖性,这非常耗时且耗费人力/能源。众所周知,混凝土强度在很大程度上取决于诸如水灰比 (w/b) 和水泥类型等因素,但其他因素(例如砂与骨料的比例)的影响混凝土的强度发展鲜为人知。

在世界各地的许多建筑工地,混凝土强度和施工质量在很大程度上取决于有经验的人员的混合设计和利用设备在 28 天内测试配比混凝土的抗压强度。这个过程可能会受到不同操作者的主观判断和操作,特别是考虑到环境条件可能会在这么长时间内发生变化。因此,需要一种能够可靠地估计具有特定配合比的混凝土的抗压强度的预测模型,以实现高通量混凝土配合比设计和施工质量的自动化无损检测。

Q2

文章提出的科学问题是什么?

有什么新的学术贡献?

近年来,深度学习——它是更广泛的基于具有表示学习的人工神经网络的机器学习方法家族的一部分——使得开发优秀的预测模型成为可能。例如,深度学习已成功应用于预测房地产和股票市场的价格变化,其中多个因素充当了决定房地产和股票实时交易价格的变量。作为混凝土抗压强度也受到各种因素的影响,可以想象它可以通过深度学习以类似的方式进行预测。

在这项研究中,提出了一种基于深度学习的“因素到强度”方法,该方法考虑了多个可解释的特征,因此充分利用了混凝土工程师的先验知识和现场配比信息,用于混凝土强度预测。不是使用成分含量作为模型输入,而是使用九个关键特征(即水泥强度等级、水灰比、砂骨料比、膏骨料比、再生粗骨料替代比例、粉煤灰替代比例、硅灰替代比例、渣置换率和坍落度)被输入到深度神经网络用于数据训练和分析。除了强度预测外,本研究还揭示了每个可解释特征对混凝土强度发展的影响,以及各种特征在确定混凝土抗压强度方面的相互作用。

Q3

文章提出的技术路线是什么?

有什么改进创新之处?

本文主要进行了基于深度学习的利用可解释特征预测混凝土抗压强度模型的构建,具体分以下部分:

① 数据集。

用于开发深度学习模型的数据集来自两个资源——实验和相关文献。从文献中收集的数据集包括多达 380 组混凝土混合物及其相应的 28 天抗压强度。更具体地说,这些数据包括 121 组常规混凝土、105 组强度在 60 MPa 和 100 MPa 之间的高强度混凝土和 154 组再生骨料混凝土。从文献中收集的数据集被分成两个子数据集——80% 作为训练集,20% 作为测试集——分别用于训练和测试 CNN 模型。实验收集的数据包括 16 组再生骨料混凝土配合比、16 组常规混凝土和 16 组从其他实验室获得的高强混凝土。这部分数据表示为实验集,用于评估通过文献数据训练和测试的不同模型的稳健性。

所有这些数据集包括十一种成分水泥强度等级、水泥含量、含水量、沙子含量、天然骨料含量、再生骨料含量、外加剂(粉煤灰、硅灰、矿渣)含量、28天固化后的坍落度和抗压强度。选择或组合九个可解释的特征来预测混凝土抗压强度。特征为水泥强度等级、水灰比、砂骨料比、浆料比、再生粗骨料替代比例,粉煤灰置换比例、硅灰置换比例、矿渣置换比例、坍落度。表 7列出了 11 种成分和 9 种可解释特征的限制值,其中包括来自文献和实验的数据。只有当输入参数的值落在最小和最大限制值之间时,模型才能有效地预测混凝土强度。

② 卷积神经网络CNN

CNN 是一个典型的深度学习神经网络,在过去的二十年中发展起来。特别是它起源于计算机视觉,在计算机视觉领域发挥了重要作用。最近,它被用于混凝土强度的预测,并取得了令人满意的性能。因此,我们尝试基于 CNN 预测混凝土强度。要建立一个CNN,首先要定义一个损失函数。在本文中,选择了广泛接受的平方误差损失函数。对于具有c个类和N个训练示例的多类问题,误差由下式给出:

基于深度学习的可解释特征准确预测混凝土抗压强度

CNN算法采用多个卷积层和池化层来转换数据特征。最后一个转换是通过全连接进行的,采用传统的分类模型。在卷积层,前一层的输出与可学习的内核进行卷积,并通过激活函数形成卷积层的输出。在数学上,它表示为:

基于深度学习的可解释特征准确预测混凝土抗压强度

每个卷积层都有多个内核k和偏置b,两者都应用于输入层以获得通道数与内核数相对应的输出层。这种布置的示意图如图1(a)所示。

基于深度学习的可解释特征准确预测混凝土抗压强度

图 1:(a) 卷积和 (b) 池化过程的示意图。

本文综合考虑了特征数量和数据集的规模,增加了更多的隐藏层。CNN的结构被调整为包括一个输入层、一个卷积层、两个全连接层和一个传统的输出层。输入层是3×3矩阵,由九个选定的可解释特征组成。在卷积层中,放置了 128 个卷积核(k)和 128 个偏置(b),并采用 ReLU 函数作为激活函数。为了确定隐藏层中神经元的最佳数量,尝试并排列了六个值(范围从 4 到 128)以生成总共 36 个不同的模型,如表 8 所示。然后对这 36 个模型进行了 10 次重复训练和测试,并使用以下方法测量其预测性能R2,如图2 所示。第 28 个模型,在第一和第二全连接层中都有 64 个神经元,具有最高的R2在训练集和测试集中。

基于深度学习的可解释特征准确预测混凝土抗压强度

基于深度学习的可解释特征准确预测混凝土抗压强度

图2:(a) 训练集和 (b) 测试集中的 36 个模型中的R 2个。灰线代表 10 次重复的训练或测试结果,蓝线代表 10 次重复的平均 R 2。

基于上述过程,最终确定的全连接层有 64 个神经元,并采用 ReLU 作为激活函数。对于仅包含一个神经元的输出层,选择 sigmoid 函数作为激活。总而言之,卷积层提取了九个可解释特征与混凝土抗压强度之间的关系。然后两个全连接层使关系更加明显和稳定。最后,输出层从最后一个全连接层中捕获64个值,综合生成一个作为混凝土抗压强度的预测值。CNN模型结构如图3所示。

基于深度学习的可解释特征准确预测混凝土抗压强度

图3:卷积神经网络的结构(CG:水泥强度等级,W/B:水胶比;SR:砂比,P/A:浆料比,RA/A:再生粗骨料置换比,F/B : 粉煤灰置换比例, SF/B: 硅灰置换比例, S/B: 矿渣置换比例)。

基于上述内容,本文有以下创新点:

1.本文开发了一个具有九个可解释特征作为输入的CNN模型,用于预测各种混凝土的抗压强度,包括普通混凝土、高强度混凝土和再生骨料混凝土。

2.本文从文献中总共收集了 380 组数据来训练 CNN 模型,另外还准备了 16 组再生骨料混凝土并进行了测试,以验证训练后的 CNN 的可靠性。基于训练有素的 CNN 模型,进行了敏感性研究,以量化三个重要特征对混凝土抗压强度的影响。

3.本研究报告的研究结果使混凝土工程师能够在混凝土配方的可解释特征方面使用他们的先验知识,从而促进对施工现场成分对混凝土强度发展的影响的理解,并更好地服务于混凝土强度设计的实际施工需求。

Q4

文章是如何验证和解决问题的?

为了可视化所开发的CNN模型的预测性能,CNN模型生成的预测混凝土抗压强度的训练和测试结果如图4所示。纵轴代表CNN模型预测的强度,横轴是观察到的强度。总体而言,训练和测试集中的数据点都聚集在对角线附近,表明该模型提供了对抗压强度的准确估计。使用以下指标进一步测量 CNN 模型的预测性能。

基于深度学习的可解释特征准确预测混凝土抗压强度

图4:(a) 训练集和 (b) 测试集上的实际抗压强度和基于 CNN 的抗压强度之间的关系。

此外,均方根误差(RMSE)、平均绝对百分比误差 (MAPE) 和平均绝对误差(MAE) 也使用方程式计算。分别为(12)、(13)和(14)。性能指标总结在表 9中。

基于深度学习的可解释特征准确预测混凝土抗压强度

除了这些宏观指标外,还绘制了一个直方图来显示在训练集和测试集上观察到的相对误差的分布,如图 5所示. 训练集的最大和最小相对误差分别为 34.3% 和 0.04%,测试集分别为 21.06% 和 0.04%。同时,近 90% 的训练集相对误差小于 10%,测试集 85% 的相对误差小于 10%。训练集和测试集的相对误差超过 20% 的比例分别仅为 1% 和 2%。所有这些观察结果表明,CNN 模型能够为三种类型的混凝土(包括普通混凝土、高强度混凝土和再生骨料混凝土)提供可靠和准确的抗压强度估计。

基于深度学习的可解释特征准确预测混凝土抗压强度

图5:训练集和测试集的实际值和预测值的相对误差直方图。

为了进一步证明 CNN 的优越性,将其与三种流行的机器学习模型(包括支持向量机(SVM)、人工神经网络(ANN) 和自适应提升 (Adaboost))进行了比较,所有这些模型都是使用相同的训练开发的和测试集。图 6显示了三种机器学习模型和 CNN 在测试集上的性能。显然,CNN 生成的预测大多接近于观察到的抗压强度,并且 CNN 的决定系数(R 2)在四个模型中最高。这四个模型的误差指标(图 7)也证实了 CNN 的性能最好。

基于深度学习的可解释特征准确预测混凝土抗压强度

图6:(a) SVM、(b) ANN、(c) Adaboost 和 (d) CNN预测的实际抗压强度和抗压强度之间的关系。

基于深度学习的可解释特征准确预测混凝土抗压强度

图7:四个模型的指标比较。

为了证明采用可解释特征的优越性,使用不同的数据集开发了一个具有相同架构的额外 CNN 模型,其中仅包含无法解释的特征。如图8所示,具有无法解释特征的 CNN 模型具有R20.881,低于具有可解释特征的对应物(图 5)。表 10比较了具有可解释和不可解释特征的 CNN 模型的误差指标。在所有误差指标中,具有可解释特征的 CNN 模型的值低于具有无法解释特征的模型,这表明可解释特征更适合预测混凝土抗压强度。

基于深度学习的可解释特征准确预测混凝土抗压强度

图8:CNN使用 (a) 训练集和 (b) 测试集的无法解释的特征,计算实际抗压强度和预测抗压强度之间的关系。

基于深度学习的可解释特征准确预测混凝土抗压强度

Q5

文章有什么可取和不足之处?

逻辑结构:本文的outline呈现在下文:

  1. Introduction

深度学习能够开发良好的预测模型,将深度学习应用到混凝乳强度预测当中是可行的。

  1. Materials and methods

2.1Materials

混凝土混合物由以下主要成分制备:I 型波特兰水泥42.5 R (C)、自来水 (W)、人工洗涤的山砂 (S)、I 级粉煤灰 (F)、硅灰(SF)密度2.26g/cm 3,比表面积20m 2 /kg,水溶性SM型三聚氰胺减水剂(SP)。

2.2Concrete mix design, sample preparation, and testing

介绍了混凝土的配合比以及准备、制造、测试的过程

2.3Data set

用于开发深度学习模型的数据集来自两个资源——实验和相关文献。从文献中收集的数据集包括多达 380 组混凝土混合物及其相应的 28 天抗压强度(见补充表 1详情)。更具体地说,这些数据包括 121 组常规混凝土、105 组强度在 60 MPa 和 100 MPa 之间的高强度混凝土和 154 组再生骨料混凝土。从文献中收集的数据集被分成两个子数据集——80% 作为训练集,20% 作为测试集——分别用于训练和测试 CNN 模型。

2.4Convolutional neural network (CNN)

CNN 是一个典型的深度学习神经网络,在过去的二十年中发展起来。特别是它起源于计算机视觉,在计算机视觉领域发挥了重要作用。最近,它被用于混凝土强度的预测,并取得了令人满意的性能。

  1. Results and discussion

3.1 Predictive performance of the CNN model

为了可视化所开发的CNN模型的预测性能,CNN模型生成的预测混凝土抗压强度的训练和测试结果用图表表示

3.2 Comparison between CNN and other method

为了进一步证明 CNN 的优越性,将其与三种流行的机器学习模型(包括支持向量机(SVM)、人工神经网络(ANN) 和自适应提升 (Adaboost))进行了比较,所有这些模型都是使用相同的训练开发的和测试集。

3.3Performance comparison between results from explainable and unexplainable features

为了证明采用可解释特征的优越性,使用不同的数据集开发了一个具有相同架构的额外 CNN 模型,其中仅包含无法解释的特征。

  1. Conclusion

开发了一个具有九个可解释特征作为输入的CNN模型,用于预测各种混凝土的抗压强度,包括普通混凝土、高强度混凝土和再生骨料混凝土。从文献中总共收集了 380 组数据来训练 CNN 模型,另外还准备了 16 组再生骨料混凝土并进行了测试,以验证训练后的 CNN 的可靠性。基于训练有素的 CNN 模型,进行了敏感性研究,以量化三个重要特征对混凝土抗压强度的影响。

从上述内容可以看出,本文主要采用纵式结构,以研究展开的顺序先后介绍了材料和方法,实验和结果,总结几部分内容,整体形成了“实验-分析-综合”的逻辑。

研究方法:本文在研究的过程中,使用了深度学习的方法,构建混凝土强度的预测模型,使用的是9个与混凝土强度相关的可解释特征,并与其他预测方法进行比较,得到CNN的准确性更好,实验结果更加严谨可靠。

并且,进行了多参数和单参数敏感性分析,以量化这些特征及其组合对混凝土强度发展的影响关系。

基于深度学习的可解释特征准确预测混凝土抗压强度

图9:九个输入特征与抗压强度的关系。

基于深度学习的可解释特征准确预测混凝土抗压强度

图10:受三个主要特征组合影响的混凝土抗压强度等值线图:(a)水胶比和砂比,(b)水胶比和浆料比,以及(c)砂比和浆料比;颜色条代表抗压强度,单位为MPa。

图表形式:本文的图表形式集中于结果分析的过程中,图片种类丰富,变现的规范具体,表格主要为实验混凝土的具体数值的展示,准确丰富。

① 使用泰勒图进行分析,图中的标出点为模型结果,底部的点代表实际的样本,左图数据放射状分布在中间区域,相比之下右图集中于模型下半部分且呈现弧形,表明与样本标准差较为接近。如图8所示

基于深度学习的可解释特征准确预测混凝土抗压强度

文字表达:本文使用的专业词汇较多,总体上表达都比较准确。

Q6

文章对自身的研究有什么启发?

本文开发了一个具有九个可解释特征作为输入的CNN模型,用于预测各种混凝土的抗压强度,包括普通混凝土、高强度混凝土和再生骨料混凝土。

将人工智能方法应到用混凝土质量预测和检测的研究思路值得学习。

本文来自网络或网友投稿,如有侵犯您的权益,我们将第一时间删除。

点赞
收藏
评论区
推荐文章
黎明之道 黎明之道
1年前
天池比赛数据挖掘心电图数据分析
Task 2 数据分析 2.1 EDA 目标 EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。 当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。 引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问
Wesley13 Wesley13
1年前
AI小白必读:深度学习、迁移学习、强化学习别再傻傻分不清
> **摘要:**诸多关于人工智能的流行词汇萦绕在我们耳边,比如深度学习 (Deep Learning)、强化学习 (Reinforcement Learning)、迁移学习 (Transfer Learning),不少人对这些高频词汇的含义及其背后的关系感到困惑,今天就为大家理清它们之间的关系和区别。 **一. 深度学习:** ------------
helloworld_38131402 helloworld_38131402
1个月前
深度学习与图神经网络学习分享:CNN经典网络之-ResNet
深度学习与图神经网络学习分享:CNN 经典网络之-ResNet resnet 又叫深度残差网络 图像识别准确率很高,主要作者是国人哦 深度网络的退化问题 深度网络难以训练,梯度消失,梯度爆炸,老生常谈,不多说 ![深度网络的退化问题](htt
helloworld_91538976 helloworld_91538976
4个月前
机器学习基础
机器学习基础本章涵盖了以下主题:分类和回归之外的其他类型的问题;评估问题,理解过拟合、欠拟合,以及解决这些问题的技巧;为深度学习准备数据。请记住,在本章中讨论的大多数技术都是机器学习和深度学习通用的,一部分用于解决过拟合问题的技术(如dropout)除外。4.1 三类机器学习问题在之前的所有例子中,尝试解决的是分类(预测猫或狗)或回归(预测用户在平台上
3A网络 3A网络
2个月前
理解 virt、res、shr 之间的关系(linux 系统篇)
# 理解 virt、res、shr 之间的关系(linux 系统篇) **前言** 想必在 linux 上写过程序的同学都有分析进程占用多少内存的经历,或者被问到这样的问题 —— 你的程序在运行时占用了多少内存(物理内存)? 通常我们可以通过 t
helloworld_91538976 helloworld_91538976
4个月前
迁移学习(Transfer Learning)
1.深入了解神经网络的组成、训练和实现,掌握深度空间特征分布等关键概念;2.掌握迁移学习的思想与基本形式,了解传统迁移学习的基本方法,对比各种方法的优缺点;3.握深度迁移学习的思想与组成模块,学习深度迁移学习的各种方法;4.掌握深度迁移学习的网络结构设计、目标函数设计的前沿方法,了解迁移学习在PDA、SourceFree DA上的应用;5.掌握深度迁移学习在
helloworld_54277843 helloworld_54277843
4个月前
机器学习基础
本章涵盖了以下主题:分类和回归之外的其他类型的问题;评估问题,理解过拟合、欠拟合,以及解决这些问题的技巧;为深度学习准备数据。请记住,在本章中讨论的大多数技术都是机器学习和深度学习通用的,一部分用于解决过拟合问题的技术(如dropout)除外。4.1 三类机器学习问题在之前的所有例子中,尝试解决的是分类(预测猫或狗)或回归(预测用户在平台上花费的平均时
京东云开发者 京东云开发者
1个月前
京东云开发者|提高IT运维效率,深度解读京东云AIOps落地实践
# 基于深度学习对运维时序指标进行异常检测,快速发现线上业务问题 时间序列的异常检测是实际应用中的一个关键问题,尤其是在 IT 行业。我们没有采用传统的基于阈值的方法来实现异常检测,而是通过深度学习提出了一种无阈值方法:基于 LSTM 网络的基线(一
helloworld_54277843 helloworld_54277843
3个月前
迁移学习(Transfer Learning)的背景、历史及学习课
迁移学习(Transfer Learning)的背景、历史及学习人工智能培训网chinaai.org迁移学习的背景、历史及学习1、迁移学习提出背景 在机器学习、深度学习和数据挖掘的大多数任务中,我们都会假设training和inference时,采用的数据服从相同的分布(distribution)、来源于相同的特征空间(feature space)。但
3A网络 3A网络
2个月前
开发一个不需要重写成 Hive QL 的大数据 SQL 引擎
# 开发一个不需要重写成 Hive QL 的大数据 SQL 引擎 学习大数据技术的核心原理,掌握一些高效的思考和思维方式,构建自己的技术知识体系。明白了原理,有时甚至不需要学习,顺着原理就可以推导出各种实现细节。 各种知识表象看杂乱无章,若只是学习
helloworld_38131402
helloworld_38131402
Lv1
公众号人工智能技术与咨询,联系19511122152(v同号)
44
文章
0
粉丝
0
获赞