【MobileNet】从V1到V3:轻量化CNN的演进之路与移动端部署实战

news2026/4/14 15:41:58
1. 引言为什么我们需要轻量级网络如果你是一名移动端或者嵌入式设备的开发者肯定遇到过这样的烦恼好不容易在电脑上训练了一个效果不错的图像识别模型准确率高达95%兴冲冲地想把它塞进手机App或者智能摄像头里结果发现模型动辄几百兆推理一张图片要好几秒手机发烫电量狂掉用户体验直接跌到谷底。这感觉就像你造了一台性能超跑的发动机却想把它装进一辆小电驴里根本跑不起来。这就是传统卷积神经网络CNN在移动端面临的尴尬。过去几年为了在ImageNet等大赛上刷榜模型的深度和复杂度一路狂飙从AlexNet的8层到VGG的19层再到ResNet的152层。模型是越来越“聪明”了但也越来越“胖”了。它们对计算资源GPU算力和内存的需求让移动设备望尘莫及。想象一下在自动驾驶场景中如果行人检测模型响应慢半拍后果不堪设想在直播美颜场景里如果滤镜特效卡成PPT用户立马就会卸载你的App。所以学术界和工业界开始思考我们能不能设计一种既“瘦”又“快”同时还能保持不错“智商”精度的模型这就是轻量化CNN的使命。而Google推出的MobileNet系列无疑是这条路上的明星产品。从2017年的V1到2019年的V3它就像一部浓缩的移动端AI进化史每一代都为了解决“小、快、好”这个不可能三角贡献了关键的创新思路。今天我就带你一起拆解MobileNet的演进之路并分享一些我在移动端部署时踩过的坑和实战经验希望能帮你少走弯路。2. MobileNet V1用“分家”的卷积实现计算量的大瘦身MobileNet V1的核心思想非常直观把标准卷积这个“全能选手”拆成两个“专项选手”从而大幅减少计算量和参数量。这个“分家”的技术就叫深度可分离卷积。2.1 深度可分离卷积一场精妙的计算分解要理解它我们得先看看标准卷积是怎么干的。假设我们有一张5x5像素、3个通道RGB的输入图片。我们想用4个3x3的卷积核去处理它得到4个通道的特征图。那么每个卷积核本身就得是3x3x3的高x宽x输入通道数。一次卷积操作卷积核要在所有输入通道上同时滑动计算最后把结果加起来形成一个输出通道。计算量相当大。深度可分离卷积把这件事分两步走逐通道卷积我习惯叫它“各扫门前雪”。我们准备3个3x3的卷积核但每个核只负责处理一个输入通道。比如红色通道的卷积核只卷红色通道的数据绿色、蓝色通道同理。这一步生成了3个特征图每个图只包含来自单一通道的空间信息。它的特点是完全避免了跨通道的计算。逐点卷积其实就是1x1卷积我把它看作“信息融合大会”。上一步我们得到了3个特征图但它们之间老死不相往来。现在我们用4个1x1的卷积核每个核就像一个小型加权器对3个特征图同一位置的像素值进行加权组合生成1个新的像素值。一个核生成一个输出通道4个核就生成4个输出通道。这一步专门负责通道间的信息交互和维度变换。我们来算笔账还是刚才的例子标准卷积参数3x3核大小x 3输入通道x 4输出通道 108个参数。深度可分离卷积参数逐通道卷积 3x3x327逐点卷积 1x1x3x412总共39个参数。 参数直接减少了约2/3计算量也是类似的下降比例。这就像原来需要一个能同时炒三个菜的厨师标准卷积现在拆解成一个专门切菜逐通道卷积一个专门调味和摆盘逐点卷积的组合效率自然就上去了。2.2 网络架构与实战中的细节V1的网络结构就是不断堆叠这种“深度可分离卷积块”论文里叫Depthwise Separable Convolution我们常简写为DW卷积。整个网络像一个瘦长的直筒开头是一个标准的3x3卷积后面跟着13个DW卷积块最后用全局平均池化和全连接层收尾。我在实际使用V1时有几点深刻体会ReLU6激活函数V1把常用的ReLU换成了ReLU6即 max(0, min(6, x))。一开始我觉得这限制输出范围不是自废武功吗后来在嵌入式设备上用float16半精度推理时才明白其妙处。数值范围被限制在[0,6]低精度下的分辨率更高数值更稳定不容易出现精度损失导致的性能崩塌。宽度乘子与分辨率乘子这是V1论文里提供的两个“旋钮”太实用了。宽度乘子α比如0.5, 0.75, 1.0可以等比例缩放所有层的通道数让你在模型大小和精度之间灵活调节。分辨率乘子ρ则是调整输入图像尺寸如224x224, 192x192。在项目初期我通常用α1.0的完整模型验证算法可行性部署时再根据设备能力比如老旧手机用α0.75甚至0.5进行瘦身非常方便。1x1卷积是计算主力分析V1的计算量分布你会发现超过70%的计算都发生在1x1的逐点卷积上。好消息是1x1卷积在硬件特别是移动端CPU和专用加速芯片如NPU上通常有高度优化的实现效率极高。这算是歪打正着为后续的部署优化埋下了伏笔。3. MobileNet V2引入“倒置”的残差与线性瓶颈V1虽然轻量但结构还是太“直”了没有利用上残差连接这种能有效缓解梯度消失、提升训练稳定性的“神器”。V2的核心任务就是把残差结构“请”进MobileNet但直接照搬ResNet的“先压缩后恢复”的瓶颈结构Bottleneck会出问题。3.1 反转残差先“增肥”再“减肥”的智慧ResNet的瓶颈结构是为了减少大模型的参数量比如输入256维先用1x1卷积压缩到64维经过3x3卷积处理再用1x1卷积扩张回256维。这就像先把一大桶水浓缩成一小杯精华液处理完再兑水还原。但MobileNet本身就很“瘦”通道数不多比如V1中间层很多是128、256维。如果也先压缩可能就直接压到几十维了特征信息损失太大模型能力会严重受限。V2的天才设计在于反转残差它反其道而行之先扩张再处理最后压缩。具体到一个块里逐点卷积升维先用1x1卷积把输入通道数扩大通常是6倍。比如输入24维先升到144维。这相当于把“一小杯水”先变成“一大桶水”。逐通道卷积处理在更高的维度上进行3x3的深度卷积提取空间特征。这时“水”多了能洗的东西也更丰富了。逐点卷积降维再用1x1卷积把通道数压缩回目标维度比如24维。把“一大桶处理过的水”再浓缩回“一小杯精华”。为什么这样设计更好我的理解是在更高维的空间比如144维中进行非线性变换ReLU激活其表达能力更强信息损失更少。就像一个画家在更大的画布上作画总能比在小纸片上画出更丰富的细节。3.2 线性瓶颈拿掉那个“雪上加霜”的ReLUV2的另一个关键改进是线性瓶颈。简单说就是在反转残差块的最后一个1x1卷积降维层后面去掉ReLU激活函数改用线性激活即不做非线性变换。这又是为什么我在复现V1时就发现深度卷积部分的参数有时会“死掉”输出经过ReLU后全变成0。论文作者的解释很精辟ReLU这个函数在输入为负时直接输出0会破坏一部分信息。当通道数本身很少的时候比如降维后的低维空间这种信息破坏可能是致命的相当于把所剩无几的有效特征也给抹除了。就好比你费劲把一首高保真音乐压缩成MP31x1卷积降维已经损失了一些细节如果再经过一个劣质滤波器ReLU音质就更没法听了。所以在负责降维、通道数变少的那个1x1卷积后面使用线性激活是为了最大程度保留从高维空间压缩下来的宝贵信息。这个细节对模型最终精度尤其是部署后的稳定性影响非常大。3.3 V2网络结构与效果V2就是由多个这样的“反转残差线性瓶颈块”堆叠而成。表格中的参数t代表扩张倍数通常是6c是输出通道数n是重复堆叠的次数s是步幅决定是否下采样。从结果看V2在ImageNet上相比V1在参数量更少的情况下分类精度还有所提升。更重要的是这种规整的块状结构非常利于我们手动进行通道剪枝、层融合等后续优化为移动端部署提供了极大的便利。在我经手的很多移动端项目中V2因其出色的平衡性成为了最常被选用的基础骨架。4. MobileNet V3用搜索与微调逼近硬件极限如果说V1和V2是工程师基于直觉和理论设计的优雅模型那么V3则更像是用“大力出奇迹”的神经架构搜索技术结合精妙的人工微调从海量可能的结构中“搜”出来的效率怪兽。4.1 NAS与人力协同设计NAS听起来很科幻让AI自己去设计网络结构。但纯粹的NAS搜出来的模型往往结构怪异像一团乱麻虽然精度高但极难部署和优化。V3采用的是平台感知NAS在搜索时不仅考虑精度还把目标硬件比如手机CPU上的实际延迟作为优化目标。搜出一个基础架构后再由工程师团队进行“精修”使其更规整、更高效。这给我的启发是在移动端AI领域纯粹的算法最优不等于工程最优。我们必须时刻考虑硬件的特性。V3的这种“先搜索后微调”的模式代表了算法与工程深度融合的趋势。4.2 关键组件升级SE、h-swish与结构微调V3在V2的块基础上引入了几个关键升级Squeeze-and-Excitation注意力模块这个模块可以理解为一个“特征通道重要性打分器”。它先通过全局平均池化把每个通道的特征压缩成一个数值Squeeze然后经过两个全连接层学习出每个通道的权重Excitation最后用这个权重去重新标定原始特征。相当于让网络自己学会说“这张图里红色通道的特征很重要给它加权蓝色通道没啥用削弱它。” 在V3中SE模块被谨慎地插入到部分反转残差块中用极小的计算代价换来了明显的精度提升。h-swish激活函数Swish激活函数x * sigmoid(x)被证明比ReLU效果更好但其中的sigmoid计算在移动端太昂贵。V3提出了h-swish用一段线性函数来近似模拟sigmoid在正区间的形状负区间则直接为0。具体实现是h-swish(x) x * ReLU6(x3)/6。这个函数计算友好在不少移动端芯片上都有指令级优化实现了精度与速度的兼得。网络头尾的“手术”头部精简V3把第一个标准卷积层的滤波器数量从V2的32个减半到16个。实验发现这对精度影响微乎其微但显著降低了计算延迟。这提醒我们网络入口处的计算往往性价比不高是可以优先优化的部位。尾部重构V2在最后的全局平均池化层之前还有一个1x1卷积来升维。V3直接把平均池化层提到这个卷积之前让1x1卷积直接在1x1的空间分辨率上操作。这一步改动减少了大量计算是降低延迟的“神来之笔”。4.3 大小双模型与部署选择V3提供了Large和Small两个版本分别针对对精度和速度有不同偏好的场景。从论文数据看V3-Large在同等精度下比V2快约20%V3-Small则更极致地追求小体积和快速度。但在实际工业部署中我发现一个有趣的现象V2的使用率依然非常高。原因在于V3虽然纸面指标漂亮但其结构因NAS搜索而略显复杂如SE模块的插入位置不规律在一些没有专门优化的推理引擎上其速度优势可能并不明显甚至因为分支增多而略慢于结构规整的V2。因此选型时一定要在自己的目标硬件和推理框架上做充分的基准测试。5. 移动端部署实战从模型到产品的最后一公里模型设计得好只是成功了一半把它高效、稳定地运行在手机或嵌入式设备上才是真正的挑战。下面分享几个我总结的关键实战环节。5.1 模型格式转换与优化我们通常在PyTorch或TensorFlow中训练模型但移动端需要更高效的格式。常见的路径是PyTorch - ONNX使用torch.onnx.export将模型导出为ONNX格式。这里最大的坑是算子兼容性。MobileNet中的一些操作如特定参数的池化、h-swish可能不被某些推理引擎的ONNX解析器完美支持。导出后务必用ONNX Runtime或目标引擎的工具验证推理结果是否正确。ONNX - 平台特定格式安卓NNAPI / TFLite通常将ONNX转换为TensorFlow SavedModel再用TFLite Converter转换为.tflite文件。转换时可以启用int8量化大幅压缩模型、提升速度。iOSCore ML使用coremltools将ONNX直接转换为.mlmodel格式。华为鸿蒙NNRT使用华为提供的转换工具链。一个至关重要的优化是“算子融合”。例如一个“卷积 - 批归一化 - 激活函数”的序列在推理时可以被融合成一个单一的“卷积”操作。这不仅能减少算子调度的开销还能为一些计算如BN的缩放和平移找到在硬件上更快的实现方式。TFLite Converter在转换时会自动尝试进行这类融合。5.2 针对硬件的调优策略不同的移动端芯片优化策略截然不同CPU多核ARM重点利用多线程并行计算。确保推理框架能正确绑定大核并利用NEON指令集进行SIMD单指令多数据加速。对于MobileNet1x1卷积是性能关键应确保其实现是高度优化的。GPUAdreno, Mali利用其强大的并行浮点计算能力。需要关注纹理内存访问是否连续避免频繁的显存读写。一些框架如MACE、TensorFlow Lite GPU Delegate提供了针对移动GPU的优化内核。NPU/DSP专用AI加速器如华为麒麟的NPU、高通Hexagon DSP。这是性能提升的“王牌”。你需要使用芯片厂商提供的专用SDK和量化工具链通常是int8量化。注意NPU对算子支持有限制MobileNet V3中的SE模块、h-swish等可能需要用支持的算子组合实现或回退到CPU执行这需要仔细规划模型分区。5.3 内存、功耗与发热的平衡在移动端性能不仅仅是速度更是综合体验。内存占用除了模型本身还要关注推理时的中间激活值所占用的内存。V2/V3的反转残差结构在扩张层会产生较大的临时张量。可以通过“内存规划”工具分析峰值内存使用避免导致OOM内存溢出。功耗与发热持续高强度的推理会快速消耗电量并导致设备发热降频。策略包括动态频率调节在不需要实时处理时如相册图片扫描降低推理频率或使用轻量级模型。精度-功耗权衡在光线良好、场景简单时使用float16甚至int8推理在暗光、复杂场景下切换回float32以保证精度。利用硬件休眠将多个推理请求排队让硬件批量处理减少频繁唤醒的开销。我在一个手机影像App里部署人像分割模型时就采用了“双模型策略”预览流使用极轻量的V3-Small int8量化版保证流畅度当用户按下快门时瞬间切换为精度更高的V2 float16模型进行最终处理。用户对速度和效果都很满意。6. 代码实操以PyTorch实现与转换为TFLite为例理论说了这么多我们动手实现一个MobileNetV2并完成到TFLite的转换和简单性能测试。6.1 用PyTorch搭建MobileNetV2import torch import torch.nn as nn # 定义反转残差线性瓶颈块 class InvertedResidual(nn.Module): def __init__(self, inp, oup, stride, expand_ratio): super(InvertedResidual, self).__init__() self.stride stride assert stride in [1, 2] hidden_dim int(round(inp * expand_ratio)) self.use_res_connect self.stride 1 and inp oup layers [] if expand_ratio ! 1: # 逐点卷积进行升维 layers.append(nn.Conv2d(inp, hidden_dim, 1, 1, 0, biasFalse)) layers.append(nn.BatchNorm2d(hidden_dim)) layers.append(nn.ReLU6(inplaceTrue)) layers.extend([ # 逐通道卷积 nn.Conv2d(hidden_dim, hidden_dim, 3, stride, 1, groupshidden_dim, biasFalse), nn.BatchNorm2d(hidden_dim), nn.ReLU6(inplaceTrue), # 逐点卷积进行降维注意这里没有ReLU nn.Conv2d(hidden_dim, oup, 1, 1, 0, biasFalse), nn.BatchNorm2d(oup), ]) self.conv nn.Sequential(*layers) def forward(self, x): if self.use_res_connect: return x self.conv(x) else: return self.conv(x) # 定义完整的MobileNetV2 class MobileNetV2(nn.Module): def __init__(self, num_classes1000, width_mult1.0): super(MobileNetV2, self).__init__() # 首层卷积 input_channel 32 last_channel 1280 # 根据宽度乘子调整通道数 input_channel int(input_channel * width_mult) last_channel int(last_channel * max(1.0, width_mult)) # 网络配置表: [t, c, n, s] # t: 扩张倍数, c: 输出通道, n: 重复次数, s: 步幅(第一个块的步幅) inverted_residual_setting [ [1, 16, 1, 1], [6, 24, 2, 2], [6, 32, 3, 2], [6, 64, 4, 2], [6, 96, 3, 1], [6, 160, 3, 2], [6, 320, 1, 1], ] features [nn.Sequential( nn.Conv2d(3, input_channel, 3, 2, 1, biasFalse), nn.BatchNorm2d(input_channel), nn.ReLU6(inplaceTrue) )] # 构建中间的反转残差块 for t, c, n, s in inverted_residual_setting: output_channel int(c * width_mult) for i in range(n): stride s if i 0 else 1 features.append(InvertedResidual(input_channel, output_channel, stride, t)) input_channel output_channel # 尾部卷积 features.append(nn.Sequential( nn.Conv2d(input_channel, last_channel, 1, 1, 0, biasFalse), nn.BatchNorm2d(last_channel), nn.ReLU6(inplaceTrue) )) self.features nn.Sequential(*features) # 分类器 self.classifier nn.Sequential( nn.Dropout(0.2), nn.Linear(last_channel, num_classes), ) # 权重初始化 for m in self.modules(): if isinstance(m, nn.Conv2d): nn.init.kaiming_normal_(m.weight, modefan_out) if m.bias is not None: nn.init.zeros_(m.bias) elif isinstance(m, nn.BatchNorm2d): nn.init.ones_(m.weight) nn.init.zeros_(m.bias) elif isinstance(m, nn.Linear): nn.init.normal_(m.weight, 0, 0.01) nn.init.zeros_(m.bias) def forward(self, x): x self.features(x) # 全局平均池化 x x.mean([2, 3]) x self.classifier(x) return x # 实例化一个宽度乘子为1.0的标准MobileNetV2 model MobileNetV2(width_mult1.0) print(model) # 可以用一个随机输入测试前向传播 test_input torch.randn(1, 3, 224, 224) output model(test_input) print(fOutput shape: {output.shape})6.2 模型导出、转换与量化接下来我们将PyTorch模型转换为TFLite格式并进行动态范围量化以压缩模型。import torch.onnx import onnx import tensorflow as tf import numpy as np # 1. 导出PyTorch模型到ONNX model.eval() # 切换到评估模式 dummy_input torch.randn(1, 3, 224, 224) onnx_path mobilenetv2.onnx torch.onnx.export(model, dummy_input, onnx_path, input_names[input], output_names[output], opset_version11, # 使用较新的算子集版本 dynamic_axes{input: {0: batch_size}, output: {0: batch_size}}) print(fModel exported to {onnx_path}) # 注意实际生产中从ONNX到TFLite可能需要经过TensorFlow作为中间步骤。 # 这里为了流程完整我们假设已经得到了一个TensorFlow SavedModel。 # 以下代码演示直接从TensorFlow构建一个简易MobileNetV2并转换。 # 2. 使用TensorFlow的Keras API构建一个MobileNetV2用于演示转换流程 # 在实际项目中你可能需要更复杂的ONNX-TF转换流程。 def build_and_convert_tflite(): # 使用TensorFlow内置的MobileNetV2与PyTorch实现结构略有不同仅作演示 keras_model tf.keras.applications.MobileNetV2( input_shape(224, 224, 3), alpha1.0, # 宽度乘子 weightsimagenet, include_topTrue # 包含顶部分类层 ) # 转换为TFLite格式浮点 converter tf.lite.TFLiteConverter.from_keras_model(keras_model) tflite_model converter.convert() # 保存浮点模型 with open(mobilenetv2_float.tflite, wb) as f: f.write(tflite_model) print(Float TFLite model saved.) # 进行动态范围量化一种后训练量化减小模型大小小幅加速 converter.optimizations [tf.lite.Optimize.DEFAULT] # 如果要进行全整数量化通常需要提供代表性数据集来校准 # def representative_dataset(): # for _ in range(100): # data np.random.rand(1, 224, 224, 3).astype(np.float32) # yield [data] # converter.representative_dataset representative_dataset # converter.target_spec.supported_ops [tf.lite.OpsSet.TFLITE_BUILTINS_INT8] # converter.inference_input_type tf.uint8 # 或 tf.int8 # converter.inference_output_type tf.uint8 # 或 tf.int8 tflite_quant_model converter.convert() with open(mobilenetv2_dynamic_quant.tflite, wb) as f: f.write(tflite_quant_model) print(Dynamically quantized TFLite model saved.) # 比较模型大小 import os float_size os.path.getsize(mobilenetv2_float.tflite) / 1024 / 1024 quant_size os.path.getsize(mobilenetv2_dynamic_quant.tflite) / 1024 / 1024 print(fFloat model size: {float_size:.2f} MB) print(fQuantized model size: {quant_size:.2f} MB) print(fSize reduced to: {quant_size/float_size*100:.1f}%) if __name__ __main__: # 注意这里需要TensorFlow环境 # build_and_convert_tflite() print(请确保在TensorFlow环境中运行转换代码。)6.3 在Android上进行基准测试模型转换好后在安卓端使用TFLite进行推理和性能测试是关键一步。以下是使用Android Studio和Java API的简化示例// 1. 将.tflite模型文件放入app/src/main/assets/目录下 // 2. 在build.gradle中添加依赖implementation org.tensorflow:tensorflow-lite:2.10.0 import org.tensorflow.lite.Interpreter; import org.tensorflow.lite.gpu.GpuDelegate; import java.nio.ByteBuffer; import java.nio.ByteOrder; import android.graphics.Bitmap; public class TFLiteMobileNetClassifier { private Interpreter tflite; private GpuDelegate gpuDelegate null; // 可选GPU代理 public void initializeModel(Context context, boolean useGPU) { try { // 加载模型文件 MappedByteBuffer modelBuffer loadModelFile(context, mobilenetv2_dynamic_quant.tflite); Interpreter.Options options new Interpreter.Options(); // 设置线程数 options.setNumThreads(4); // 可选启用GPU加速需要设备支持 if (useGPU isGpuDelegateAvailable()) { gpuDelegate new GpuDelegate(); options.addDelegate(gpuDelegate); Log.d(TFLite, Using GPU delegate.); } else { Log.d(TFLite, Using CPU.); } // 创建解释器 tflite new Interpreter(modelBuffer, options); } catch (Exception e) { Log.e(TFLite, Error initializing model, e); } } public float[] runInference(Bitmap bitmap) { // 预处理将Bitmap缩放到224x224归一化等 ByteBuffer inputBuffer preprocessBitmap(bitmap); // 输出容器 float[][] output new float[1][1000]; // ImageNet有1000类 // 运行推理并计时 long startTime SystemClock.uptimeMillis(); tflite.run(inputBuffer, output); long endTime SystemClock.uptimeMillis(); Log.d(TFLite, Inference time: (endTime - startTime) ms); return output[0]; } private ByteBuffer preprocessBitmap(Bitmap bitmap) { Bitmap resizedBitmap Bitmap.createScaledBitmap(bitmap, 224, 224, true); ByteBuffer byteBuffer ByteBuffer.allocateDirect(4 * 224 * 224 * 3); // float32 byteBuffer.order(ByteOrder.nativeOrder()); int[] intValues new int[224 * 224]; resizedBitmap.getPixels(intValues, 0, 224, 0, 0, 224, 224); int pixel 0; for (int y 0; y 224; y) { for (int x 0; x 224; x) { int val intValues[pixel]; // 量化模型可能需要uint8输入这里以float为例 byteBuffer.putFloat(((val 16) 0xFF) / 255.0f); // R byteBuffer.putFloat(((val 8) 0xFF) / 255.0f); // G byteBuffer.putFloat((val 0xFF) / 255.0f); // B } } return byteBuffer; } public void close() { if (tflite ! null) { tflite.close(); tflite null; } if (gpuDelegate ! null) { gpuDelegate.close(); gpuDelegate null; } } }在实际测试中你需要在一个真实的设备上使用不同的输入尺寸、线程数、是否启用GPU/NPU等参数进行多次推理取稳定后的平均耗时和内存占用作为基准。记得在非充电、温度适宜的环境下测试以获得更接近用户实际使用的数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2516885.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…