基于Windows Defender遥测数据与机器学习预测恶意软件感染风险

news2026/5/22 5:32:18
1. 项目概述当Windows Defender遇见机器学习在网络安全这个没有硝烟的战场上恶意软件Malware始终是悬在个人用户和企业头顶的达摩克利斯之剑。从勒索软件加密关键文件到间谍软件窃取商业机密每一次成功的攻击都可能意味着数据泄露、系统瘫痪乃至巨额经济损失。传统的“杀毒软件”依赖特征码Signature进行比对就像一份通缉令名单只能识别已知的“罪犯”。然而恶意软件的变种和新型攻击层出不穷每天都有数以万计的新“面孔”出现这让基于签名的防御体系越来越力不从心。正是在这种背景下基于机器学习的动态行为检测技术成为了安全研究者和从业者眼中的“破局之匙”。其核心思路不再是“认脸”而是“识行”——通过分析程序或系统的行为模式、资源调用、网络活动等海量特征来判断其是否具有恶意意图。这就像从“比对通缉犯照片”升级为“分析一个人的行为轨迹是否可疑”能够有效应对未知威胁和经过混淆、伪装的新型恶意软件。我们这次的研究正是将这把“钥匙”对准了全球部署最广泛的终端防护体系之一Microsoft Windows Defender。 Defender每天守护着数以亿计的Windows设备其后台默默收集的匿名化遥测数据Telemetry Data构成了一个描绘系统安全状态的、极其珍贵的真实世界数据金矿。我们的目标很明确利用机器学习技术深度挖掘Windows Defender数据集中的隐藏模式构建一个能够高精度预测Windows计算机是否易受恶意软件感染的模型。这不仅是对传统检测方法的补充更是一种从“被动响应”到“主动预测”的防御思路转变。这项工作的价值在于其高度的实践导向。我们使用的Kaggle平台上的“Microsoft Malware Prediction”数据集包含了超过890万台真实Windows设备的匿名化特征数据规模之大、场景之真实在学术界和工业界都属罕见。通过系统性的特征工程和多种主流机器学习算法的对比实验我们最终找到了在当前数据维度下表现最优的模型方案。无论你是一名安全工程师希望为你的企业端点防护EDR方案注入预测能力还是一名数据科学家对网络安全领域的机器学习应用感兴趣亦或是一名IT管理员想更深入地理解影响系统安全性的关键因素这篇文章中详尽的思路拆解、实操步骤和避坑经验都能为你提供直接的参考。2. 核心思路与技术选型背后的考量面对一个拥有近900万条样本、81个原始特征的大规模分类问题盲目地套用模型无异于大海捞针。我们的整体研究思路遵循一个清晰的管道Pipeline数据理解 - 特征工程 - 模型训练与评估 - 结果分析。每一个环节的选择都基于我们对问题本质和数据特性的理解。2.1 为什么选择Windows Defender数据在项目启动时数据集的选择直接决定了模型的上限和落地潜力。我们放弃了使用合成数据集或小规模实验室数据而坚定地选择了微软官方发布的Kaggle竞赛数据集主要基于以下几点考量规模与真实性890多万条记录源自真实用户环境中的Windows Defender事件。这种规模确保了模型能够学习到足够多样化的模式其统计规律更接近现实世界分布避免了在小数据集上过拟合导致的“实验室效果”。特征维度丰富数据集提供了从操作系统版本、补丁状态、安全软件配置到硬件普查信息等81个维度的特征。这为我们从系统“状态”而非单一文件“行为”的角度预测感染风险提供了可能。我们预测的不是某个文件是否为恶意软件而是这台计算机在当前配置下是否处于易受攻击的“脆弱状态”。业务指向性明确数据直接来源于微软的终端防护产品这意味着任何在此数据上验证有效的模型和特征洞察都有潜在的路径被整合回产品线用于改进Defender自身的智能检测模块或风险评分系统实现从研究到产品的闭环。2.2 模型选型策略从基线到集成的演进逻辑我们并没有一上来就使用最复杂的深度学习模型而是采用了一种循序渐进的策略。这既是出于对计算资源的考量也是为了更扎实地理解问题。建立性能基线首先使用高斯朴素贝叶斯Gaussian NB和逻辑回归Logistic Regression这类计算简单、解释性强的模型。目的有两个一是验证数据集本身是否具有可学习的模式如果连逻辑回归都比随机猜测好不了多少那可能特征或问题定义本身就有问题二是为后续更复杂模型的性能提升提供一个明确的对比基线。探索非线性关系决策树Decision Tree是我们的下一个选择。它能自动捕捉特征间的非线性关系和交互作用且对数据尺度不敏感。通过决策树的训练我们可以初步观察哪些特征被模型认为更重要为特征工程提供反馈。拥抱集成学习当单一模型弱学习器表现遇到瓶颈时集成学习Ensemble Learning是自然的选择。我们重点尝试了两种主流方向梯度提升Gradient Boosting以XGBoost和LightGBM为代表。这类模型通过迭代地训练新树来纠正前一棵树的残差通常能获得很高的精度。它们能有效处理混合类型数据且对过拟合有一定的抑制能力通过正则化参数。堆叠Stacking这是一种高阶集成将多个不同类型的基模型如我们训练好的NB、LR、DT、随机森林的预测结果作为新特征再用一个元模型Meta-Model进行最终预测。理论上它能融合不同模型的优势。注意模型选择没有“银弹”。在网络安全领域除了精度Accuracy我们还需极度关注查全率Recall即找出所有坏人的能力和查准率Precision即我们认定的坏人里有多少是真坏人。一个查全率很低的模型即使精度再高也会漏掉大量威胁这是不可接受的。因此我们的评估始终围绕混淆矩阵Confusion Matrix及其衍生的各项指标展开。3. 数据预处理与特征工程的魔鬼细节如果说模型是发动机那么特征就是燃料。对于这个数据集特征工程的质量直接决定了模型性能的天花板。原始数据就像一座未经雕琢的矿山充满了缺失值、高基数类别特征和不一致的格式。3.1 数据清洗大胆假设小心求证我们面对的第一个挑战是海量的缺失值。直接删除所有含缺失值的样本会导致数据量锐减而盲目填充如用均值、众数又可能引入严重偏差。我们的处理策略是分层处理剔除信息量极低的特征我们首先计算了每个特征的缺失值比例。发现有3个特征如DefaultBrowsersIdentifier缺失率超过90%。这类特征携带的有效信息极少留之无益果断删除。另有4个特征缺失率在60%-90%之间出于对信息保留和数据质量的平衡考虑也予以剔除。处理高偏态Skewed特征有26个特征中超过90%的样本都集中在某一个类别上例如99%的机器HasTpm特征都为“是”。这种特征方差极小对模型区分不同类别的贡献微乎其微反而可能成为噪声因此也将其移除。处理剩余缺失值经上述筛选特征数降至51个但数据集中仍有缺失值。考虑到我们仍有超过350万条完整记录删除含缺失值行后这个数据量对于训练机器学习模型依然非常充足。在计算资源有限且缺失机制可能并非完全随机的情况下采用列表删除法Listwise Deletion保留完整案例是一个务实且常见的工业界做法。最终我们得到了一个包含350万条样本、51个特征的平衡数据集正负样本比例约为51:49。3.2 特征编码与变换分而治之的艺术清洗后的数据包含数值型、二值型和类别型特征。其中类别型特征是处理的难点和重点。我们根据类别基数Cardinality即唯一值的数量采用了不同的编码策略这是一个关键的经验点二值特征保持不变直接作为0/1输入。数值特征使用最小-最大缩放Min-Max Scaling进行归一化将其压缩到[0,1]区间避免量纲对基于距离的模型如后续可能用到的模型产生影响。低基数类别特征5类使用独热编码One-Hot Encoding。例如Firewall防火墙状态可能只有“开”、“关”、“未知”三类将其转换为三个二进制特征。中基数类别特征5-20类使用标签编码Label Encoding或因子化Factorizing。为每个类别分配一个唯一的整数ID。这适用于有内在顺序或只是作为标识符的特征。高基数类别特征20类这是最大的挑战。例如CityIdentifier城市标识符有7万多个唯一值使用独热编码会导致特征空间爆炸使用标签编码则会赋予类别无意义的序关系。我们采用频率编码Frequency Encoding用每个类别在训练集中出现的频率或占比来替换类别标签。这样模型学习到的是“这个值常见与否”的信息而非其ID大小。编码后同样进行Min-Max归一化。3.3 深度特征解析从版本号中挖掘金矿数据集中有一些以点分十进制格式如1.2.3.4存在的特征如AvSigVersion反病毒签名版本、EngineVersion引擎版本等。直接将其视为一个字符串类别基数会非常高。我们的创新处理方法是分段解析以AvSigVersion为例其格式为A.B.C.D。我们发现A段和D段在所有样本中都相同不提供区分信息直接丢弃。B段有51个类别但绝大多数样本集中在其中两个值上。我们将其他所有低频类别合并为“其他”然后对这三个类别两个主要值“其他”进行独热编码。C段有2725个类别属于典型的高基数特征采用频率编码。这种方法的核心思想是降维和语义提取。版本号的不同段位往往代表不同的含义如主版本号、次版本号、构建号。分段处理不仅大幅降低了特征维度还可能让模型捕捉到更有意义的模式例如是不是某个主版本号的系统更容易受到攻击。实操心得警惕数据陷阱。在分析CountryIdentifier和CityIdentifier时我们发现了一个有趣的数据质量问题理论上一个城市ID应只属于一个国家。但交叉匹配显示有2109个城市ID出现在了多个国家记录中。这可能是数据匿名化过程中的错误或是某些特殊区域如争议地区的编码问题。对于这类明显存在逻辑错误或含义模糊的特征最稳妥的做法是直接剔除而不是试图去修正或解释否则可能将噪声甚至错误引入模型。我们最终删除了CityIdentifier特征。经过这一系列繁复但至关重要的特征工程我们将51个原始特征转换为了97个可供模型直接使用的编码后特征。这个过程虽然耗时但却是整个项目成功的基石。4. 模型训练、调优与性能对决特征准备就绪后我们进入了模型构建阶段。我们按照从简到繁的顺序训练了多个模型并详细记录了它们的表现和训练成本。4.1 基线模型朴素贝叶斯与逻辑回归作为起点高斯朴素贝叶斯模型在测试集上仅取得了约57.5%的准确率几乎等同于随机猜测50%。这初步印证了我们的假设特征之间存在复杂的相关性“朴素”的条件独立性假设在这个问题上不成立。逻辑回归模型经过超参数调优使用saga求解器L2正则化强度C1准确率提升至约61.8%。虽然仍有提升但对于一个二分类问题这个性能远远达不到实用水平。逻辑回归作为广义线性模型难以捕捉特征间复杂的非线性交互。4.2 决策树揭示特征重要性决策树模型显示了更强的拟合能力。未经剪枝的树在训练集上达到了近乎完美的99.99%但在测试集上只有55.58%这是典型的过拟合。我们通过网格搜索Grid Search配合3折交叉验证找到了最优超参数组合分裂准则为“熵”最大深度为12分裂器为“随机”。调优后的决策树在测试集上的准确率达到了62.35%。决策树的一个重要副产品是特征重要性评分。通过分析我们发现了几个对预测感染风险至关重要的系统状态特征例如SmartScreen相关特征Windows SmartScreen筛选器的状态这是微软内置的一道重要防线。Census_OSBuildNumber操作系统内部版本号反映了系统补丁的新旧程度。AVProductStatesIdentifier防病毒产品状态标识暗示了安全软件的安装和运行状况。各种Census_硬件普查特征如处理器类型、内存容量等可能与特定漏洞的利用条件相关。这些发现极具业务价值它告诉我们保持系统更新至最新版本、确保安全功能如SmartScreen开启、使用受认可的安全软件是降低恶意软件感染风险最直接有效的几个可操作点。4.3 集成模型性能的飞跃单一模型的表现遇到了瓶颈我们转向集成学习。堆叠Stacking模型我们将调优后的高斯NB、逻辑回归、决策树、极端随机树Extra-Trees和随机森林作为基学习器使用XGBoost作为元学习器进行堆叠。最终模型测试准确率约为62.89%。虽然比单一决策树略有提升但代价是超过8小时的训练时间。考虑到性能提升并不显著而计算成本高昂我们判断此方案性价比不高。梯度提升树XGBoost与LightGBM这是本次研究的亮点。我们直接使用梯度提升框架。初步训练XGBoost时模型再次过拟合训练精度99.99%测试精度61.08%。这提醒我们对于强大的集成模型严格的超参数调优和正则化设置至关重要。我们随后对XGBoost进行了系统的调优重点关注以下参数 *max_depth树的最大深度控制模型复杂度。 *learning_rate学习率控制每棵树对最终结果的贡献权重。 *n_estimators树的数量。 *subsample样本子采样比例引入随机性防止过拟合。 *colsample_bytree特征子采样比例。 *reg_alpha,reg_lambdaL1和L2正则化项。通过贝叶斯优化Bayesian Optimization寻找最优参数组合并将早停法Early Stopping应用于验证集我们最终获得了稳定的模型。调优后的XGBoost模型在测试集上的准确率达到了约68.5%同时查全率和查准率也取得了较好的平衡。LightGBM作为另一个高效的梯度提升实现在调整了类似参数后取得了与XGBoost相近的性能约68.1%但训练速度更快。4.4 模型性能对比与最终选择我们将各模型的性能总结如下表模型训练准确率测试准确率关键优势主要不足训练时间高斯朴素贝叶斯57.54%57.52%训练极快解释性强假设过强精度低1分钟逻辑回归61.79%61.83%训练快可解释性好无法处理复杂非线性~5分钟决策树调优后62.75%62.35%可解释性极佳提供特征重要性容易过拟合精度一般~10分钟堆叠模型63.46%62.89%理论上能融合各模型优势训练成本极高提升有限8小时XGBoost调优后~70.2%~68.5%精度高鲁棒性好支持正则化超参数多调优复杂可解释性较差~1小时LightGBM调优后~69.8%~68.1%精度高训练速度最快可解释性较差对少量数据可能过拟合~30分钟最终选择与理由 综合考量精度、训练效率和工程实用性调优后的XGBoost模型被选为我们的最终预测模型。其接近68.5%的测试准确率在如此大规模、高噪声的真实世界数据上是一个颇具说服力的结果。更重要的是相比于随机猜测或基线模型它将预测能力提升了超过10个百分点这意味着在实际部署中它能显著缩小需要优先排查的高风险主机范围。LightGBM虽然速度更快但在我们的实验设置下XGBoost的精度略胜一筹且其社区更成熟在生产环境中的部署案例也更丰富。决策树模型则作为我们进行特征分析和结果解释的重要辅助工具。5. 实战复盘挑战、问题与解决方案在实际操作中我们遇到了诸多预料之中和预料之外的挑战。以下是其中最具代表性的问题及我们的解决思路。5.1 内存与计算资源瓶颈问题原始数据集约8.9GB即使经过清洗和抽样处理350万条样本、97维特征的数据在进行独热编码特别是尝试处理高基数特征时和训练复杂模型如未调优的深度树或堆叠模型时极易导致内存溢出OOM Error并使训练时间变得不可接受。解决方案增量编码与处理对于高基数特征放弃创建巨大稀疏矩阵的独热编码转而采用频率编码或目标编码Target Encoding将类别信息压缩为一个连续的数值。利用高效库使用pandas时注意数据类型如将category类型用于分类特征使用scikit-learn的HashingVectorizer替代CountVectorizer处理文本类特征。对于模型训练优先选择对内存友好的实现如LightGBM和XGBoost。分布式与抽样如果条件允许可以在Spark集群上进行特征工程和训练。我们的折中方案是在特征工程和模型初步筛选阶段使用一个较小的随机子样本如10%在最终模型训练和调优时再使用全量数据或更大的子样本。早停法在训练XGBoost/LightGBM时设置一个验证集并启用早停法。当验证集指标在连续多轮迭代中不再提升时自动停止训练避免不必要的计算和过拟合。5.2 类别不平衡与评估指标陷阱问题虽然我们的数据集整体是平衡的51.2% vs 48.8%但在某些特征分组或模拟的真实滚动预测场景中新感染样本的比例可能远低于正常样本。如果只关注准确率一个将所有样本都预测为“正常”的模型也会有很高的准确率但这毫无用处。解决方案采用综合评估指标坚决摒弃单一准确率论。我们主要监控精确率-召回率曲线PR Curve及其平均精度Average Precision, AP以及ROC曲线及其AUC值。对于安全场景我们通常更偏好高召回率因为“漏报”的代价远高于“误报”。我们会观察在不同决策阈值下的性能变化。代价敏感学习在训练XGBoost时可以通过scale_pos_weight参数增加少数类感染类样本的权重让模型在训练时更关注正确分类少数类。业务阈值调整模型输出的是感染概率0-1。部署时不应简单使用0.5作为分类阈值。我们可以根据业务能承受的误报率在PR曲线上选择一个合适的点对应一个更高的概率阈值如0.7以提升查准率或者选择一个更低的阈值如0.3以提升查全率。5.3 特征工程中的“数据泄露”问题这是一个极易忽视但致命的错误。例如在频率编码中如果使用整个数据集包括测试集来计算某个类别的出现频率那么测试集的信息就“泄露”到了训练过程中导致评估结果过于乐观模型在实际部署中表现骤降。解决方案严格遵守“仅从训练集获取统计信息”的原则。在fit阶段仅基于训练数据计算频率编码的映射字典、Min-Max缩放的最大最小值等。在transform阶段对训练集应用这些映射和参数对测试集则严格使用从训练集fit得到的参数进行转换。对于测试集中出现训练集未见过的类别OOV我们将其编码为一个特殊值如-1或使用训练集的全局平均频率。使用scikit-learn的Pipeline可以很好地封装这一过程确保数据预处理步骤与模型训练一起进行交叉验证避免泄露。5.4 模型可解释性与业务落地问题XGBoost等集成模型性能强大但常被诟病为“黑箱”。安全团队和决策者很难信任一个无法解释其预测原因的模型。解决方案全局特征重要性利用XGBoost内置的feature_importances_属性基于增益、覆盖度或频率输出最重要的Top-N个特征。这能帮助理解哪些系统属性整体上对感染风险影响最大。局部可解释性使用SHAPSHapley Additive exPlanations或LIME等工具。对于某台被预测为高风险的特定机器我们可以生成一个解释图展示是哪些特征值如“SmartScreen已禁用”、“系统版本过旧”将模型的预测推向了“感染”一侧。这能为安全分析师提供直接的调查线索。决策树代理模型训练一个深度受限的决策树在XGBoost的预测结果上进行拟合。虽然精度会下降但生成的树规则集可以作为人类可读的、近似的业务规则便于集成到现有的规则引擎或用于编写排查手册。经过这一系列实战我们得到的不仅仅是一个精度尚可的模型更是一套处理大规模安全遥测数据、构建可解释、可落地的机器学习检测系统的完整方法论。从数据清洗的取舍到特征工程的巧思再到模型选型的权衡和评估指标的把握每一个环节的决策都直接影响最终结果的可靠性与实用性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2633785.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…