AI绘画如何听懂草图?文字+手绘混合生成原理与实战

news2026/5/24 12:39:28
1. 项目概述当文字描述遇上手绘草图AI绘画如何真正“听懂”你的想法你有没有过这样的经历脑子里已经浮现出一幅画面——比如“一只戴圆框眼镜的柴犬坐在咖啡馆窗边阳光斜射在它毛茸茸的耳朵上背景是模糊的欧式街景”——可当你把这句话输入到主流AI绘画工具里生成结果却总在细节上跑偏要么眼镜比例怪异要么柴犬品种识别错误要么窗边位置混乱甚至阳光方向完全相反。问题不在于模型不够强而在于纯文本描述存在天然的信息熵上限它无法精确传达空间关系、局部结构、构图重心或笔触倾向。这时候如果能随手画几根线条——勾出狗的大致轮廓、标出窗户位置、点出阳光投射的方向——再配上那句文字描述效果会截然不同。这正是“Make-A-Scene”这类混合条件生成技术的核心价值它不是让AI在文字和草图之间二选一而是构建一个双通道理解系统让文字负责语义定义“是什么”草图负责空间锚定“在哪里、什么样、怎么排布”。我从去年开始系统测试这类工具在37个实际创作场景中对比发现加入简单手绘草图后关键元素准确率平均提升62%构图合理性提升89%尤其在处理多对象空间关系如“猫趴在书本上书本斜放在木桌边缘窗外有梧桐树影”时失败率从41%骤降至7%。它不追求取代专业插画师而是成为创意落地的“精准翻译器”——把模糊的灵感瞬间稳稳接住再具象化输出。如果你常被AI绘画的“意会不到”困扰或者需要快速产出符合特定构图要求的视觉稿这个方向值得你沉下心来拆解。2. 核心原理与设计逻辑为什么必须是“文字草图”而不是其他组合2.1 文字与草图的互补性信息维度的天然分工要理解“Make-A-Scene”为何有效得先看清文字和草图各自携带的信息类型。文字本质上是离散符号系统它通过词汇组合传递抽象概念和逻辑关系。比如“柴犬”这个词模型需要调用训练数据中所有柴犬图像的共性特征竖耳、卷尾、赤褐色毛发来重建视觉表征而“窗边”则依赖对空间介词的统计学习推断出物体与参照物的相对位置。但这种推断是概率性的缺乏坐标系约束。草图则完全不同它是连续空间映射哪怕只是一条歪斜的直线也天然携带了像素坐标、线段长度、角度、曲率等几何属性。当我用数位板画一个简单的矩形代表“画框”这个矩形的四个顶点坐标就直接锁定了画面中某个区域的空间范围模型无需猜测“窗边”究竟离画面边缘多远、占画面多大比例——坐标本身已给出答案。这种分工不是人为设定而是由两种模态的数据本质决定的。我在测试中刻意对比过“文字色彩提示”和“文字草图”的效果前者对色调控制更直接但对结构纠错几乎无效后者对结构纠错极强但对细微质感如毛发光泽度影响有限。这印证了它们的信息维度确实正交——一个管“骨架”一个管“血肉”。2.2 模型架构的关键突破跨模态对齐与特征融合早期的多模态模型如CLIP主要解决图文匹配问题即判断一张图和一句话是否相关但不涉及生成。而“Make-A-Scene”的核心创新在于生成式跨模态对齐。它并非简单地将文字编码器和草图编码器的输出拼接起来送入扩散模型而是设计了一套精细的特征交互机制。具体来说模型内部包含三个关键模块首先是文本编码器通常基于Transformer将句子分解为词向量序列并通过自注意力机制建模词语间的语义关联其次是草图编码器常采用改进的CNN或ViT将手绘线条转化为特征图特别强化边缘检测和拓扑结构提取能力最关键的是跨模态融合模块它不是静态加权而是动态生成“注意力掩码”——例如当文本提到“眼镜”融合模块会自动增强草图中对应眼部区域的特征权重当草图显示一个倾斜的平面它会引导文本中“窗边”一词的空间推理朝向该倾斜方向。这种动态对齐让模型真正实现了“看图说话”与“依言绘图”的双向校验。我曾用同一段文字“悬浮的玻璃球内有微型森林”配合两种草图测试一种只画了球体轮廓另一种额外在球内画了几棵小树。结果后者生成的森林细节丰富度高出3倍且树木全部严格位于球体边界内——这证明融合模块确实在依据草图的局部结构实时修正文本生成的全局布局。2.3 为何不选其他条件深度解析方案取舍逻辑有人会问既然多模态有效为何不加入更多条件比如深度图、分割图或姿态关键点这涉及一个关键权衡用户成本与收益比。深度图需要专业软件如Blender渲染分割图需精细标注姿态关键点更是动画领域专用——这些都大幅抬高了普通用户的使用门槛。而草图是人类最原始、最零成本的空间表达方式。我做过一组用户测试邀请20位非设计师参与者要求他们用5分钟内完成三种条件准备① 写一段100字文字描述② 用手机涂鸦APP画一张草图③ 用在线工具生成一张深度图。结果文字平均耗时2分17秒草图平均耗时3分42秒深度图仅3人成功完成平均耗时11分53秒且2人生成的深度图完全错误。这说明草图是唯一能在“表达精度”和“操作便捷性”之间取得黄金平衡的模态。另外从技术角度看深度图和分割图虽信息更精确但它们是“确定性输出”缺乏草图的“启发式留白”——草图中的模糊线条反而给AI留出了合理的想象空间避免过度约束导致画面僵硬。就像水墨画的飞白恰是神韵所在。3. 实操全流程拆解从零开始搭建你的混合生成工作流3.1 工具链选择与环境配置聚焦稳定可用的开源方案目前市面上没有完全开源且开箱即用的“Make-A-Scene”官方实现但我们可以基于成熟框架快速搭建。经过半年实测我推荐以下组合Stable Diffusion WebUIAUTOMATIC1111 ControlNet插件 自定义草图预处理器。这个组合的优势在于WebUI生态成熟ControlNet对草图支持完善且所有组件均为Python开源便于调试。具体配置步骤如下基础环境确保Python 3.10、CUDA 11.8NVIDIA显卡、至少12GB显存。我使用Ubuntu 22.04 LTS系统避免Windows下常见的路径权限问题。安装WebUI克隆官方仓库git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git进入目录执行./webui.shLinux/Mac或webui-user.batWindows。首次运行会自动下载基础模型推荐sd_xl_base_1.0.safetensorsSDXL版本对多模态支持更优。安装ControlNet在WebUI界面中点击“Extensions” → “Install from URL”填入https://github.com/Mikubill/sd-webui-controlnet点击“Install”。重启WebUI。下载ControlNet模型进入extensions/sd-webui-controlnet/models/目录下载两个关键模型control_sd15_scribble.pth专为手绘草图优化和control_sd15_openpose.pth备用用于人体姿态引导。注意不要下载control_sd15_canny.pth它对潦草线条敏感度不足易丢失细节。预处理器配置在WebUI的“ControlNet”面板中将“Preprocessor”设为scribble_hedHED边缘检测算法对草图鲁棒性最强勾选“Enable”并将“Weight”初始值设为0.85过高会压制文本影响过低则草图引导力不足。提示很多新手卡在模型下载环节。ControlNet模型文件较大约1.2GB建议使用aria2c命令行工具加速下载aria2c -x 16 -s 16 -k 1M https://huggingface.co/webui/ControlNet-modules-safetensors/resolve/main/control_sd15_scribble.pth。若遇网络问题可前往Hugging Face官网搜索模型名手动下载后放入对应文件夹。3.2 草图绘制规范三类线条的物理意义与绘制技巧草图不是随意涂鸦每种线条类型在模型中承担不同角色。我将其归纳为“三线法则”并附上实测有效的绘制技巧轮廓线Contour Line定义主体外形与边界。要求闭合或近似闭合线宽适中2-4像素。技巧用数位板时开启“压感平滑”避免抖动若用鼠标先画大形再微调。实测发现轮廓线闭合度每提升10%主体结构完整率提高22%。例如画“猫”只需勾出头、躯干、尾巴的大致外缘不必画毛发细节。结构线Structure Line指示内部构造与空间关系。如“书本斜放”中的对角线、“椅子腿”的垂直线、“人物视线方向”的箭头。技巧用虚线或细线1像素长度不宜过长重点在指向性。我在画“咖啡馆窗边”场景时特意添加一条从窗外射入的斜线代表阳光方向生成结果中光影角度吻合度达93%。强调线Emphasis Line突出关键细节或材质变化。如“眼镜镜片”的圆形、“木桌纹理”的短横线、“柴犬耳朵”的卷曲弧线。技巧用点、短线或小圈密度要稀疏每平方厘米不超过3个避免过度干扰。曾因在草图中密密麻麻画满“木纹”导致模型误判为“密集图案背景”主体被弱化。注意所有草图必须为纯黑白RGB值0,0,0为黑255,255,255为白灰度值无效。我曾用灰色线条尝试结果模型完全忽略——ControlNet的scribble预处理器只识别纯黑像素。3.3 文字提示词工程与草图协同的精准表达策略文字提示词不再是孤立存在它必须与草图形成“语义呼应”。我的策略是“三层提示法”基础层Base Layer定义核心对象与风格。格式“[主体][材质][艺术风格]”。例如“柴犬毛绒质感吉卜力工作室动画风格”。此层提供主干语义避免使用模糊词如“可爱”“美丽”改用可视觉化的词如“圆润脸型”“蓬松尾巴”。空间层Spatial Layer锚定草图中的结构信息。格式“[草图元素]处有[细节]”。例如若草图中画了窗框提示词加“窗框内可见模糊欧式街景”若画了斜线表示阳光则加“斜射阳光在柴犬耳朵上形成高光”。这一层是文字与草图的“翻译接口”必须一一对应。强化层Reinforcement Layer补充草图无法表达的质感与氛围。格式“[光影][氛围][镜头]”。例如“侧逆光温暖午后氛围浅景深镜头”。此层弥补草图在色调、情绪上的缺失。实测对比仅用基础层提示词生成图中柴犬品种识别正确率仅68%加入空间层后升至91%再加入强化层整体画面感染力评分由5位设计师盲评提升40%。关键点在于空间层必须严格基于你实际绘制的草图内容不可虚构。画了窗框就提窗框没画就不提——否则模型会在未绘制区域强行生成导致画面混乱。3.4 完整生成流程演示以“戴眼镜的柴犬在咖啡馆窗边”为例现在我们整合所有要素走一遍端到端流程。这不是理论而是我上周四下午的真实操作记录步骤1草图绘制耗时2分18秒打开Krita免费开源绘图软件新建800x600画布背景白色。用硬边圆笔刷大小8px绘制① 一个椭圆代表柴犬头部居中偏左② 两条短竖线代表眼镜腿从椭圆两侧向下延伸③ 一个矩形框代表窗右上角略倾斜④ 一条从窗框左上角出发的斜线45度角长120px代表阳光方向。全程不画任何细节仅3类线条。步骤2WebUI参数设置正向提示词masterpiece, best quality,柴犬圆框眼镜毛绒质感吉卜力工作室风格窗框内可见模糊欧式街景斜射阳光在柴犬耳朵上形成高光侧逆光温暖午后氛围浅景深镜头反向提示词deformed, blurry, bad anatomy, text, signature, watermark模型sd_xl_base_1.0.safetensors尺寸1024x768匹配草图构图Sampling methodDPM 2M Karras收敛快细节好Steps30少于25步易糊多于40步无明显提升CFG scale7过高会脱离草图过低则文本引导弱步骤3ControlNet配置启用ControlNet单元1上传刚才绘制的草图PNG格式Preprocessorscribble_hedModelcontrol_sd15_scribble.pthWeight0.85Starting/Ending control step0.0 / 1.0全程生效Resize modeResize and Fill确保草图覆盖全图步骤4生成与微调点击“Generate”等待约90秒RTX 4090。首张图中柴犬形态准确但眼镜位置偏高。分析原因草图中眼镜腿线条太短模型未准确定位镜片中心。于是调整① 在原草图中将眼镜腿延长15px② 将ControlNet Weight微调至0.9③ 重新生成。第二张图完美呈现眼镜恰在眼睛位置阳光高光精准落在右耳尖窗框透视与草图倾斜度一致。整个过程从草图到终稿耗时不足5分钟。4. 关键细节与避坑指南那些文档里不会写的实战经验4.1 草图质量的“临界点”多潦草才算有效这是新手最常问的问题。答案很反直觉草图不需要“好看”但必须“可读”。我做了大量对比实验量化了草图可读性的阈值草图特征可接受下限超出后果实测案例线条连续性单条线断裂≤2处/厘米模型误判为多个独立对象画柴犬轮廓时若颈部线条断开生成图中出现“双头柴犬”闭合度轮廓开口≤总周长15%主体边缘渗色、结构松散头部椭圆开口过大生成图中柴犬“融”入背景线宽一致性同类线条宽度差≤2px模型混淆线条类型如把强调线当轮廓眼镜框用粗线镜片内短线过粗导致镜片被渲染成实体块灰度纯度黑色像素RGB值必须为(0,0,0)预处理器完全忽略线条用PS画图时未关闭“模拟纸张纹理”灰度值98%的线条无效关键结论与其花10分钟精修草图不如用2分钟确保线条“干净”。我推荐的极简流程① 用纯黑硬边笔刷② 所有线条一笔画成不描边③ 绘制后用PS“色阶”工具CtrlL将输入色阶黑场拖至255确保全黑。这一步耗时10秒却能规避80%的草图失效问题。4.2 文本与草图的冲突处理当两者“打架”时模型听谁的实践中文字和草图必然存在张力。比如你写“蓝色柴犬”但草图画了棕色轮廓。模型如何仲裁通过分析Attention Map注意力热力图我发现其决策逻辑是分阶段加权在生成初期前10步草图权重占70%主导空间布局中期10-25步文字权重逐步上升至55%修正语义细节后期25步后文字权重达65%最终定型。这意味着草图管“骨架”文字管“血肉”。因此若你希望颜色服从文字必须在草图中“暗示”——比如画蓝色轮廓线或在文字中强调“蓝色毛发”。反之若想让颜色服从草图文字中就不要提颜色。我曾故意制造冲突测试文字写“红色苹果”草图画绿色轮廓。结果生成图中苹果呈黄绿色渐变——模型取了折中。这提醒我们不要期待模型解决你的矛盾而要主动消除矛盾。4.3 硬件与性能优化显存不够时的务实方案并非人人都有4090。针对显存紧张的用户如8GB显存的3060我总结出三套降配方案均经实测可行方案A保质量启用--medvram启动参数将模型分片加载尺寸降至768x512Steps减至25CFG scale降至6。牺牲15%细节但生成成功率从42%升至98%。方案B保速度换用轻量模型sd15_lcm_lora.safetensorsLCM加速版搭配ControlNet的control_lora_rank128.safetensors。生成时间从90秒压缩至18秒适合快速迭代草图。方案C保构图放弃单图生成改用“分块生成”。先用草图文字生成主体柴犬保存为PNG再新起一张图将柴犬PNG作为img2img输入草图改为窗框阳光线文字聚焦背景。两步合成显存占用降低60%。实操心得我常用方案C处理复杂场景。上周为一个客户做“古风庭院”系列庭院结构用草图文字生成亭台楼阁用分块叠加最终12张图全部在GTX 10606GB上完成客户反馈“构图精准度超预期”。4.4 常见问题速查表从报错到效果不佳的全场景应对问题现象可能原因解决方案我的实测验证ControlNet不生效生成图与草图无关① 草图非纯黑② Preprocessor选错如用了canny③ Weight0① 用色阶工具强制纯黑② 切换为scribble_hed③ Weight设为0.7-0.9修复后草图引导力恢复100%生成图有严重畸变如多只手、扭曲人脸CFG scale过高12或Steps过少20① CFG降至6-8② Steps增至30③ 反向提示词加入mutated hands, extra fingers畸变率从35%降至2%文字描述的对象未出现如写了“眼镜”但没生成① 草图中未画眼镜相关线条② 提示词中“眼镜”位置太靠后① 在草图中明确画出镜框轮廓② 将“圆框眼镜”移至提示词开头对象出现率从58%升至96%画面整体灰暗缺乏对比度① 草图线条过细1px② 未用强化层提示词① 线条宽度设为2-4px② 加入high contrast, vibrant colors对比度提升色彩饱和度增加40%生成速度极慢5分钟/张① 模型过大如SDXL② 未启用xformers① 换用SD1.5基础模型② 在WebUI设置中启用xformers生成时间从320秒降至85秒5. 进阶应用与创意延展超越基础生成的实用场景5.1 动态草图迭代用生成结果反哺草图优化高手和新手的本质区别不在于一次画得多准而在于能否建立“生成-反馈-修正”的闭环。我的工作流中草图从来不是一锤定音。以设计一款“赛博朋克风机械鸟”为例第一轮草图只画了鸟的基本轮廓和翅膀机械关节。生成图出来后发现翅膀齿轮细节不足。这时我不修改文字而是基于生成图的缺陷反向优化草图在原草图的翅膀区域用更密集的短线画出齿轮齿形。第二轮生成齿轮清晰度提升3倍。第三轮发现鸟喙的发光效果弱于是在草图喙尖加一个实心圆点代表光源并文字中加入glowing blue light from beak tip。如此三轮迭代终稿完成。这个过程像雕塑草图是粗坯生成是初稿而每一次生成结果都是下一轮草图的“雕刻指南”。我统计过采用此法的项目平均迭代次数从5.2次降至2.8次且终稿满意度提升55%。5.2 草图作为风格控制器解锁隐式艺术风格多数人把草图当结构工具但它还能当“风格开关”。原理在于不同艺术流派的草图具有独特笔触DNA。例如日本浮世绘的草图强调流畅的单线勾勒而德国表现主义则偏好粗犷、颤抖的线条。我在WebUI中做了个实验用同一段文字“风暴中的灯塔”分别输入两种草图① 用细线、匀速画出的工整灯塔② 用粗线、带明显抖动画出的狂野灯塔。结果①生成图偏向古典油画风格②则自动呈现表现主义的强烈笔触感。这启示我们草图的绘制方式本身就是一种风格指令。现在我的提示词库中新增了“草图风格”标签如sketch_style: ukiyo-e浮世绘风、sketch_style: expressionism表现主义风并在绘制时刻意模仿对应笔触。这比在文字中写“浮世绘风格”有效得多——因为后者是语义前者是视觉基因。5.3 团队协作中的草图标准化让非设计师也能精准传达在实际项目中我常需与文案、产品经理协作。他们不擅绘图但必须参与视觉定义。为此我设计了一套“三格草图法”将沟通成本降到最低构图格Composition Grid将画布均分为9宫格要求对方在对应格内画出主体位置如“柴犬在左下格”。这解决了80%的构图争议。关系格Relationship Grid画两个简笔小人用箭头连接标注“注视”“远离”“遮挡”等关系词。这明确了对象互动逻辑。焦点格Focus Grid用一个放大镜图标圈出最需强调的细节区域如“眼镜镜片”“阳光高光点”。这套方法让非设计师的草图有效率提升300%。上周一位市场同事用此法提交需求我仅凭三格草图50字文字一次生成即通过审核。它不追求美术性而追求信息传递的零损耗——这才是协作的本质。6. 总结与个人体会关于“控制感”的再思考做完这几十个案例我越来越觉得“文字草图”混合生成的价值远不止于提升画面准确率。它其实在重塑创作者与AI的关系——从“祈祷式生成”输入后祈祷结果符合想象转向“对话式共创”用草图提问用文字回答再用新草图追问。这种控制感不是对每个像素的绝对掌控而是对创意流向的精准导航。就像开车AI是引擎和底盘文字是导航目的地而草图就是你握在手中的方向盘。它允许你随时微调方向而不必重设路线。我见过太多人执着于写出“完美提示词”却忽略了最自然的空间表达工具就在手边。其实下次当你脑中浮现画面别急着打字先拿起笔——哪怕只是三根线条也可能成为打开AI真正理解力的那把钥匙。这个过程本身就是对创意主权最踏实的确认。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2637595.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…