机器学习笔记【Week7】

机器学习笔记【Week7】

news2025/6/7 19:26:18

一、SVM的动机：大间隔分类器

1、逻辑回归回顾

假设函数为 sigmoid 函数：
$h_\theta(x) = \frac{1}{1 + e^{-\theta^Tx}}$
分类依据是 $h_\theta(x) \geq 0.5$ 为正类，反之为负类。

2、SVM 的思路

SVM 不采用 sigmoid，而是直接构造优化目标：
- 最大化间隔（margin）：希望分类边界离最近的点尽可能远。
构造代价函数时：
- 对正类样本 $y = 1$ ，如果 $\theta^T x \geq 1$ 则无惩罚，否则惩罚。
- 对负类样本 $y = 0$ ，如果 $\theta^T x \leq -1$ 则无惩罚，否则惩罚。

二、SVM 的代价函数与优化

1、硬间隔 vs 软间隔

硬间隔（hard margin）：
- 不允许分类错误，适合线性可分的情况。
软间隔（soft margin）：
- 允许一定的错误分类，提升鲁棒性。

2、SVM 的标准形式

目标函数如下：
$\min_{\theta} \frac{1}{2} \|\theta\|^2 + C \sum_{i=1}^{m} \text{cost}(h_\theta(x^{(i)}), y^{(i)})$
其中：

$||\theta\|^2$ 控制模型复杂度（间隔）。
$C$ 控制对错误分类的惩罚程度。
$\text{cost}(\cdot)$ 是 hinge loss。

三、支持向量与最大间隔的直观理解

训练集中距离分类边界最近的点称为支持向量，它们决定了最终的分类超平面。
最大化间隔等价于最小化 $||\theta\|^2$ 。

四、核函数（Kernel Function）

1、核函数的作用

核函数可将输入数据映射到更高维空间，在高维空间中实现线性可分。
避免显式计算高维特征，用核技巧计算内积。

2、常见核函数

线性核（Linear Kernel）：
$K(x, z) = x^T z$
多项式核（Polynomial Kernel）：
$K(x, z) = (x^T z + c)^d$
高斯核 / RBF（Radial Basis Function）：
$\exp\left(-\frac{\|x - z\|^2}{2\sigma^2}\right)$

3、高斯核的参数选择

σ（或 γ）控制分布宽度：
- σ 小 → 拟合更 “尖锐”，可能过拟合。
- σ 大 → 拟合更平滑，可能欠拟合。

五、SVM 的使用建议

1、特征缩放

特征归一化非常重要，尤其在使用核函数时，避免某些维度主导距离计算。

2、SVM 的优点

通常表现优于逻辑回归，尤其在特征维度高、样本数较少的场景。
在文本分类、图像识别中表现优异。

3、与其他模型的对比

特点	逻辑回归	支持向量机
分类边界	最大似然	最大间隔
可扩展到核函数	较难	支持各种核函数
参数解释性	较强	较弱
小样本泛化能力	一般	强

六、SVM 的训练与实现

1、训练库推荐

推荐使用现有库如：
- LIBSVM：C++ 实现，接口广泛。
- Scikit-learn 中的 sklearn.svm.SVC
- MATLAB/Octave 中也有内建支持。

2、超参数调优建议

交叉验证选取最佳的：
- 惩罚参数 C。
- 核函数参数（如 σ）。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2403273.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

智能推荐系统：协同过滤与深度学习结合

智能推荐系统：协同过滤与深度学习结合

智能推荐系统：协同过滤与深度学习结合系统化学习人工智能网站（收藏）：https://www.captainbed.cn/flu 文章目录智能推荐系统：协同过滤与深度学习结合摘要引言技术原理对比1. 协同过滤算法：基于相似性的推…

阅读更多...

文档处理组件Aspose.Words 25.5全新发布：六大新功能与性能深度优化

文档处理组件Aspose.Words 25.5全新发布：六大新功能与性能深度优化

在数字化办公日益普及的今天，文档处理的效率与质量直接影响到企业的运营效率。Aspose.Words 作为业界领先的文档处理控件，其最新发布的 25.5 版本带来了六大新功能和多项性能优化，旨在为开发者和企业用户提供更强大、高效的文档处理能力。六…

阅读更多...

固态继电器与驱动隔离器：电力系统的守护者

固态继电器与驱动隔离器：电力系统的守护者

在电力系统中， 固态继电器合驱动隔离器像两位“电力守护神”，默默地确保电力设备的安全与稳定运行。它们通过高效、可靠的性能，保障了电力设备在各种环境下的正常工作。固态继电器是电力控制中的关键组成部分，利用半导体器件来实…

阅读更多...

【数据分析】基于adonis2与pairwise.adonis2的群组差异分析教程

【数据分析】基于adonis2与pairwise.adonis2的群组差异分析教程

禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者! 文章目录介绍加载R包数据下载导入数据数据预处理adonis分析pairwise.adonis2分析总结系统信息介绍本教程主要用于执行和分析基于距离矩阵的多样性和群落结构分析，特别是通过adonis2和pairwi…

阅读更多...

Nginx + Tomcat负载均衡群集

Nginx + Tomcat负载均衡群集

目录一、案例环境二、部署 Tomcat（102/103） 1、准备环境 （1）关闭firewalld 防火墙 （2）安装JDK 2、安装配置 Tomcat （1）Tomcat 的安装和配置 （2）移动…

阅读更多...

嵌入式开发之STM32学习笔记day22

嵌入式开发之STM32学习笔记day22

STM32F103C8T6 FLASH闪存 1 FLASH简介 STM32F1系列微控制器的FLASH存储器是一种非易失性存储器，它在微控制器中扮演着至关重要的角色。以下是对STM32F1系列FLASH存储器及其相关编程方式的扩展说明： 【FLASH存储器的组成部分】程序存储器：这…

阅读更多...

分词算法BBPE详解和Qwen的应用

分词算法BBPE详解和Qwen的应用

一、TL；DR BPE有什么问题：依旧会遇到OOV问题，并且中文、日文这些大词汇表模型容易出现训练中未出现过的字符Byte-level BPE怎么解决：与BPE一样是高频字节进行合并，但BBPE是以UTF-8编码UTF-8编码字节序列而非字符序列B…

阅读更多...

多线程下使用缓存+锁Lock, 出现“锁失效” + “缓存未命中竞争”的缓存击穿情况，双重检查缓存解决问题

多线程下使用缓存+锁Lock, 出现“锁失效” + “缓存未命中竞争”的缓存击穿情况，双重检查缓存解决问题

多线程情况下，想通过缓存同步锁的机制去避免多次重复处理逻辑，尤其是I/0操作，但是在实际的操作过程中发现多次访问的日志 2025-06-05 17:30:27.683 [ForkJoinPool.commonPool-worker-3] INFO Rule - [vagueNameMilvusReacll,285] - embeddin…

阅读更多...

Playwright 测试框架 - .NET

Playwright 测试框架 - .NET

💖亲爱的技术爱好者们，热烈欢迎来到 Kant2048 的博客！我是 Thomas Kant，很开心能在CSDN上与你们相遇～💖 本博客的精华专栏：【自动化测试】

阅读更多...

命令行以TLS/SSL显式加密方式访问FTP服务器

命令行以TLS/SSL显式加密方式访问FTP服务器

昨天留了一个小尾巴~~就是在命令行或者代码调用命令，以TLS/SSL显式加密方式，访问FTP服务器，上传和下载文件。有小伙伴可能说ftp命令不可以吗？不可以哦~~ ftp 命令本身不支持显式加密。要实现 FTP 的显式加密，可以使…

阅读更多...

Linux配置yum 时间同步服务关闭防火墙关闭ESlinux

Linux配置yum 时间同步服务关闭防火墙关闭ESlinux

1、配置yum 1.1、Could not resolve host: mirrorlist.centos.org; 未知的错误 https://blog.csdn.net/fansfi/article/details/146369946?fromshareblogdetail&sharetypeblogdetail&sharerId146369946&sharereferPC&sharesourceRockandrollman&sharefr…

阅读更多...

LLaMA-Factory和python版本的兼容性问题解决

LLaMA-Factory和python版本的兼容性问题解决

引言笔者今天在电脑上安装下LLaMA-Factory做下本地的模型调优。从github上拉取代码git clone https://github.com/hiyouga/LLaMA-Factory.git. pycharm建立工程,按照官网指导如下: LLaMA-Factory 安装在安装 LLaMA-Factory 之前，请确保您安装了下列依赖: 运行以…

阅读更多...

每日算法-250605

每日算法-250605

每日算法 - 20240605 525. 连续数组题目描述给定一个二进制数组 nums , 找到含有相同数量的 0 和 1 的最长连续子数组，并返回该子数组的长度。思路前缀和哈希表解题过程核心思想是将问题巧妙地转换为寻找和为特定值的子数组问题。转换问题：我…

阅读更多...

分布式锁-Redisson实现

分布式锁-Redisson实现

目录本地锁的局限性 Redisson解决分布式锁问题在分布式环境下，分布式锁可以保证在多个节点上的并发操作时数据的一致性和互斥性。分布式锁有多种实现方案，最常用的两种方案是：zookeeper和redis，本文介绍redis实现分布式锁方案…

阅读更多...

C++学习-入门到精通【14】标准库算法

C++学习-入门到精通【14】标准库算法

C学习-入门到精通【14】标准库算法目录 C学习-入门到精通【14】标准库算法一、对迭代器的最低要求迭代器无效二、算法1.fill、fill_n、generate和generate_n2.equal、mismatch和lexicographical_compare3.remove、remove_if、remove_copy和remove_copy_if4.replace、replace_…

阅读更多...

HarmonyOS运动语音开发：如何让运动开始时的语音播报更温暖

HarmonyOS运动语音开发：如何让运动开始时的语音播报更温暖

##鸿蒙核心技术##运动开发##Core Speech Kit（基础语音服务）# 前言在运动类应用中，语音播报功能不仅可以提升用户体验，还能让运动过程更加生动有趣。想象一下，当你准备开始运动时，一个温暖的声音提醒你“…

阅读更多...

vscode使用系列之快速生成html模板

vscode使用系列之快速生成html模板

一.欢迎来到我的酒馆 vscode，yyds! 目录一.欢迎来到我的酒馆二.vscode下载安装1.关于vscode你需要知道2.开始下载安装三.vscode快速创建html模板二.vscode下载安装 1.关于vscode你需要知道 Q：为什么使用vscode? A：使用vscode写…

阅读更多...

网页前端开发（基础进阶4--axios）

网页前端开发（基础进阶4--axios）

Ajax Ajax(异步的JavaScript和XML) 。 XML是可扩展标记语言，本质上是一种数据格式，可以用来存储复杂的数据结构。可以通过Ajax给服务器发送请求，并获取服务器响应的数据。 Ajax采用异步交互：可以在不重新加载整个页面的情况下&am…

阅读更多...

软件安全：漏洞利用与渗透测试剖析、流程、方法、案例

软件安全：漏洞利用与渗透测试剖析、流程、方法、案例

在数字时代，软件已深度融入生活与工作的方方面面，从手机应用到企业核心系统，软件安全至关重要。而漏洞利用与渗透测试，作为软件安全领域中相互关联的两个关键环节，一个是黑客攻击的手段，一个是安全防护的方…

阅读更多...

Haproxy的基础配置

Haproxy的基础配置

1、参考文档官方文档：HAProxy version 2.2.22 - Configuration Manual 运维派配置手册：Haproxy-基础配置详解 - 运维派 Haproxy 的配置文件haproxy.cfg由两大部分组成，分别是global和proxies部分。 2、haproxy global 配置 global&…

阅读更多...

推荐文章

最新文章