我的机器学习起步如何Getting Started

news2025/5/16 2:03:01

学习技巧和原则

  • 先通过经典书籍进行科普
  • 知名机器学习网站
  • 根据书籍或网站的目录,先泛读、再选择有兴趣的部分重点精读、后至于反复读
  • 知行合一

起步Getting Started

  • 周志华版《机器学习》,又名西瓜书

可以作为科普书籍,需要主动略过对于理论推导过程,和数学公式的求真

介绍的非常全面,可作为参考书籍

书籍的前几章基本上概括了机器学习现在的框架,有助于对具体的机器学习算法或工具进行把握

  • 吴军博士《数学之美》

更侧重对于自然语言处理、语音识别、搜索等方面的人工智能上层应用,做了专向的科普和技术原理概要介绍。

文风轻松、叙事流畅,读起来相当轻松

区别于常见回归分类的基础应用,对于更上层的人工智能技术应用进行了介绍,并阐述了背后的数学原理并不复杂

更侧重于基于大数据的概率统计、马尔可夫过程、条件概率等技术手段进行人工智能应用

  • scikit-learn.org官网起步资料
    • getting_started
      知识成图

介绍了粗略结构

    • user_guide目录结构

仅关注目录结构,把握机器学习的大脉络

每个章节仅读取头部几个章节的简单的内容

数据清洗,对于这一部分目录的了解,让你几乎可以作为一名初级的数据工程师

    • 简明扼要介绍机器学习要解决的问题
      • 有监督学习:分类问题、回归问题
      • 无监督学习: 聚类、概率分布、降维等
    • Faqs

英文比较好的同学,可以深入研究其它官网例子

  • 信息论主要观点
    • 信息消除不确定性
    • 信息量、信息熵

代码例子学习网站

  • scikit-learn

相当全面的机器学习工具库,着力解决中小数据规模的机器学习问题,但大部分也够用了

基于深度学习的神经网络,确实在既适应线性问题、又适应非线性问题方面比较突出
可视化例子

  • OpenCV

对于图片或视频进行处理,可以进行一些SVMKNN的机器学习,甚至包括一些预处理。例如,常用的图片灰度化手段,其实从机器学习来看,就是专家赋能后进行降维处理,但是,对于学习任务信息量又没有丢失太多,以致于学习不到什么东西。

彩蛋

  • 回归问题和分类问题的桥梁

对数几率回归;两者的差别没有想想的那么大

  • CNN卷积神经网络

在图片特征抽取上面找到了工程上可接受的调参技术手段,关键在于最终步骤采样特征向量形成

相比较于常见较为容易处理特征向量,深度学习对于容易获取的图片数据、但难以描述其典型特征的的粗材料数据,提供了形成特征向量的方法

  • 对于关系数据库中的表记录作为特征向量的思考

关系数据库中的唯一索引对于机器学习并不友好,可以考虑提前去除

非唯一索引等非独立属性可以作为聚类分析的关注对象
其它列数据基本上可以做到相互独立,或依赖比较弱

  • 算力的忧虑

一般人很难拥有强大算力,需要注意如何自举

结束语

机器学习对于其成熟的应用领域,确实达到了工具化的程度,如果了解了,就会能够使用,并成为倍增器!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1343686.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

搭建flink集群 —— 筑梦之路

Apache Flink 是一个框架和分布式处理引擎, 用于在无边界和有边界数据流上进行有状态的计算。 Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。 Flink并没有依靠自身实现所有分布式系统需要解决的问题, 而是在已有集群…

vue连接本地服务器

vue 连接本地服务器做后端。 后端服务 使用springboot新建一个基于restful的接口,访问如下的地址,返回值。 vue构建 新建一个vue项目,安装访问服务器的插件。 npm install axios vue-axios --save 修改main.js使用axios,最终…

Linux 内核学习笔记: hlist 的理解

前言 最近阅读 Linux 内核时,遇到了 hlist,这个 hlist 用起来像是普通的链表,但是为何使用 hlist,hlist 是怎么工作的? 相关代码 hlist_add_head(&clk->clks_node, &core->clks); /*** clk_core_link_…

很实用的ChatGPT网站——httpchat-zh.com

很实用的ChatGPT网站——http://chat-zh.com/ 今天介绍一个好兄弟开发的ChatGPT网站,网址[http://chat-zh.com/]。这个网站功能模块很多,包含生活、美食、学习、医疗、法律、经济等很多方面。下面简单介绍一些部分功能与大家一起分享。 登录和注册页面…

Mac Pycharm在Debug模式报编码(SyntaxError)错误

1. 错误信息: Traceback (most recent call last):File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/tokenize.py", line 330, in find_cookieline_string line.decode(utf-8) UnicodeDeco…

【持续更新ing】uniapp+springboot实现个人备忘录系统【前后端分离】

目录 (1)项目可行性分析 (2)需求描述 (3)界面原型 (4)数据库设计 (5)后端工程 接下来我们使用uniappspringboot实现一个简单的前后端分离的小项目----个…

numpy数组03-数组的计算

一.数组与数字之间进行计算 numpy中的数组与数字进行计算是广播形式,数组-*/数字,则数组中的每一个数字都会进行相应的四则运算。 1.1数组与数字之间的四则运算 示例代码如下: import numpy as npa np.arange(24) b a.reshape(4, 6) pr…

Flutter BottomSheet 拖动分两段展示

第一段 第二段 实现思路 通过 GestureDetector 的 Drag 方法,动态改变Dialog的高度,通过设置一个最大高度和最小高度分成两层进行展示 实现 常用的展示BottomSheet的方法为 showModalBottomSheet /// 设置最高最好以高度的比例进行设置,方…

mongoose中http server服务器解决“Access-Control-Allow-Origin mongoose”跨域问题

问题 使用mongoose做http服务器,自己构造的浏览器端jquery在访问server时,会遇到: Access to XMLHttpRequest at http://127.0.0.1:8000/ from origin null has been blocked by CORS policy: No Access-Control-Allow-Origin header is pr…

Shell脚本-bin/bash: 解释器错误: 没有那个文件或目录-完整路径执行-“/”引发的脑裂

引起该不适的一种可能以及解决方案,网上较多,比如: 但按以上方式操作,并经过查看,发现仍然未能解决问题。 因为两种方式执行,有一种能成功,有一种不能,刚开始未怀疑是文件问题&…

基于OpenAI的Whisper构建的高效语音识别模型:faster-whisper

1 faster-whisper介绍 faster-whisper是基于OpenAI的Whisper模型的高效实现,它利用CTranslate2,一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度,还优化了内存使用效率。faster-whisper的核心优势在于其能够在…

分布式系统架构设计之分布式系统实践案例和未来展望

分布式系统在过去的几十年里经历了长足的发展,从最初的简单分布式架构到今天的微服务、云原生等先进架构,取得了丰硕的成果。本文将通过实际案例分享分布式系统的架构实践,并展望未来可能的发展方向。 一、实践案例 1、微服务化实践 背景 …

【HarmonyOS开发】案例-记账本开发

OpenHarmony最近一段时间,简直火的一塌糊度,学习OpenHarmony相关的技术栈也有一段时间了,做个记账本小应用,将所学知识点融合记录一下。 1、记账本涉及知识点 基础组件(Button、Select、Text、Span、Divider、Image&am…

SpringBoot项目部署及多环境

1、多环境 2、项目部署上线 原始前端 / 后端项目宝塔Linux容器容器平台 3、前后端联调 4、项目扩展和规划 多环境 程序员鱼皮-参考文章 本地开发:localhost(127.0.0.1) 多环境:指同一套项目代码在把不同的阶段需要根据实际…

在STM32中集成TSL2561光强传感器的开发和调试

在STM32中集成TSL2561光强传感器的开发和调试是一个常见的应用场景。TSL2561是一款数字光传感器,能够测量可见光和红外光的光强,并通过I2C接口将数据传输给微控制器。下面将为您介绍在STM32中集成TSL2561传感器的开发步骤,并附上相应的代码示…

【机器学习前置知识】Beta分布

Beta分布与二项分布的关系 Beta分布与二项分布密切相关,由二项分布扩展而来,它是用来描述一个连续型随机变量出现的概率的概率密度分布,表示为 X X X~ B e t a ( a , b ) Beta(a,b) Beta(a,b) , a 、 b a、b a、b 是形状参数。Beta分布本质上也是一个概率密度函数,只是这…

水库大坝安全监测设计与施工经验

随着我国的科技水平不断上升,带动了我国的水电建设向更高层次发展。目前,我国的水电站大坝已有上百座,并且大坝安全检测仪器质量与先进技术不断更新发展,如今水电站大坝数据信息采集与观测资料分析,能够有效提高水库大…

outlook邮箱群发邮件方法?邮箱如何群发?

outlook邮箱群发邮件如何使用?QQ邮箱设置群发的步骤? Outlook邮箱群发邮件:必要性 Outlook邮箱作为全球广泛使用的邮件服务之一,不仅提供了便捷的邮件收发功能,还支持多种附件、日历提醒及强大的联系人管理。Outlook…

NVMe over Fabrics:概念、应用和实现

对于大部分人来说,NVMe over Fabrics(简称NVMf)还是个新东西,因为其第一个正式版本的协议在今年6月份才发布。但是这并不影响人们对NVMf的关注,因为这项依托于NVMe的技术很可能继续改变存储市场格局。 NVMf的贡献在于…

CENTOS docker拉取私服镜像

概述 docker的应用越来越多,安装部署越来越方便,批量自动化的镜像生成和发布都需要docker镜像的拉取。 centos6版本太老,docker的使用过程中问题较多,centos7相对简单容易。 本文档主要介绍centos系统安装docker和拉取docker私…