【AWS入门】Amazon SageMaker简介

news2025/5/21 2:15:21

【AWS入门】Amazon SageMaker简介

[AWS Essentials] Brief Introduction to Amazon SageMaker

By Jackson@ML

机器学习(Machine Learning,简称ML) 是当代流行的计算机科学分支技术。通常,人们在本地部署搭建环境,以满足机器学习的要求。
AWS是Amazon Web Service,即亚马逊云科技,其提供给用户超过200种云产品和服务。用户无需搭建硬件环境,就可以实现科学计算、数据分析、项目开发和运维、大数据、无服务器应用开发、人工智能等一系列技术创新和迭代。

访问AWS官网,可以看到Amazon SageMaker主页面。

在这里插入图片描述
图1 Amazon SageMaker主页面

AWS提供了机器学习的专有产品和服务,就是 Amazon SageMaker,利用业界先进的AI技术,在云平台上应用和完成机器学习。

1. 什么是Amazon SageMaker?

Amazon SageMaker AI 是一项云托管服务,它对机器学习 (ML) 服务完全托管。借助 SageMaker AI,广大用户包括数据科学家、人工智能专家、软件开发者,均可以快速、便捷地构建和训练 ML 模型,并将其快速部署到生产环境中。

Amazon SageMaker AI为运行 ML 工作流提供了用户界面体验,使 SageMaker AI ML 工具可在多个集成开发环境 (IDE) 中使用。

有了 SageMaker AI,用户就可以存储和共享数据,而无需构建和管理自己的服务器。这样,企业或用户就有更多时间来协作构建和开发特定功能的 ML 工作流程,并且可以高效完成工作。

SageMaker AI提供受控的ML算法,可在分布式环境中针对超大数据量运算高效运行。SageMaker AI 内置支持自带算法和框架,提供灵活的分布式训练选项,可根据用户需要的特定工作流程进行调整。用快捷的步骤,就能从 SageMaker AI 控制台将模型部署到安全、可扩展的环境中。

2. Amazon SageMaker主要功能

1) Amazon SageMaker新版发布

2024 年 12 月 03 日,AWS亚马逊云科技发布了新一代 Amazon SageMaker。

Amazon SageMaker 是数据、分析和人工智能的统一平台。新一代 SageMaker 集合了 AWS 机器学习和分析功能,为分析和人工智能提供了集成体验,可统一访问您的所有数据。

2) Amazon SageMaker 包括以下功能:
  • Amazon SageMaker AI(前身为 Amazon SageMaker)- 利用完全托管的基础架构、工具和工作流,构建、训练和部署 ML 和基础模型;
  • Amazon SageMaker Lakehouse - 跨 Amazon S3 数据湖、Amazon Redshift 和其它数据源统一数据访问;
  • Amazon SageMaker 数据和 AI 治理 - 利用基于 Amazon DataZone 构建的 Amazon SageMaker Catalog 安全地发现、治理和协作数据和 AI;
  • SQL 分析结构化查询语言(Structured Query Language)即SQL,是关系型数据库必不可少的语言。 借助 Amazon Redshift 最具性价比的 SQL 引擎获得洞察力;
  • Amazon SageMaker 数据处理 - 使用 Amazon Athena、Amazon EMR 和 AWS Glue 上的开源框架分析、准备和集成数据,以进行分析和人工智能;
  • Amazon SageMaker Unified Studio - 在单一开发环境中使用所有数据和工具进行构建,以进行分析和人工智能;
  • Amazon Bedrock - 构建和扩展生成式 AI 应用程序
  • 通过DeepL.com(免费版)翻译

3. 安装Amazon SageMaker

要使用 Amazon SageMaker AI 中的功能,首先必须有访问 Amazon SageMaker AI 的权限。

通过设置 Amazon SageMaker AI 及其功能,有以下安装选项:

  • 快速安装: 使用默认设置,为个人用户进行快捷安装配置。
  • 自定义安装: 面向企业机器学习 (ML) 管理员,这些高级配置对于那些为多用户或组织设置 SageMaker AI 的 ML 管理员来说,显示是个理想的选项。

4. 访问AWS门户和身份验证

AWS通过网络门户,对所有AWS账户分配对应用程序的单点登录访问,通过AWS的 IAM 身份验证和访问。

关于具体如何登录 AWS 访问门户、登录提示以及如何退出 AWS 访问门户,作为 IAM Identity Center 用户,可登录 AWS 访问门户,详细步骤请参阅《AWS 登录指南》中的相关章节,进一步了解如何登录 AWS 访问门户。

在这里插入图片描述
图2 在AWS登录IAM控制台

5. Amazon SageMaker AI域

Amazon SageMaker AI 使用域(domain)来组织用户配置文件、应用程序及其相关资源。
Amazon SageMaker AI 域由以下部分组成:

  • 相关的亚马逊弹性文件系统(亚马逊 EFS)卷
  • 授权用户列表
  • 各种安全、应用程序、策略和 Amazon 虚拟私有云 (Amazon VPC) 配置

每个域中都有私有应用程序和共享空间,如下图所示:

在这里插入图片描述
要访问大多数 Amazon SageMaker AI 环境和资源,用户必须使用 SageMaker AI 控制台或 AWS CLI 完成 Amazon SageMaker AI 域入门流程。

有关如何根据访问 SageMaker AI 的方式开始使用 SageMaker AI,以及必要时如何设置域的指南,请参阅 Amazon SageMaker AI 设置指南

6. Amazon SageMaker的优势

1) 融通式合作开发工作室

Amazon SageMaker 融通式合作开发工作室提供集成式体验,让用户可以使用适用于分析和人工智能的所有数据和工具。

通过发现数据,并使用熟悉的 AWS 工具(适用于模型开发、生成式人工智能、数据处理和 SQL 分析)将数据用于实处。

使用统一的笔记本电脑处理计算资源,使用内置的 SQL 编辑器发现和查询不同的数据来源,大规模训练和部署人工智能模型,快速构建自定义的生成式人工智能应用程序。创建并安全共享分析和人工智能构件,例如数据、模型和生成式人工智能应用程序,以更快地将数据产品推向市场。

2) 整套安全的人工智能开发功能

借助一整套设计安全的人工智能开发功能,推进 SageMaker 中的人工智能发展。在高性能且经济高效的基础设施上训练、自定义和部署机器学习和基础模型(Fundation Model, 即FM)

使用可满足整个人工智能生命周期需求的专用工具,覆盖高性能集成式开发环境(IDE)和分布式训练到推理、人工智能运维、治理和可观测性等领域。

使用尖端模型和专用数据,快速创建为业务量身定制的生成式人工智能应用程序。使用 Amazon Q Developer加快人工智能开发,帮助用户更加容易、轻松地发现数据、构建和训练机器学习模型、生成 SQL 查询以及创建和运行数据管道任务,所有这些都可通过自然语言完成。

3) 统一数据,减少数据孤岛

使用Amazon SageMaker数据湖仓,统一用户在 Amazon Simple Storage Service(Amazon S3)数据湖Amazon Redshift 数据仓库中的所有数据。

使用所有与 Apache Iceberg 兼容的工具和引擎,在分析数据的单个副本上灵活地访问和查询数据。

通过定义应用于湖仓中的分析和人工智能工具的精细权限来保护数据。通过零 ETL 集成,将运营数据库和应用程序中的数据近实时地导入湖仓。

此外,通过跨第三方数据来源的联合查询功能访问和查询数据。

4) 端对端数据和人工智能治理

通过贯穿整个数据和人工智能生命周期的内置治理,确保企业安全。Amazon SageMaker 确保用户能够控制正确的用户,用以出于正当理由访问正确的数据、模型和开发构建。

通过 Amazon SageMaker Catalog 的精细访问控制,使用单一权限模型一致地定义和强制执行访问策略。使用数据分类、毒性检测、防护机制和负责任的人工智能政策,以保护您的人工智能模型安全。

通过数据质量监控和自动化、敏感数据检测以及数据和机器学习任务流水线,让整个组织安心无忧。

在这里插入图片描述

关于Amazon SageMaker应用及开发,还有很多。

  • 鸣谢:AWS亚马逊云科技

AWS技术好文陆续推出,敬请关注、收藏和点赞👍。

您的认可,我的动力!😃

相关阅读:

  1. 【AWS入门】Amazon Bedrock简介
  2. 【AWS入门】Amazon Q Developer简介
  3. 【AWS入门】AWS Lambda应用简介
  4. 【AWS入门】Amazon Nova简介
  5. 【AWS入门】Amazon S3简介
  6. 【AWS入门】Amazon EC2简介
  7. 【AWS入门】Amazon云计算简介
  8. 【AWS入门】创建并使用AWS Builder ID
  9. 【AWS入门】AWS亚马逊云科技账户注册指南
  10. 2025最新版Python 3.13.3安装使用指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2380382.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MYSQL 故障排查与生产环境优化

目录 一.前置知识点 1. 案例需求 (1)mysql 常见故障解决 (2)mysql 性能优化 2.案例实施思路 (1)单库常见故障分析 (2)主从常见故障分析 (3)从几个不同…

解决使用@JsonFormat(pattern = “yyyy-MM-dd HH:mm:ss“, timezone = “GMT+8“)时区转换无效的问题

前言 对于一些时间的字段,我们从数据库查询出来通常需要转换后返回给前端展示,前端需要的格式一般为yyyy-MM-dd HH:mm:ss,可以通过JsonFormat注解来作转换和时区转换。 问题场景 原因 LocalDateTime类本身不带时区信息所以转换无效 解决办…

计算机网络概要

⽹络相关基础知识 协议 两设备之间使⽤光电信号传输信息数据 要想传递不同信息 那么⼆者ᳵ就需要约定好的数据格式 层 封装 继承 多态是计算机的性质 它们⽀持了软硬件分层的实现 同层协议可以ᳵ接通信 同层协议ᳵ不直接通信 是各⾃调⽤下层提供的结构能⼒完成通信 分层…

Word压缩解决方案

Word压缩解决方案:基于图片压缩的 .docx 优化实践 📌 背景 在日常科研写作或项目文档整理中,Word 文档(.docx)往往因为插入大量高清图表、扫描图像、公式图等导致文件体积过大,或者毕业学位论文查重要求上…

TDengine 2025年产品路线图

TDengine OSS 之 2025 年年度路线图如下表所示。 季度功能2025Q1 虚拟表查询能力:REGEXP、GREATEST、LEAST、CAST 函数支持判断表达式、单行选择函数的其他列值、INTERP 支持插值时间范围存储能力:支持将查询结果写入超级表、超级表支持 KEEP 参数、STM…

Ubuntu服务器部署多语言项目(Node.js/Python)方式实践

Ubuntu服务器部署多语言项目(Node.js/Python)方式实践 服务器脚本运行方式命令行直接执行nohup后台执行进程 Screen概述安装基本操作命令启动 Screen退出当前会话(不终止进程)查看所有会话重连会话关闭会话 常用快捷键典型使用场景…

计算机网络 - 2.基础协议

1.TCP协议 1.TCP(Transmission Control Protocol):传输控制协议2.TCP协议是一种面向连接的、可靠的、 基于字节流的传输层通信协议 1.面向连接:两个使用TCP协议的应用(通常一个客户和一个服务器)在彼此交换数据包之前必须先建立一个TCP连接2.可靠的 1.数据传输之前都要建立…

初识css,css语法怎样学好css以及常见问题与避坑

一、CSS 是什么? CSS(Cascading Style Sheets)是一种用于描述网页文档(HTML 或 XML)呈现样式的语言。它负责控制网页元素的视觉表现,如颜色、字体、布局等,使内容与展示分离。 二、CSS 语法结构…

Axure疑难杂症:垂直菜单展开与收回(4大核心问题与专家级解决方案)

亲爱的小伙伴,在您浏览之前,烦请关注一下,在此深表感谢!如有帮助请订阅专栏! Axure产品经理精品视频课已登录CSDN可点击学习https://edu.csdn.net/course/detail/40420 课程主题:垂直菜单展开与收回 主要内容:超长菜单实现、展开与收回bug解释、Axure9版本限制等问题解…

vue2.0 组件生命周期

个人简介 👨‍💻‍个人主页: 魔术师 📖学习方向: 主攻前端方向,正逐渐往全栈发展 🚴个人状态: 研发工程师,现效力于政务服务网事业 🇨🇳人生格言&…

在Linux服务器上部署Jupyter Notebook并实现ssh无密码远程访问

Jupyter notebook版本7.4.2(这个版本AI提示我Jupyter7(底层是 jupyter_server 2.x) 服务器开启服务 安装Jupyter notebook 7.4.2成功后,终端输入 jupyter notebook --generate-config 这将在 ~/.jupyter/ 目录下生成 jupyter_…

GPU 超级节点:AWS Trainium2 UltraServer

目录 文章目录 目录时间线Inferentia1Trainium1Inferentia2Trainium2Trainium2 ServerTrainium2 UltraServerTrainium2 UltraClustersTrainium3AWS GPU 实例矩阵与竞品分析SuperNode RackTrn2 ServerTrn2U Server ScaleUp 网络PCIe Gen5:CPU-Trainium2 ScaleUpNeuro…

git仓库中.git 文件很大,怎么清理掉一部分

查询 .git 文件大小,在 git-bash 里执行(后面有些命令不能执行,也请在 git-bash 里执行) windows11 安装好后右键没有 git bash 命令-CSDN博客 du -sh .git // 592m .git 操作前最好先备份一份,避免推送到远程时出错…

MySQL安装实战指南:Mac、Windows与Docker全平台详解

MySQL作为世界上最流行的开源关系型数据库,是每位开发者必须掌握的基础技能。本指南将手把手带你完成三大平台的MySQL安装,从下载到配置,每个步骤都配有详细说明和截图,特别适合新手学习。 一、Mac系统安装MySQL 1.1 通过Homebre…

Rocky Linux 远程服务器画面GUI传输到本地显示教程——Xming

Rocky Linux 远程服务器画面GUI传输到本地显示教程——Xming 下载Xming安装Xming安装Xming字体Xming的使用设置测试 Xming可以提供GUI环境,在Linux服务器上执行GUI应用时,可通过Xming在Windows上执行GUI操作。 下载Xming 下载链接:https://…

游戏引擎学习第283天:“让‘Standing-on’成为一个更严谨的概念

如果同时使用多个OpenGL上下文,并且它们都有工作负载,GPU或GPU驱动程序如何决定调度这些工作?我注意到Windows似乎优先处理活动窗口的OpenGL上下文(即活动窗口表现更好),挺有意思的…… 当多个OpenGL上下文…

React集成百度【JSAPI Three】教程(001):快速入门

文章目录 1、快速入门1.1 创建react项目1.2 安装与配置1.3 静态资源配置1.4 配置百度地图AK1.5 第一个DEMO1、快速入门 JSAPI Three版本是一套基于Three.js的三维数字孪生版本地图服务引擎,一套引擎即可支持2D、2.5D、3D全能力的地理投影与数据源加载,帮助开发者轻松搞定平面…

python学习day2

今天主要学习了变量的数据类型,以及如何使用格式化符号进行输出。 一、认识数据类型 在python里为了应对不同的业务需求,也把数据分为不同的类型。 代码如下: """ 1、按类型将不同的变量存储在不同的类型数据 2、验证这些…

【C++】模版(1)

目录 1. 泛型编程 2. 函数模版 2.1 函数模版概念 2.2 函数模版格式 2.3 函数模版的原理 2.4 函数模版实例化方式 隐式实例化 显式实例化 2.5 模版参数的匹配原则 3. 模版类 模版类的定义格式 模版类的实例化 1. 泛型编程 如何实现一个通用的交换函数呢&#xff1f…

基于开源AI智能名片链动2+1模式S2B2C商城小程序源码的去中心化商业扩散研究

摘要:本文探讨在去中心化商业趋势下,开源AI智能名片链动21模式S2B2C商城小程序源码如何助力企业挖掘数据价值、打破信息孤岛,实现商业高效扩散。通过分析该技术组合的架构与功能,结合实际案例,揭示其在用户关系拓展、流…