Microsoft Fabric - 尝试一下Data Factory一些新的特性(2025年5月)

news2025/7/21 11:57:39

1.简单介绍

Microsoft Fabric是微软提供的一个数据管理和分析的统一平台,感觉最近的新特性也挺多的。

        

Data Factory是Microsoft Fabric的一个功能模块,也是一个cloud service。Data Factory可以和多种数据源进行连接,同时提供了data movement, data orchestration, data transformation的功能。有点类似以前的数据ETL工具的功能。       

这边主要尝试一下Data Factory的一些比较新的特性

2.具体说明

2.1 SharePoint作为存储目标

当前Microsoft Fabric中的Dataflow Gen2允许将数据存储到SharePoint library中,

1) 创建一个类型为Dataflow Gen2的dataflow,上传一个excel文件作为数据源,点击Next按钮,

        

 2) 选择一张table作为数据源,点击Create按钮创建dataflow,

        

3) 在dataflow编辑界面中,点击Add data destination下拉框,选择SharePoint选项,

        

4) 输入SharePoint站点的URL同时设定一些相关的配置,然后点击Next按钮,

         

5)  在Choose destination target窗口的左侧目录视图中,选择保存的文档库,还可以设定一下file name,最后点击Next按钮,

         

6) 保存并运行dataflow,最后在SharePoint站点的特定文档库中会发现有个csv文件生成了,

        

2.2 Dataflow转换

 假定已经创建了一个Dataflow Gen1

        

当前Microsoft Fabric增加了一个新特性,可以将Dataflow Gen1升级成Dataflow Gen2,

1) 点击DataflowGen1右侧的...,在下拉选项中选择Save as Dataflow Gen2即可,

        

 2) 在弹出的Save as Dataflow Gen(Preview)窗口中,输入Dataflow的名字,点击Create按钮,

        

3) 最后就多了一个Dataflow Gen2的dataflow了,

        

2.3 Variable library

Microsoft Fabric中多了Variable Library配置项

2.3.1 创建variable library 

1) 点击workspace中的New Item按钮,

        

2) 在New item面板中,点击Variable library的选项(当前处于preview阶段)

        

3) 可以创建一个如下图所示的variable library,

如下图datapath是变量名,当前的值为new_sales, 

        

还可以为变量datapath设定两个候选值,一个是new_sales_test,另外一个是new_sales_prod

        

创建的variable library最后是下面这个样子的,

        

2.3.2 应用variable library

假定已经创建了一个Data pipeline,主要功能是从一个网站下载sales数据到Microsoft Fabric的lakehouse中,

        

下载到lakehouse的sales.csv如下图所示,

        

下面Microsoft Fabric workspace中创建的Data pipeline, Lakehouse和Variable library, 

        

1) 在创建的data pipeline中,发现新增了一个Library variables(preview)的tab,可以添加一个变量和之前创建的variable library进行关联,配置如下图所示,

        

2) 可以配置Copy data action的File Path值来自variable library,如下图所示,

        

         

2.3.3 运行pipeline

假定当前变量datapath值为new_sales,

        

1) 现在点击下图中的Set as active选项将值new_sales_test变成active状态,

        

        

2) 点击pipeline界面上边的Run按钮,

        

3) 等待一些时间,pipeline运行成功了,

        

        

4) 最后查看目标lakehouse,发现有目录new_sales_test创建同时数据也下载完成了,

        

5) 如果是将值new_sales_prod设定为active状态,运行pipeline,最后发现lakehouse中也有new_sales_prod目录生成,如下面图所示,

        

         

感觉variable library用来设定不同产品环境的配置值,比如Developement, Test, Production环境的配置项相同但是值不同。可能比较适合CICD(continuous integration and continuous deployment)中的配置

3.总结

本文简单介绍了Microsoft Fabric Data Factory的一些新特性,其中variable library还处于preview阶段。当前随着大语言模型的普及,Data Factory也可以使用Copilot进行制作了。Microsoft Fabric的功能更新确实挺快的,还需继续跟着微软老师们学习一下。

本文如果哪里有错误,麻烦告之,谢谢谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2396153.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【前端】javascript和Vue面试八股

面试暂时没有遇到过考这么深的,一般还是问一些生命周期和性能相关。 Q:什么情况下“ a 1 && a 2 && a 3 ”同时成立 A:对象的valueOf与toString方法:当一个对象与一个原始值(如数字)进…

WEB3——区块链留言板(留言上链),查看web3日志-入门项目推荐

区块链留言板(留言上链) 目标:构建一个用户可以“写入留言、读取历史留言”的 DApp。 内容: Solidity 编写留言合约,存储留言内容和发送者地址。 提供 API: GET /messages:获取留言列表 POST…

【配置vscode默认终端为git bash】

配置vscode默认终端为git bash 点击左下角小齿轮,点击设置,搜索terminal.integrated.profiles.windows,点击在setting.json中编辑 第一部分是当前的所有的终端,第二部分是配置默认的终端"terminal.integrated.defaultProfi…

Cypress + TypeScript + Vue3

🚀 从零构建 Cypress + TypeScript + Vue3 组件测试环境【详细实战教程】 组件测试是前端开发中不可忽视的一环,它能够帮助我们在开发阶段就发现 UI 与交互逻辑问题。本文将带你手把手搭建基于 Cypress + TypeScript + Vue3 的组件测试环境,包含完整目录结构、配置文件、组…

深入解析 IP 代理:原理、应用场景与优化策略

在当今数字化时代,网络通信的安全性与隐私保护成为人们日益关注的焦点,而 IP 代理作为网络技术领域的一个重要概念,正扮演着愈发关键的角色。本文将深入剖析 IP 代理的原理、广泛的应用场景以及如何对其进行优化,以期为读者提供有…

58、辣椒种植学习

辣椒(学名:Capsicum annuum)属于茄科辣椒属,是一种重要的蔬菜兼调味作物,具有较高的经济价值和营养价值。其果实富含维生素C、辣椒素等成分,既可鲜食,也可加工成干辣椒、辣椒粉、辣椒酱等产品&a…

【SpringBoot】零基础全面解析SpringBoot配置文件

本篇博客给大家带来的是SpringBoot配置文件的知识点, 有properties 配置文件 和 yml 配置文件, 目前主流的是yml,所以本文以 重点讲解 yml 配置文件. 🐎文章专栏: JavaEE进阶 👉gitte链接: 薯条不要番茄酱 🚀若有问题 评论区见 ❤ 欢迎大家点…

python:PyMOL 能处理 *.pdb 文件吗?

PyMOL 完全可以打开并处理 PDB(Protein Data Bank)文件,这是 PyMOL 最主要的功能之一。PDB 格式是结构生物学领域的标准文件格式,专门用于存储生物大分子(如蛋白质、核酸)的三维结构数据。 在 PyMOL 中打开…

GNSS终端授时之四:高精度的PTP授时

我们在GNSS终端的授时之三:NTP网络授时中介绍了NTP网络授时的基本原理。我们知道了NTP授时的精度跟网络环境相关,即使在局域网中NTP授时的精度也只能到ms级别。如果广域网,经过多级交换机,路由器,由于传输路径和延时的…

PHP与MYSQL结合中中的一些常用函数,HTTP协议定义,PHP进行文件编程,会话技术

MYSQL: 查询函数: 执行查询语句: 1.mysql_query("SQL语法"); 凡是执行操作希望拿到数据库返回的数据进行展示的(结果返回: 数据结果); 2.执行结果的处理:成功为结果集,失败为false; 成功返回结果:SQL指令没有错误,但是查询结果…

OpenCV计算机视觉实战(9)——阈值化技术详解

OpenCV计算机视觉实战(9)——阈值化技术详解 0. 前言1. 全局阈值与自适应阈值2. Otsu 算法3. 实战案例:文档扫描中的二值化处理4. 算法对比小结系列链接 0. 前言 在图像处理领域,阈值化 (Binarization) 技术就像一把魔术剪刀&…

【Tauri2】049——upload

前言 这篇就看看一个简单地插件——upload Upload | Taurihttps://tauri.app/plugin/upload/upload的英文意思是“上传(程序或信息)”。 看来是用来上传文件的。 支持移动端 正文 安装 pnpm tauri add upload 在前后端都会安装,即 .plug…

4、数据标注的武林秘籍:Label-Studio vs CVAT vs Roboflow

开篇痛点:90%的模型效果取决于数据质量 "标注3小时,训练5分钟"——这是很多AI工程师的真实写照。上周有位读者训练YOLOv12时发现,同样的代码,换批数据mAP直接跌了15%,根本原因是标注不规范!本文…

Linux 基础IO(上)

目录 前言 重谈文件 文件操作 1.打开和关闭 2.对文件打开之后操作 理解文件fd 1.文件fd的分配规则与重定向 2.理解shell中的重定向 3.关于Linux下一切皆文件 关于缓冲区 1.为什么要有缓冲区 2.缓冲区刷新策略的问题 3.缓冲区的位置 前言 本篇到了我们linux中的文件…

el-tree拖拽事件,限制同级拖拽,获取拖拽后节点的前后节点,同级拖拽合并父节点name且子节点加入目标节点里

node-drag-start:开始拖拽节点时触发​​(按下鼠标按钮),无论是否允许放置,此事件都会触发。 allow-drop 返回 true 才能触发@node-drag-end="handleDragend"、@node-drop="handleDrop"; (1)allow-drop:动态控制​​是否允许放置; (2)node-dr…

day62—DFS—太平洋大西洋水流问题(LeetCode-417)

题目描述 有一个 m n 的矩形岛屿,与 太平洋 和 大西洋 相邻。 “太平洋” 处于大陆的左边界和上边界,而 “大西洋” 处于大陆的右边界和下边界。 这个岛被分割成一个由若干方形单元格组成的网格。给定一个 m x n 的整数矩阵 heights , hei…

《Python基础》第2期:环境搭建

在开始编写 Python 代码前,还需要搭建 Python 的开发环境。 电脑是没办法直接读懂 Python 代码的,而是需要一个解释器,实时把代码翻译成字节码,字节码再转换成 0 和 1,电脑就能读懂了。 Python 的运行过程就是翻译一行…

WSL 安装 Debian 12 后,Linux 如何安装 curl , quickjs ?

在 WSL 的 Debian 12 系统中安装 curl 非常简单,你可以直接使用 APT 包管理器从官方仓库安装。以下是详细步骤: 1. 更新软件包索引 首先确保系统的包索引是最新的: sudo apt update2. 安装 curl 执行以下命令安装 curl: sudo…

[CSS3]vw/vh移动适配

vw/vh 目标: 能够使用vw单位设置网页元素的尺寸 相对单位相对视口的尺寸计算结果.vw全称viewport width; 1vw1/100视口宽度 vh全称viewport height; 1vh1/100视口高度 体验vw和vh单位 <!DOCTYPE html> <html lang"en"> <head><meta charset…

YOLOX 的动态标签分类(如 SimOTA)与 Anchor-free 机制解析2025.5.29

YOLOX 的动态标签分类&#xff08;如 SimOTA&#xff09;与 Anchor-free 机制是其核心改进中的两个关键部分&#xff0c;它们在目标检测中的作用和实现方式存在显著差异。以下从原理、实现细节及效果三个方面进行详细对比&#xff1a; 一、核心原理与目标 1. Anchor-free 机制…