Dataiku DSS Concept-13- formulas (公式)
Dataiku 拥有一套自己的公式语言。这是一种功能强大的表达式语言可用于执行计算、操作字符串等多种任务主要类似Vlookup。公式处理器(Formula processor)利用公式的一种主要方式是在Prepare准备recipe中使用Formula处理器。你可以从处理器库中添加一个公式步骤并为输出列新创建的列命名。你可以在“表达式 (Expression)”框中直接编写简单的公式。不过打开编辑器面板(Editor panel)会提供更多的辅助功能代码补全一旦你开始输入Dataiku 就会自动建议数据集中的列名或可应用的函数。语法检查如果公式无效编辑器会立即发出警告。常用操作公式语言允许你构建相当复杂的表达式。你可以使用常用数学函数如round四舍五入、sum求和、max最大值。比较运算符如,,,,等于,!不等于。逻辑运算符如AND、OR。缺失值测试如isBlank()或isNULL()。条件语句即if-then逻辑。常用函数表函数描述length()返回字符串长度。适用于根据文本数据的长度进行行过滤。substring()通过指定起始和结束位置从文本列中提取子字符串。rand()在选定的最小值和最大值之间生成随机整数。常用于生成模拟数据。strval()解决带空格的列名当列名包含空格时直接引用会报错。使用strval(列 名)可以安全获取其值返回字符串。numval()与strval()类似但将带空格列名的值返回为数字类型。业务用例标记大额信用卡消费假设你有一个信用卡交易数据集你希望将某一笔交易的金额与该卡的平均消费金额进行对比。这在欺诈检测中非常有用。例如如果持卡人进行了一次与其往常消费习惯相比不成比例的高额购买你可以将其标记为潜在欺诈。如果你添加了一个名为higher_than_avg_purchase的公式步骤你可以编写如下表达式if(purchase_amountcard_purchase_amount_avg,yes,no)在这种情况下每一行交易都会被贴上标签说明其是否高于持卡人的平均消费水平。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2444500.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!