本篇的思维导图:
数据预处理:数据的规范化
数据标准化(归一化)处理是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值间的差别可能很大,不进行处理可能会影响数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。如将股票数据属性值映射到[-1,1]或者[0,1]内。
最小-最大规范化最小
最小-最大规范化也称为离差标准化,是对原始数据的线性变换,将数值映射到[0,1]之间。其转换公式如式所示:
本篇的思维导图:
数据预处理:数据的规范化
数据标准化(归一化)处理是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值间的差别可能很大,不进行处理可能会影响数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。如将股票数据属性值映射到[-1,1]或者[0,1]内。
最小-最大规范化最小
最小-最大规范化也称为离差标准化,是对原始数据的线性变换,将数值映射到[0,1]之间。其转换公式如式所示:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/138074.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!