【Spark分布式内存计算框架——离线综合实战】1. 综合实战概述

news2025/7/17 17:47:09

离线综合实战

大数据营销是基于多平台的大量数据,依托大数据技术的基础上,应用于互联网广告行业的营销方式。大数据营销的核心在于让网络广告在合适的时间,通过合适的载体,以合适的方式,投给合适的人。大数据营销是精准营销的一种方式,日后是一种主流的广告模式方向,大数据营销的效果犹如现在搜索引擎营销,都是精准营销的模式。
在这里插入图片描述
大数据营销是未来广告行业发展的一个趋势,现在每个有名的平台都有大数据分析部门,不管是阿里,还是腾讯和百度,甚至央企的移动、联通,都有大数据部分进行精准的计算,因为每个人都有上网的习惯,上网留下的行为轨迹,通过浏览器就可以记录一个人的最近的想法。例如:张三最近登录看新闻 ,看车的新闻比较多,登录某些平台,肯定会推荐车的广告给张三。
在这里插入图片描述

第一章 综合实战概述

数据管理平台(Data Management Platform,简称DMP),能够为广告投放提供人群标签进行受众精准定向,并通过投放数据建立用户画像,进行人群标签的管理以及再投放。 各大互联网公司都有自己的DMP平台,用户广告精准投放营销,比如字节跳动产品今日头条、抖音短视频等主要是通过广告推广盈利,BAT公司DMP平台:

1、百度DMP智选:http://dmp.baidu.com/static/index.html
2、淘宝达摩盘(DMP营销平台):https://dmp.taobao.com/
3、腾讯DMP:https://dmp.qq.com/
4、品友互动DMP:http://www.ipinyou.com.cn/dmp
5、微博广告DMP平台:https://tui.weibo.com/platform/dmp

1.1 需求概述

DMP日渐火爆源于广告主对投放效果的更高追求以及对营销浪费更低的容忍度,DMP即是为解决这些问题而生。广告主希望更精准的对目标人群进行广告投放,如果投放的对象对某些广告不感兴趣,却反复被广告轰炸只会适得其反。如果企业能够在投放广告或其他营销手段前就能对受众进行具体、精准的识别,广告投放的效果会因此增强。
在这里插入图片描述
DMP平台数据集生成的步骤如下:

第一步、收集数据

  • 数据来自于以往的竞价记录和收集到的用户数据;竞价记录来自于以往的交易;用户数据有可能来自第三方, 也有可能是自己收集(可能性比较小)。
  • 数据的来源分为三类:
    • 第一方数据:广告主自有用户数据,包括网站/APP监测数据、CRM数据、电商交易数据等。
    • 第二方数据:广告商在广告投放过程中积累的业务数据,如DSP平台业务中积累的受众浏览广告、点击广告等相关数据。
    • 第三方数据:非直接合作方拥有的数据,如运营商数据等。

第二步、合并多个数据源的数据

  • 在进行针对 DMP 的数据分析时,需要用到用户的数据来判定用户的喜好,也需要竞价数据来判定价格是否合适,所以需要将这两部分数据合并起来,再进行数据处理和分析;

为了更加关注于业务数据分析处理及应用调度执行,将广告相关数据进行整合,最终为JSON格式数据,每条数据大概上百个字段。
在这里插入图片描述

1.2 数据调研

广告相关数据整合存储在JSON格式中,数据字段说明及格式如下所述:

1)、JSON数据格式,截取一部分
在这里插入图片描述
2)、数据字段含义

字段解释
ip设备的真实IP
sessionid会话标识
advertisersid广告主ID
adorderid广告ID
adcreativeid广告创意ID( >= 200000 : dsp , < 200000 oss)
adplatformproviderid广告平台商ID(>= 100000: rtb , < 100000 : api )
sdkversionnumberSDK版本号
adplatformkey平台商key
putinmodeltype针对广告主的投放模式,1:展示量投放 2:点击量投放
requestmode数据请求方式(1:请求、2:展示、3:点击)
adprice广告价格
adppprice平台商价格
requestdate请求时间,格式为:yyyy-m-dd hh:mm:ss
appid应用id
appname应用名称
uuid设备唯一标识,比如imei或者androidid等
device设备型号,如htc、iphone
client设备类型 (1:android 2:ios 3:wp)
osversion设备操作系统版本,如4.0
density设备屏幕的密度 android的取值为0.75、1、1.5,ios的取值为:1、2
pw设备屏幕宽度
ph设备屏幕高度
provincename设备所在省份名称
cityname设备所在城市名称
ispid运营商id
ispname运营商名称
networkmannerid联网方式id
networkmannername联网方式名称
iseffective有效标识(有效指可以正常计费的)(0:无效 1:有效)
isbilling是否收费(0:未收费 1:已收费)
adspacetype广告位类型(1:banner 2:插屏 3:全屏)
adspacetypename广告位类型名称(banner、插屏、全屏)
devicetype设备类型(1:手机 2:平板)
processnode流程节点(1:请求量kpi 2:有效请求 3:广告请求)
apptype应用类型id
district设备所在县名称
paymode针对平台商的支付模式,1:展示量投放(CPM) 2:点击量投放(CPC)
isbid是否rtb
bidpricertb竞价价格
winpricertb竞价成功价格
iswin是否竞价成功
curvalues:usd|rmb等
rate汇率
cnywinpricertb竞价成功转换成人民币的价格
imei手机串码
mac手机MAC码
idfa手机APP的广告码
openudid苹果设备的识别码
androidid安卓设备的识别码
rtbprovincertb 省
rtbcityrtb 市
rtbdistrictrtb 区
rtbstreetrtb 街道
storeurlapp的市场下载地址
realip真实ip
isqualityapp优选标识
bidfloor底价
aw广告位的宽
ah广告位的高
imeimd5imei_md5
macmd5mac_md5
idfamd5idfa_md5
openudidmd5openudid_md5
androididmd5androidid_md5
imeisha1imei_sha1
macsha1mac_sha1
idfasha1idfa_sha1
openudidsha1openudid_sha1
androididsha1androidid_sha1
uuidunknowuuid_unknow UUID密文
userid平台用户id
iptype表示ip库类型,1为点媒ip库,2为广告协会的ip地理信息标准库,默认为1
initbidprice初始出价
adpayment转换后的广告消费(保留小数点后6位)
agentrate代理商利润率
lomarkrate代理利润率
adxrate媒介利润率
title标题
keywords关键字
tagid广告位标识(当视频流量时值为视频ID号)
callbackdate回调时间 格式为:YYYY/mm/dd hh:mm:ss
channelid频道ID
mediatype媒体类型
email用户email
tel用户电话号码
sex用户性别
age用户年龄

上百个数据字段,有的字段没有值,有的字段的值需要进行转换处理,具体依据业务需要选择相应字段进行对应处理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/361975.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

buu [WUSTCTF2020]情书 1

题目描述&#xff1a; 题目分析&#xff1a; 翻译一下可知&#xff1a; 前提&#xff1a;用0、1、2、……枚举字母表25 使用RSA系统 加密&#xff1a;0156 0821 1616 0041 0140 2130 1616 0793 公钥&#xff1a;2537和13 私钥&#xff1a;2537和937 从提示可以得知 n 2537 , …

盘点四种自动化测试模型实例及优缺点

一&#xff0c;线性测试 1.概念&#xff1a; 通过录制或编写对应应用程序的操作步骤产生的线性脚本。单纯的来模拟用户完整的操作场景。 &#xff08;操作&#xff0c;重复操作&#xff0c;数据&#xff09;都混合在一起。 2.优点&#xff1a; 每个脚本相对独立&#xff0…

leetcode1143 最长公共子序列LCS

这道题目核心的一行代码就是判断s1的第i个字符和s2的第j个字符是否相等 是s1.charAt(i-1)s2.charAt(j-1) 而不是s1.charAt(i)s2.charAt(j) 动态规划就是搞清楚dp[i][j]的含义然后写出动态转移方程 (1)dp[i][j]的含义 dp[i][j]表示考虑s1的前i个字符&#xff0c;考虑s2的前j…

【C++】类型转换方法

本篇博客让我们来见识一下C中新增的类型转换方法 文章目录1.C语言中类型转换2.C中的强制类型转换2.1 static_cast2.2 reinterpret_cast2.3 const_castvolatile关键字2.4 dynamic_cast3.C强制类型转换的作用4.RTTI1.C语言中类型转换 在C语言中&#xff0c;类型转换有下面两种形…

音视频基础之ffmpeg命令实战一

一&#xff1a;概念区别 ffmpeg/ffmplay/ffprobe区别 ◼ffmpeg: Hyper fast Audio and Video encoder 超快音视频编码器&#xff08;类似爱剪辑&#xff09; 如&#xff1a;把10分钟的视频剪辑为2分钟。 ◼ffplay: Simple media player简单媒体播放器 ◼ffprobe: Simple multi…

0202插入删除-算法第四版红黑树-红黑树-数据结构和算法(Java)

文章目录4 插入4.1 序4.2 向单个2-结点插入新键4.3 向树底部的2-结点插入新键4.4 向一棵双键树&#xff08;3-结点&#xff09;中插入新键4.5 颜色调整4.6 根结点总是黑色4.7 向树底部的3-结点插入新键4.8 将红链接在树中向上传递4.9 实现5 删除5.1 删除最小键5.2 删除6 有序性…

ASE4N65SE-ASEMI高压MOS管ASE4N65SE

编辑-Z ASE4N65SE在TO-220F封装里的静态漏极源导通电阻&#xff08;RDS(ON)&#xff09;为2.5Ω&#xff0c;是一款N沟道高压MOS管。ASE4N65SE的最大脉冲正向电流ISM为16A&#xff0c;零栅极电压漏极电流(IDSS)为10uA&#xff0c;其工作时耐温度范围为-55~150摄氏度。ASE4N65S…

面试官:说说react的渲染过程

hello&#xff0c;这里是潇晨&#xff0c;大家在面试的过程中有没有遇到过一些和react相关的问题呢&#xff0c;比如面试官让你说说react渲染的过程&#xff0c;这到题目比较开放&#xff0c;也比较考验大家对react渲染原理以及源码的整体架构的理解。 整体流程&#xff1a; r…

AcWing语法基础课笔记 第八章 C++ STL 第九章 位运算与常用库函数

第八章 C STL 第八章 C STL 1.#include <vector> 2.#include<queue> 3.#include <stack> 4.#include <deque> 5.#include <set> 6.#include<map> 第九章 位运算与常用库函数 STL是提高C编写效率的一个利器。 ——闫…

文献阅读笔记 # 区块链在软件供应链管理中的应用探索

崔宝江, 宋绪言. 区块链在软件供应链管理中的应用探索[J]. 保密科学技术, 2019(5): 41-44.主要作者来自北京邮电大学网络空间安全学院 移动互联网安全技术国家工程实验室&#xff1b; 摘要 探索用区块链技术保障软件供应链安全 1 引言 略。 2 软件供应链面临的安全风险 一…

网络协议(一)应用层(自定制协议、HTTP协议)

目录 应用层&#xff1a;负责应用程序之间的数据沟通 一、自定制协议&#xff08;私有协议&#xff09; 二、HTTP协议 1&#xff09;、请求行解析&#xff1a;GET /index.html HTTP/1.1 第一部分&#xff1a;请求方法&#xff1a;多种多样&#xff0c;描述不同的请求目的 …

吐血整理的网络工程师必懂的26个技术名词,自查一下看看自己知道多少 ?

在做网络工程师的工作时候&#xff0c;虽说那些晦涩难懂的英语以及技术名词很难记 比如我这个英语从不及格的小乐色&#xff0c;但是你会发现很多都会用到&#xff0c;所以多多少少还是要储备一些在脑子里&#xff0c;有点印象就OK了。查起来也方便不是&#xff01;那么今天咱…

基于龙芯 2K1000 的嵌入式 Linux 系统移植和驱动程序设计(二)

第 3 章 嵌入式软件系统移植本课题中嵌入式系统正常工作的前提是嵌入式软件系统完整且能正常工作&#xff0c; 以便为之后的软件开发提供一个能够正常工作的平台。引导程序 PMON 需要完成 内核引导&#xff0c;嵌入式 Linux 内核需要具有完备的功能且能够正常使用&#xff0c;根…

2023年 Android Studio Unable to find bundled Java version 解决方法

学习flutter过程中发现 Unable to find bundled Java version 错误搜索网上的解决方案都不对最后在 b站 https://www.bilibili.com/video/BV1S4411E7LY?p17&vd_sourced7cf0e2cd70b3cc57314d2efcb598c3d 教程的课件中找到了解决方哦 我的flutter版本 C:\Users\Ken>flu…

MQTT传输JSON数据实例

想跑一个用MQTT传输JSON的实例&#xff0c;上网找了一下开源代码&#xff0c;找到一个比较合适的&#xff1a;https://blog.csdn.net/ktigerhero3/article/details/107178252&#xff0c;程序源码直接用这个就可以&#xff0c;然后过程中需要进行一下环境的配置&#xff0c;本篇…

本地事务详解

1、事务的基本性质 数据库事务的几个特性&#xff1a;原子性(Atomicity )、一致性( Consistency )、隔离性或独立性( Isolation) 和持久性(Durabilily)&#xff0c;简称就是 ACID&#xff1b;  原子性&#xff1a;一系列的操作整体不可拆分&#xff0c;要么同时成功&#x…

【Optional】告别丑陋判空,使用Optional类

一、概述 当项目中充斥着大量的、丑陋的判空语句&#xff0c;如下&#xff1a; if (user ! null) {Address address user.getAddress();if (address ! null) {Country country address.getCountry();if (country ! null) {String isocode country.getIsocode();if (isocod…

ksycopg2连接人大金仓数据库报错ksycopg2._ksycopg问题解决

一句话解决 ksycopg2目前仅支持python2.7/3.5&#xff0c;若版本不同&#xff0c;则会发生报错&#xff1a; 替换ksycopg2为psycopg2即可&#xff1a; pip install psycopg2 测试&#xff1a; import psycopg2conn psycopg2.connect(host"xxx.xxx.xxx.xxx", por…

average_precision_score()函数----计算过程与原理详解

最近在复现论文时发现作者使用了 sklearn.metrics 库中的 average_precision_score() 函数用来对分类模型进行评价。 看了很多博文都未明白其原理与作用&#xff0c;看了sklean官方文档也未明白&#xff0c;直至在google上找到这篇文章Evaluating Object Detection Models Usi…

【SpringBoot 自动配置】-EnableAutoConfiguration 注解

【SpringBoot 自动配置】-EnableAutoConfiguration 注解 续接上回 【Spring Boot 原理分析】- 自动配置 与【SpringBoot 自动配置】- Enable*注解 ,在前面笔者分析了在 SpringBoot 自动装配中的最重要的两个注解类&#xff0c; Condition 与 EnableAutoConfiguration 哎~说到…