1.4 流量运营的4类数据来源
本节将介绍流量运营的数据来源,包括通过广告投放工具获得的外部投放数据、通过流量分析工具采集的自有流量数据、通过大数据工具采集的自有数据以及通过第三方来源获得的行业和竞品数据。如图1-4所示。
图1-4 流量运营的4类数据来源
1.4.1 通过广告投放工具获得的外部投放数据
在流量数据化运营过程中,在广告投放时会产生大量的数据,这些数据主要集中在曝光和点击两个阶段。不同的广告渠道所能获取的数据差异极大,根据详细程度的差异,这些数据大体可分为三类。
1. 曝光和点击等汇总数据
这类渠道以硬广告类为代表,其数据主要以曝光和点击数据为主。这类渠道主要通过合作伙伴或媒体直接投放,而合作伙伴或媒体一般都只能提供基于不同时间粒度的广告曝光和点击、CTR的汇总数据,无法直接提供广告曝光和点击明细数据。
提示
在大多数情况下,硬广告类的数据都是由媒体或广告投放平台自己提供,因此它们同时扮演了“裁判员”和“运动员”两种角色;另外,由于硬广告类媒体的强势及其他潜在的灰色原因(例如作弊流量、媒体刊例上的虚标用户规模等),它们也不允许插入第三方代码进行实际广告曝光和点击的监测。因此其提供的数据对于广告主来说,仅作为参考使用。
2. 带有更多细分维度的分类汇总和统计分析数据
这类渠道以SEM、信息流、社交媒体、CPS、会员类等为代表,能提供更多维度。根据这些维度数据可以得到在广告投放时的人群定位、投放规则、地域、预算等具体投放细节的统计报告,从而帮助企业更好地分析不同维度下站外的广告投放效果。会员类渠道能借助运营服务商获得更多关于信息投递的到达、打开、点击等效果,在电子邮件中,甚至可以植入网站流量采集的代码,以采集会员在邮件中的互动行为。
提示
这类渠道的效果能依托于站外广告投放的实际执行规则,覆盖统计每个规则下的实际广告效果,因此对于每个流量运营执行活动的效果评估以及优化具有重要的参考意义。
3. 带有所有明细的广告数据
通常而言,站外广告媒体都不会提供有明细的广告数据。这类明细数据包括两个粒度:一是基于用户(这里指的是Cookie级别的匿名用户,不是企业的用户)级别的明细数据,即用来评估站外每一个匿名Cookie机制下,在每个广告投放规则下的效果情况;二是基于每次曝光行为的明细,即当广告对用户曝光后用户是否点击的数据。
这两类数据,由于涉及每个用户的数据(第二类是每个用户的每次行为),因此对于数据的明细粒度要求非常高,但广告渠道一般不会直接向第三方提供此类原始粒度级别的数据。
不过,某些具有完整生态的广告平台却可以提供这类数据。例如,GMP(Google Marketing Platform)作为Google主要的广告营销平台,包含营销业务、数据分析业务、优化业务以及Google云服务相关业务。当广告主选择在Google平台(例如Google Ads)投放广告时,基于曝光和点击粒度的数据可以进入Google ADH(Ads Data Hub)。此时ADH中的明细数据可供广告主自己灵活使用。举例如下:
- 广告主可以通过Google的机器学习业务实现广告行为分析,从而了解每个规则下的广告细分情况以及与转化目标的关系;
- 广告主可以对多次曝光的用户,统计每个用户站外的广告曝光的数据流;
- 广告主可以通过对用户曝光后的实际点击数据进行建模,预测特定用户在特定场景下是否会完成点击,以辅助后续的广告投放以及Lookalike客户特征的分析;
- 广告主可以与自己的CRM(Customer Relationship Management,用户关系管理)打通,组建基于完整数据(企业内部数据+外部数据)覆盖的SCRM(Social Customer Relationship Management,社会化用户关系管理),此时广告主对用户的认知将比之前基于企业私域范围内的数据的认识更加清晰。
提示
什么是完整的数据生态?站外广告渠道在投放广告时,其每次曝光的用户信息一般都有数据记录。但是这些数据一般都只能供广告平台内部使用,作为平台为广告主提供额外增值服务(售卖服务)、额外数据分析产品(售卖产品)、优化广告投放平台的产品功能(功能的优化可以实现广告主和广告平台双向收益的提升)的数据资源。如果这些数据开放出来,就意味着广告平台会将资源共享给其他平台。谁也不想为他人做业务嫁衣。
1.4.2 通过流量分析工具采集的自有流量数据
企业内获得流量数据的主要途径是通过第三方流量分析工具采集。企业只需将特定的检测代码植入网站或App即可(网站端基于JavaScript实现、App基于SDK实现)采集自有数据。如果存在特定的隐私或保密数据则可以通过Server to Server的方式,直接从企业内部的服务器发送到流量分析工具的服务器,而不用经过用户的客户端。
当前市场上已经具备一些功能强大、产品易用、数据安全的第三方流量分析工具。典型的代表包括国外的Google Analytics、Adobe Analytics,国内的Ptmind、神策、诸葛IO等。不同的工具具有不同的特征,这也是它们能够共存的前提。因此企业只需在特定的费用区间内选择能满足当前业务需求以及可预见阶段内具有一定应用拓展性的工具即可。
第三方流量分析工具能够采集到的数据已经非常完善,包含了从用户到达网站到用户离开网站的所有数据。举例如下。
- 页面信息:用户看了什么页面、停留了多长时间、看到第几屏幕后退出、从哪个页面进入、又进入了其他哪些页面。
- 渠道信息:用户从哪些渠道来,包含来源网站的域名、URL、自定义跟踪的参数信息(例如网站、媒介、位置、广告活动、关键字信息、内容信息)、搜索关键字等。
- 用户信息:用户的年龄、性别等社会属性(部分工具,例如Google Analytics提供),访问网站的间隔,属于哪类访客(新、老访客),用户不同时间粒度的留存情况,用户的设备、浏览器、系统等详细情况等。
- 转化信息:用户买了什么、花了多少钱、买了多少次、是否使用优惠券、是否有折扣信息等。
提示
大部分的第三方流量分析工具都只能提供基于不同细分维度的汇总报表,但类似于Google Analytics等工具则可以提供所有用户在网站上行为的明细数据,企业可以基于这些明细数据做更多深入分析、数据建模、二次功能开发以及系统协作等。例如分析购买了特定商品的用户在购买动作之前频繁地查看商品和购买商品的关系,挖掘从特定渠道到达网站后形成转化的客户特征,使用原始数据构建在线个性化推荐系统等。因此,明细级别用户数据,除了可以帮助企业获得快速的数据采集和分析能力之外,也是企业数据资产的重要组成部分。
1.4.3 通过大数据工具采集的自有数据
通过第三方流量分析工具采集数据适合大多数企业,但对于各个级别的头部企业来说,则更倾向于通过大数据工具自建一套系统来实现数据采集、统计和分析工作。
通过大数据工具采集自有数据的基本模式与第三方流量分析工具基本一致,也都需要经过网站或App埋码,完成前端的采集工作。数据采集到企业内部服务器或云平台后再进行离线计算,对于部分实时性要求高的数据还需要进行实时计算。数据计算完成之后的结果将进入数据库、数据仓库或数据平台内供后期的报表或应用查询。为了方便多系统间的数据调用,企业还可以开发数据API为后续的应用提供接口服务。
提示
单纯只从功能的实现性以及投入的资源(包括硬件、软件、人力资源开发)上来看,自建流量采集系统属于投入产出比低的选择,而且从功能的完整性、易用性、丰富性上来看它都远远不如第三方流量采集系统。因此,如果只为了开发一个系统用于流量统计分析使用,企业一般不会选择自建。但是,对于各个领域内的头部企业来说,数据定制化开发、对完整数据链路的掌控、内部业务生态的构建、基于流量数据的多分析和应用系统的开发、对数据安全与隐私的100%掌控等的重要性可能要大于一个标准化产品功能的完整性、易用性、丰富性,因此自建是更优方案。
1.4.4 通过第三方来源获得的行业和竞品数据
通过第三方来源获得的行业和竞品数据将作为流量运营的补充数据,这些数据主要涵盖行业信息和竞争信息两方面。
- 行业信息:包括行业的最新趋势和技术动态,客户属性、喜好、行为的演变,行业热度信息,新技术带来的营销方式、手段、触点、策略等的变化等,用于帮助流量运营从业者快速掌握行业最新信息。
- 竞争信息:包括竞争对手的广告投放的媒体渠道、排期、素材、广告卖点、策略监控、竞争厂商以及特定服务和商品的关键字热度、企业形象和口碑对比情况等,用于帮助流量运营从业者掌握竞争对手动态,做到“知己知彼”。
关于行业和竞争的数据获取,企业可以通过爬虫、付费购买、资源互换以及商务合作等方式获得部分数据,但在该领域内,更多企业会选择付费使用专业的服务公司或技术公司。
提示
对企业来讲,竞争对手的公开数据可以很方便地获取(例如网站、商城、品牌官网、行业协会网站等),但某些数据是无法通过“正当”渠道合法合规获得的。如果选择通过第三方渠道获得这些数据,则可以通过数据规范、合作协议、合作框架、合同文本等“原则性”的合法合规的、具有法律效力的文件来“规避”这些潜在风险。