请选择 进入手机版 | 继续访问电脑版
免费制作论坛,请联系羽翼互动陈先生qq:329059459,手机:13540604645

网站建设论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 376|回复: 2

如果你的流量里掺入了虚假流量……

[复制链接]

8251

主题

8982

帖子

2万

积分

管理员

联盟创始人

Rank: 9Rank: 9Rank: 9

积分
27563
QQ
发表于 2017-10-12 18:29:54 | 显示全部楼层 |阅读模式
今天我们来聊一下,流量中的灰色地带–虚假流量,据官方统计数据, 2016 年虚假流量就给全球广告主造成了 76 亿美元的直接经济损失,除了直接经济损失外,更加多样的流量造假方式,也带来了更多的“副作用”。
2 Z# A! ~) [5 |9 {: F- a如无效的用户定位,广告出现在了不该出现的媒体上面,吸引了不该吸引的用户,白白浪费流量,更有甚者,如果把流量导流到了美女游戏页面,那么对品牌形象也会产生负面影响。
) S" k: Y2 o4 m, y. G' v虚假流量是如何产生的整个广告生态会涉及三方角色:广告主、媒体(卖广告的)、用户(看广告的)。媒体是不会承诺效果的,但是如果你反馈曝光量和点击量不够,媒体是可以给你再补量的。给你补的量多了,势必造成其它家量少,间接造成竞争加剧,流量价格也越来越高,但是只有曝光点击没有转化也是没有用的,于是更多的广告主更倾向于用户转化作为考核指标,而忽略了其它考核指标如CPC、CPM,只会让竞争更加加剧,造成恶性循环,从而导致了虚假流量的产生。- I1 m; J, f" M/ S( }: [
我们知道用户一般会在三次或三次以上访问后最终才能决定转化,他的整个生命周期决定了最后的转化,某些渠道虽然不擅长转化,但是它对其它渠道有助攻作用,所以不能一刀切。
6 x, B! |$ ^- r3 G; L, J6 {另外,如果把和渠道结算的指标定为CPS、CPA就万事大吉了吗?有利益驱使的地方就有魔鬼。所以我们需要一整套完整的策略为渠道保驾护航。
* A. }  m( m8 `5 H甄别虚假流量在研究虚假流量之前,还有一种流量需要引起我们的注意,那就是异常流量,异常流量通常混杂在虚假流量中间,扰乱我们的判断。所以首先我们要区分什么是虚假流量什么是异常流量?! {% R% @. P" w7 ^" X) Q6 q& V9 c
如果出现了以下情况,多半可以认为是异常流量,当然这需要沟通多方然后去判断:, }; y% m4 I' V% I! J% H+ B
  • 投放的媒体出现了问题,投放的页面宕机了) Y0 m. O" c. `) ^6 p4 e. M! E
  • 打的链接参数缺失或者丢失导致代码失效) ]- y$ r* j- g. b
  • 埋点采集异常
    9 n; E$ y9 k( i+ t: `$ l
  • 数据通路被无故屏蔽% F( Q$ k0 m* Z) |: _" _
  • 指标配置有问题
    ) F. E8 T; M# N8 q' e  u9 T% n0 H
    . `0 t# m$ s4 M/ V
如果出现了以下情况,多半可以认为是虚假流量:
4 ]3 q* y" x3 T9 O/ {
  • 刷量!* W; O; Y$ |9 E5 |. L
  • 刷量!!% C2 F( w4 _1 i9 e
  • 刷量!!!, h6 U5 b) x5 ?2 K
    3 c3 E5 d+ A1 f
对于如何避免异常流量,不是今天文章的重点,就不多说了,这需要公司内部规范化项目流程,各个环节把控好,才能有效规避。下面,我们详细说下如何排查出虚假流量的蛛丝马迹。
0 R0 ^# V$ X: q/ z1 r流量全流程数据监控我们需要将流量数据、行为数据和转化数据通过一定的数据采集手段,来获取完整、全面和准确的数据,目的是将全流程数据打通,只有获取了完整全面的数据我们才能找到虚假流量的踪迹。下图是流量转化的完整过程:
+ O- g$ |( m: l" c& w9 Q4 @% ]7 T8 |

0 S$ o" l# `/ J2 l: ~. u% \这个过程我们面临了两个难题:
8 L: I% B/ V+ ]
  • 展示和点击数据都在第三方广告投放平台,我们不能获得用户的详细信息1 Q8 B/ v  t  s3 |! B
  • 前后端数据存在割裂,只能统计到前端的点击转化,不知道后续业务转化如何
    " ^( ], q/ P% k5 k; s& Z7 F+ h3 G- Q/ ]! V4 s# \
所以好多渠道作弊方,会在这两个方面做文章,钻渠道的空子,通过程序或者雇佣人肉等人为操作产生流量,人为操作可能是点击你的广告、访问推广落地页,或者完成某个简单的任务,比如点击Call to Action按钮,这种流量通常不会带来实际的转化,上面也说了因为转化的业务数据不能获得,抓不到证据也就不好衡量,所以就只能呵呵了。/ F( j  L' k% f% |- c2 X0 x; |
作弊流量是不能避免的,我们只能靠增加技术壁垒,增加作弊的成本,作弊的成本高了,一定程度会减少作弊的现象。( a% N2 [9 h( I5 o7 L% z
数据预处理我们可以在流量正式到达落地页之前,在展示点击阶段和到达产品落地页之间构建一层屏障,即通过数据预处理手段,通过一定的反作弊规则先把某些行为可疑或者不需要的流量过滤掉:
. ^! n, e( T" S4 J9 h
  • 过滤某些已知IP段,如内网IP、测试IP! x) N; m6 B$ \& i( g9 B; x2 ~5 d
  • 设备号异常:如频繁重置idfa
    9 G: U. m, T3 ]
  • IP异常:定位的IP来自莫名其妙的地方
    , k, L% A5 q! P3 [9 b3 r. V
  • 行为异常:如频繁刷新页面
    / U9 P% z) `/ N0 X
  • 数据包不够完整:只有启动信息,没有页面、事件等其他用户行为信息1 I& I$ o5 S3 W# ]) i5 R
    4 q# S- r/ i5 a" q, S2 W! ]
这样我们就能保证到达落地页的流量相对干净,但仍有落网之鱼,需要我们通过进一步的数据分析来找到虚假流量。
4 b9 m3 t3 V: H3 r, u& H0 Z/ y) f
网站建设论坛——爱自己并要求自己,努力打造互联网界的营销旗舰!
回复

使用道具 举报

8251

主题

8982

帖子

2万

积分

管理员

联盟创始人

Rank: 9Rank: 9Rank: 9

积分
27563
QQ
 楼主| 发表于 2017-10-12 18:30:10 | 显示全部楼层
案例剖析虚假流量我们先来看一组数据:
* Q' M' W8 @; ~" q& v# T
  • 日均访问次数:10w+8 n7 W. m  q( C8 g4 B; ?/ A1 A
  • 跳出率:45%
    5 \4 P9 o7 I# C- @' [# K
  • 平均每次访问页数:3.2$ g* Z' m6 j* l: k- F
  • 平均每次访问停留时长: 1 分 50 秒3 V# n1 h# ?1 {5 M7 G) E" Z
  • 订单转化率:0.12%
    + z/ T; E4 E; d' R8 m+ x2 U- c; n- V, q' J  h3 C
这是我们某个电商类客户反馈出的问题,他们新上线了某个电商网站,从访问量、跳出率等这些指标来看表现都不错,偏偏订单转化率低,不知道怎么回事。
$ m. j2 V5 ?; p遇到这种情况,只能说别急,我们先从数据上细分看看。细分对虚假流量是致命的,因为通过细分我们一定能识别出虚假流量的模式和规律。
  d2 t: m) k) n网站整体的访问量变化趋势5 {  v8 R# v2 U' z5 K
从上图可以看出, 9 月 3 号PV较平时较低;访问量和唯一身份访问用户数几乎相等,即人均访问次数接近与1,每个用户只访问了一次,月回访率很低。. {% b, u4 l6 B! J
新访占比和跳出率对比分析% b- H+ G+ k. ~5 |
从上图我们可以得出这些信息:
5 r3 ~* a, l) t2 Z  ~* d
  • 新用户占比接近于80%,说明新用户居多
    : N& T8 Z4 I4 ^
  • 跳出率在45%左右,跳出率很低,说明流量质量还可以
    ' c/ {. p  C7 v: |- ^( C( T' o
    - w" U0 g6 A" {% u
但是如果我们深入想一下,会发现有如下问题:8 ]% N. `  I5 g9 y0 M' V
  • 新用户占比和跳出率指标成反比关系,正常情况下,新用户占比和跳出率指标成正比关系,新用户占比高的话,跳出率也高+ O7 {7 g# v, x7 f* e
  • 跳出率低,为什么转化率也那么低呢?
    ) J" t' M! j2 T/ o) G2 [) L1 h6 d% F
不同城市不同转化指标对比
2 \# f5 H- S& d* p1 k1 @, j
我们找了流量排名Top8 的城市的对比数据,这Top8 的城市数据对流量贡献较大,且上海的销售额占总销售额的1/ 3 左右,河南订单转化率较高。城市为“未知”的流量贡献也较大,跳出率低,但是订单转化率远小于0.01%。显示为未知,说明抓不到这些流量来自于哪个IP段,但是访问量足够大,所以需要引起注意,有作弊嫌疑。3 E3 ?# j: u9 B1 [- J
未知城市不同时间段分类对比分析) D. _; M) Y$ q2 F+ M) b! G# @
选择了最近一个月的数据,看不同时段这些流量的分布情况(图略),发现凌晨 1 点到凌晨 6 点流量占总流量的25%,占比较高,更奇怪的是,晚间流量每个时段较平均,流量差不多,这是不符合常理的,需要进一步分析。' K/ @9 m; ~: O, B: ]
2 z5 ~* {, F" S5 g; {
网站建设论坛——爱自己并要求自己,努力打造互联网界的营销旗舰!
回复 支持 反对

使用道具 举报

8251

主题

8982

帖子

2万

积分

管理员

联盟创始人

Rank: 9Rank: 9Rank: 9

积分
27563
QQ
 楼主| 发表于 2017-10-12 18:30:27 | 显示全部楼层
夜间流量分类对比分析2 q! }1 L* Q, B) ?2 S
我们发现这些流量中72%的流量来自于广告系列,但是转化率较低,不知道具体哪个广告系列来源拉了后腿。2 }2 b# }& z3 G: y# R3 U8 \/ [8 J
夜间流量广告系列来源占比分析' g" ?2 A0 U; n3 q
发现广告系列流量中大部分都来自于sm这个渠道,此时可以把分析范围缩小到sm这个渠道。2 c. E5 t" k7 `3 m7 j3 {3 r! e, l* D
sm渠道指标整合分析7 ~, J: G( F3 f7 _
sm渠道的访问量很大,新用户占比90.31%,而跳出率为20.32%,转化率0.08%。基本可以断定是sm渠道出问题了。- ?! g. Y0 B, z3 l
sm渠道细分落地页和非活动页面数据表现. J+ \' F( X/ e% g) y8 s
通过进一步细分,发现sm渠道大部分流量都流入了活动落地页(图略),跳出率低于23%,且每次访问的平均浏览深度接近于1,有趣的是,另一部分非活动落地页的,页面浏览深度在几百个页面,非正常人类行为,它的目的只是为了平均整体流量。
1 D) ]1 Z+ n8 s2 B# b% q4 I# esm渠道活动落地页点击图分析
2 W& U- V! g5 R+ F同时我们还可以结合不同落地页的点击图进行分析,你会发现更多有趣的现象。& r( ~! x8 A1 y+ Y* J
至此,大功告成。
+ H1 R' O) U) E! B! H& ]: F案例总结从上面的案例我们看到通过层层细分,层层递进的方法我们找到了虚假流量,所以要想找出虚假流量,我们需要密切关注如下几个方面:
# z) [% @+ |4 N) `/ L4 K# C! @给渠道打好标记,目的方便分割流量0 v6 J! W8 r* B  v, e- \, n  S
为每一个渠道打好UTM标记,那么渠道会贯穿于用户的整个访问过程中,方便按渠道分组查看每个渠道的表现,避免其它渠道的干扰。0 L5 U4 p8 B$ E0 N" K- d& A
流量产生的时间
& d" P* o& v9 h$ f4 k1 F找到异常流量发生的时间点,然后将时间细化到每小时的访问数据,如果流量过于集中在某个时段,或者在不恰当的时间点出现了流量激增的情况,这时候就要引起注意了。9 `1 T) F) ^3 ?
流量的地理来源
$ c- T! b1 T5 r" K5 _# f通常情况下,访客会来自不同的地理位置,如果流量过于集中在某个地区,或者采集不到地区的地方出现了大量的流量等等都是很可疑的。
4 {. T, [3 H: s流量的用户终端: m; t, C( `! A0 w6 D8 \+ ^8 n* ~/ H
不同的渠道覆盖不同的用户群,所以各自的用户终端会有一定的区别。比如对于小米应用商店这个渠道来说,它的用户很可能排在前 10 的手机都是小米手机,而对移动MM来说,他们的用户都来自于移动运营商。排除这些特殊渠道的应用商店,大部分渠道的用户终端跟整个互联网终端分布是类似的。我们可以通过看行业报告或者查询数据指数产品来了解这些数据,把这些数据作为行业基准值,进行对比。另外我们还可以重点关注设备终端类型、操作系统、联网方式、运营商、地理位置等设备属性。# ^" }6 s  s) s; ^' B% Y
流量的跳出率和新访用户占比) S, x% G4 ^, D# u8 ]
跳出率和新访用户占比成正比关系,另外如果流量在某个时段跳出率突然增高,可以结合上述维度进行细分查看,哪个细分维度的跳出率增高。! A, A! p/ m- w+ x
流量的转化
! E& A6 z2 Z# }& S8 V很多作弊流量可以模仿人类行为,绕过跳出率、平均访问深度和停留时长这些宏观指标,但是要模仿一个业务转化就比较难了,如果宏观指标表现很好,业务转化很少的话,就需要提高警觉。/ U  b0 C" t4 z# z
流量的留存. {. C4 a: h# Z. g6 n! H9 M
我们一般经常看的留存指标有次日留存、 7 日留存、 30 日留存,所以一些作弊渠道会专门针对这三个指标做手脚,所以除了看这三个指标外,建议将指标拓宽,关注每天的留存变化。- h+ m9 E8 Z* m- q2 `* o) A; y
新流量过来的用户路径2 l* Q* v6 Q0 S; ]

$ a7 h9 M) S. Q" A- `: I) r新用户来到推广落地页后,一般会从落地页开始进行分流,他们会点击不同的链接,访问不同的页面,而作弊流量很难完成2- 3 次点击,即便完成了,点击的链接或内容也基本固定。
/ a% L( y4 }  K2 R, y流量的功能访问分布分析
3 C; h) R2 x% j8 a适当拉大时间维度,看某个渠道某个基本功能如浏览页面的访问频次分布,真实的访客是有再次回访行为的,而虚假流量一般是本次任务完成后是不会管后续收尾动作的,回访频率很低。2 a  L* J% ?0 h) }6 ^/ g  C
流量的单页面人均访问次数
# S, F2 i2 F" O) ^! `7 G如果某个落地页面的人均访问次数很高比如 4 次以上的话,就很可疑了,因为在一次访问中用户一般是不会多次浏览同一个落地页的。同时结合该页面在网站整体的人均访问次数进行对比,结果会更加准确。5 {& t1 F5 o; t
流量的落地页点击热图分析% I& E3 D2 @5 @9 `3 U  ?
这需要借助一些热图工具,从热图工具中,作弊流量的蛛丝马迹更易发现。
, ]1 V3 k% Z) w5 M, M作者:北极星,神策数据分析师,先后服务的客户包含纷享销客、拉钩云人事、网易七鱼、ofo、多盟、更美等公司,致力于通过数据分析实现产品优化和精细化运营。
& h/ q* f2 B5 P7 r
8 y( N% K  e* P& c8 \7 v( K
网站建设论坛——爱自己并要求自己,努力打造互联网界的营销旗舰!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

免费微信二次开发,想做马上联系羽翼互动陈先生:QQ:329069459,手机:13540604645.

QQ|Archiver|手机版|小黑屋|网站建设论坛 ( 蜀ICP备15006334号-1

GMT+8, 2018-1-18 18:10 , Processed in 0.186447 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表