请选择 进入手机版 | 继续访问电脑版
免费制作论坛,请联系羽翼互动陈先生qq:329059459,手机:13540604645

网站建设论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 115|回复: 2

如果你的流量里掺入了虚假流量……

[复制链接]

8195

主题

8912

帖子

2万

积分

管理员

联盟创始人

Rank: 9Rank: 9Rank: 9

积分
27343
QQ
发表于 2017-10-12 18:29:54 | 显示全部楼层 |阅读模式
今天我们来聊一下,流量中的灰色地带–虚假流量,据官方统计数据, 2016 年虚假流量就给全球广告主造成了 76 亿美元的直接经济损失,除了直接经济损失外,更加多样的流量造假方式,也带来了更多的“副作用”。5 \0 K& P# O. U* u* g3 x
如无效的用户定位,广告出现在了不该出现的媒体上面,吸引了不该吸引的用户,白白浪费流量,更有甚者,如果把流量导流到了美女游戏页面,那么对品牌形象也会产生负面影响。
0 r5 T$ i, |& l' ^4 N- y3 z虚假流量是如何产生的整个广告生态会涉及三方角色:广告主、媒体(卖广告的)、用户(看广告的)。媒体是不会承诺效果的,但是如果你反馈曝光量和点击量不够,媒体是可以给你再补量的。给你补的量多了,势必造成其它家量少,间接造成竞争加剧,流量价格也越来越高,但是只有曝光点击没有转化也是没有用的,于是更多的广告主更倾向于用户转化作为考核指标,而忽略了其它考核指标如CPC、CPM,只会让竞争更加加剧,造成恶性循环,从而导致了虚假流量的产生。( o/ @2 r/ d6 j+ m( t
我们知道用户一般会在三次或三次以上访问后最终才能决定转化,他的整个生命周期决定了最后的转化,某些渠道虽然不擅长转化,但是它对其它渠道有助攻作用,所以不能一刀切。
( f6 f% H, o% N; v- E4 D另外,如果把和渠道结算的指标定为CPS、CPA就万事大吉了吗?有利益驱使的地方就有魔鬼。所以我们需要一整套完整的策略为渠道保驾护航。
) J- J( i) h! C& h* ^# M2 y( b' M甄别虚假流量在研究虚假流量之前,还有一种流量需要引起我们的注意,那就是异常流量,异常流量通常混杂在虚假流量中间,扰乱我们的判断。所以首先我们要区分什么是虚假流量什么是异常流量?+ B! k. o% a% a6 R) \* Z% u
如果出现了以下情况,多半可以认为是异常流量,当然这需要沟通多方然后去判断:
+ _3 \' E( C: i# V+ G9 r
  • 投放的媒体出现了问题,投放的页面宕机了
    , q( H3 g' b6 B1 h4 ~
  • 打的链接参数缺失或者丢失导致代码失效* I* v6 _3 l- A) F( u
  • 埋点采集异常
    5 E+ ]! l: V' a. w: V
  • 数据通路被无故屏蔽% {; k. [! x2 }( t& J0 _/ H3 G9 J
  • 指标配置有问题5 u, G8 h6 r: D  D4 |
    8 B' h# E- g3 e" C. ]  n
如果出现了以下情况,多半可以认为是虚假流量:, d5 @; V7 |. r( M1 ]+ w! z
  • 刷量!0 Y% t" z* d: G$ x$ C) m
  • 刷量!!
    - u7 ^* O. A: Z. g4 ~2 ~
  • 刷量!!!& C$ I0 o* X/ S" }* \

    ) K1 E( }: C9 k% t; |
对于如何避免异常流量,不是今天文章的重点,就不多说了,这需要公司内部规范化项目流程,各个环节把控好,才能有效规避。下面,我们详细说下如何排查出虚假流量的蛛丝马迹。/ i" W$ k3 j' T: L* V
流量全流程数据监控我们需要将流量数据、行为数据和转化数据通过一定的数据采集手段,来获取完整、全面和准确的数据,目的是将全流程数据打通,只有获取了完整全面的数据我们才能找到虚假流量的踪迹。下图是流量转化的完整过程:/ m2 L/ G9 Y. F9 w2 @8 Z) h

& V/ j% @+ `/ {9 J8 R& y! x0 ~8 g这个过程我们面临了两个难题:
% R7 d# C* o' J
  • 展示和点击数据都在第三方广告投放平台,我们不能获得用户的详细信息% S% Z  f( N6 O/ a3 V
  • 前后端数据存在割裂,只能统计到前端的点击转化,不知道后续业务转化如何
    9 e6 t3 N0 e$ c& u& M0 U" E# a1 v
所以好多渠道作弊方,会在这两个方面做文章,钻渠道的空子,通过程序或者雇佣人肉等人为操作产生流量,人为操作可能是点击你的广告、访问推广落地页,或者完成某个简单的任务,比如点击Call to Action按钮,这种流量通常不会带来实际的转化,上面也说了因为转化的业务数据不能获得,抓不到证据也就不好衡量,所以就只能呵呵了。
  \) L; ?/ P' R作弊流量是不能避免的,我们只能靠增加技术壁垒,增加作弊的成本,作弊的成本高了,一定程度会减少作弊的现象。0 Z/ s' k8 @; x0 o" E! u
数据预处理我们可以在流量正式到达落地页之前,在展示点击阶段和到达产品落地页之间构建一层屏障,即通过数据预处理手段,通过一定的反作弊规则先把某些行为可疑或者不需要的流量过滤掉:
5 a, ~+ f2 G, w
  • 过滤某些已知IP段,如内网IP、测试IP7 H, g/ L0 v' ]& ~/ A/ M
  • 设备号异常:如频繁重置idfa5 Q' T, c  C7 N! g/ _7 p
  • IP异常:定位的IP来自莫名其妙的地方
    # i- y8 E, ?) w
  • 行为异常:如频繁刷新页面* s5 c) s) Q: n; Z; z6 o
  • 数据包不够完整:只有启动信息,没有页面、事件等其他用户行为信息; X2 ]( z% y  q! }$ @& _0 L
    6 h8 m! ?) X  h0 `4 |
这样我们就能保证到达落地页的流量相对干净,但仍有落网之鱼,需要我们通过进一步的数据分析来找到虚假流量。* K) E0 X) E# G' z
0 N2 H' w$ F3 {8 Q' L% F
网站建设论坛——爱自己并要求自己,努力打造互联网界的营销旗舰!
回复

使用道具 举报

8195

主题

8912

帖子

2万

积分

管理员

联盟创始人

Rank: 9Rank: 9Rank: 9

积分
27343
QQ
 楼主| 发表于 2017-10-12 18:30:10 | 显示全部楼层
案例剖析虚假流量我们先来看一组数据:3 r, }+ g' U: m2 t
  • 日均访问次数:10w+! A* D0 l8 x# K6 k3 E
  • 跳出率:45%- c1 h# \* A- ]
  • 平均每次访问页数:3.2: B  Y$ {1 m! p
  • 平均每次访问停留时长: 1 分 50 秒
    8 M4 T) n) N3 O
  • 订单转化率:0.12%
    . t! f: B# p1 Y; ^
      ?2 s: b5 K4 k: m8 R
这是我们某个电商类客户反馈出的问题,他们新上线了某个电商网站,从访问量、跳出率等这些指标来看表现都不错,偏偏订单转化率低,不知道怎么回事。
# Q; Z3 ?" j  x  Z6 L遇到这种情况,只能说别急,我们先从数据上细分看看。细分对虚假流量是致命的,因为通过细分我们一定能识别出虚假流量的模式和规律。1 k; t& X- {* H% A+ _6 u
网站整体的访问量变化趋势: l9 C- \; {) `, B
从上图可以看出, 9 月 3 号PV较平时较低;访问量和唯一身份访问用户数几乎相等,即人均访问次数接近与1,每个用户只访问了一次,月回访率很低。
! a4 L! W  z% v. m) |1 r( d1 m( T新访占比和跳出率对比分析2 q+ n, d+ E4 ~; l* B9 q  D" m
从上图我们可以得出这些信息:
" R- r  J* Y0 A+ g/ {$ _
  • 新用户占比接近于80%,说明新用户居多
    ) o/ w9 z" Y* Y1 H: a
  • 跳出率在45%左右,跳出率很低,说明流量质量还可以
    7 Y0 f. e+ R3 {5 |, u: o
    / e3 ~0 n) Y- ~
但是如果我们深入想一下,会发现有如下问题:
! L/ j3 J- J3 p
  • 新用户占比和跳出率指标成反比关系,正常情况下,新用户占比和跳出率指标成正比关系,新用户占比高的话,跳出率也高
    ) K! c6 Y9 i" R  f# k1 s
  • 跳出率低,为什么转化率也那么低呢?
    # Y. i# Y+ e& W4 B3 X
    6 l. k8 h2 u$ L- z
不同城市不同转化指标对比
0 l( x% u# v" I. z
我们找了流量排名Top8 的城市的对比数据,这Top8 的城市数据对流量贡献较大,且上海的销售额占总销售额的1/ 3 左右,河南订单转化率较高。城市为“未知”的流量贡献也较大,跳出率低,但是订单转化率远小于0.01%。显示为未知,说明抓不到这些流量来自于哪个IP段,但是访问量足够大,所以需要引起注意,有作弊嫌疑。
# B, R2 N! u( y9 z' R未知城市不同时间段分类对比分析- Y# w# h  h2 a  l; ?8 b
选择了最近一个月的数据,看不同时段这些流量的分布情况(图略),发现凌晨 1 点到凌晨 6 点流量占总流量的25%,占比较高,更奇怪的是,晚间流量每个时段较平均,流量差不多,这是不符合常理的,需要进一步分析。9 e1 F% i2 N* z

; T6 \! F) C6 x0 b9 c; m
网站建设论坛——爱自己并要求自己,努力打造互联网界的营销旗舰!
回复 支持 反对

使用道具 举报

8195

主题

8912

帖子

2万

积分

管理员

联盟创始人

Rank: 9Rank: 9Rank: 9

积分
27343
QQ
 楼主| 发表于 2017-10-12 18:30:27 | 显示全部楼层
夜间流量分类对比分析4 _/ U3 m$ g6 _, r
我们发现这些流量中72%的流量来自于广告系列,但是转化率较低,不知道具体哪个广告系列来源拉了后腿。. g  g7 F. F, `; l9 r
夜间流量广告系列来源占比分析, z+ s% c" B; s, [: B  O1 h2 H
发现广告系列流量中大部分都来自于sm这个渠道,此时可以把分析范围缩小到sm这个渠道。8 j3 D  y  i0 _: \% U) Q
sm渠道指标整合分析( _5 I" Q7 n  V
sm渠道的访问量很大,新用户占比90.31%,而跳出率为20.32%,转化率0.08%。基本可以断定是sm渠道出问题了。
# t8 p: G0 C3 R. l$ Esm渠道细分落地页和非活动页面数据表现1 d% {+ x  G! z6 ~) ^8 V
通过进一步细分,发现sm渠道大部分流量都流入了活动落地页(图略),跳出率低于23%,且每次访问的平均浏览深度接近于1,有趣的是,另一部分非活动落地页的,页面浏览深度在几百个页面,非正常人类行为,它的目的只是为了平均整体流量。4 h0 f( L* u8 {5 i0 Y8 B7 X6 |
sm渠道活动落地页点击图分析
" `2 u3 H+ r( ~- c% b* P* ^同时我们还可以结合不同落地页的点击图进行分析,你会发现更多有趣的现象。
3 l' z  g  d8 L8 O1 J& p至此,大功告成。1 o- D3 [$ f: f' x+ }: c
案例总结从上面的案例我们看到通过层层细分,层层递进的方法我们找到了虚假流量,所以要想找出虚假流量,我们需要密切关注如下几个方面:5 J5 A- j0 p% u% L. b/ Y" X- g
给渠道打好标记,目的方便分割流量$ `+ d: Z2 b0 T7 ?$ o" O
为每一个渠道打好UTM标记,那么渠道会贯穿于用户的整个访问过程中,方便按渠道分组查看每个渠道的表现,避免其它渠道的干扰。
5 K' u- w, s' g, i8 M- H5 O% g流量产生的时间2 z, w3 ?, v7 i9 }/ W2 ^
找到异常流量发生的时间点,然后将时间细化到每小时的访问数据,如果流量过于集中在某个时段,或者在不恰当的时间点出现了流量激增的情况,这时候就要引起注意了。
  w' n* f4 E3 M9 S流量的地理来源# n# C# n' a( L. j
通常情况下,访客会来自不同的地理位置,如果流量过于集中在某个地区,或者采集不到地区的地方出现了大量的流量等等都是很可疑的。- v$ @" ^" O4 T; \. i& J3 E
流量的用户终端
" }- l' B7 b+ @7 j1 [$ ]( Z1 S不同的渠道覆盖不同的用户群,所以各自的用户终端会有一定的区别。比如对于小米应用商店这个渠道来说,它的用户很可能排在前 10 的手机都是小米手机,而对移动MM来说,他们的用户都来自于移动运营商。排除这些特殊渠道的应用商店,大部分渠道的用户终端跟整个互联网终端分布是类似的。我们可以通过看行业报告或者查询数据指数产品来了解这些数据,把这些数据作为行业基准值,进行对比。另外我们还可以重点关注设备终端类型、操作系统、联网方式、运营商、地理位置等设备属性。$ d4 [4 H, g( t( u" n# k  ]
流量的跳出率和新访用户占比# y1 U" @# W- }# k0 B1 u6 {3 i) H3 a
跳出率和新访用户占比成正比关系,另外如果流量在某个时段跳出率突然增高,可以结合上述维度进行细分查看,哪个细分维度的跳出率增高。, V( V8 i# [, U/ P6 J7 x
流量的转化
# a' k$ d2 F( A+ I$ @, G很多作弊流量可以模仿人类行为,绕过跳出率、平均访问深度和停留时长这些宏观指标,但是要模仿一个业务转化就比较难了,如果宏观指标表现很好,业务转化很少的话,就需要提高警觉。6 D* y$ L) y$ S# ?
流量的留存3 t5 l5 _$ C# W. f
我们一般经常看的留存指标有次日留存、 7 日留存、 30 日留存,所以一些作弊渠道会专门针对这三个指标做手脚,所以除了看这三个指标外,建议将指标拓宽,关注每天的留存变化。( c: B& E7 X1 v4 y2 F. d
新流量过来的用户路径
. [$ ?1 y! _' |& _1 k- d) ^
; Y9 k$ c% v) d7 G: m( Q# Y- C新用户来到推广落地页后,一般会从落地页开始进行分流,他们会点击不同的链接,访问不同的页面,而作弊流量很难完成2- 3 次点击,即便完成了,点击的链接或内容也基本固定。
2 j9 F* C/ F2 m  O& E& J流量的功能访问分布分析& H9 D8 u$ f: ]( @6 |
适当拉大时间维度,看某个渠道某个基本功能如浏览页面的访问频次分布,真实的访客是有再次回访行为的,而虚假流量一般是本次任务完成后是不会管后续收尾动作的,回访频率很低。
8 U1 z7 D; k; X2 j5 R5 l- h流量的单页面人均访问次数
4 G0 A. @0 U( j5 ^4 W. H如果某个落地页面的人均访问次数很高比如 4 次以上的话,就很可疑了,因为在一次访问中用户一般是不会多次浏览同一个落地页的。同时结合该页面在网站整体的人均访问次数进行对比,结果会更加准确。
5 _. v" h# Z" |) r- ?流量的落地页点击热图分析
/ V; E2 @8 T7 B6 g. [这需要借助一些热图工具,从热图工具中,作弊流量的蛛丝马迹更易发现。
% j/ c/ ~; x! J& P$ q作者:北极星,神策数据分析师,先后服务的客户包含纷享销客、拉钩云人事、网易七鱼、ofo、多盟、更美等公司,致力于通过数据分析实现产品优化和精细化运营。
7 |/ N- h) D. ?) x9 d/ I8 G7 G! o' ?  l, ]
网站建设论坛——爱自己并要求自己,努力打造互联网界的营销旗舰!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

免费微信二次开发,想做马上联系羽翼互动陈先生:QQ:329069459,手机:13540604645.

QQ|Archiver|手机版|小黑屋|网站建设论坛 ( 蜀ICP备15006334号-1

GMT+8, 2017-10-24 19:33 , Processed in 0.174167 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表