侵权投诉

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

采集与分析用户行为数据的意义

DBDevs ? 来源:一个数据人的自留地 ? 作者:数据人创作者联盟 ? 2021-10-15 09:32 ? 次阅读

本文属于用户行为数据领域入门级别文章,适合对用户行为数据略知一二但是对这个主题非常感兴趣的同学。

1

什么是用户行为数据?

“用户行为数据”,顾名思义就是用户在 APP、小程序、WEB 端等平台所做的行为(浏览、点击、滑动、长按等),通过数据埋点的方式上报至数据库,从而能够记录用户在一段时间内在不同平台上所做的动作。

2

采集与分析用户行为数据的意义

公司内部存储的数据一般被分为业务数据和用户行为数据,其中业务数据是与公司业务本身相关的数据,例如电商行业中的订单支付数据(商品名称/ID、购买件数等)、汽车行业中的销售数据(购买车型、经销商名称、车辆价格等)、以及在线教育行业中的课程付费数据(课程名称、课程类别、课程价格等);用户行为数据则反映用户在不同平台的行为。

在数据分析和应用过程中,两者是相辅相成的:用户行为数据需要业务数据进行补充,从而能够看出一笔订单到底支付了多少钱、买了什么商品;而业务数据也离不开用户行为数据这个载体,因为用户行为数据串起了用户在各个平台上的行为序列,从而能够看到用户在购买/转化之前都做了什么动作。

另外,用户行为数据能够真实反应用户在平台上的行为,并且能够据此推断出用户心智,从而及时进行相关运营动作。

举个例子,很多 APP 为了优化用户体验,会请用户填写一份调查问卷,但是真正愿意填写问卷的用户寥寥无几,用户如果对 APP 不感兴趣会直接离开并流失。退一步说,即使有很多用户在优惠券等奖励驱使下填写了调查问卷,填写结果也不一定能代表用户的真实想法,可能有的用户为了得到奖励胡乱填写,或者是用户误解了选项的意思导致结果偏差。

通过采集和分析用户行为数据,可以观察那些流失的用户在 APP 里做了什么,导致他们流失的原因是什么,从而帮助产品经理优化产品、降低用户流失风险。

3

采集和分析用户行为数据的步骤

3.1

指标体系搭建

很多企业在搭建自己的用户行为数据平台的时候会忽视这一步,以为把行为数据采集上来就能为我所用,其实不然。好的指标体系有如下优点:

(1)统一的指标体系能避免数据指标定义模糊和逻辑混乱,减少数据解释成本;

(2)好的指标体系能在某一核心指标出现问题的时候迅速向下进行维度拆分,从而定位问题所在,帮助产品/运营不断改良,甚至发现一个新的业务增长点;

(3)领导层通常会关注指标体系,尤其是其中的核心业务指标,通过指标体系能够帮助领导层从大局上制定战略目标。

指标体系的搭建方法有北极星指标法、UJM(用户旅程地图)模型和 OSM 模型等。

其中北极星指标法是指业务人员先找出一个与业务目标强相关的核心指标(也叫“北极星指标”,该指标像北极星一样指引未来的行动方向),然后逐渐向下进行指标的拆解。

举个例子,在电商场景中,我们可以选择 GMV 作为“北极星指标”,然后根据首购/复购用户或用户旅程步骤等维度进行拆解,最后得到类似于 GMV = 客单价 * 购买人数 = 客单价 * (首购用户 + 复购用户) = 客单价 * (APP 启动/激活人数 * 商品详情页渗透率(触达率) * 购买转化率 + 之前下过订单的老用户 * 留存率 * 商品详情页渗透率(触达率) * 购买转化率)。

这个连续等式的第二步中利用首购/复购用户维度进行拆分,第三步则是使用用户旅程步骤(启动 - 浏览商详页 - 购买)维度进行进一步拆解。

3.2

数据采集

数据采集也叫数据埋点、埋码或者是打点,就是将一套数据采集代码埋入 APP/小程序/WEB 页面,用户在触发某一事件(浏览、点击等)时将该行为数据进行上报,从而形成用户行为数据表。

埋点方式分以下几个种类:

(1)全埋点/无埋点:通过调用 SDK (Software Development Kit) 对页面上的行为数据进行采集,此方案优点是无需开发同学写代码,减少人力成本,缺点是灵活性差,只能覆盖一些通用数据(操作系统/版本、浏览器名称、设备型号。。。),无法对于业务专用的数据进行采集;而且对代码的规范要求比较高(例如页面标题/按钮名称取值要规范)。

作者的工作经历中经常碰到有公司的代码非常不整齐,导致通过全埋点自动抓取的数据非常杂乱,无法使用的情况。

(2)自定义埋点/手工埋点:此方法需要开发同事进行手工代码埋点,优点是能够灵活覆盖各类个性化业务数据,缺点是需要大量人力成本。

(3)可视化全埋点:这个方法只需要在页面中圈选想要监测的元素(运营位、按钮等),不用植入代码即可埋点。优点是对不懂代码的业务人员非常友好,缺点是只能采集浏览/点击等最基础的事件,并不能采集相对复杂的事件。

此外,一般来说,埋点需要遵循 “相同类型事件合并为同一个埋点,不同类型事件分开埋点” 的原则,方便之后埋点的迭代和查找。错误的示范是把每个按钮都当作是一个埋点上报,那么随着之后产品迭代,按钮会越来越多,埋点数量也会随着按钮数量水涨船高。

举个例子,某电商平台首页有两个运营位,分别叫 “商品上新” 和 “猜你喜欢”,两个运营位里分别有新商品的轮播展示和通过算法推荐给用户的商品轮播展示。

业务人员提出想要看这两个运营位内商品的点击次数和人数,并且要区分出用户点击的是哪个商品。既然 “点击新商品” 和 “点击推荐商品” 这两个事件都属于点击,那么在设计埋点的时候需要将这两个事件结合成一个埋点,并将运营位名称和业务人员关注的 “商品名称/ID” 属性放入该埋点中作为事件属性进行上报,以区分用户点击的运营位信息和商品信息。

3.3

数据分析

用户行为分析中有一套独有的分析模型:

(1)事件分析:“事件” 就是前面所述的用户行为,这是对用户行为最基础的描述,例如 “打开 APP 的次数”、“点击xxx按钮的人数” 等。在电商场景中常见的有 “新用户注册数”、“支付订单且成功的人数” 以及代表用户粘性的 “用户整站平均停留时长” 等,这三个指标对应的用户行为(事件)分别为 “注册”、“支付订单” 和 “APP浏览页面”。如果想要看这三个指标,就需要把三个对应事件做成埋点进行监测。

(2)漏斗分析:用户的整体用户旅程就像一个漏斗,做第一步的用户最多,随着用户流失,做之后步骤的用户会越来越少。在电商场景中,常见的是用户从 “浏览商品列表页 - 浏览商品详情页 - 加入购物车/立即购买 - 提交订单 - 支付订单” 这一漏斗。通过分析漏斗的整体转化率和步骤间的转化率,可以找出异常的转化率,然后对某一步骤中流失的用户进行洞察,发现其共性,为之后的防流失预警提供依据。

(3)留存分析:指的是用户在做了某个行为后第 n 天还会做某个行为的概率。在电商场景中最典型的就是复购,即用户在首次购买后有多大概率会在第 n 天再次购买。

(4)分布分析:与统计学上的频率分布直方图(histogram)类似,分布分析观察的是某个行为做的次数的人次分布。例如我们可以分别查看过去 30 天中用户购买 1、2、3 次商品的人数,也可以根据需求自定义设置区间查看对应区间的人数。

(5)归因分析:一个目标事件(支付订单、帖子转发。。。)的达成,我们不能只归功于某个事件(运营位点击、推荐商品点击、分享商品、收藏商品。。。),而是应该“按劳分配”,根据一定的计算规则公平分配功劳。归因分析模型可以提供这样的计算方式,比如按照时间衰减规则(越靠近转化的事件功劳越大)或者按照首/末次触点(行为序列中第一个/最后一个事件得到 100% 的功劳)进行归因。

3.4

数据应用

分析数据的最终目的是为了驱动业务发展,否则只是躺在数据分析报告里冷冰冰的结论。在作者的工作经历中,“营销自动化” 和 “用户标签体系” 是两个主要运用用户行为数据的场景。

(1)营销自动化:简称MA(Marketing Automation)。传统的营销模式,要么是“拍脑袋”,依据业务经验进行营销,要么无法做到精准营销和 “千人千面”,一套营销方案通用所有的用户。通过营销自动化,我们可以对不同用户进行精准触达。例如我们可以使用 RFM 模型,从最近一次购买时间、购买次数和购买金额三个维度对用户进行分层,对不同层级的用户在不同时机发送不同的短信/PUSH,从而用最小的成本获得最大的转化和收益。

(2)用户标签体系:我们在购买商品时会看到商品的标签,上面会注明例如价格、材料、生产日期等信息。同样的,我们也可以给用户打上标签,例如性别、年龄、城市、职业、收入、商品偏好、用户生命周期等。用户标签体系可以与营销自动化结合使用,从而对拥有特定标签的用户进行精准营销。

4

结语

用户行为数据分析这个领域,无论在商业应用广度、深度上还是企业内部的重视程度上都有待提升。可以说,谁先占领了用户行为数据分析和应用的高地,谁就能率先以最小的成本获得最有效的用户洞察。

责任编辑:haq

原文标题:用户行为数据入门理论与实例

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    科伦特LM Pro系列具备完善的备货方案 助力城市数字化转型

    指挥中心显示信息复杂,数据量庞大,需求显示终端能够快速响应,将画面内容全面呈现。科伦特LM Pro系....
    的头像 科技绿洲 发表于 05-07 14:58 ? 197次 阅读

    desensitization数据脱敏工具类库

    desensitization.zip
    发表于 05-07 10:15 ? 6次 阅读
    desensitization数据脱敏工具类库

    老树洞安全存储技术

    ./oschina_soft/lsdong.zip
    发表于 05-07 09:28 ? 3次 阅读
    老树洞安全存储技术

    天马微电子喜获vivo“优秀质量奖“

    在“本分共赢,智创未来”为主题的vivo 2021年商业伙伴质量沟通大会上,天马微电子凭借与vivo....
    的头像 科技绿洲 发表于 05-06 16:58 ? 267次 阅读

    如何运用正确方法管理攻击面

    Palo Alto Networks(派拓网络)威胁研究团队 Unit42 发现,在所有勒索软件攻击....
    的头像 科技绿洲 发表于 05-06 15:13 ? 140次 阅读

    一种名为“STRIDE”的解卷积新方法

    首先,作者从乳腺癌(BRCA)scRNA-seq数据模拟了三个ST数据集,具有已知细胞类型组成的合成....
    的头像 上海生物芯片 发表于 05-06 15:05 ? 127次 阅读

    Nexperia公布2021年营收数据

    奈梅亨,2022年5月6日:基础半导体器件领域的高产能生产专家Nexperia今日公布2021年财务....
    的头像 21克888 发表于 05-06 11:04 ? 250次 阅读
    Nexperia公布2021年营收数据

    水产养殖场与微软合作 确保养殖户最大限度提高产量

    通过与微软合作,Portugal 和他的团队在 Marfrisco 水产养殖场采用全新软件,布放更多....
    的头像 科技绿洲 发表于 05-06 10:57 ? 256次 阅读

    Cansina网站的敏感目录发掘工具

    cansina.zip
    发表于 05-06 10:47 ? 6次 阅读
    Cansina网站的敏感目录发掘工具

    Fides数据隐私的开源语言

    fides.zip
    发表于 05-06 09:51 ? 6次 阅读
    Fides数据隐私的开源语言

    达摩院发布开源新型联邦学习框架FederatedScope

    5月5日,达摩院发布并开源新型联邦学习框架FederatedScope,该框架支持大规模、高效率的联....
    的头像 科技绿洲 发表于 05-05 15:22 ? 230次 阅读

    案例研究:欧洲顶级足球俱乐部基于视觉的运动分析、训练和球员评估

    ? 足球不仅是世界上最受欢迎的娱乐活动,同时也是一个价值数十亿美元的产业。个别球员的薪酬和转会费可达....
    的头像 21克888 发表于 05-05 14:14 ? 100次 阅读
    案例研究:欧洲顶级足球俱乐部基于视觉的运动分析、训练和球员评估

    结合句子间差异的无监督句子嵌入对比学习方法-DiffCSE

    句向量表征技术目前已经通过对比学习获取了很好的效果。而对比学习的宗旨就是拉近相似数据,推开不相似数据....
    的头像 深度学习自然语言处理 发表于 05-05 11:35 ? 134次 阅读

    头盘界面影响机械硬盘可靠性的主要因素

    固态硬盘作为新兴的介质,虽起步较晚,但凭借性能优势,出货量占比的持续增长,价格持续优化,市场竞争力也....
    的头像 浪潮存储 发表于 05-05 10:24 ? 150次 阅读

    tcpxm基于pylibcap的抓包工具

    tcpxm.zip
    发表于 05-05 10:19 ? 10次 阅读
    tcpxm基于pylibcap的抓包工具

    NVIDIA Riva可快速开发出GPU加速对话式AI应用

    为了加快生产级、高精度 AI 模型的开发,NVIDIA 提供多种工具用于生成训练数据、训练和优化模型....
    的头像 科技绿洲 发表于 04-29 14:33 ? 758次 阅读

    marketpulse网络应用

    marketpulse.zip
    发表于 04-29 10:25 ? 6次 阅读
    marketpulse网络应用

    RedisShake Redis数据同步工具

    RedisShake.zip
    发表于 04-28 16:02 ? 10次 阅读
    RedisShake Redis数据同步工具

    数智源以视频AI可视化赋能智能煤矿建设

    在数智源看来,需要建设智能化综合管控系统,将上述各系统远程集中控制和统一调度,实现与煤矿信息互联互通....
    的头像 科技绿洲 发表于 04-28 15:40 ? 321次 阅读

    自连科技为手术床厂商提供AiCloud云平台服务

    手术床看似不引人注目,却直接影响着麻醉或手术的进程甚至质量,其重要性不言而喻。每类手术对手术床的需求....
    的头像 科技绿洲 发表于 04-28 15:25 ? 249次 阅读

    数据分析将成为创新起源与企业核心能力

    Amazon Athena 是一种无服务器的交互式查询服务,用户能够轻松使用标准 SQL 分析 Am....
    的头像 程序人生 发表于 04-28 10:06 ? 145次 阅读

    “数智化”时代之下,掌握数据分析四大要素很重要

    如今,数字化时代正逐渐向数智化时代转变,我们生活的方方面面都充满了数据,我们越来越离不开数据,也越来....
    发表于 04-27 16:21 ? 23次 阅读

    MDB硬币器虚拟器自动售货机数据转接盒

    如何快速使用RS232-MDB硬币器虚拟器连接自动售货机。介绍了RS232-MDB型MDB硬币器模拟....
    发表于 04-27 15:52 ? 46次 阅读

    MDB-RS232适配器数据格式分析

    MDB-RS232适配器数据格式分析。让用户能够很容易理解发送和接收的数据格式。快速实现MDB接口的....
    发表于 04-27 15:50 ? 11次 阅读

    Matlab生成任意分布数据实例演示

    matlab的rand指令可以帮助我们生成0-1均匀分布的数据,这样,如果我们想要[a,b]的分布数....
    的头像 模拟在线 发表于 04-27 14:46 ? 124次 阅读

    Countly开源的移动分析应用

    countly-server.zip
    发表于 04-27 14:32 ? 7次 阅读
    Countly开源的移动分析应用

    EDA企业数据分析

    EDA.zip
    发表于 04-27 11:01 ? 11次 阅读
    EDA企业数据分析

    微软发布第三财季财报 营收493.6亿美元

    近日,微软公司正式发布了公司2022财年第三财季财报,数据显示,本季度微软的营收为494亿美元,与去....
    的头像 lhl545545 发表于 04-27 09:37 ? 128次 阅读

    如何实现CAN总线数据与以太网数据之间的相互转换

    网口转can工具即CAN转以太网网关设备,从名字上就可以看出,这东西能够实现CAN总线数据与以太网数....
    的头像 科技绿洲 发表于 04-27 09:20 ? 975次 阅读

    第一新声对话Smartbi徐晶:BI市场有多大,未来BI的趋势

    面对激烈的市场竞争,未来BI的方向是什么,我们的产品又有什么突出优势?让我们一起来看看思迈特软件副总....
    发表于 04-26 16:36 ? 17次 阅读

    Naarad系统性能分析工具

    naarad.zip
    发表于 04-26 11:19 ? 9次 阅读
    Naarad系统性能分析工具

    ASDebugger App网络监控工具

    ASDebugger.zip
    发表于 04-26 10:09 ? 10次 阅读
    ASDebugger App网络监控工具

    紫光云“云智原生”战略加速业务转型与创新

    在从以“应用”为中心的云原生时代,向以“感知”为中心的云边协同时代迈进的过程中,一种满足更广连接、更....
    的头像 科技绿洲 发表于 04-26 09:43 ? 199次 阅读

    SCI串口自动波特率介绍

    自中科昊芯推出专题讲解SCI串口通信以来,第一期主要讲解SCI串口FIFO通信原理,本期主要讲解SC....
    的头像 科技绿洲 发表于 04-26 09:26 ? 174次 阅读
    SCI串口自动波特率介绍

    Cube基于MongoDB的数据分析工具

    cube.zip
    发表于 04-26 09:09 ? 18次 阅读
    Cube基于MongoDB的数据分析工具

    西部数据公司发布全新品牌形象

    我们非常高兴地宣布:西部数据公司现已更新品牌形象。西部数据公司全新的品牌形象灵感来自于人类的无限潜能....
    的头像 21克888 发表于 04-25 17:49 ? 416次 阅读
    西部数据公司发布全新品牌形象

    从三个层次来分析:商业智能的价值在哪里

    以下将从商业智能的三个层面分析商业智能的价值,现在让我们来逐一了解~
    发表于 04-25 17:00 ? 39次 阅读
    从三个层次来分析:商业智能的价值在哪里

    OpenHarmony生态论坛:关于教育伴随式数据采集方案

    OpenHarmony生态论坛:关于教育伴随式数据采集,同意数据规范,提供可信安全等方面的新型基础设....
    的头像 lhl545545 发表于 04-25 15:10 ? 176次 阅读
    OpenHarmony生态论坛:关于教育伴随式数据采集方案

    将framebuffer保存为图片来检查内容正确性

    本文会介绍一种方法,将帧缓冲内容导出并保存为图片,来判断帧缓冲内容是否正确。由于帧缓冲的内容为全部像....
    的头像 STM32单片机 发表于 04-25 10:46 ? 164次 阅读

    篆芯半导体、云豹智能与燧原科技达成战略合作

    2022年4月25日,篆芯半导体、云豹智能与燧原科技三家公司达成战略合作,依托三方各自在智能网络交换....
    的头像 科技绿洲 发表于 04-25 10:18 ? 280次 阅读

    http request请求不到接口数据是为什么?

    import http from '@ohos.net.http'; export function doList() {     const url     const httpRequ...
    发表于 04-25 10:15 ? 746次 阅读

    monitor_agent主机监控节点

    gitee-monitor_agent.zip
    发表于 04-25 10:04 ? 13次 阅读
    monitor_agent主机监控节点

    各种典型的数据中台架构

    从数据处理与数据治理两个维度出发,可以设计一个解耦的数据中台体系架构。该数据中台体系架构具有一定的柔....
    的头像 工业互联网前线 发表于 04-24 14:37 ? 176次 阅读

    德赛西威发布智慧《德赛西威工作法》

    4月22日,德赛西威发布核心理念为“成就倔匠,我们引领出行想象”的全新雇主品牌,同时推出凝聚公司35....
    的头像 科技绿洲 发表于 04-24 10:18 ? 379次 阅读

    上海航芯ACM32 MCU的安全特性

    上海航芯MCU提供安全启动与安全更新参考实现,具体可见对应的软件包。安全启动与安全更新利用芯片的硬件....
    的头像 科技绿洲 发表于 04-22 16:09 ? 516次 阅读

    魔方网表数字中台将给医药行业带来一场数字革命

    时代的不断更迭,见证了我们所处社会的蓬勃发展,推动着人们不断往高住走,现如今,人类即将进入数字文明时....
    的头像 科技见闻网 发表于 04-21 17:51 ? 313次 阅读
    魔方网表数字中台将给医药行业带来一场数字革命

    UniPlot软件发动机数据模板制造指导

    在汽车以及动力总成开发领域内, UniPlot软件是非常通用的数据分析及报告生成解决方案, 几十年来....
    的头像 FEV CN 发表于 04-21 16:15 ? 356次 阅读

    在Versal里实现cache一致性传输

    Versal与MPSoC在cache维护数据的架构上,有一定的相似性。所以在Versal器件里,我们....
    的头像 XILINX开发者社区 发表于 04-21 10:19 ? 180次 阅读

    调用功能块(FB或SFB)

    在功能块调用时输出赋值是不可能的。声明的输出参数的值存贮在实例数据中。在那它能够被所有功能块存取。要....
    的头像 机器人及PLC自动化应用 发表于 04-20 15:35 ? 264次 阅读

    如何将fal软件包重新定义为RT-Thread内部组件

    在使用方式上和以前有这些区别:原本使用 fal 需要在 RT-Thread 的包管理器中选择并进行下....
    的头像 科技绿洲 发表于 04-20 11:03 ? 236次 阅读
    如何将fal软件包重新定义为RT-Thread内部组件

    如何解决CAN发送数据发送不出去的问题啊

    在调试CAN,接收数据都没什么问题,但是发送那一块,有的时候rt_device_write的返回值为0,就是没发出去,这个应该怎么解决这...
    发表于 04-20 09:22 ? 1387次 阅读

    测量系统一致性分析

    熊妈妈已经忍无可忍了。最近一次关于她做的汤有多辣的争论以张牙舞爪而结束,而且把小女孩吓坏了。 熊妈妈....
    的头像 MinitabUG 发表于 04-19 14:58 ? 86次 阅读
    测量系统一致性分析

    请问FINSH是否具备输入/输出换向功能?

    有时候需要FINSH把接收到的数据保存到本地文件中,有时候需要从本地文件中导入输入命令或数据,FINSH是否有这个功能 ?...
    发表于 04-18 09:22 ? 1205次 阅读

    labview 的索引数组控件工作不正常

    我使用重排数组对一个数组进行了分组,然后使用索引数组控件,将不同的组分开,发现数据在进入索引数组之前是正常的,经过索引数...
    发表于 04-17 15:42 ? 5106次 阅读
    labview 的索引数组控件工作不正常

    如何获取bh1750软件包bh1750.c文件的光照强度数据?

    请问怎么将bh1750软件包2.0里的bh1750_read_light是光强的数据吗?(onenet_mqtt_upload_string("light", 这里应该是什么) < ...
    发表于 04-06 09:35 ? 749次 阅读

    ListContainer代码获取高度不准怎么解决?

    int listContainerHeight = listContainer.getHeight(); 通过这个方法获得的方法,返回的数据和实际数据不一样, 有类似...
    发表于 03-23 10:19 ? 414次 阅读

    LAN8720A无法接收数据是为什么?怎么解决?

      1.环境使用RT-Studio创建的标准F2工程,已经修改了HSE时钟。   RT版本:4.0.3   STM32CubeMX版本6.4 ...
    发表于 03-16 09:34 ? 1228次 阅读

    数据文件合并

    第一次练手写的小工具,可以批量将大量测试数据文件合并成一个文档,以便后续处理,奉上源码,各位可自由发挥。 ...
    发表于 03-04 16:52 ? 2721次 阅读
    数据文件合并

    数据的通信方式/同步方式有哪几种?

    数据的通信方式有哪几种? 数据的同步方式有哪几种? ...
    发表于 02-28 07:31 ? 641次 阅读

    机智云开发者平台生成的MCU代码注意事项相关资料推荐

    gizwitsHandle((dataPoint_t *)¤tDataPoint);        //这句话很重要  相当...
    发表于 02-11 07:12 ? 626次 阅读
    她的小梨涡完整版免费阅读