用户标签
一、用户标签的定义
用户标签是具有某一系列特征的人群集合,标签值是“一组相似人群”的集合,通过标签和标签值可以方便将人群结构化。
如:用户标签为“付费用户”,标签下有标签值分别为“大R”、“中R”、“小R” 的3种群体。
二、用户标签的意义与作用
通过某种创建方式,将相似特征用户按特征值汇总后组成标签。方便在各种模型中使用用户标签进行细分分析。
(1)提供多种创建方式,适合更深度的用户群体下钻分析
(2)同一维度下的多个相似人群组成标签,每种人群作为一个标签值,实现关联人群间的联结。
三、用户标签的设置入口和快速使用
具有用户标签查看权限的用户从“用户分析-用户标签”进入,设置用户标签
选择一种标签创建方式创建用户标签
查看标签中用户的详细信息
在模型筛选、分组项查看中使用标签
四、用户标签的使用场景
4.1用户标签与标签值
用户标签是一组具有“同一维度下,多组相似人群”的集合,标签值是“一组相似人群“的集合。
如:用户标签为“付费用户”,标签下有标签值分别为“大R”、“中R”、“小R”的3种群体。
属于某一标签的用户有且只有唯一的标签值
4.2用户标签的创建
新建时,可选择“自定义条件”、“ID上传”、“首末次特征”“指标值”,选择后进入具体创建配置页面。
4.2.1自定义条件
筛选特定行为条件或用户属性的用户,并赋予标签值;用户优先匹配至满足条件且顺序靠前的标签值中。
比如,可以创建付费用户标签,再通过自定条件将用户分为高消费用户、中消费用户、低消费用户。这样,后续可通过分组该标签,实现同时分析三种类型用户。
(1)自定义条件时,所有用户将按照标签值的先后顺序依次判断组成。即同一用户满足上层标签值后,将不再参与下层标签值筛选。
(2)所有标签值中的组成用户,合成了标签用户。
(3)新增标签值始终在最后一个标签值后。创建时一个标签最多设置20组标签值。达到20时,无法新增。
(4)条件创建的标签上限为200个。
(5)更新方式选择动态更新数据时,可以设置延迟时间。
4.2.2 ID上传
上传ID定义标签用户,并同时赋予标签值
选择某一用户属性作为判断用户的关联字段,根据模板要求的规范上传
(1)第二列值相同的用户将组成同一个标签值
(2)如果用户没有标签值,那么该用户将被摒弃,并在最后一步结果展示时给到提示
(3)ID上传创建的标签值,记录的独立标签值个数没有上限
4.2.3 首末次特征
指定时段内,用户完成首/末次事件的属性,作为标签值
比如,埋点层面没有记录用户的首次登录时间,当需要通过首登日期去做分组或筛选时。
那么可以选取从开服日至今作为分析时段,以首次登录的时间作为用户的标签值。
4.2.3.1 创建时的标签条件设置
完成条件的用户将属于标签(无标签值除外)
1、分析时段:默认选中动态的“过去7日”,可选择动态或静态时间
2、完成事件:可选择任意一个物理事件或虚拟事件
事件的筛选条件*:可以筛选事件属性或用户属性
事件类型 | 可筛选的事件属性 |
---|---|
物理事件 | 事件属性 |
虚拟事件 | 虚拟事件的事件属性(并集) |
选择时间型属性作为筛选条件时,按照项目的时区计算时间
*即使完成了事件,当标签值为空时,该用户依然将会被剔除出标签
4.2.3.2 创建条件的标签值确定
首末次信息 | |
---|---|
首次 | |
末次 |
分析属性:可选发生时间或事件的属性
*事件的虚拟属性、维度表属性都可以进行选择
属性 | 数据类型 |
---|---|
发生时间* | 时间 |
数值型属性 | 数值 |
列表型属性 | 列表 |
布尔型属性 | 布尔 |
时间型属性* | 时间 |
字符串型属性 | 字符串 |
数据类型将决定标签的数据类型,及使用标签时的关键字。
*发生的时间按照项目的时区计算,非个人配置的时区。
4.2.4 指标值
指定时段内,用户完成事件的聚合指标,作为标签值。
比如,需要记录用户在一段时间内的累计付费数据,通过这个数据为用户分层。
那么可以将这段时间的付费金额总和作为标签值。再通过筛选或分组对用户进行全面分析。
4.2.4.1 创建时的标签条件设置
完成事件的用户将属于标签(指标为空的用户被剔除)
分析时段:默认选中动态的”过去7天“,可选择动态或静态时间
完成事件:可选择任意一个物理事件或虚拟事件或任意事件
事件的筛选条件*:可以筛选事件属性或用户属性
事件类型 | 可筛选的事件属性 |
---|---|
物理事件 | 事件属性 |
虚拟事件 | 虚拟事件的事件属性(并集) |
选择时间型属性作为筛选条件时,按照项目的时区计算时间
4.2.4.2创建条件的标签值确定
通过属性值确定用户的标签值
分析特征:分析角度
分析角度:由角度+角度的选项构成
*事件的虚拟属性、维度表属性都可以进行选择
属性 | 角度 |
---|---|
总次数 | |
天数 | |
小时数 | |
数值型属性 | 总和、均值、中位数、最大值、最小值、去重数 |
列表型属性 | 列表去重数、列表元素去重数 |
布尔型属性 | 为真数、为假数、去重数 |
时间型属性* | 去重数 |
字符串型属性 | 去重数 |
*发生的时间按照项目的时区计算,非个人配置的时区。
4.2.4.3 编辑公式场景
每一个公式需要编辑显示名,公式中元素通过四则运算组成公式
(1)公式计算中各个组成部分的组成规范
事件描述 | 指标描述/数据类型 | 分析角度 |
---|---|---|
任意事件 | 次数、天数、小时数 | |
元事件 | 次数、天数、小时数 | |
元事件 | 事件属性(数值型) | 总和、均值、最大值、最小值、去重数 |
元事件 | 事件属性(列表型) | 列表去重数、元素去重数 |
元事件 | 事件属性(布尔型) | 为真数、为假数、为空数、不为空数、去重数 |
元事件 | 事件属性(其他类型) | 去重数 |
(2)整体筛选条件与细分筛选条件
整体筛选条件的可选属性为:公式所有组成部分的公有事件属性或全部用户属性。
属性的筛选逻辑与事件分析一致。
所有用户样本为:满足整体筛选条件,且参与过组成部分中任一事件
(3)未参与事件的取值
用户在公式中的未参与事件的分析角度,值记为0
(4)计算结果的异常情况
当使用除法时,可能出现除数为0的情况,此时数值无法计算。将定义为“未知”,该名用户将被剔除出标签。
4.3 创建过程中的限制
左半部分为标签信息部分
(1)标签名称、显示名会默认代入,用户创建时可修改
(2)备注选填,最多可输入50字。
右半部分为标签值信息部分
(1)数据更新方式
更新方式默认选择为:手动更新
手动更新时:创建后将不会自动更新用户,可手动点击“更新”按钮更新用户。
自动更新时:前一日标签信息将在凌晨进行更新。由于产品数据在TA集群外的流转及推送可能存在延迟,故设置更新延迟,以确保数据完整性。例如更新延迟设为30分钟,则将于每日00:30执行前一日的标签更新任务。
自动更新后:可配置延迟时间(分钟),默认配置为“0”,可设置“0~1440”之间的整数。
4.4用户标签在模型中的使用
4.4.1用户标签下的筛选条件
用户标签筛选,进一步选择“标签值”的场景
用户标签中选择“标签”作为筛选项目时,属性逻辑、关联值与“字符串”类型相同
关于标签筛选逻辑的列表
标签的数据类型 | 可选项 |
---|---|
字符串 | 等于、不等于、包括、不包括、有值、无值、正则匹配、正则不匹配 |
数值 | 等于、不等于、小于、大于、有值、无值、区间 |
时间 | 绝对时间、相对当前日期、相对事件发生时刻、有值、无值 |
列表 | 存在元素、不存在元素、元素位置、有值、无值 |
布尔 | 为真、为假、有值、无值 |
4.4.2 用户标签分组项使用
选择用户分群、用户标签作为分组项时
分组项选项 | 分组下的分组项 |
---|---|
用户标签 | 标签值、“(未知)” |
用户标签下的分组为“标签值”与“未知”(相当于不属于标签)
4.5 用户标签列表页
(1)通过点击切换标签名,切换右侧标签详细信息部分内容
(2)新增条件创建标签或ID上传创建标签
(3)点击用户标签人数,向右进入用户标签详情页
(4)可进入详情进入标签定义
4.6用户标签详情页
用户标签详情页,包含基础标题、标签筛选框、人数表格信息等元素
左半部分
沿用列表页标签详细信息,去除标签值下详细人数信息。
右半部分
(1)标签信息:创建方式、标签值数量、合计人数
(2)自定义条件时,可点击“>”打开条件详情弹窗。查看具体标签值下的创建条件
(3)ID上传创建时,无交互,不能打开详情弹窗
条形图:
(1)仅展示数量最多的前5项的人数及占比,剩余项由“其他”表示
(2)鼠标移入时,展示该标签值下的备注信息,移入“其他”时无内容。
用户详情信息:
(1)第一二三列为:账户ID、访客ID、标签值。其余列为选中的用户属性
用户列表页,仅在该场景下有标签值信息
(2)下载用户列表与配置展示属性
按照当前选中的展示属性下载列表
(3)标签值列的筛选:自定义条件标签,支持在指标值中筛选