作为数据产品经理,你需要知道这些技术知识
副标题[/!--empirenews.page--]
本文将从数据采集、数据接入、数据分析、数据展示等4个重要地方,分别介绍相关涉及的技术知识。这一节主要介绍整体概念。 1.1 概念用户行为分析系统其实是指用户使用产品过程中,把产生的行为数据通过分析而成的报表工具。此类数据区别于业务数据,大多为公开、有权限获取的,比如一些设备信息、埋点信息等。 目前行业较为人熟知的有百度统计、友盟、神策等,而使用此类产品的主要是数据分析师、数据运营和产品经理等。目的是为了统计埋点、基础指标分析(如PV、UV)等,从而对产品进行体验优化或运营推广。 (样例:数据分析系统图) 1.2 数据系统框架1.2.1 数据采集 一般用户使用产品的时候,所填写的信息会经由业务系统加密储存。而行为数据是不会经由这些系统收集,而由专门的采集工具进行采集,这就是SDK。 1.2.2 数据接入 因为SDK采集的数据是非结构化的,所以数据都是以原始数据的方式按批次定期或实时上传。服务端通过接口对这些数据进行解析、加工处理,初步形成结构化的日志数据,并在数据库按表进行存储。 1.2.3 数据分析 当数据解析并存储之后,即可通过离线和实时两大方式进行分析。部分指标计算量大且实时要求不高,则会采取T+1、T+2(即第二天、第三天出结果)等离线计算方式。 有些指标时效性要求高,如关键指标、日常运营活动(如双十一)等,就需要较高的实时计算方式,以便监测表现。两大方式采用的系统框架会有所差别,后面详解。 1.2.4 数据应用 当使用结构化数据进行分析时,就需要可视化的图表进行展示,不管哪种方式,基本就是通过报表网站平台进行展示。比如折线图、表格、柱状图等,甚至还需要提供更多维的分析指标支持用户自主查询。 二、数据采集层(SDK)2.1 何为SDK?2.1.1 定义 SDK是指一种软件开发工具包,是数据采集的必备工具,英文为“Software Development Kit”。 本质上它其实是一些接口API的文件,为某个应用程序提供服务。也可以理解为应用开发者通过接入这些文件,并调用里面的相关接口,即可采集相应数据。 因为SDK的大小一定程度上会影响应用程序性能,所以尽量轻量处理,占内存大多在几百K和几兆之间。 2.1.2 作用 不同业务下,SDK的应用性质是不同的。常见的就有数据行为类SDK、功能服务类SDK以及广告营销类SDK等。 其中功能服务类就是指应用通过接入SDK增加一些特殊的产品功能服务,而广告营销类则指专门做消息推送、营销推广等业务的SDK。而本文仅介绍数据行为类SDK。 2.2 SDK类型主要分为客户端SDK和服务端SDK,客户端SDK是指这类SDK接入在应用的前端,比如iOS、安卓等。而服务端SDK是指接入在后端,更多的在后台底层。 2.2.1 客户端SDK
2.2.2 服务端SDK
2.2.3 小结 不同的用户有不同的业务诉求,客户端和服务端各有优缺点,主要取决于业务诉求。整体而言,大多数产品应用使用客户端SDK居多。 2.3 作用SDK大的任务就在于采集数据、识别数据和上报数据。 2.3.1 采集数据 由于SDK采集的数据较广,涉及种类较多,主要分几类:
2.3.2 识别数据 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |