O2O产品质量保障体系(四)| 基于学习的线下商户质量挖掘
这是我们的一个整体方案。主要是通过机器学习/大数据来进行数据挖掘,然后交由客服品控进行干预处理。 在学习模块:我们的样本集来源主要是退款数据、客诉数据、交易数据、以及UGC。而我们的训练样本主要是一些客服标注的接待和不接待数据。有了这些数据,我们会对我们所需要的特征进行提取。在经过一些列的样本去噪后,使用模型进行训练。而由此产出的实验数据交由客服以糯米客服的身份进行电话回访,初步确认相关原因。确认异常之后,再由客服交由品控运营同学对团单进行操作处理。而最终处理产生的这些实验数据我们会再用来优化我们的模型,提高准确率。 其中建模部分,我们聚焦了决策树算法。因为商家是否接待,其实是可以简单的进行二分,接待或是不接待。而我们的目的就是通过分类算法,把一个无序的数据集变得有序。而决策树会对每个特征节点引入影响整个数据集有序程度的这样一个量,也就是信息增益。而决策树的建树过程是个贪心算法,每次会选择信息增益最大的作为根节点。而除此之外,我们引入了区域矩阵的概念,主要是根据我们发布的几期数据,发现地域差异对准确率的影响比较大,所以我们针对团单大区进行了分类建模(不同城市匹配不同模型)。 多分店情况相比单分店业务特征比较欠缺。所以我们需要借助大数据来填充这些空白。虽然无法获得分店的下单和退款信息,但是可以清楚一个门店的验券信息。通过人流密度信息,来判断分店所处的位置客流量是否大,可以量化这样一个热门商圈因子,从而构建漏斗模型来挖掘支持多分店商品的异常不接待门店。 关注“百度质量部”订阅号,回复以下内容立马查看干货哦~ ----------------------------------------------------------- ?1.回复关键词“评测”查看评测系列文章 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |