最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

数据科学家杨滔揭秘阿里内部数据运用

[复制链接]
跳转到指定楼层
楼主
发表于 2015-2-27 09:24:22 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

在国内的互联网企业中,阿里巴巴算是对数据非常重视的一个。作为电商巨头,依靠淘宝和支付宝平台,本身就可以获得大量数据,此外还通过收购(友盟、高德等),来丰富数据来源。

    那么,这些数据具体是如何为企业运营服务,帮助业务部门提高收益的。或许可以从阿里巴巴数据科学家杨滔所分享的三个实际案例,来做些了解。

    下面是杨滔分享的部分内容摘录:

    我们团队的使命,第一个是以大数据为原材料,以机器学习和数据挖掘技术为工具,提升阿里巴巴业务部门的KPI;第二个让这种数据创造价值的过程规模化、可复制化、通用化、产品化,最终形成产品,以大数据为核心,以算法为核心。第三个是应用实践过程中,研发核心算法和模型。

    三个实际的案例,第一个是消费者超级数据集,第二个是淘宝网微市场,第三个是聚划算商品销售预测系统。

1、超级数据集

    就是对消费者本职信息的提炼,通过你的购物记录,支付宝的记录等,提炼出来你的性别、年龄,所在地的级别(是在城里还是乡里,是在几级乡,几级城市),是在沿海还是内陆,还有南方和北方,是不是结婚了,是不是有孩子了,还有反映你的消费力,通过支付宝的转账,社交关系和身份职业,这些信息都是从大量非机构数据化提炼出来的。

    比如说,我们通过支付宝和淘宝的数据,发现淘宝网有近两千万的大学生。而大学生的标签是本身数据中没有的,我们通过用户收货地址挖掘出来的,把大学职工和在职人员排除在外。

    还有是不是有孩子,是大孩还是小孩,你买母婴,孩子的用品,甚至汽车的用品,对于我们预测你有没有孩子是非常有帮助的。

    2、淘宝网的微市场

    我们把用户分到一个不同的群体,在这个群体中再找到淘宝网达人买家,用达人买家所喜欢的商品来给用户做推送,提升用户个性化的体验。

    可能你是一个大学生,可能你是一个都市的美少女,可能你是一个小城的贵妇,你是不同的群体就有不同的商品需求。

    首先我们给用户分成了很多群,这个群就是用到刚才所谓的消费者超级数据集,再根据用户的购物行为做动态的分组,比如说一个贵妇也喜欢买便宜的东西,一个不是有钱的大学生也可能买奢侈品,不同的行业里面和不同类目里面,根据消费者的行为做购物的动态分析。

    第三个是我们的专利,达人推荐,找到你所在的群体中比较活跃,善于发现淘宝商品的达人,用达人来给你做推荐。

    如果你是一个潜在的,比较追求高品质商品的人,和你相似的达人,都是买一些有品质商品的人,他们所喜欢的商品可能你都没有见过,但是能拔高你的需求,而不是重复你的需求。

    在女装微市场我们测试了六个群体,如果你在我们六个群体中,你不会知道,但是你默认看到的东西和别人看到的东西是不一样的。这六个群体是用到了分群和达人推荐,各项指标提升得都非常明显。

    其中成交转换化,客单价和UV价值平均提升20%以上。其中“贵妇群”支付宝交易额UV价值提升60%以上,贵妇群以前在淘宝很难找到适合她的商品,淘宝更照顾便宜和性价比高的人群,我们找到达人买家,直接提升类目的KPI。

    3、聚划算商品预测系统

    聚划算中筛选商品是关键的一环,大家都想上,但我们只选少量的商品。

    做这个项目之前我们了解了业务的实际需求,聚划算的运营人员,每人平均每天要审200个商品,没有数据的支持拍脑袋是非常辛苦的,而且没有一定的标准。

    我们是提升选品效率,增加爆款量,根据聚划算、淘宝的属性,卖家的属性,品牌属性,自动让工作人员筛选高销售的商品和卖家。

    我们把完全用机器审核和完全用人审核做了一个对比,具体的数字不方便透露,最后的指标看平均一个坑位的销售额,人审核和机器审核,提高了人工平均单产是64%,在人必须审核的时候减轻人的运营成本和操作压力。

    我们做这一套销售预测系统不仅有算法的创新,解决聚划算的实际问题,对于未来淘宝网精细化的运营,包销,机器自动审核频道,招商,如何从海量的卖家中去找到最合适这个平台的卖家,还有合理的定价和库存管理,就是一个基础的工具。



楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-16 22:38

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表