最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

构建基于LBS的大数据应用

[复制链接]
跳转到指定楼层
楼主
发表于 2015-7-22 09:04:32 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

目前,3.0产品最重要的技术——电子围栏技术:电子围栏是精确捕捉用户场景,实时给用户推送有价值消息的手机推送解决方案。客户根据业务需求,在地图上设置电子围栏区域和目标用户属性,通过冷数据画像(结合大数据分析,筛选目标用户)以及热数据投放(当目标用户进入电子围栏实时触发),做到在合适的时间、合适的地点、合适的场景、把合适的内容、推送给合适的人。

构建基于LBS的大数据应用,一般的实现流程为:通过信息收集后进行基础数据的整理,数据挖掘/机器学习,服务搭建以及数据可视化等。


数据挖掘的基本流程

基础数据的处理主要包括:数据集成和一些部分数据处理。

数据集成,数据挖掘或统计分析可能用到来自不同数据源的数据,我们需要将这些数据集成在一起。但如果只有一个数据源,这一步可以省略。

基础数据处理,有些数据是缺失的(数据属性的值是空值),有些数据是含噪声的(属性的值是错误的,或有孤立点数据),有时同样的信息采用了多种不同的表示方式(在编码或命名上存在不一致),基于种种问题要对数据进行基础的处理。通过基础数据处理,可以确保村人数据仓库中的信息是完整、正确和格式一致的。

数据转换主要是利用现有的字段进行运算来得到新的字段,通常说到数据变换主要包括四种:数据离散化(采用分箱等方式)、产生衍生变量、使变量分布更接近正态分布、数据标准化。如果对连续变量进行离散化,可以避免引入任何分布假设。这样就不需要符合正态分布了。
数据挖掘时只根据数据库中的数据,用合适的数据挖掘算法进行分析,得出有用的信息。其中,模型算法质量的评价是很重要的一步。且数据挖掘是一个循环往复的过程。

基于LBS的大数据应用需要解决很多问题:基础数据问题比如海量数据流(>20W 条/s)、数据处理性能复杂计算(定位和统计)、准确率、秒级实时性要求、以及数据的实时性等。对此,个推的解决方案是:分布式流式计算框架、Spark Streaming、发布/订阅模型、Apache Kafka、Events等。

最后,基于大数据的LBS应用,可以使用分布式流式计算框架,构建数据闭环,从而实现持续优化基础数据。

目前的成功案例有:
1.杭州白马湖动漫节的安全保障。本通过海量的样本数据采集和分析,以实时人流热力分析图为主要服务接口,监控动漫节期间杭州滨江区白马湖动漫广场附近的人流去向和拥挤程度。这一项部署建立了白马湖区块的实时监控和人流预警系统,在人流量超过一定数量的时候实时发布预警,从而及时提醒相关人员注意对应区域的高峰人流量疏散和引导,从源头上防范踩踏事件及避免安全隐患的发生。
2.发生地震时实时警报,并通过大数据对人群热力图的分析,为震后救援工作定制合理方案及提供有效帮助。
3.与旅游局合作,将旅游分析热点图与实时推送相结合,用于疏散和引导景区高峰人流量,避免危险事件发生。




楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-4 22:44

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表