最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

[大数据] 【分享】大数据分析,鲁班为祖师

[复制链接]
跳转到指定楼层
楼主
发表于 2017-4-13 21:04:22 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 乔帮主 于 2017-4-17 17:23 编辑

1.《全栈数据之门》现货上架
经过一段时间的等待,目前已经可以在各大电商平台『现货』购买本书。
本文后面也有京东、当当、天猫的购买链接!
本书适用
本书以数据分析领域最热的Python语言为主要线索,介绍数据分析库Numpy、Pandas与机器学习库Scikit-Learn,使用了可视化环境Orange3来理解算法的一些细节。
对于机器学习,既有常用算法KNN与Kmeans的应用,决策树与随机森林的实战,还涉及常用特征工程与深度学习中的自动编程器。
大数据hadoop与Hive环境的基础之上,使用Spark的ML/MLLib库来集成了前面的各部分内容,让分布式机器学习更容易。大量的工具与技能实战,从而将各部分融合成为一个全栈的数据科学内容。

2. 大数据分析,鲁班为祖师
该节选自《全栈数据之门》第四章『数据分析,见微知著』的引言部分!
如果你要问大数据分析最早起源于哪里,答案自然是有着5千年悠久历史的中国了。若君不信,且看下面的说明。
大数据
有一颗树,非常非常大,一个人搬不动,于是鲁班发明了锯子,将树锯成很多小节,然后找很多人来帮忙搬,这样不仅速度快,而且效率高。此所谓“大树锯”是也。这样一传十,十传百,传到其它国家,大家讹传讹,就变成了“大数据”。
分布式存储
为了保证高可用性,鲁班教了大家一个好方法。将同样的木料,分3份保存,自己家放一份,邻居家放一份,邻村里面再放一份。如果自己家被烧了,还可以使用邻居家的那份。如果整个村子被水湮(或者像现在电视剧里演的一样,在古代可能会一不小心被灭村),还有邻居村子的那份可以使用。
数据分析
将树锯断后,分成一小节一小节的,统计每节的长度,面积等等。分析木料是否有被虫咬过,以及如何防止其它树也被类似的虫咬。分析树每年的增长幅度,以及每天需要投入多少水资源来促进树的快速增长。
数据挖掘
鲁班通过分析树干上面的纹理,发现了树的年轮规律,这样可以快速了解树生长了多少年。这个方法被鲁班建立成了一个模型,用于预测其它树每年的生长速度。另外,还将树根“挖掘”出来,分析为什么这个地方能产生这么大的树,和土地是否有关系,土壤的成分是什么,能否将这种土壤移植到其它地方等等。总之,是真正的进行了数据的“挖掘”。
因此,大数据分析技术不仅起源于中国,而且其祖师正是木工艺人的祖师--鲁班。
一本正经的胡说八道了这么多,相信你对数据分析有了一个初步的了解吧。
欲了解更多的内容,请关注下面购买地址。

3. 网站购买地址
点击文章末尾左下角的『阅读原文』可进行链接跳转


4. 一些信息

豆瓣:
https://book.douban.com/subject/26998034

百度百科:
http://baike.baidu.com/item/全栈数据之门/20490226

5. 试读文章
本文题图取自《全栈数据之门》的封底,使用的是Orange3制作的数据挖掘流程『演示』图。

作者微信公众号:


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-26 19:47

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表