最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

《数据科学概论》教材介绍

[复制链接]
跳转到指定楼层
楼主
发表于 2018-10-23 11:06:46 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 168主编 于 2018-10-23 11:13 编辑

前言

大数据时代已经来临,数据中蕴含价值。挖掘数据中的价值,可以发现新知,为我们的经济、社会、生活提供决策依据,创造更加美好的生活。

大数据时代需要大量合格的数据科学家。数据科学家应该具有宽广的理论视野,同时具有扎实的技术功底。

数据科学是基于计算机科学(数据库、数据挖掘、机器学习等)、统计学、数学等学科的一门新兴的交叉学科。它研究数据的各种类型、状态、属性及其变化规律,它研究如何对数据进行分析,从而揭示自然界和人类行为等现象背后的规律。

随着大数据时代的到来,以及数据科学的兴起,来自计算机、统计学、经济学、金融学、档案学等不同专业的师生,急切需要一本内容全面、论述清楚、通俗易懂的入门或者导论性质的教材。《数据科学概论》教材,顺应这个需求。本教材对数据科学的核心问题,即对数据进行分析,从而提取价值,获得对事物的洞察和理解的各种技术手段,进行全面的论述。

这本教材为《数据科学概论》课程而设计,这是一门入门和统领式的课程,为后续课程,比如深度学习、统计分析、数据挖掘、机器学习等课程的学习,打下坚实的基础。有利于培养新一代数据科学家,为各行各业的数据处理,提供急需的人才。

本教材的主要特点(1) 兼顾理论、技术、方法的论述和实践性

本书包括四大模块,前两个模块主要讲述数据科学的基本概念、原则、方法,以及各种类型数据的管理和分析技术,后两个模块介绍具体的平台和工具,以及数据科学的成功案例和具体领域的实践。读者不仅知其然,还可以知其所以然。

这四大模块简单介绍如下,(1) 概论:数据科学的基本概念、原则、和方法。(2) 数据和数据上的计算:主要数据类型包括,结构化数据、文本、社交网络、时间序列、轨迹数据等。主要分析方法包括,统计分析、机器学习(深度学习)、数据挖掘等。批处理、流数据处理、交互式处理。(3) 基础设施、平台和工具:介绍云平台、数据库、hadoop/Spark大数据平台、Python语言、统计分析/数据挖掘/机器学习工具库。传统的关系数据库技术和系统,新型的noSQL技术和系统,以及文本分析、社交网络分析的工具,在第二部分的各章进行简单介绍。(4) 数据科学案例和实践:数据科学成功案例,量化交易实践。

在教材编写的过程中,我们利用开源的数据集以及工具,同步建设案例库。方便学生在学习的过程中,通过运行这些案例,加深对数据科学的重要概念和技术原理的理解和运用。

使用本教材,通过《数据科学概论》课程的学习,学生们将具备扎实的基础理论、系统的知识结构、以及统计分析/数据挖掘/机器学习的实践能力。

(2) 清晰的内容展示路线图

本教材内容广泛、全面,为了把内容有效组织起来,本教材采用深度展开和宽度展开的内容展示路线图。

(a) 理论部分,先由浅入深,再宽度展开,旨在培养学生宽广的视野,形成完整的知识体系。在介绍数据科学基本概念、原则和方法的基础上,本教材按照在线事务处理和数据服务、在线数据分析和结构化数据分析、到数据的深度分析(包括统计分析、机器学习和数据挖掘)的路线,由简单分析到复杂分析,层层引导用户了解数据的管理和分析的主要技术和方法。

然后,本教材接着进行宽度展开。分别介绍了批处理模式之外的流数据处理,结构化数据之外的文本数据、社交网络数据、时间序列数据、轨迹数据等的管理和分析技术与方法。

(b) 实践部分先宽度展开,再深入量化交易领域,旨在培养学生的动手能力和浓厚兴趣。

通过深度展开和宽度展开的论述,本教材全面讲述各种类型的数据及其蕴含的价值,以及用何种技术可以对这些数据进行分析,以便发挥其价值。

(3) 案例式、形象化论述

作为一本入门的教材,本教材避免陷入数学公式的复杂推导过程(必要的数学知识是需要的)。

在对数据管理和分析的主要技术和方法的介绍中,我们采用直观的案例、形象化的图形等手段,通过浅显易懂的语言,深入浅出地进行论述。使得本书的内容不会枯燥无味,方便读者迅速掌握这些概念和技术的要领。让不同背景的读者感受到数据的分析和处理,是如此的有趣和有价值。

我们认为,作为一本导论性质的教材,采取这种方式是合适的。不仅计算机专业的学生很容易理解和把握书本的内容,其它专业比如经济学、金融学、统计学、档案学、新闻学等专业的学生,理解起来也不会有太大困难。

数据科学已经渗透到各行各业,不同专业背景的读者,都可以把本书论述的数据处理方法,应用于本专业的研究,解决实际问题。比如来自新闻专业的学生,可以利用文本分析技术和可视化技术,对新闻进行分析和可视化等。这些专业的学生,正急需这样一本入门的教材。


相关资料网站



楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-6 02:44

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表