最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

java和大数据架构师,各需要什么技能?

[复制链接]
跳转到指定楼层
楼主
发表于 2019-3-14 14:28:21 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
架构不是一个职业而是一种能力,每一种架构师只不过是在不同的领域里面使用不同的技术,没有什么可对比,就好比如你问一个篮球明星和一个足球明星有什么区别一样!
01  
架构师需要考虑四个问题
1. 确定系统干什么不干什么,也就是说系统的边界在哪里?
2. 确定架构内部的模块与模块之间的关系,以及模块与外部之间的关系是什么?
3. 架构确定以后,有能力去指导开发去继续设计和演化,如果开发设计和演化出来的东西和架构不一致也是有问题的。
4. 确定非功能性需求,安全性,可扩展性,可用性,可维护性。
02  Java架构师方向的人才
● 系统的技术选型和可行性评估;
你家的房子户型设置,硬件软件配置必须要有自己的经验,装修完之后总得适用,不浪费成本,偏激一点总不能到处是柜子。
● 分布式技术框架的把控;
你家的柜子可以做出多种组合,你家的被子是放在A柜,枕头放B柜,床单放C柜,这得看你的划分用途。
● 深入发掘和分析业务需求,重点模块的设计、方案评审与技术支持,技术难点攻坚,应用系统分布式技术的落地,撰写技术方案和系统设计,最终完成编码工作;
柜子可以用来放东西,也可以用来拼装;如果组合柜,那可以拼出一些艺术品,那就看你的空间思维了。
● 针对产品性能和架构优化,确保系统的架构质量;
柜子如果没有按照之前图纸来规划安装摆放,你就会发现有些地方是可以改进的,及时完全参照图纸,你还是会想如何改进,这就会产生一些小想法;你可能会想如何装更多的物品,如何方便取物,如何整理方便。
● 优秀的抽象设计能力,思路清晰,善于思考,能独立分析和解决问题及编写解决方案;
哇,你家的装修真棒,这时你的邻居,或亲威朋友想参考你的想法,你可以提供一整套安装配置方案,现在你就是专家,因为他们想利用空间,发挥你的空间想像力。需要你来指导装修,提高装修质量,减少控制装修成本等等。
● 熟悉linux,能熟练应用shell/python等脚本语言;
● 扎实的Java基础知识,熟悉IO、多线程及并发技术;
● 熟练掌握redis、mongodb、netty、kafka等中间件;
● 对JVM原理有扎实的理解,对服务器端设计和编程有深入理解;
你对基建设施了如指掌,编译原理很清楚,恭喜你,你已经超过我了。
● 算法基础扎实,熟悉常见的数据结构,熟悉常用的设计模式,深入理解分布式算法和主流分布式系统,了解主流消息队列工作原理;
排序,索引,存储,去重,平滑等一些算法有深入了解,恭喜你,你已经是数学专家级了。
● 有丰富的分布式、高并发、高负载、高可用性系统设计经验,熟悉分布式缓存、消息等机制。
03  大数据架构方向的人才
● 针对大数据平台的设计和开发制定数据架构规范,进行核心代码编写;
有设计图纸的能力,能够指导各个组件安装部署,以及数据的数据抽象能力。
● 针对数据基础架构和数据处理体系的升级和优化,技术难题攻关,持续提升核心系统性能,保证系统的安全、稳定、高效运行;
数据的价值,在于你的抽取采集能力是否高深,是否便于加工,标注。各组件的稳定性,兼容性,是否有预警,在于你的规划和监控接口是否到位。
● 大规模数据实时化、大数据技术容器化、私有云实施方案、数据模型规范化等方面根据不同项目的技术发展路线;
引入 Docker 的镜像机制来完善自己的容器;同时计算能力、数据结构抽象、定义,要用自己的风格和规范。能用最简单的配置,迅速跑起来流式streaming或离线处理Spark程序.
● 跟踪大数据相关领域的技术趋势,竞争对手的产品、技术动态;
● 大数据平台的稳定性和性能优化及技术攻关;
● 产品研发过程中关键设计的把关和研发;
● 精通大数据生态圈主流技术和产品,如Hive、Storm、Flink、Spark,ELK、Kafka,Zookeeper、Yarn,presto,Hue等,对Spark分布式计算的底层原理有深度理解,对复杂系统的性能优化和稳定性的一线实战经验;
● 精通实时数据仓库设计,深刻理解MR运行原理和机制,能进行任务执行效率的优化,熟悉开源数据交换工具如sqoop,streamset,kettle,datax等
● 熟悉elasticsearch、Lucene、Solr、Kylin、Phoenix、Alluxio等相关技
● 具有规划和决策能力,善于捕捉业务需求、架构设计存在的问题,并能给出有效的解决措施和方法 。
● 数据预测,预警,人工智能,图像识别,智能语音,物联网数据采集,标注等。线性计算,神经网络,知识图谱,都要有自己的项目,而且能迅速组建团队,成就你的客户,你就是未来的行家和赢家。
04  两者侧重点不同
Java架构
● 开发语言
● 分布式,高可用
● 设计模式
● 支撑业务的系统架构或者工具集

大数据架构
● 不局限开发语言,有Java,Scala,Python等转型大数据都有天然的进阶优势
● 人工智能,商业智能,数据挖掘
● 离线,实时,高效率,高可用
● 结构化数据,半结构化数据
hadoop生态圈
● 使用的模型越来越复杂,计算量指数级上升
● 组件集
05  总之了解到用户的痛点,抓住用户的喜好,改善用户的体验
一个好的产品,一定要让用户感觉到爽。核心问题还是哪些数据值的采集,每个开发,码者都应该站在产品的角度去思考问题,如何描绘出适合我们的一套智能化,自动化的问题解决方案.
来源:程序员小灰


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-28 05:50

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表