大数据进阶实战dmp广告系统
Kudu是cloudera开源的运行在hadoop平台上的列式存储系统,拥有Hadoop生态系统应用的常见技术特性,运行在一般的商用硬件上,支持水平扩展,高可用。
flink入门到精通
课程内容:
1、Flink框架简介
2、Flink集群搭建运维
3、Flink Dataset开发
4、Flink 广播变量,分布式缓存,累加器
5、Flink Datastream开发
6、Flink Window操作
7、Flink watermark与侧道输出
8、Flink状态计算
9、Flink容错checkpoint与一致性语义
10、Flink进阶 异步IO,背压,内存管理
11、Flink Table API与SQL
大数据反爬虫项目
视频简介:
很多订票网站的官网在互联网提供查询、预订等服务,如:各种航空公司的官网、去哪网、携程等,有大量正常用户访问的同时,也存在大量爬虫。爬虫消耗了系统资源,但是却没有转化成销量,导致系统资源虚耗,严重时会造成系统波动,影响正常用户访问购票。 大量热门路线的好车次和航线的特价舱位吸引正常用户通过官网订票的同时,也存在大量恶意占座的非法代理(黄牛)。通过不断的订座但不支付,利用这些虚占的座位进行非法盈利,通过系统日志分析等,发现官网存在大量的非法占座会员及非会员手机号用户。 为了限制伪装技术越来越强的爬虫访问和恶意占座行为,需要开发大数据防爬工具。 项目采用Lua+Spark+Redis+Hadoop框架搭建,包含状态监控,反爬指标配置,运营指标监控展示等功能。
大数据教程全面深入spark教程
课程亮点:
1,课程由浅到深,由原理到实践,既适合零基础也适合深入学习。
2,涵盖了Spark一站式解决方案,包括:SparkCore、SparkSQL、SparkStreaming、StructuredStreaming等技术。
3,结合实际案例,培养解决实际问题的能力。
大数据linux教程视频
01、Vmware虚拟网络组件
02、Vmware三种网络模式
03、Vmware虚拟机搭建--nat模式搭建
04、Vmware虚拟机搭建--完整克隆虚拟机
05、SSH协议--基于用户名密码验证
06、SSH协议--基于密钥验证
Hadoop视频教程
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。
最全面的hadoop入门教程
课程简介
从零开始搭建Hadoop集群环境,学习HDFS、MapReduce、Yarn、Hive
等Hadoop技术,通过知识点 + 案例教学法帮助小白快速掌握大数据Hadoop开发。
scala入门到精通
课程亮点:
1,知识体系完备,从小白到大神各阶段读者均能学有所获。
2,生动形象,化繁为简,讲解通俗易懂。
3,结合工作实践及分析应用,培养解决实际问题的能力。
4,每一块知识点, 都有配套案例, 学习不再迷茫。