相关题库

咨询

其他联系方式

所属系列课程

评价

数据收集,AI MONSTER慧智深学教育,本章节中将从基础建设出发,学习Big Data中的基础建设思路,介绍及实现现今在建置基础建设中最火热的虚拟化技术-Docker,Docker 可以封存许多建置时的繁锁步骤,并可以扩展别人的既有建置,加以改良,使得可以符合自已或企业的需求,而不需闭门造车,可以更有效率的发展Big Data技术,是一定要掌握的虚拟化技术。 接着一步步探索数据工程中的第一站-Data Collection的两个主要概念: Data Collector及Data Injection ,并介绍在 Data Collector 主流的两套工具 fluentd 及 logstash,透过工具的使用案例说明,来更快进入 fluentd 及 logstash 的世界,以了解有哪些需求会需要加入 Data Collect 工具的串接。 而Data Injection中将介绍kafka,透过 kafka 来了解 Data Caching 在数据工程中的角色,同时学习到 Data Caching 的串接并解决数据重现的问题,以及有建立 Data Caching 的情况下如何避免数据遗失等等风险。 这堂课将以实例的方式带领学员如何建立 kafka steaming 的功能、运作原理,以及如何正确创建及使用 Topic 与 Subscriber。 适用人群:修课基础技能要求有 : 数据处理与程序设计 -SQL 语言程序设计 -Python 语言程序设计 -Java 语言程序设计;