未分类

kafka最新面试题整理共55题_kafka笔试题

前言最近很多粉丝后台留言问了一些大数据的面试题,其中包括了大量的 Kafka、Spark等相关的问题,所以我特意抽出时间整理了一些大数据相关面试题,本文是 Kafka 面试相关问题,其他系列面试题后面会陆续整理文章目录1、Kafka 都有哪些特点?2、请简述下你在哪些场景下会选择 Kafka?3、 Kafka 的设计架构你知道吗?4、Kafka 分区的目的? …

腾讯三面:说说Kafka的分区状态机的状态转换过程?

PartitionStateMachine分区状态转换实现1 我为何读这源码?PartitionStateMachine,分区状态机负责管理Kafka分区状态的转换,类似ReplicaStateMachine。很多面试官都爱问Leader选举策略。学完本文,你不但能说出4种Leader选举场景,还能总结出它们的共性。2 简介PartitionStateMac …

我们为什么用gRPC取代了Kafka(Java消息中间件)

本文作者Stephanie Sherriff的技术团队第一个 App 高度依赖 Kafka,她希望这个 App 能够支持审计,具有很高的稳定性,从长远看,随着用户量的增长也能够轻松地处理高负载。但 Kafka 同样带来了基础设施、系统维护和支持方面的成本问题,最终他们选择了用 gRPC 取代了 Kafka。值得说明的是,二者的技术选型并没有明确的优劣之分,有 …

Java通过Kafka Streams库来实现数据流处理

#暑期创作大赛#Kafka数据流处理在Java中的应用可以通过Kafka Streams库来实现。以下是一个简单的示例,展示了如何使用Kafka Streams进行数据流处理:import java.util.Properties;import org.apache.kafka.streams.KafkaStreams;import org.apache.k …

Apache Druid 数据摄取——本地数据和kafka流式数据 一篇文章看懂

Durid概述Apache Druid是一个集时间序列数据库、数据仓库和全文检索系统特点于一体的分析性数据平台。本文将带你简单了解Druid的特性,使用场景,技术特点和架构。这将有助于你选型数据存储方案,深入了解Druid存储,深入了解时间序列存储等。Apache Druid是一个高性能的实时分析型数据库。上篇文章,我们了解了Druid的加载方式,咱么主要说 …

深入理解Kafka生产者 & 消费者设计模式

介绍 KafkaKafka 是一款基于发布与订阅的消息系统。用生产者客户端 API 向 Kafka 生产消息,用消费者客户端 API 从 Kafka 读取这些消息。Kafka 使用 Zookeeper 保存元数据信息。Kafka 0.9 版本之前,除了 broker 之外, 消费者也会使用 Zookeeper 保存一些信息,比如消费者群组的信息、 主题信息、 …

从源码和日志文件结构中分析 Kafka 重启失败事件

上次的 Kafka 重启失败事件,对为什么重启失败的原因似乎并没有解释清楚,那么我就在这里按照我对 Kafka 的认识,从源码和日志文件结构去尝试寻找原因。从源码中定位到问题的根源首先把导致 Kafka 进程退出的异常栈贴出来:注:以下源码基于 kafka 0.11.0.2 版本。我们直接从 index 文件损坏警告日志的位置开始:kafka.log.Log …