Big Data 9 min read

Comprehensive Big Data Interview Questions and Topics

This article compiles a wide range of interview questions covering JVM garbage collection, Hadoop, Hive, Flink, HBase, data warehousing, real‑time processing, and HR topics, providing a thorough preparation guide for candidates targeting senior big‑data positions.

Big Data Technology & Architecture
Big Data Technology & Architecture
Big Data Technology & Architecture
Comprehensive Big Data Interview Questions and Topics

This is a recent interview guide for a student who successfully secured an offer at a leading company.

Some content related to project privacy has been removed.

Framework Section

JVM垃圾回收机制<br/>HashMap与HashTable区别<br/>Hbase中rowkey设计原则?工作中怎么设计rowkey的<br/>Flink提交流程<br/>Flink水位线机制<br/>Flink状态与状态后端<br/>Flink如何实现精准一次语义<br/>Flink的checkpoint机制<br/>Hadoop中MR工作原理相关<br/>Hive的分区表和分桶表区别<br/>Hive的四个by<br/>Hive的优化<br/>Hive数据倾斜<br/>HDFS读写流程<br/>Doris优化<br/>Doris的架构原理<br/>

Project Section

有没有做过数据治理?都做过什么?<br/>离线或实时数仓的分层架构?每一层都做了什么<br/>实时数仓和离线数仓的不同<br/>离线或实时工作中遇到过数据倾斜么?<br/>工作中最难或最有意义的项目是哪个? 有什么困难的点?<br/>实时数仓中遇到过背压么?一旦产生背压会影响什么?怎么解决的?结合实际工作说说<br/>离线工作中遇到过大表join大表慢的情况么? 怎么解决的? 说一个实际场景<br/>实时计算中多流join怎么解决<br/>什么叫主题域,数仓中数据域、主题和主题域的区别?<br/>工作中是怎么进行业务建模的?<br/>数据湖和流批一体了解么?<br/>实时任务一旦失败或者丢数了,如何修复?<br/>实时数据怎么保证准确性一致性?<br/>各个部门之间怎么保证数据口径一致<br/>Hbase热点问题遇到过么?<br/>数仓为什么分层,有什么好处<br/>页面上实时展示历史累计去重值或者周期性最大最小值,说一下全链路的处理思路,考虑高并发<br/>

HR Questions

想了解一下为什么离职或跳槽<br/>我们公司最吸引你的地方是什么?<br/>工作期间最让你成长最有收获的事情<br/>某个项目中遇到最大的挑战是什么?<br/>当时加入某司的时候,你自己希望有的一些发展或者说成长是什么?那现在回头回过头来看,你的一些成长和发展是实际来看是怎么样子?<br/>下一份工作的一些成长发展的诉求或期待是什么样子的?或者说职业规划是什么?<br/>

If this article helped you, don’t forget to "watch", "like", and "bookmark".

Promotional Image
Promotional Image

Related resources:

300万字!全网最全大数据学习面试社区等你来!

全网首发|大数据专家级技能模型与学习指南(胜天半子篇)

互联网最坏的时代可能真的来了

我在B站读大学,大数据专业

我们在学习Flink的时候,到底在学习什么?

193篇文章暴揍Flink,这个合集你需要关注一下

Flink生产环境TOP难题与优化,阿里巴巴藏经阁YYDS

Flink CDC我吃定了耶稣也留不住他!| Flink CDC线上问题小盘点

我们在学习Spark的时候,到底在学习什么?

在所有Spark模块中,我愿称SparkSQL为最强!

硬刚Hive | 4万字基础调优面试小总结

数据治理方法论和实践小百科全书

标签体系下的用户画像建设小指南

4万字长文 | ClickHouse基础&实践&调优全视角解析

【面试&个人成长】社招和校招的经验之谈

大数据方向另一个十年开启 |《硬刚系列》第一版完结

我写过的关于成长/面试/职场进阶的文章

当我们在学习Hive的时候在学习什么?「硬刚Hive续集」

Original Source

Signed-in readers can open the original source through BestHub's protected redirect.

Sign in to view source
Republication Notice

This article has been distilled and summarized from source material, then republished for learning and reference. If you believe it infringes your rights, please contactadmin@besthub.devand we will review it promptly.

FlinkHiveHadoop
Big Data Technology & Architecture
Written by

Big Data Technology & Architecture

Wang Zhiwu, a big data expert, dedicated to sharing big data technology.

0 followers
Reader feedback

How this landed with the community

Sign in to like

Rate this article

Was this worth your time?

Sign in to rate
Discussion

0 Comments

Thoughtful readers leave field notes, pushback, and hard-won operational detail here.