#join

Questions tagged join

All easy (0)medium (210+)hard (250+)

Tell me about yourself and your experience.

Behavioralhardjoinpartition0.7 min read

AltimetrikChryselysFossil GroupGlobant+5

→

What is the difference between narrow and wide transformations in Apache Spark? Explain with examples.

Spark/Big Datamediumjoinpartitionpython0.9 min read

CoforgeDelivery HeroDunnhumbyFragma Data Systems+1

→

What architecture are you following in your current project, and why?

System Design/Architecturehardairflowetljoin3.5 min read

CognizantHCLNagarroThoughtworks+1

→

Explain the differences between Repartition and Coalesce. When would you use each?

SQLmediumjoinpartition0.5 min read

DatameticaFedEx DataworksNihilentPresidio

→

What is the difference between partitioning and bucketing in Spark, and when would you use bucketing?

SQLmediumjoinpartitionspark0.5 min read

CitiCoforgeHCLLTIMindtree

→

What strategies can you use to handle skewed data in Spark?

Spark/Big Datamediumjoinpartitionspark0.5 min read

BCGBitwiseCitiHashedIn

→

Briefly introduce yourself and walk us through your journey as a Data Engineer so far.

Behavioralhardetljoinpartition0.5 min read

AccentureEPAMYash Technologies

→

Describe a time when you had to optimize a slow SQL query. What steps did you take?

SQLmediumjoinsql0.5 min read

AareteAccentureFossil GroupYash Technologies

→

Explain the difference between INNER JOIN, LEFT JOIN, RIGHT JOIN, and FULL JOIN.

SQLmediumjoin0.5 min read

AccentureCognizantEPAMYash Technologies

→

How do you handle NULL values in SQL? Mention functions like COALESCE and NULLIF.

SQLmediumjoinsql0.4 min read

AccentureCognizantEPAMYash Technologies

→

Write a Python function to check if a string is a palindrome.

Python/Codingmediumjoinpython0.4 min read

CapcoHashedInLTIMindtree

→

Describe a scenario where partitioning and bucketing would improve query performance.

SQLmediumjoinpartition0.7 min read

Daniel WellingtonGoldman SachsSwiggy

→

Explain Fact and Dimension Tables with examples.

SQLhardjoin0.6 min read

DatameticaDeloitteIncedo

→

Joins and window functions - INNER, LEFT, RIGHT, FULL OUTER, ROW_NUMBER(), RANK(), DENSE_RANK()

SQLhardjoinpartitionwindow0.7 min read

FordKPMGNihilent

→

When would you choose a Snowflake schema over a Star schema?

SQLmediumjoinsnowflake0.6 min read

Goldman SachsMicrosoftZS Associates

→

Can you explain the architecture of Apache Spark and its components?

Spark/Big Datahardjoinoptimizationpartition3.2 min read

CoforgeFreechargeNihilent

→

How does Spark's Catalyst Optimizer work? Explain its stages.

Spark/Big Datahardjoinoptimizationspark0.5 min read

DunnhumbyFragma Data SystemsHashedIn

→

Explain the concept of Broadcast Join in Spark. When should it be used?

Spark/Big Datamediumjoinsparksql0.4 min read

Delivery HeroDunnhumbyFragma Data Systems

→

How do you optimize Spark jobs for better performance? Mention at least 5 techniques.

Spark/Big Datahardjoinoptimizationpartition0.5 min read

Fragma Data SystemsPresidioSwiggy

→

What challenges did you face, and how did you tackle them?

Behavioralmediumjoinpartitionspark0.6 min read

Delivery HeroGrover

→

1 2 3...24 Next

Other Tags

#partition #python #spark #optimization #sql #window #airflow #etl #bigquery #snowflake #lakehouse