Archives — Distributed Readings

Airbnb ↗

Scaling Airbnb’s identity graph with a unified knowledge graph infrastructure

Airbnb needed to scale their identity graph infrastructure to efficiently resolve user identities and understand relationships between entities across their platform.

databases distributed-systems

5 min

Airbnb ↗

Viaduct 1.0 and the future of Airbnb’s data mesh

Airbnb needed to transition Viaduct from an internal-only data mesh tool to a production-ready, community-driven platform with a stable public API.

api-design distributed-systems

5 min

Airbnb ↗

Monitoring reliably at scale

Designing monitoring and observability systems that remain functional and reliable even when the core infrastructure they monitor is failing or degraded.

observability distributed-systems

5 min

Airbnb ↗

Skipper: Building Airbnb’s embedded workflow engine

How to build a durable workflow execution engine that can recover from failures mid-process without losing state or duplicating work.

distributed-systems databases

5 min

Airbnb ↗

Building a fault-tolerant metrics storage system at Airbnb

Building a metrics storage system capable of ingesting 50 million samples per second while reliably storing 2.5 petabytes of time series data at scale.

observability storage-systems

5 min

Airbnb ↗

Privacy-first connections: Empowering social experiences at Airbnb

How can Airbnb enable social features and community connections while maintaining strict user privacy and giving users control over their personal data sharing?

security api-design

5 min

Airbnb ↗

Building a high-volume metrics pipeline with OpenTelemetry and vmagent

Migrating a large-scale metrics pipeline from StatsD to OpenTelemetry while handling production traffic volumes without losing data or blocking dependent systems.

observability distributed-systems

5 min

Airbnb ↗

My Journey to Airbnb — Jonathan Woodard

This article does not describe a specific engineering problem or technical solution.

security

5 min

Airbnb ↗

What COVID did to our forecasting models (and what we built to handle the next shock)

Building forecasting models that remain accurate during sudden market shocks like a global pandemic, where historical data no longer predicts future outcomes.

ml-systems observability

5 min

Airbnb ↗

Academic Publications & Airbnb Tech: 2025 Year in Review

Airbnb needed to advance its AI, data science, and machine learning capabilities across multiple domains (NLP, optimization, measurement science) to improve its travel and living platform, requiring solutions to challenges in search ranking, recommendation, experimentation, and large-scale data processing.

ml-systems search

5 min

Airbnb ↗

From Static Rate Limiting to Adaptive Traffic Management in Airbnb’s Key-Value Store

Airbnb's multi-tenant key-value store (Mussel) used static rate limiting that couldn't adapt to varying traffic patterns and spikes, risking degraded performance and reliability for all tenants during surges.

rate-limiting distributed-systems

5 min

Airbnb ↗

From vendors to vanguard: Airbnb’s hard-won lessons in observability ownership

Airbnb's reliance on multiple third-party observability vendors resulted in inconsistent data, fragmented developer experiences, and limitations in cost-effectiveness and reliability at their scale.

observability microservices

5 min

Airbnb ↗

GraphQL Data Mocking at Scale with LLMs and @generateMock

Producing valid and realistic mock data for GraphQL testing and prototyping is tedious to write and maintain; existing approaches like random value generation and field-level stubbing lack domain context, resulting in unconvincing and brittle test data that doesn't scale across a large schema.

api-design ml-systems

5 min

Airbnb ↗

It Wasn’t a Culture Problem: Upleveling Alert Development at Airbnb

Airbnb's Observability as Code alert development process had excessively long development cycles (weeks) due to cumbersome code review workflows, slowing down engineers' ability to create and iterate on alerts at scale across thousands of services.

observability microservices

5 min

Airbnb ↗

My Journey to Airbnb — Anna Sulkina

This article is a personal profile of a Senior Director of Engineering at Airbnb rather than a technical post addressing a specific engineering challenge. It highlights her role overseeing Application & Cloud infrastructure but does not detail a specific system problem.

distributed-systems

5 min

Airbnb ↗

My Journey to Airbnb: Peter Coles

Airbnb needed to build robust data science and economic modeling capabilities to understand and optimize their two-sided marketplace dynamics for policy and business decisions.

ml-systems

5 min

Airbnb ↗

Pay As a Local

Airbnb relied primarily on card payments across 220+ global markets, but many users preferred local payment methods, causing checkout friction, reduced accessibility, and lower adoption in key markets.

api-design microservices

5 min

Airbnb ↗

Recommending Travel Destinations to Help Users Explore

Airbnb users in the early trip planning stage often lack a clear travel destination, making it difficult to provide relevant recommendations and convert exploratory browsing into bookings.

ml-systems search

5 min

Airbnb ↗

Safeguarding Dynamic Configuration Changes at Scale

Dynamic configuration changes at scale can cause widespread outages if rolled out unsafely—a single bad config update can immediately affect all services and requests without the safety net of a gradual deployment process.

distributed-systems microservices

5 min