Building Adaptive Systems

May 28, 2020

1.6k

Building Adaptive Systems

Chris Keathley

May 28, 2020

Tweet

More Decks by Chris Keathley

See All by Chris Keathley

Solid code isn't flexible

Contracts for building reliable systems

Kafka, the hard parts

Building Resilient Elixir Systems

Consistent, Distributed Elixir

Telling stories with data visualization

Easing into continuous deployment

Leveling up your git skills

Generative Testing in Elixir

Other Decks in Programming

See All in Programming

25分で理解する！Symfonyの魅力とその実践的活用法

CDK Day 2023 - Configure cross-account deployment using CDK

「ちょうどよい」フロントエンドアーキテクチャを求めて

CSS Subgridが遂に全ブラウザ対応。新時代のグリッドデザインを学ぼう

tonkotsuboy_com

安易に前職同僚飲み会に行ったら売り上げのほぼないスタートアップに入社してた話

From Spring Boot 2 to Spring Boot 3 with Help of Apache Tomcat and More

実践！Swift API Design Guidelinesに基づいた簡潔明瞭なAPIの作り方

#phpcon 良いコードを書けるようになるコツは「エラーを気にする」〜プログラマにとってエラーとは何なのか〜

スケーラブルシステム / Scalable System

Ebitengine, community, and my dream

CircleCIでChatGPTにエラーの解説を頼んでみた

A sighting of traverseFilter and foldMap in Practical FP in Scala

Featured

See All Featured

A designer walks into a library…

pauljervisheath

How GitHub Uses GitHub to Build GitHub

The Language of Interfaces

The MySQL Ecosystem @ GitHub 2015

Art Directing for the Web. Five minutes with CSS Template Areas

Build The Right Thing And Hit Your Dates

Atom: Resistance is Futile

[RailsConf 2023] Rails as a piece of cake

From Idea to $5000 a Month in 5 Months

How to name files

Writing Fast Ruby

The Cost Of JavaScript in 2023

Transcript

Chris Keathley / @ChrisKeathley / [email protected]
Building Adaptive Systems

View Slide
Server Server

View Slide
Server Server
I have a request

View Slide
Server Server

View Slide
Server Server

View Slide
Server Server
No Problem!

View Slide
Server Server

View Slide
Server Server
Thanks!

View Slide
Server Server

View Slide
Server Server
I have a request

View Slide
Server Server

View Slide
Server Server

View Slide
Server Server
I’m a little busy

View Slide
Server Server
I’m a little busy
I have more requests!

View Slide
Server Server
I’m a little busy
I have more requests!

View Slide
Server Server
I’m a little busy
I have more requests!

View Slide
Server Server
I’m a little busy
I have more requests!

View Slide
Server Server
I’m a little busy
I have more requests!

View Slide
Server Server
I’m a little busy
I have more requests!

View Slide
Server Server
I’m a little busy
I have more requests!

View Slide
Server Server
I’m a little busy
I have more requests!

View Slide
Server Server
I don’t feel so good

View Slide
Server

View Slide
Server
Welp

View Slide
Server
Welp

View Slide
All services have
objectives

View Slide
A resilient service should
be able to withstand a 10x
traffic spike and continue
to meet those objectives

View Slide
Lets Talk About…
Queues
Overload Mitigation
Adaptive Concurrency

View Slide
Lets Talk About…
Queues
Overload Mitigation
Adaptive Concurrency

View Slide
What causes
overload?

View Slide
What causes overload?
Server
Queue

View Slide
What causes overload?
Server
Queue
Processing Time
Arrival Rate >

View Slide
Little’s Law
Elements in the queue = Arrival Rate * Processing Time

View Slide
Little’s Law
Server
1 requests = 10 rps * 100 ms
100ms

View Slide
Little’s Law
Server
1 requests = 10 rps * 100 ms
100ms

View Slide
Little’s Law
Server
1 requests = 10 rps * 100 ms
100ms

View Slide
Little’s Law
Server
2 requests = 10 rps * 200 ms
200ms

View Slide
Little’s Law
Server
2 requests = 10 rps * 200 ms
200ms

View Slide
Little’s Law
Server
2 requests = 10 rps * 200 ms
200ms

View Slide
Little’s Law
Server
2 requests = 10 rps * 200 ms
200ms

View Slide
Little’s Law
Server
2 requests = 10 rps * 200 ms
200ms

View Slide
Little’s Law
Server
2 requests = 10 rps * 200 ms
200ms
BEAM Processes

View Slide
Little’s Law
Server
2 requests = 10 rps * 200 ms
200ms
BEAM Processes
CPU Pressure

View Slide
Little’s Law
Server
3 requests = 10 rps * 300 ms
300ms
BEAM Processes
CPU Pressure

View Slide
Little’s Law
Server
30 requests = 10 rps * 3000 ms
3000ms
BEAM Processes
CPU Pressure

View Slide
Little’s Law
Server
30 requests = 10 rps * ∞ ms
∞
BEAM Processes
CPU Pressure

View Slide
Little’s Law
30 requests = 10 rps * ∞ ms

View Slide
Little’s Law
∞ requests = 10 rps * ∞ ms

View Slide
Little’s Law
∞ requests = 10 rps * ∞ ms
This is bad

View Slide
Lets Talk About…
Queues
Overload Mitigation
Adaptive Concurrency

View Slide
Lets Talk About…
Queues
Overload Mitigation
Adaptive Concurrency

View Slide
Overload
Arrival Rate > Processing Time

View Slide
Overload
Arrival Rate > Processing Time
We need to get these under control

View Slide
Load Shedding
Server
Queue
Server

View Slide
Load Shedding
Server
Queue
Server
Drop requests

View Slide
Load Shedding
Server
Queue
Server
Drop requests
Stop sending

View Slide
Autoscaling

View Slide
Autoscaling

View Slide
Autoscaling
Server DB
Server

View Slide
Autoscaling
Server DB
Server
Requests start queueing

View Slide
Autoscaling
Server DB
Server
Server

View Slide
Autoscaling
Server DB
Server
Server
Now its worse

View Slide
Autoscaling needs to
be in response to
load shedding

View Slide
Circuit Breakers

View Slide
Circuit Breakers

View Slide
Circuit Breakers
Server Server

View Slide
Circuit Breakers
Server Server

View Slide
Circuit Breakers
Server Server
Shut off traffic

View Slide
Circuit Breakers
Server Server

View Slide
Circuit Breakers
Server Server
I’m not quite dead yet

View Slide
Circuit Breakers are
your last line of
defense

View Slide
Lets Talk About…
Queues
Overload Mitigation
Adaptive Concurrency

View Slide
Lets Talk About…
Queues
Overload Mitigation
Adaptive Concurrency

View Slide
We want to allow as
many requests as we
can actually handle

View Slide
View Slide
Adaptive Limits
Time
Concurrency

View Slide
Adaptive Limits
Actual limit
Time
Concurrency

View Slide
Adaptive Limits
Actual limit
Dynamic Discovery
Time
Concurrency

View Slide
Load Shedding
Server
Server

View Slide
Load Shedding
Server
Server
Are we at the limit?

View Slide
Load Shedding
Server
Server
Am I still healthy?

View Slide
Load Shedding
Server
Server

View Slide
Load Shedding
Server
Server
Update Limits

View Slide
Adaptive Limits
Time
Concurrency
Increased latency

View Slide
Latency
Successful vs. Failed requests
Signals for Adjusting Limits

View Slide
Additive Increase Multiplicative Decrease
Success state: limit + 1
Backoﬀ state: limit * 0.95
Time
Concurrency

View Slide
Prior Art/Alternatives
https://github.com/ferd/pobox/
https://github.com/ﬁshcakez/sbroker/
https://github.com/heroku/canal_lock
https://github.com/jlouis/safetyvalve
https://github.com/jlouis/fuse

View Slide
Regulator
https://github.com/keathley/regulator

View Slide
Regulator.install(:service, [
limit: {Regulator.Limit.AIMD, [timeout: 500]}
])
Regulator.ask(:service, fn ->
{:ok, Finch.request(:get, "https://keathley.io")}
end)
Regulator

View Slide
Conclusion

View Slide
Queues are
everywhere

View Slide
Those queues need
to be bounded to
avoid overload

View Slide
If your system is
dynamic, your
solution will also
need to be dynamic

View Slide
Go and build
awesome stuff

View Slide
Thanks
Chris Keathley / @ChrisKeathley / [email protected]

View Slide