Designing Data-Intensive Applications を読み終わった

DDIA 本棚

昨年末に着手して、足掛け5ヶ月で読了した。 5ヶ月というとあまりに時間がかかりすぎているように聞こえる。実際には年末年始とこの GW で集中的に読んだ。しかも、後者の連休ではメモを取りながら読み進めることをやめて、読み終えることそのものを目標化し…

2021-04-25

分散データベースのレプリケーション: Designing Data-Intensive Applications 第5章より

DDIA

ネットワーク越しにつながった複数のマシンに、同じデータのレプリカを作成して保存する。「ネットワーク越しに」というのが難しいところで、ネットワーク障害が起きたり、コピー先のマシンが死んでしまったり（ネットワーク越しに生死を確認するというのも…

2021-04-24

並行書き込みを検知する

DDIA

リーダーレスデータベースは書き込み時コンフリクトに対してひどく脆弱である。クオラムが満たされていても並行書き込みによるコンフリクトは起こりうるし、リードリペアの際にもコンフリクトしうる。さらには書き込み可用性を高めるためにクオラムをぞんざ…

2021-04-23

Sloppy Quorums and Hinted Handoff

DDIA

クオラムが適切に設定されていれば、システム全体の可用性は確かに高まる。とはいえクライアント側のネットワーク障害など、クオラムが満たせなくなる状況は容易に生じうる。システムとして問題があるわけではないのだが、クライアントの視点からはシステム…

2021-04-14

リーダーレスレプリケーションとクオラム

DDIA

リーダーレスデータベースにおいて、仮に書き込みに失敗したノードがあってもクライアントは失敗を無視して処理を継続できると述べた。ただしこれは文面ほど無秩序ではない。極端な話、すべてのノードに書き込みが失敗したのにクライアントが成功したと思い…

2021-04-13

ノードが落ちていても書き込みをおこない続ける

DDIA

リーダーレスデータベースにおいて、クライアントはすべてのノードに同時に書き込みリクエストを発出し、仮にひとつのノードがダウンしていたとしても気にせずに処理を続行する。読み込みリクエストについても同じである。任意のノードに読み込みリクエスト…

2021-04-11

書き込みコンフリクトを制御する

DDIA

複数リーダーレプリケーションは書き込みコンフリクトの発生を防ぐことができない。またその解消を非同期的に実施する必要がある。「同期的にコンフリクトを検出したい」というのは本質的に単一リーダーがトランザクションで実現すべきことがらであるから、…

2021-04-10

複数リーダーレプリケーションのユースケース

DDIA

複数リーダーレプリケーションが行われるユースケースを考えてみよう。「データベース」という言葉からくる先入観に必ずしも対応しないものも含めて、いくつものユースケースがある。まずは複数のデータセンターについて、各データセンターにひとつずつリー…

2021-03-30

レプリケーションラグと結果整合性

DDIA

ひとつのリーダーが排他的に書き込みを管理する方式について検討してきた。この方式によって享受できるメリットはスケーラビリティとレイテンシの向上である。つまり、リードレプリカを追加すれば読み込みをスケールアウトさせられるし、ユーザーの近くにレ…

2021-03-29

レプリケーションログの実装

DDIA

リーダーノードからリードレプリカに変更差分を通知するのはレプリケーションログの転送によってであるとこれまで述べてきた。ではレプリケーションログとはなにか。どのような詳細を持っているのか。これにもいくぶんばらつきがあり、ここで整理することに…

2021-03-28

ノードのダウンに対応する

DDIA

個別のノードがダウンすること自体は防ぎようがない。よって個別のダウンが発生してもシステムが稼働し続けることを目指すのが健全である。言い換えると、ノードが不足する状況が発生したときにどれだけその影響を小さく止められるか、を対策するのである。 …

2021-03-21

新しいリードレプリカをクラスタに追加する

DDIA

サービスが成長するに従って、既存のクラスタにリードレプリカを追加する必要性は必ず生じる。そのときどうやって新しいリードレプリカにリーダーのデータを複製するか？単にデータファイルをコピーするだけでは、コピー中に生じる差分を吸収できない。かと…

2021-03-20

同期レプリケーションか、非同期レプリケーションか

DDIA

書き込みログをネットワーク越しにリードレプリカに転送するジョブは、基本的には軽量で高速動作する。ただしネットワークの不調やリードレプリカの予期せぬ故障など外部要因によって無制限の遅延が発生する可能性は常に存在する。同期レプリケーションリ…

2021-03-14

データベースを支えるデータ構造: Designing Data-Intensive Applications 第3章より

DDIA

Designing Data-Intensive Applicationsより、インデックスにまつわる箇所の読書ノートをまとめた。いくつか重要なデータ構造が登場しているが、個別の語彙やアルゴリズムについて深く検討まではしていない。概念を把握する前に、概念の存在をまずは認識した…

2021-03-07

信頼性、保守性、スケーラビリティ: Designing Data-Intensive Applications 第1章より

DDIA

Designing Data-Intensive Applications の第1章の読書ノートを公開する。主題はシステムの信頼性、保守性、スケーラビリティについてである。個別の手法や技術というよりは、システム設計や技術選定の際に大事にすべきマインドセットに重点をおいた論文で…

ﾕﾕﾕﾕﾕ

webエンジニアです

DDIA

Designing Data-Intensive Applications を読み終わった

分散データベースのレプリケーション: Designing Data-Intensive Applications 第5章より

並行書き込みを検知する

Sloppy Quorums and Hinted Handoff

リーダーレスレプリケーションとクオラム

ノードが落ちていても書き込みをおこない続ける

書き込みコンフリクトを制御する

複数リーダーレプリケーションのユースケース

レプリケーションラグと結果整合性

レプリケーションログの実装

ノードのダウンに対応する

新しいリードレプリカをクラスタに追加する

同期レプリケーションか、非同期レプリケーションか

データベースを支えるデータ構造: Designing Data-Intensive Applications 第3章より

信頼性、保守性、スケーラビリティ: Designing Data-Intensive Applications 第1章より