PostgreSQL レプリケーション: 総合ガイド

公開: 2022-08-11

サイト所有者なら誰でも言うように、データの損失とダウンタイムは、最小限の量であっても破滅的な結果をもたらす可能性があります。彼らはいつでも準備ができていない人を襲う可能性があり、生産性、アクセシビリティ、および製品の信頼性の低下につながります.

サイトの整合性を保護するには、ダウンタイムやデータ損失の可能性に対する保護手段を構築することが不可欠です。

そこでデータ複製の出番です。
サイト所有者なら誰でも言うように、データの損失とダウンタイムは、たとえ最小限の線量であっても壊滅的なものになる可能性があります. 開始、データ複製クリックしてツイート
データレプリケーションは、データをメインデータベースから別のリモートロケーションに繰り返しコピーして保管する、自動化されたバックアッププロセスです。これは、データベースサーバーを実行するすべてのサイトまたはアプリにとって不可欠なテクノロジです。また、複製されたデータベースを利用して読み取り専用 SQL を処理し、システム内でより多くのプロセスを実行できるようにすることもできます。

2 つのデータベース間でレプリケーションを設定すると、予期しない事故に対するフォールトトレランスが提供されます。これは、災害時に高可用性を実現するための最良の戦略であると考えられています。

この記事では、シームレスな PostgreSQL レプリケーションのためにバックエンド開発者が実装できるさまざまな戦略について詳しく説明します。

PostgreSQL レプリケーションとは?

プライマリサーバーからレプリカへのデータの流れを示す PostgreSQL レプリケーションの図。 — PostgreSQL レプリケーションの図 (画像提供元: EnterpriseDB)

PostgreSQL レプリケーションは、PostgreSQL データベースサーバーから別のサーバーにデータをコピーするプロセスとして定義されます。ソースデータベースサーバーは「プライマリ」サーバーとも呼ばれ、コピーされたデータを受信するデータベースサーバーは「レプリカ」サーバーと呼ばれます。

PostgreSQL データベースは、すべての書き込みがプライマリノードに送信される単純なレプリケーションモデルに従います。その後、プライマリノードはこれらの変更を適用し、セカンダリノードにブロードキャストできます。

自動フェールオーバーとは

PostgreSQL で物理ストリーミングレプリケーションが構成されると、データベースのプライマリサーバーに障害が発生した場合にフェイルオーバーを実行できます。フェールオーバーは回復プロセスを定義するために使用されますが、サーバー障害の範囲を特定するための組み込みツールが提供されないため、時間がかかる場合があります。

フェールオーバーのために PostgreSQL に依存する必要はありません。自動フェイルオーバーとスタンバイへの自動切り替えを可能にする専用ツールがあり、データベースのダウンタイムを削減します。

フェールオーバーレプリケーションをセットアップすることで、プライマリサーバーがダウンした場合にスタンバイを利用できるようにすることで、高可用性を保証します。

PostgreSQL レプリケーションを使用する利点

PostgreSQL レプリケーションを利用する主な利点をいくつか紹介します。

データの移行: データベースサーバーハードウェアの変更またはシステムの展開を通じて、データの移行に PostgreSQL レプリケーションを利用できます。
耐障害性: プライマリサーバーに障害が発生した場合、プライマリサーバーとスタンバイサーバーの両方に含まれるデータが同じであるため、スタンバイサーバーがサーバーとして機能できます。
オンライントランザクション処理 (OLTP) のパフォーマンス: レポートクエリの負荷を取り除くことで、OLTP システムのトランザクション処理時間とクエリ時間を改善できます。トランザクション処理時間は、トランザクションが完了する前に特定のクエリが実行されるのにかかる時間です。
並行してシステムをテストする: 新しいシステムをアップグレードする際、システムが既存のデータにうまく適合することを確認する必要があるため、展開前に実稼働データベースのコピーでテストする必要があります。

PostgreSQL レプリケーションの仕組み

一般に、プライマリアーキテクチャとセカンダリアーキテクチャに手を出す場合、バックアップとレプリケーションをセットアップする方法は 1 つしかないと人々は信じていますが、PostgreSQL のデプロイは次の 3 つのアプローチのいずれかに従います。

プライマリノードからセカンダリノードにストレージレイヤーでレプリケートした後、BLOB/S3 ストレージにバックアップするボリュームレベルのレプリケーション。
プライマリノードからセカンダリノードにデータをレプリケートした後、BLOB/S3 ストレージにバックアップするPostgreSQL ストリーミングレプリケーション。
S3 から新しいセカンダリノードを再構築しながら、プライマリノードから S3 への増分バックアップを取得します。セカンダリノードがプライマリノードの近くにある場合は、プライマリノードからストリーミングを開始できます。

アプローチ 1: ストリーミング

WAL レプリケーションとも呼ばれる PostgreSQL ストリーミングレプリケーションは、すべてのサーバーに PostgreSQL をインストールした後、シームレスにセットアップできます。このレプリケーションのアプローチは、プライマリデータベースからターゲットデータベースへの WAL ファイルの移動に基づいています。

プライマリ/セカンダリ構成を使用して、PostgreSQL ストリーミングレプリケーションを実装できます。プライマリサーバーは、プライマリデータベースとそのすべての操作を処理するメインインスタンスです。セカンダリサーバーは補助インスタンスとして機能し、プライマリデータベースに加えられたすべての変更をそれ自体で実行し、その過程で同一のコピーを生成します。プライマリサーバーは読み取り/書き込みサーバーですが、セカンダリサーバーは単に読み取り専用です。

このアプローチでは、プライマリノードとスタンバイノードの両方を構成する必要があります。次のセクションでは、それらを簡単に構成するための手順を説明します。

プライマリノードの構成

次の手順を実行して、ストリーミングレプリケーション用にプライマリノードを構成できます。

ステップ 1: データベースを初期化する

データベースを初期化するには、 initidb utilityコマンドを利用できます。次に、次のコマンドを使用して、レプリケーション権限を持つ新しいユーザーを作成できます。

 CREATE USER REPLICATION LOGIN ENCRYPTED PASSWORD '';

ユーザーは、指定されたクエリのパスワードとユーザー名を提供する必要があります。 replication キーワードは、ユーザーに必要な権限を付与するために使用されます。クエリの例は次のようになります。

 CREATE USER rep_user REPLICATION LOGIN ENCRYPTED PASSWORD 'rep_pass'

ステップ 2: ストリーミングプロパティを構成する

次に、次のように変更できる PostgreSQL 構成ファイル ( postgresql.conf ) を使用してストリーミングプロパティを構成できます。

 wal_level = logical wal_log_hints = on max_wal_senders = 8 max_wal_size = 1GB hot_standby = on

前のスニペットで使用されたパラメーターの背景を少し説明します。

wal_log_hints : このパラメーターは、スタンバイサーバーがプライマリサーバーと同期していない場合に役立つpg_rewind機能に必要です。
wal_level : このパラメーターを使用して、 replicaストリーミングレプリケーションを有効にすることminimalできlogical 。
max_wal_size : これは、ログファイルに保持できる WAL ファイルのサイズを指定するために使用できます。
hot_standby : このパラメーターを ON に設定すると、セカンダリとの読み取り接続にこのパラメーターを利用できます。
max_wal_senders : max_wal_sendersを使用して、スタンバイサーバーで確立できる同時接続の最大数を指定できます。

ステップ 3: 新しいエントリを作成する

postgresql.conf ファイルのパラメーターを変更した後、 pg_hba.confファイルの新しいレプリケーションエントリにより、サーバーはレプリケーションのために相互に接続を確立できます。

通常、このファイルは PostgreSQL のデータディレクトリにあります。同じために次のコードスニペットを使用できます。

 host replication rep_user IPaddress md5

コードスニペットが実行されると、プライマリサーバーは、レプリケーション用に指定された IP を使用して、 rep_userというユーザーが接続し、スタンバイサーバーとして機能することを許可します。例えば：

 host replication rep_user 192.168.0.22/32 md5

スタンバイノードの構成

ストリーミングレプリケーション用にスタンバイノードを構成するには、次の手順に従います。

ステップ 1: プライマリノードのバックアップ

スタンバイノードを構成するには、 pg_basebackupユーティリティを利用して、プライマリノードのバックアップを生成します。これは、スタンバイノードの開始点として機能します。このユーティリティは、次の構文で使用できます。

 pg_basebackp -D -h -X stream -c fast -U rep_user -W

上記の構文で使用されるパラメーターは次のとおりです。

-h : これを使用して、プライマリホストに言及できます。
-D : このパラメーターは、現在作業中のディレクトリを示します。
-C : これを使用してチェックポイントを設定できます。
-X : このパラメーターを使用して、必要なトランザクションログファイルを含めることができます。
-W : このパラメーターを使用して、データベースにリンクする前にユーザーにパスワードの入力を求めることができます。

ステップ 2: レプリケーション構成ファイルのセットアップ

次に、レプリケーション構成ファイルが存在するかどうかを確認する必要があります。そうでない場合は、レプリケーション構成ファイルを recovery.conf として生成できます。

このファイルは、PostgreSQL インストールのデータディレクトリに作成する必要があります。 pg_basebackupユーティリティ内で-Rオプションを使用すると、自動的に生成できます。

recovery.confファイルには、次のコマンドが含まれている必要があります。

スタンバイモード = 'オン'

primary_conninfo = 'host=<master_host> port=<postgres_port> user=<replication_user> password=<password> application_name="host_name"'

recovery_target_timeline = '最新'

前述のコマンドで使用されるパラメーターは次のとおりです。

primary_conninfo : これを使用して、接続文字列を利用してプライマリサーバーとセカンダリサーバー間の接続を確立できます。
standby_mode : このパラメータにより、スイッチがオンになったときにプライマリサーバがスタンバイとして起動する可能性があります。
recovery_target_timeline : これを使用して回復時間を設定できます。

接続をセットアップするには、ユーザー名、IP アドレス、およびパスワードを primary_conninfo パラメーターの値として指定する必要があります。例えば：

 primary_conninfo = 'host=192.168.0.26 port=5432 user=rep_user password=rep_pass'

ステップ 3: セカンダリサーバーを再起動する

最後に、セカンダリサーバを再起動して設定プロセスを完了できます。

ただし、ストリーミングレプリケーションには、次のようないくつかの課題があります。

さまざまな PostgreSQL クライアント (さまざまなプログラミング言語で記述) が、単一のエンドポイントと通信します。プライマリノードに障害が発生すると、これらのクライアントは同じ DNS または IP 名を再試行し続けます。これにより、フェイルオーバーがアプリケーションから見えるようになります。
PostgreSQL のレプリケーションには、組み込みのフェールオーバーと監視が付属していません。プライマリノードに障害が発生した場合、セカンダリを新しいプライマリに昇格させる必要があります。この昇格は、クライアントが 1 つのプライマリノードのみに書き込み、データの不整合を観察しない方法で実行する必要があります。
PostgreSQL はその状態全体を複製します。新しいセカンダリノードを開発する必要がある場合、セカンダリはプライマリノードからの状態変更の履歴全体を要約する必要があります。これはリソースを大量に消費し、ヘッド内のノードを削除して新しいノードを作成するにはコストがかかります。

アプローチ 2: レプリケートされたブロックデバイス

レプリケートされたブロックデバイスのアプローチは、ディスクミラーリング (ボリュームレプリケーションとも呼ばれます) に依存します。このアプローチでは、別のボリュームに同期的にミラーリングされる永続ボリュームに変更が書き込まれます。

このアプローチの追加の利点は、いくつか例を挙げると、PostgreSQL、MySQL、および SQL Server を含むすべてのリレーショナルデータベースとのクラウド環境での互換性とデータの耐久性です。

ただし、PostgreSQL レプリケーションへのディスクミラーリングアプローチでは、WAL ログとテーブルデータの両方をレプリケートする必要があります。データベースへの各書き込みは同期的にネットワークを経由する必要があるため、データベースが破損した状態になる可能性があるため、1 バイトを失うわけにはいきません。

このアプローチは通常、Azure PostgreSQL と Amazon RDS を使用して活用されます。

アプローチ 3: WAL

WAL はセグメントファイル (デフォルトで 16 MB) で構成されます。各セグメントには、1 つ以上のレコードがあります。ログシーケンスレコード (LSN) は、WAL 内のレコードへのポインタであり、ログファイル内でレコードが保存された位置/場所を示します。

スタンバイサーバーは、WAL セグメント (PostgreSQL 用語では XLOGS とも呼ばれます) を活用して、プライマリサーバーからの変更を継続的にレプリケートします。先行書き込みログを使用して、データベースに適用される前にバイト配列データのチャンク (それぞれが一意の LSN を持つ) を安定したストレージにシリアル化することにより、DBMS で耐久性と原子性を付与できます。

データベースにミューテーションを適用すると、さまざまなファイルシステム操作が発生する可能性があります。ファイルシステムの更新中に停電が原因でサーバーに障害が発生した場合に、データベースが原子性をどのように保証できるかという問題が生じます。データベースが起動すると、利用可能な WAL セグメントを読み取り、それらをすべてのデータページに保存されている LSN と比較できる起動または再生プロセスが開始されます (すべてのデータページは、ページに影響する最新の WAL レコードの LSN でマークされます)。

ログ配布ベースのレプリケーション (ブロックレベル)

ストリーミングレプリケーションは、ログ配布プロセスを改善します。 WAL スイッチを待つのではなく、レコードが作成されると送信されるため、レプリケーションの遅延が減少します。

また、ストリーミングレプリケーションは、レプリケーションプロトコルを利用してスタンバイサーバーがネットワーク経由でプライマリサーバーとリンクするため、ログ配布よりも優先されます。プライマリサーバーは、エンドユーザーが提供するスクリプトに依存することなく、この接続を介して直接 WAL レコードを送信できます。

ログ配布ベースのレプリケーション (ファイルレベル)

ログ配布は、ログファイルを別の PostgreSQL サーバーにコピーし、WAL ファイルを再生して別のスタンバイサーバーを生成することと定義されています。このサーバーは回復モードで動作するように構成されており、その唯一の目的は、新しい WAL ファイルが表示されたときに適用することです。

このセカンダリサーバーは、プライマリ PostgreSQL サーバーのウォームバックアップになります。また、ホットスタンバイとも呼ばれる読み取り専用クエリを提供できる読み取りレプリカとして構成することもできます。

継続的な WAL アーカイブ

WAL ファイルをアーカイブするために、作成時にpg_walサブディレクトリ以外の場所に複製することを、WAL アーカイブと呼びます。 PostgreSQL は、WAL ファイルが作成されるたびに、アーカイブのためにユーザーが指定したスクリプトを呼び出します。

スクリプトはscpコマンドを利用して、NFS マウントなどの 1 つ以上の場所にファイルを複製できます。アーカイブが完了すると、WAL セグメントファイルを利用して、任意の時点でデータベースを復元できます。

その他のログベースの構成には、次のものがあります。

同期レプリケーション: すべての同期レプリケーショントランザクションがコミットされる前に、プライマリサーバーはスタンバイサーバーがデータを取得したことを確認するまで待機します。この構成の利点は、並列書き込みプロセスによる競合が発生しないことです。
同期マルチマスターレプリケーション: ここでは、すべてのサーバーが書き込み要求を受け入れることができ、各トランザクションがコミットされる前に、変更されたデータが元のサーバーから他のすべてのサーバーに送信されます。 2PC プロトコルを活用し、全か無かのルールに従います。

WAL ストリーミングプロトコルの詳細

スタンバイサーバーで実行される WAL レシーバーと呼ばれるプロセスは、 recovery.confのprimary_conninfoパラメータで提供される接続の詳細を利用し、TCP/IP 接続を利用してプライマリサーバーに接続します。

ストリーミングレプリケーションを開始するために、フロントエンドは起動メッセージ内でレプリケーションパラメータを送信できます。 true、yes、1、または ON のブール値は、バックエンドに、物理レプリケーション walsender モードに入る必要があることを知らせます。

WAL 送信者は、プライマリサーバー上で実行される別のプロセスであり、生成された WAL レコードをスタンバイサーバーに送信する役割を担います。 WAL レシーバーは、ローカルに接続されたクライアントのクライアントアクティビティによって作成されたかのように、WAL レコードを WAL に保存します。

WAL レコードが WAL セグメントファイルに到達すると、スタンバイサーバーは常に WAL を再生し続け、プライマリとスタンバイが最新の状態になるようにします。

プライマリサーバーとスタンバイサーバー間の WAL ストリーミングプロトコルプロセスに関連する手順を示すフロー図。 — WAL ストリーミングプロトコルのフロー図 (画像の出典: EnterpriseDB)

PostgreSQL レプリケーションの要素

このセクションでは、一般的に使用されるモデル (シングルマスターおよびマルチマスターレプリケーション)、タイプ (物理および論理レプリケーション)、および PostgreSQL レプリケーションのモード (同期および非同期) についてより深く理解することができます。

PostgreSQL データベースレプリケーションのモデル

スケーラビリティとは、既存のノードにリソース/ハードウェアを追加して、水平方向および垂直方向に達成できるより多くのデータを保存および処理するデータベースの能力を強化することを意味します。 PostgreSQL のレプリケーションは、垂直方向のスケーラビリティよりも実装がはるかに難しい水平方向のスケーラビリティの例です。主にシングルマスターレプリケーション (SMR) とマルチマスターレプリケーション (MMR) によって、水平方向のスケーラビリティを実現できます。

シングルマスターレプリケーションでは、データを 1 つのノードでのみ変更でき、これらの変更は 1 つ以上のノードにレプリケートされます。レプリカデータベース内のレプリケートされたテーブルは、プライマリサーバーからの変更を除き、変更を受け入れることはできません。たとえそうであっても、変更はプライマリサーバーにレプリケートされません。

ほとんどの場合、アプリケーションには SMR で十分です。構成と管理が簡単で、競合の可能性もないからです。レプリケーションデータは主に一方向 (プライマリデータベースからレプリカデータベース) に流れるため、シングルマスターレプリケーションも単方向です。

場合によっては、SMR だけでは不十分な場合があり、MMR を実装する必要がある場合があります。 MMR では、複数のノードをプライマリノードとして機能させることができます。指定された複数のプライマリデータベースのテーブル行に対する変更は、他のすべてのプライマリデータベースの対応するテーブルに複製されます。このモデルでは、主キーの重複などの問題を回避するために競合解決スキームがよく使用されます。

MMR を使用すると、次のような利点があります。

ホストに障害が発生した場合でも、他のホストは引き続き更新および挿入サービスを提供できます。
プライマリノードは複数の異なる場所に分散しているため、すべてのプライマリノードで障害が発生する可能性は非常に低くなります。
クライアントのグループに地理的に近いプライマリデータベースのワイドエリアネットワーク (WAN) を使用しながら、ネットワーク全体でデータの一貫性を維持する機能。

ただし、MMR を実装することの欠点は、複雑さと競合の解決の難しさです。

PostgreSQL は MMR ソリューションをネイティブにサポートしていないため、いくつかのブランチとアプリケーションが MMR ソリューションを提供しています。これらのソリューションは、オープンソース、無料、または有料の場合があります。そのような拡張機能の 1 つが双方向レプリケーション (BDR) です。これは非同期で、PostgreSQL の論理デコード機能に基づいています。

BDR アプリケーションは他のノードでトランザクションをリプレイするため、適用されているトランザクションと受信ノードでコミットされたトランザクションとの間に競合がある場合、リプレイ操作が失敗する可能性があります。

PostgreSQL レプリケーションの種類

PostgreSQL のレプリケーションには、論理レプリケーションと物理レプリケーションの 2 種類があります。

ダウンタイムや WordPress の問題に悩まされていませんか? Kinstaは、時間を節約するために設計されたホスティングソリューションです! 私たちの機能をチェックしてください

単純な論理操作「initdb」は、クラスターのベースディレクトリを作成する物理操作を実行します。同様に、単純な論理操作「CREATE DATABASE」は、ベースディレクトリにサブディレクトリを作成する物理操作を実行します。

通常、物理レプリケーションはファイルとディレクトリを扱います。これらのファイルとディレクトリが何を表しているかはわかりません。これらの方法は、通常は別のマシン上にある 1 つのクラスターのデータ全体の完全なコピーを維持するために使用され、ファイルシステムレベルまたはディスクレベルで実行され、正確なブロックアドレスを使用します。

論理レプリケーションは、レプリケーション ID (通常は主キー) に基づいて、データエンティティとその変更を再現する方法です。物理レプリケーションとは異なり、データベース、テーブル、および DML 操作を処理し、データベースクラスターレベルで実行されます。 1 つ以上のサブスクライバーがパブリッシャーノード上の 1 つ以上のパブリケーションにサブスクライブされるパブリッシュおよびサブスクライブモデルを使用します。

レプリケーションプロセスは、パブリッシャーデータベース上のデータのスナップショットを取得し、それをサブスクライバーにコピーすることから始まります。サブスクライバーは、サブスクライブしているパブリケーションからデータをプルし、後でデータを再パブリッシュして、カスケードレプリケーションやより複雑な構成を可能にします。サブスクライバーはパブリッシャーと同じ順序でデータを適用するため、トランザクションレプリケーションとも呼ばれる単一のサブスクリプション内のパブリケーションに対してトランザクションの一貫性が保証されます。

論理レプリケーションの一般的な使用例は次のとおりです。

1 つのデータベース (またはデータベースのサブセット) の増分変更を、発生時にサブスクライバーに送信します。
複数のデータベース間でデータベースのサブセットを共有します。
個々の変更がサブスクライバーに到着したときに、それらの変更をトリガーします。
複数のデータベースを 1 つに統合します。
レプリケートされたデータへのアクセスをさまざまなユーザーグループに提供します。

サブスクライバーデータベースは、他の PostgreSQL インスタンスと同じように動作し、そのパブリケーションを定義することにより、他のデータベースのパブリッシャーとして使用できます。

サブスクライバーがアプリケーションによって読み取り専用として扱われる場合、単一のサブスクリプションからの競合は発生しません。一方、アプリケーションまたは他のサブスクライバーによって同じテーブルセットに対して行われた他の書き込みがある場合、競合が発生する可能性があります。

PostgreSQL は両方のメカニズムを同時にサポートします。論理レプリケーションにより、データのレプリケーションとセキュリティの両方をきめ細かく制御できます。

レプリケーションモード

PostgreSQL レプリケーションには、主に同期と非同期の 2 つのモードがあります。同期レプリケーションでは、データをプライマリサーバーとセカンダリサーバーの両方に同時に書き込むことができますが、非同期レプリケーションでは、データが最初にホストに書き込まれ、次にセカンダリサーバーにコピーされます。

同期モードのレプリケーションでは、プライマリデータベースのトランザクションは、それらの変更がすべてのレプリカにレプリケートされた場合にのみ完了したと見なされます。プライマリでトランザクションを完了するには、すべてのレプリカサーバーが常に使用可能である必要があります。レプリケーションの同期モードは、すぐにフェールオーバーが必要なハイエンドトランザクション環境で使用されます。

非同期モードでは、変更がプライマリサーバー上でのみ行われたときに、プライマリサーバー上のトランザクションが完了したと宣言できます。これらの変更は、後でレプリカに複製されます。レプリカサーバーは、レプリケーションラグと呼ばれる一定期間、非同期のままになることがあります。クラッシュの場合、データの損失が発生する可能性がありますが、非同期レプリケーションによって提供されるオーバーヘッドは小さいため、ほとんどの場合は許容されます (ホストに過負荷がかかることはありません)。プライマリデータベースからセカンダリデータベースへのフェールオーバーは、同期レプリケーションよりも時間がかかります。

PostgreSQL レプリケーションの設定方法

このセクションでは、Linux オペレーティングシステムで PostgreSQL レプリケーションプロセスをセットアップする方法を示します。この例では、Ubuntu 18.04 LTS と PostgreSQL 10 を使用します。

掘り下げましょう！

インストール

次の手順で PostgreSQL を Linux にインストールすることから始めます。

まず、ターミナルで以下のコマンドを入力して、PostgreSQL 署名キーをインポートする必要があります。
```
 wget -q https://www.postgresql.org/media/keys/ACCC4CF8.asc -O- | sudo apt-key add -
```

次に、ターミナルで次のコマンドを入力して、PostgreSQL リポジトリを追加します。

 echo "deb http://apt.postgresql.org/pub/repos/apt/ bionic-pgdg main" | sudo tee /etc/apt/sources.list.d/postgresql.list

ターミナルで次のコマンドを入力して、リポジトリインデックスを更新します。
```
 sudo apt-get update
```
apt コマンドを使用して PostgreSQL パッケージをインストールします。
```
 sudo apt-get install -y postgresql-10
```
最後に、次のコマンドを使用して PostgreSQL ユーザーのパスワードを設定します。
```
 sudo passwd postgres
```

PostgreSQL のレプリケーションプロセスを開始する前に、プライマリサーバーとセカンダリサーバーの両方に PostgreSQL のインストールが必須です。

両方のサーバーに PostgreSQL をセットアップしたら、プライマリサーバーとセカンダリサーバーのレプリケーションのセットアップに進むことができます。

プライマリサーバーでのレプリケーションの設定

プライマリサーバーとセカンダリサーバーの両方に PostgreSQL をインストールしたら、これらの手順を実行します。

まず、次のコマンドを使用して PostgreSQL データベースにログインします。
```
 su - postgres
```

次のコマンドでレプリケーションユーザーを作成します。

 psql -c "CREATEUSER replication REPLICATION LOGIN CONNECTION LIMIT 1 ENCRYPTED PASSWORD'YOUR_PASSWORD';"

Ubuntu の任意の nano アプリケーションでpg_hba.cnfを編集し、次の構成を追加します。 file edit コマンド
```
 nano /etc/postgresql/10/main/pg_hba.conf
```
ファイルを構成するには、次のコマンドを使用します。
```
 host replication replication MasterIP/24 md5
```

postgresql.conf を開いて編集し、次の構成をプライマリサーバーに配置します。

 nano /etc/postgresql/10/main/postgresql.conf

次の構成設定を使用します。

 listen_addresses = 'localhost,MasterIP'

 wal_level = replica

 wal_keep_segments = 64

 max_wal_senders = 10

最後に、プライマリメインサーバーで PostgreSQL を再起動します。

 systemctl restart postgresql

これで、プライマリサーバーでのセットアップが完了しました。

セカンダリサーバーでのレプリケーションの設定

次の手順に従って、セカンダリサーバーでレプリケーションをセットアップします。

以下のコマンドで PostgreSQL RDMS にログインします。
```
 su - postgres
```
以下のコマンドを使用して PostgreSQL サービスを停止し、作業できるようにします。
```
 systemctl stop postgresql
```
このコマンドでpg_hba.confファイルを編集し、次の構成を追加します。
編集コマンド
```
 nano /etc/postgresql/10/main/pg_hba.conf
```
構成
```
 host replication replication MasterIP/24 md5
```
セカンダリサーバーでpostgresql.confを開いて編集し、次の構成を追加するか、コメント化されている場合はコメントを解除します。コマンドの編集

構成
```
 nano /etc/postgresql/10/main/postgresql.conf
```
```
 listen_addresses = 'localhost,SecondaryIP'
```
```
 wal_keep_segments = 64
```
```
 wal_level = replica
```
```
 hot_standby = on
```
```
 max_wal_senders = 10
```
SecondaryIP はセカンダリサーバーのアドレスです。
セカンダリサーバーの PostgreSQL データディレクトリにアクセスし、すべてを削除します。
```
 cd /var/lib/postgresql/10/main
```
```
 rm -rfv *
```
PostgreSQL プライマリサーバーのデータディレクトリファイルを PostgreSQL セカンダリサーバーのデータディレクトリにコピーし、次のコマンドをセカンダリサーバーに書き込みます。
```
 pg_basebackup -h MasterIP -D /var/lib/postgresql/11/main/ -P -U
```
```
 replication --wal-method=fetch
```
プライマリサーバーの PostgreSQL パスワードを入力し、Enter キーを押します。次に、リカバリ構成用に次のコマンドを追加します。 Edit Command
```
 nano /var/lib/postgresql/10/main/recovery.conf
```
構成
```
 standby_mode = 'on' primary_conninfo = 'host=MasterIP port=5432 user=replication password=YOUR_PASSWORD' trigger_file = '/tmp/MasterNow'
```
ここで、 YOUR_PASSWORD は、PostgreSQL が作成したプライマリサーバーのレプリケーションユーザーのパスワードです。
パスワードが設定されたら、セカンダリ PostgreSQL データベースが停止されたため、再起動する必要があります。

 systemctl start postgresql

セットアップのテスト

手順を実行したので、レプリケーションプロセスをテストし、セカンダリサーバーデータベースを観察します。このために、プライマリサーバーにテーブルを作成し、それがセカンダリサーバーに反映されるかどうかを観察します。

始めましょう。

プライマリサーバーにテーブルを作成しているため、プライマリサーバーにログインする必要があります。
```
 su - postgres psql
```

次に、「testtable」という名前の単純なテーブルを作成し、ターミナルで次の PostgreSQL クエリを実行してテーブルにデータを挿入します。

 CREATE TABLE testtable (websites varchar(100)); INSERT INTO testtable VALUES ('section.com'); INSERT INTO testtable VALUES ('google.com'); INSERT INTO testtable VALUES ('github.com');

セカンダリサーバーにログインして、セカンダリサーバーの PostgreSQL データベースを確認します。
```
 su - postgres psql
```
ここで、テーブル「testtable」が存在するかどうかを確認し、ターミナルで次の PostgreSQL クエリを実行してデータを返すことができるかどうかを確認します。このコマンドは、基本的にテーブル全体を表示します。
```
 select * from testtable;
```

これは、テストテーブルの出力です。

 | websites | ------------------- | section.com | | google.com | | github.com | --------------------

プライマリサーバーのデータと同じデータを観察できるはずです。

上記のように表示された場合、レプリケーションプロセスは正常に実行されています。

PostgreSQL の手動フェールオーバー手順とは?

PostgreSQL の手動フェイルオーバーの手順を見てみましょう。

プライマリサーバーをクラッシュさせます。
スタンバイサーバーで次のコマンドを実行して、スタンバイサーバーを昇格します。
```
 ./pg_ctl promote -D ../sb_data/ server promoting
```

昇格したスタンバイサーバーに接続し、行を挿入します。

 -bash-4.2$ ./edb-psql -p 5432 edb Password: psql.bin (10.7) Type "help" for help. edb=# insert into abc values (4,'Four');

挿入が正常に機能する場合は、以前は読み取り専用サーバーであったスタンバイサーバーが新しいプライマリサーバーとして昇格されています。

PostgreSQL でフェイルオーバーを自動化する方法

自動フェイルオーバーの設定は簡単です。

EDB PostgreSQL フェールオーバーマネージャー (EFM) が必要です。各プライマリノードとスタンバイノードに EFM をダウンロードしてインストールしたら、EFM クラスタを作成できます。これは、プライマリノード、1 つ以上のスタンバイノード、および障害発生時にアサーションを確認するオプションの監視ノードで構成されます。

EFM は、システムの状態を継続的に監視し、システムイベントに基づいて電子メールアラートを送信します。障害が発生すると、最新のスタンバイサーバーに自動的に切り替わり、他のすべてのスタンバイサーバーが新しいプライマリノードを認識するように再構成されます。

また、ロードバランサー (pgPool など) を再構成し、「スプリットブレイン」 (2 つのノードがそれぞれプライマリと見なす) の発生を防ぎます。

概要

大量のデータがあるため、スケーラビリティとセキュリティは、データベース管理、特にトランザクション環境における最も重要な基準の 2 つになっています。既存のノードにリソース/ハードウェアを追加することで垂直方向のスケーラビリティを改善できますが、新しいハードウェアを追加する際のコストや制限が原因で、常に可能であるとは限りません。

したがって、水平方向のスケーラビリティが必要です。これは、既存のノードの機能を強化するのではなく、既存のネットワークノードにノードを追加することを意味します。ここで、PostgreSQL レプリケーションの出番です。
サイトの整合性を保護するには、ダウンタイムやデータ損失の可能性に対する保護手段を構築することが不可欠です。このガイドでさらに詳しく知るクリックしてツイートする
この記事では、PostgreSQL レプリケーションの種類、利点、レプリケーションモード、インストール、および SMR と MMR 間の PostgreSQL フェールオーバーについて説明しました。それでは、あなたから聞いてみましょう。

通常はどちらを実装しますか? あなたにとって最も重要なデータベース機能はどれですか?その理由は? 皆様のご意見をお待ちしております。以下のコメントセクションでそれらを共有してください。

PostgreSQL レプリケーション: 総合ガイド

PostgreSQL レプリケーションとは?

自動フェールオーバーとは

PostgreSQL レプリケーションを使用する利点

PostgreSQL レプリケーションの仕組み

アプローチ 1: ストリーミング

プライマリ ノードの構成

ステップ 1: データベースを初期化する

ステップ 2: ストリーミング プロパティを構成する

ステップ 3: 新しいエントリを作成する

スタンバイ ノードの構成

ステップ 1: プライマリ ノードのバックアップ

ステップ 2: レプリケーション構成ファイルのセットアップ

ステップ 3: セカンダリ サーバーを再起動する

アプローチ 2: レプリケートされたブロック デバイス