基本介紹

首先我們要如何透過 Google Cloud Platform 雲端平台設計完善可靠的系統呢?所謂完善可靠的系統主要能夠在發生中斷或故障的情況時盡可能降低停機的時間,避免影響使用者操作服務的體驗,其中我們主要能夠透過 Compute Engine 服務設計完善可靠的系統。

接著系統發生中斷或故障的狀況主要可分為三種,分別為:

  1. 未預期的虛擬機器中斷。

  2. 未預期的虛擬機器重新啟動。

  3. 未預期的虛擬機器所屬地區或區域故障。

針對上述三種方式,我們分別有適當的實作方式來減少當發生中斷或故障的狀況時所造成的影響,為了減少發生未預期的虛擬機器中斷時所造成的影響,我們將能夠使用永久磁碟和開機指令來儲存資料以及在重新啟動虛擬機器時啟動特定軟體。為了避免發生未預期的虛擬機器重新啟動時所造成的影響,我們將能夠使用永久磁碟、開機指令和備份資料來還原資料、儲存資料以及在重新啟動虛擬機器時啟動特定軟體。為了避免發生未預期的虛擬機器所屬區域故障,我們將能夠建立跨地區或區域複製永久磁碟、備份資料和實作負載平衡器來還原資料、儲存資料以及分散至不同的地區或區域處理虛擬機器所提供的雲端服務,像是網站伺服器。

再來我們除了透過實作的方式來減少當發生中斷或故障的狀況時所造成的影響,更能夠採用即時遷移的方式,以利 Google Cloud Platform 定期針對基礎架構執行維運作業,包括更新軟體修補系統、執行日常測試和預防性維護,皆能夠確保虛擬機器於安全、快速和效率良好的狀態。此外當執行即時遷移時,虛擬機器將可能會在短時間之內效能下降,當然我們也能夠將虛擬機器設為終止,並且在完成即時遷移的方式之後重新啟動虛擬機器。

最後若是建立了跨地區或區域虛擬機器的執行個體群組,當其中一個執行個體的地區或區域發生故障時,就會自動將流量導向不同的地區或區域。此外我們更能夠使用代管執行個體群組建立相同的執行個體範本,當單一虛擬機器的執行個體發生故障時,就能夠透過負載平衡器將流量導向不同的執行個體,同時提供自動擴展和自動修復的功能,所謂自動擴展的功能主要會根據特定指標動態調整代管執行個體群組中虛擬機器的執行個體數量,以利處理尖峰時段的龐大流量,所謂自動修復的功能主要會在必要時執行健康狀態檢查,並且自動重新啟動健康狀態不佳的執行個體。