mysql集群是一種在無共享架構(SNA,Share Nothing Architecture)系統里應用內存數據庫集群的技術。這種無共享的架構可以使得系統使用低廉的硬件獲取高的可擴展性。 MySQL集群是一種分布式設計,目標是要達到沒有任何單點故障點。因此,任何組成部分都應該擁
MySQL集群是一種在無共享架構(SNA,Share Nothing Architecture)系統里應用內存數據庫集群的技術。這種無共享的架構可以使得系統使用低廉的硬件獲取高的可擴展性。
MySQL集群是一種分布式設計,目標是要達到沒有任何單點故障點。因此,任何組成部分都應該擁有自己的內存和磁盤。任何共享存儲方案如網絡共享,網絡文件系統和SAN設備是不推薦或不支持的。通過這種冗余設計,MySQL聲稱數據的可用度可以達到99.999%。
實際上,MySQL集群是把一個叫做NDB的內存集群存儲引擎集成與標準的MySQL服務器集成。它包含一組計算機,每個都跑一個或者多個進程,這可能包括一個MySQL服務器,一個數據節點,一個管理服務器和一個專有的一個數據訪問程序。它們之間的關系如下圖所示:
存儲引擎
MySQL Cluster 使用了一個專用的基于內存的存儲引擎,這樣做的好處是速度快, 沒有磁盤I/O的瓶頸,但是由于是基于內存的,所以數據庫的規模受系統總內存的限制, 如果運行NDB的MySQL服務器一定要內存夠大,比如4G, 8G, 甚至16G。NDB引擎是分布式的,它可以配置在多臺服務器上來實現數據的可靠性和擴展性,理論上 通過配置2臺NDB的存儲節點就能實現整個數據庫集群的冗余性和解決單點故障問題。
該存儲引擎有下列弊端:
基于內存,數據庫的規模受集群總內存的大小限制
基于內存,斷電后數據可能會有數據丟失,這點還需要通過測試驗證。
多個節點通過網絡實現通訊和數據同步、查詢等操作,因此整體性受網絡速度影響,
因此速度也比較慢
當然也有它的優點:
多個節點之間可以分布在不同的地理位置,因此也是一個實現分布式數據庫的方案。
擴展性很好,增加節點即可實現數據庫集群的擴展。
冗余性很好,多個節點上都有完整的數據庫數據,因此任何一個節點宕機都不會造成服務中斷。
實現高可用性的成本比較低,不象傳統的高可用方案一樣需要共享的存儲設備和專用的軟件才能實現,NDB 只要有足夠的內存就能實現。
體系結構
MySQL Cluster 由3個不同功能的服務構成,每個服務由一個專用的守護進程提供,一項 服務也叫做一個節點,下面來介紹每個節點的功能。
The management (MGM) node
管理節點,用來實現整個集群的管理,理論上一般只啟動一個,而且宕機也不影響 cluster 的服務,這個進程只在cluster 啟動以及節點加入集群時起作用, 所以這個節點不是很需要冗余,理論上通過一臺服務器提供服務就可以了。
通過 ndb_mgmd 命令啟動,使用 config.ini 配置文件
The storage or database (DB) node:
數據庫節點,用來存儲數據,可以和管理節點(MGM) , 用戶端節點(API) 可以處在 不同的機器上,也可以在同一個機器上面,集群中至少要有一個DB節點,2個以上 時就能實現集群的高可用保證,DB節點增加時,集群的處理速度會變慢。
通過 ndbd 命令啟動,第一次創建好cluster DB 節點時,需要使用 –init參數初始化。
例如: bin/ndbd –ndb-connectstring=ndb_mgmd.mysqlcluster.net –initial
The client (API) node:
客戶端節點,通過他實現 cluster DB 的訪問,這個節點也就是普通的 mysqld 進程, 需要在配置文件中配置ndbcluster 指令打開 NDB Cluster storage engine 存儲引擎,增加 API 節點會提高整個集群的并發訪問速度和整體的吞吐量,該節點 可以部署在Web應用服務器上,也可以部署在專用的服務器上,也開以和DB部署在 同一臺服務器上。
通過 mysqld_safe 命令啟動,
這3類節點可以分布在不同的主機上,比如 DB 可以是多臺專用的服務器,也可以 每個DB都有一個API,當然也可以把API分布在Web前端的服務器上去,通常來說, API越多cluster的性能會越好。