分布式數(shù)據(jù)庫的數(shù)據(jù)存儲(chǔ)的好處和壞處
分布式數(shù)據(jù)庫系統(tǒng)是在集中式數(shù)據(jù)庫系統(tǒng)的基礎(chǔ)上發(fā)展起來的,是計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)結(jié)合的產(chǎn)物。IT專家表示,分布式數(shù)據(jù)庫系統(tǒng)適合于單位分散的部門,允許各個(gè)部門將其常用的數(shù)據(jù)存儲(chǔ)在本地,實(shí)施就地存放本地使用,從而提高響應(yīng)速度,降低通信費(fèi)用。從數(shù)據(jù)意義上講,數(shù)據(jù)分布的合理與否不僅影響著訪問的局部性,而且也制約著數(shù)據(jù)查詢及事務(wù)處理的效率。
在分布式數(shù)據(jù)庫中,數(shù)據(jù)存儲(chǔ)包括數(shù)據(jù)分片和數(shù)據(jù)分配兩個(gè)部分。分布式數(shù)據(jù)庫大部分問題均與數(shù)據(jù)分片和分布有關(guān),它們對(duì)整個(gè)系統(tǒng)的可用性、可靠性、及效率都有極大的影響,同時(shí)也與分布式數(shù)據(jù)庫系統(tǒng)的其他方面密切相關(guān),尤其是分布式查詢處理問題。
戴爾IT解決方案專家團(tuán)介紹,在分布式數(shù)據(jù)庫中由于數(shù)據(jù)的分布和冗余,使得查詢處理中需要考慮站點(diǎn)間傳輸數(shù)據(jù)的通信費(fèi)用,所以除了考慮CPU代價(jià)和I\O代價(jià)之外。還應(yīng)該包括數(shù)據(jù)在網(wǎng)絡(luò)上的傳輸代價(jià)。即總代價(jià)=CPU代價(jià)+I\O代價(jià)+通信代價(jià)。因此,分布式數(shù)據(jù)庫進(jìn)行分布式設(shè)計(jì)時(shí),一個(gè)重要原則是使數(shù)據(jù)和應(yīng)用程序?qū)崿F(xiàn)最大程度的本地性,這樣就可以使應(yīng)用數(shù)據(jù)盡可能地本地化,以減少通信開支。對(duì)于建立在各場(chǎng)所的分布式數(shù)據(jù)庫,不需要過分進(jìn)行限制,但也必須要有規(guī)范的設(shè)計(jì)要求。
?。?)硬件規(guī)范,必須支持局域網(wǎng)乃至Internet的包括聲音,文字,圖像的交流,支持IE或Netscape瀏覽web界面,支持開放性數(shù)據(jù)源的建立。
?。?)數(shù)據(jù)庫形式規(guī)范,原則上Access、Paradox,甚至文本文件都可以進(jìn)行數(shù)據(jù)傳輸,但必須保證自己有開放式數(shù)據(jù)源的特征及關(guān)系繼承的特征。
?。?)域的統(tǒng)一和分類、分科的統(tǒng)一,數(shù)據(jù)庫在各個(gè)分布場(chǎng)所必須有統(tǒng)一的域結(jié)構(gòu),以確保給用戶提供完整統(tǒng)一的視圖,科目分類的命名必須要求規(guī)范,以確保查詢和統(tǒng)計(jì)工作的準(zhǔn)確性,在方便工作的條件下,可以不要求唯一確定的主關(guān)鍵字。
由于傳統(tǒng)的數(shù)據(jù)存儲(chǔ)方式過于簡(jiǎn)單化,過于集中管理而造成了大量數(shù)據(jù)的堆積。這樣一來一個(gè)公司或企業(yè)要使用大量的數(shù)據(jù)就需要大量的存儲(chǔ)數(shù)據(jù)的介質(zhì),而導(dǎo)致服務(wù)器的回應(yīng)下降乃至崩潰,這樣一來就會(huì)有大量數(shù)據(jù)會(huì)隨著服務(wù)器的崩潰而丟失,而數(shù)據(jù)對(duì)于企業(yè)來說數(shù)據(jù)量會(huì)很大,數(shù)據(jù)的丟失,沒有了數(shù)據(jù)的對(duì)照會(huì)使企業(yè)的業(yè)績(jī)虧損,更嚴(yán)重的說也可能導(dǎo)致企業(yè)倒閉。這種方式存儲(chǔ)還不能解決的問題就是異地的存儲(chǔ),有的企業(yè)會(huì)有很多的分公司,這樣一來就傳統(tǒng)的數(shù)據(jù)存儲(chǔ)就會(huì)帶來大量人力、資金的浪費(fèi)。這些問題的存在也促進(jìn)了分布式數(shù)據(jù)庫的發(fā)展。
分布式數(shù)據(jù)庫具有分布數(shù)據(jù)的功能,它的數(shù)據(jù)存儲(chǔ)方式是物理上是分布的,邏輯上是集中的。也就是說分布式數(shù)據(jù)就是指數(shù)據(jù)和程序可以不位于一個(gè)服務(wù)器上,而是分散到多個(gè)服務(wù)器,以網(wǎng)絡(luò)上分散分布的地理信息數(shù)據(jù)及受其影響的數(shù)據(jù)庫操作為研究對(duì)象的一種理論計(jì)算模型。而分布式數(shù)據(jù)庫數(shù)據(jù)存儲(chǔ)是在不同地域或者不同網(wǎng)絡(luò)之間的存儲(chǔ),進(jìn)而達(dá)到數(shù)據(jù)共享,數(shù)據(jù)交換的目的。
戴爾IT解決方案專家團(tuán)表示,分布式數(shù)據(jù)的優(yōu)勢(shì)也正體現(xiàn)在這"分布"這兩個(gè)字,讓操作終端的人感覺不到數(shù)據(jù)庫的分散,當(dāng)然這也需要好的網(wǎng)絡(luò)的努持。使用者感覺是在本地?cái)?shù)據(jù)庫操作一樣。這樣既方便又快捷,使維護(hù)起來不用操作大量的數(shù)據(jù)。它綜合了計(jì)算機(jī)、通訊、顯示(CRT)和控制等4項(xiàng)技術(shù),其基本思想是分散控制,集中操作、分級(jí)管理、配置靈活、高可靠性,易于維護(hù)等基本特點(diǎn),從而實(shí)現(xiàn)了異地存儲(chǔ)的實(shí)現(xiàn)。