文章詳情頁
關于DB2數(shù)據(jù)庫的系統(tǒng)信息集成(1)
瀏覽:49日期:2023-11-10 12:48:35
集成工作永無止境。IT 環(huán)境在不斷變化。新的應用程序在網(wǎng)上源源不斷地出現(xiàn)。對已打包的應用程序進行發(fā)行版級別的更改會對整個基礎結構產(chǎn)生連鎖反應。人們總是想嘗試使用下一個新工具或新技術。我們做出的投資必須著眼于未來。因此,公司內出現(xiàn)了專注于一個集成體系結構的組織。不管是稱作信息治理(Information Management)、集成服務(Integration Service)還是數(shù)據(jù)體系結構(Data Architecture),公司內的專門部門都在解決集成業(yè)務以及定義集成體系結構和基礎結構(提供其未來業(yè)務的基礎)方面的問題。集成是一項很艱巨的工作,因為信息的增加和信息源的多樣性結合在一起,檢索有用信息的工作變得非常復雜。企業(yè)必須不僅能訪問傳統(tǒng)的應用程序來源(比如關系數(shù)據(jù)庫),還要能訪問可擴展標記語言(Extensible Markup Language,XML)文檔、文本文檔、掃描的圖像、視頻剪輯、傳入的新聞、Web 內容、電子郵件、分析性三維數(shù)據(jù)和非凡用途的存儲(包括內部和外部)。由于組織上或操作上的約束,通常不能對來自不同的分布式數(shù)據(jù)源的信息進行完全復制或將其合并到單個數(shù)據(jù)庫中。雖然可以發(fā)現(xiàn)隱含的信息,但是當信息相互關聯(lián)時會更加輕松地把握機會,同時才能更好為客戶服務。眾多市場(比如企業(yè)應用程序集成、數(shù)據(jù)倉庫、企業(yè)內容治理、門戶網(wǎng)站和應用程序服務器)中的技術供給商已經(jīng)開始將他們的關注焦點轉向整體集成問題。這使得我們更難選擇能滿足業(yè)務需求的最佳技術。而且,拳頭產(chǎn)品的市場定位經(jīng)常使利用后續(xù)項目中某個實現(xiàn)的優(yōu)勢變得很難。雖然競爭對手們可能只提供非凡領域的集成,但是 IBM 可以提供綜合的集成平臺,該平臺具有許多可以無縫地在一起工作的產(chǎn)品。本文著重討論 DB2® Information Integrator™ 產(chǎn)品,以幫助您理解它們是如何幫助解決信息集成問題的。 12345下一頁 IBM DB2 Information Integrator 概述圖 1所示的 IBM DB2 Information Integrator 軟件提供了戰(zhàn)略信息集成框架的基礎。這樣的框架有助于客戶實時訪問、操作和集成各種不同的分布式數(shù)據(jù)。該文件夾(portfolio)包括:IBM DB2 Information Integrator V8.1,基于 DB2 信息治理技術的新產(chǎn)品IBM DB2 Information Integrator for Content V8.2,前身是 IBM Enterprise Information Portal。圖 1. DB2 Information Integrator 產(chǎn)品提供了對各種不同的分布式和實時數(shù)據(jù)的集成訪問,就象數(shù)據(jù)是來自單個數(shù)據(jù)源那樣。這些產(chǎn)品中的每一個都能使客戶從各種不同的分布式數(shù)據(jù)和內容源抽象出公共數(shù)據(jù)模型,并使客戶能夠將它們當作單一源進行訪問和操作。每個產(chǎn)品都支持一個用戶社區(qū),用戶社區(qū)主要是根據(jù)其成員可以訪問的數(shù)據(jù)和他們支持的開發(fā)社區(qū)定義的。該產(chǎn)品集支持主要采用讀訪問的方案,這些方案對于企業(yè)報告生成、知識治理、商業(yè)智能、門戶站點基礎結構和客戶關系治理而言都很常見。DB2 Information Integrator:用于聯(lián)邦數(shù)據(jù)和復制的服務器DB2 Information Integrator 的服務對象是熟悉關系數(shù)據(jù)庫應用程序開發(fā)的應用程序開發(fā)社區(qū)。使用 SQL 的應用程序或生成 SQL 的工具(比如集成開發(fā)環(huán)境、報告生成和分析工具等)現(xiàn)在可以通過聯(lián)邦數(shù)據(jù)服務器訪問和操作各種不同的分布式數(shù)據(jù)。DB2 Information Integrator 最適合于主數(shù)據(jù)源為關系數(shù)據(jù)、另外還添加了其它 XML、Web 或內容源的項目。DB2 Information Integrator 基于 DB2 技術基礎結構,利用 IBM 在諸如 IBM DB2 DataJoiner®、IBM DB2 Relational Connect 和 IBM DiscoveryLink® 之類產(chǎn)品上的早期投資。DB2 Information Integrator 構建在 DB2 通用數(shù)據(jù)庫之上,DB2 通用數(shù)據(jù)庫是一種現(xiàn)代的數(shù)據(jù)庫體系結構,因其可伸縮性和可擴展性而全球聞名。 上一頁12345下一頁 DB2 Information Integrator 能夠聯(lián)邦、搜索、高速緩存、轉換和復制數(shù)據(jù)。作為一種聯(lián)邦數(shù)據(jù)服務器,它提供了對 DB2 通用數(shù)據(jù)庫、IBM Informix® 產(chǎn)品以及來自 Microsoft®、Oracle、Sybase 和 Teradata 的數(shù)據(jù)庫的“開箱即用式訪問。另外,它還可以訪問來自 WebSphere® MQ 消息、XML 文檔、Web 服務、Microsoft Excel、平面文件、ODBC 或 OLE DB 源以及生命科學行業(yè)特有的各種格式的半結構化數(shù)據(jù)。對 IBM Lotus® Extended Search 的集成支持使解決方案能夠對各種廣泛的內容進行訪問,使之能訪問各種內容資源庫(包括 DB2 Content Manager)以及電子郵件數(shù)據(jù)庫、文檔資源庫、第三方因特網(wǎng)搜索引擎和 LDAP 目錄。另外,開發(fā)人員的工具箱擴展了聯(lián)邦功能,使其真正觸及到了每一個數(shù)據(jù)源。搜索和查詢訪問是通過標準的 SQL API 提供的,并將 Lotus® Extended Search 可以訪問廣泛內容的能力和關系引擎的精確性相結合。文本的搜索方法有兩種:能夠創(chuàng)建后端關系存儲的全局索引。通過使用這種方法,文本搜索的語義 - 比如模糊搜索、辭典支持和段內搜索 - 可以在查詢內使用。代理的搜索體系結構,它不要求創(chuàng)建或維護中心索引以便跨多個源訪問內容。擴展搜索引擎將每個完整的文本查詢轉換成目標數(shù)據(jù)源的本機查詢語言查詢可以產(chǎn)生標準的 SQL 應答集或 XML 文檔。優(yōu)化器已經(jīng)得到了顯著的擴展,能夠支持分布式聯(lián)邦查詢處理。查詢重寫,這是查詢優(yōu)化中的一個功能強大的階段,在該階段將寫得很糟糕的輸入查詢轉換成語義相同的形式以改善性能,它能識別底層數(shù)據(jù)源并可以根據(jù)特定轉換對于某個特定數(shù)據(jù)源的可用性來限制或啟用這些轉換。下推分析(pushdown analysis)是查詢處理中新引入的階段,它確定每個特定的后端服務器可以計算出某個特定查詢的程度,并確定在 DB2 Information Integrator 系統(tǒng)上需要進行多少補償性處理。 上一頁12345下一頁 基于成本的優(yōu)化根據(jù)成本估算創(chuàng)建查詢執(zhí)行方案,成本估算目前包括來自源數(shù)據(jù)的標準統(tǒng)計信息(例如,基數(shù)或索引)、數(shù)據(jù)服務器的能力(如連接功能或內置函數(shù))、數(shù)據(jù)服務器容量、I/O 容量和網(wǎng)絡容量。語句生成(根據(jù)基于成本的優(yōu)化器的結果生成可執(zhí)行方案)已經(jīng)得到了擴展,可以為“理解 SQL的數(shù)據(jù)源生成有效的特定于 DBMS 的 SQL。查詢運行時引擎已經(jīng)得到了擴展,可以驅動對本地和分布式信息執(zhí)行查詢,答應功能補償并提供一致的虛擬數(shù)據(jù)庫視圖。聯(lián)邦高速緩存的首個發(fā)行版提供了治理員治理的跨關系數(shù)據(jù)庫后端的集成視圖的高速緩存。優(yōu)化器自動將查詢發(fā)送到高速緩存,以便在合適時滿足查詢。DB2 Information Integrator 有一組豐富的轉換功能,包括標準的 SQL 函數(shù),比如字符串操作、算術計算、統(tǒng)計計算、聯(lián)機分析處理函數(shù)和過程邏輯。特定于類型的功能 - 比如計分算法(scoring algorithm)或化學相似性搜索的應用程序 - 進一步增強了現(xiàn)有的這一組豐富的轉換。可擴展樣式表語言(Extensible Stylesheet Language,XSL)轉換使文檔互換和各種顯示特征的動態(tài)樣式匹配更為方便。用戶定義的函數(shù)使客戶幾乎可以標準化任何數(shù)據(jù)類型的任何函數(shù)。另外,能夠將 Web 服務當作內置函數(shù)進行訪問,這意味著任何 Web 服務(比如貨幣轉換)可以變成嵌入式轉換函數(shù)。DB2 Information Integrator 還包括一個用于混合關系數(shù)據(jù)庫的復制服務器。客戶可以在 IBM(DB2,還包括 IBM Informix)、Microsoft、Oracle、Sybase 和 Teradata(只作為目標)數(shù)據(jù)庫之間復制數(shù)據(jù)。您可以配置各種拓撲結構、等待時間和一致性特征。DB2 Information Integrator for Content:以內容為中心的應用程序的聯(lián)邦訪問 上一頁12345下一頁 DB2 Information Integrator for Content 的服務對象是需要在大量內容源中搜索和訪問文本及非文本信息的內容應用程序開發(fā)人員。通過提供對各種不同數(shù)據(jù)環(huán)境的無縫訪問,DB2 Information Integrator for Content 相當于重新命名和重新定位的 Enterprise Information Portal 產(chǎn)品。DB2 Information Integrator for Content 提供了一組豐富的集成功能,比如與各種不同內容源進行連接的連接器、復雜的信息挖掘和高級工作流。為了加快內容集成項目的實現(xiàn),DB2 Information Integrator for Content 提供了對各種數(shù)據(jù)源的“開箱即用式訪問,所有這些都可以聯(lián)合成單一搜索。這些連接器可以訪問 DB2 Content Manager 系列和其它內容資源庫、Lotus 數(shù)據(jù)庫、關系數(shù)據(jù)庫以及 IBM Lotus Extended Search 可以提供的大量內容。另外,DB2 Information Integrator for Content 包括了復雜的信息挖掘功能,該功能使用 Web 搜尋和文本挖掘算法來為非結構化內容提供結構。挖掘算法的能力包括識別文檔所用語言、識別文檔中諸如名稱之類的特性、根據(jù)定義的分類法對文檔進行分類、根據(jù)類別對文檔進行分組以及概述文檔。通過構建有關企業(yè)范圍信息的額外知識,企業(yè)可以從現(xiàn)有的內容資產(chǎn)中獲得額外的回報。最后,DB2 Information Integrator for Content 提供了高級工作流應用程序,使企業(yè)能夠提高生產(chǎn)效率、縮短生產(chǎn)時間并增強交流與合作。通過使用圖形化的工作流構建器,開發(fā)人員可以輕松地將合并查詢結果的工作流過程定義到 DB2 Information Integrator for Content 中,以便在整個企業(yè)中使用這些結果。結束語如今的企業(yè)需要集成信息以提高客戶忠誠度和滿足度、提高運營效率、爭取在線客戶和貿(mào)易伙伴,以及識別和把握出現(xiàn)的機會。簡而言之,信息集成提供了競爭優(yōu)勢,是隨需應變計算的基礎。IBM 已經(jīng)聽到了集成各種不同數(shù)據(jù)的需求并理解了這種需求。實際上,利用 DB2 Information Integrator 文件夾,IBM 可以繼續(xù)推動第一流的技術創(chuàng)新,使企業(yè)能夠充分利用它們所有的信息資產(chǎn)。 上一頁12345
標簽:
DB2
數(shù)據(jù)庫
排行榜
