第三節 電子政務信息資源體係建設(1 / 3)

信息資源建設是電子政務建設的基礎問題。本節主要剖析信息資源庫建設流程及應注意的問題,闡述電子政務信息資源體係建設的核心環節,提出電子政務信息資源體係建設的階段策略。

一、政務信息資源及其分類

*&;gt;,40%&;amp;?@

有人為政務信息資源提出了一個很簡單明確的定義:即政務部門或利用財政資金所收集、生成的信息。也就是說隻要是政府部門組織或委托進行信息采集,生成的所有信息都是政務信息資源的一部分。政府對國家安全利益、經濟利益負有重大責任,充分利用高科技手段開發政務信息資源搶占先機,是在全球經濟一體化進程中占領有利地位必不可少的一環。

政府是信息資源的最大擁有者、生產者、使用者和傳送者,政府所擁有的信息資源占整個社會資源的80%,對社會信息資源的開發與利用起著主導作用。先進的計算機技術、網絡技術的使用,是建立大規模信息資源建設中必不可少的一部分,而信息資源建設和計算機網絡建設成為了一個事物不可分割的兩個部分。因此,從某種意義上講,政府能否適應信息網絡技術發展的特點,科學、有效地開發與利用政務信息資源,將直接決定一個國家的信息化發展前途。

’()%&;amp;*+,-。

政務信息範圍幾乎涵蓋了國民生活的所有內容,因此分類就可以從政府政務運行、國民經濟監管、為社會提供服務這樣大的範圍去劃分,然後再在各大範圍內作進一步細化,使之成為一個自上向下具有整體概念的信息分類表。如:

①從政務辦公信息建設分類:政府核心業務運行類如安全情報信息、首腦機關監控信息、決策信息、公文流動管理信息、檔案管理係統信息、內部通信管理信息、信息與知識管理信息等;增加政府的透明度類如機關財務管理信息、人事管理信息、電子采購係統信息、政府工程招標信息等;政府行政信息如各種法律信息、政令信息等。

②經濟效益角度分類:政府收益類如各種稅收管理信息、各種費用管理信息等;財務管理類如工資管理、支付和開支管理、各種投資和建設項目的管理信息等;資源和計劃管理類如地理信息、資源信息、土地與地產管理信息、國有資產管理信息、城市規劃與建設管理信息等;市場和投資環境類如工商企業管理信息、經濟數據統計分析信息,以及各種相關的政府法規信息及服務信息等。

③社會效益角度分類:麵向居民的各種服務信息,如居民登記、護照發放、駕照發放、證件防偽係統、社會保障信息等;警察與公安管理信息,如出入境管理、罪犯管理、監獄管理、毒品管理、交通監測和管理,以及其他的公安管理信息等;公共教育和文化信息,如網絡招生入學管理、畢業證書和學位證明信息、數字圖書信息、數字博物館、社區公共信息等;醫療與保健信息,如醫院信息、遠程醫療、網上藥物銷售、器官移植資源、血液資源、醫療保險管理信息等;環境和環境保護信息,如環保信息、氣象預報、地震監測信息等。

這隻是從國家的宏觀角度上的劃分,從地方和部門內部進一步細化,將可以分出更多的信息資源類別。從分類也可以看出,政務信息資源庫應當是一個“大而全,大而精”的政府信息數據庫群,是一個從中央到地方、從各級管理部門到企業及基層社區的縱橫互聯的信息資源網。政務信息資源庫提供的是電子政務運行的動力,是實現電子政務的基礎之一。要搞好信息資源建設確是一件看起來容易,做起來複雜的任務。

我國從20世紀80年代起就開始了政務信息資源的建設。由於基礎薄弱,對如何搞好信息資源建設認識不足,經過十幾年的建設,建立了一批政務信息資源庫,但由於目標不清、標準不一,沒有建立關於信息資源利用的法律法規,形成各自為政狀態。很多建好的信息資源庫由於缺乏信息來源成了死庫,一部分庫由於無法互聯互通成了無法共享的信息孤島。因此,政務信息資源體係處於相對滯後的狀態,是製約電子政務發展的一個重大瓶頸。究其原因,就是缺乏一批統一標準、可以互聯互通的基礎政務信息資源庫。因此,要從信息資源建設的基礎工作抓起,以科學求實的態度,分類建設好若幹戰略性、宏觀性、基礎性、公益性的國家級信息資源庫。

二、常見的數據庫的基本類型

要做好信息資源建設就必須用好數據庫技術。自20世紀60年代開發成功第一代數據庫技術後至今,該技術已經過了近40年的發展,各方麵的性能已有了長足的進步,建立了較完整的數據庫理論體係,出現了一批相當成熟的數據庫平台,如Oracle、DB2、Sybase、SQL-server等等,數據庫技術的應用使信息係統有了一個可實際運行的存儲、維護信息和可向應用係統提供數據的軟件係統,為信息資源建設和管理奠定了一個有力的技術基礎。

*+,%&;amp;-。/01234

數據庫係統是存儲介質、處理對象和管理係統的集合體。它通常由軟件、數據庫和數據管理員組成。其軟件主要包括操作係統、各種宿主語言、實用程序以及數據庫管理係統。數據庫是依照某種數據模型組織起來並存放於二級存儲器中的數據集合。這些數據為多個應用服務,獨立於具體的應用程序。數據庫由數據庫管理係統統一管理,數據的插入、修改和檢索均要通過數據庫管理係統進行。

數據庫管理係統是一種係統軟件,它的主要功能是維護數據庫並有效地訪問數據庫中任意部分數據。對數據庫的維護包括保持數據的完整性、一致性和安全性。數據管理員負責創建、監控和維護整個數據庫,使數據能被任何有權使用的人有效使用。

對數據庫係統來說,要完成的管理工作包括:①要建立數據模型,使用戶可以根據數據模型訪問數據庫中的數據(如檢索、插入、刪除和修改),而不必關心數據的物理存儲位置,數據模型也要像書卡那樣能反映各種數據之間的內在聯係。②數據也應有組織地存放在存儲設備上,並建立數據模型到物理存儲位置的對應表(這種對應稱為映射),它使係統能夠按照用戶的訪問請求,找到被訪問數據的存儲位置。建立數據模型和設計數據的物理存儲(組織)方法,其目的是方便用戶對數據的應用,與數據的存放位置和存儲結構無關。後者的變動不影響前者,這稱為數據獨立性。③數據庫係統要為不同用戶確定不同的訪問權限並進行訪問控製。④提供以數據庫為基礎的各種應用服務。上述各種功能都是在數據庫管理係統(英語縮寫為DBMS)的統一管理和控製下實現的,正像一個大型公共圖書館需要有專門的工作人員負責規劃、設計、協調、維護和管理一樣。數據庫係統需要設立數據庫管理員(DBA),負責協調和監視數據庫的使用,一旦發現違反安全保密或性能下降的現象,立即采取相應地對策。因此,一個數據庫係統由數據庫、數據庫管理係統、應用程序和數據庫管理員四部分組成。一般,數據庫係統也簡稱為數據庫。

1.關係數據庫

數據庫是在文件係統的基礎上發展起來的,這種文件管理方式也就是我們在WINDOWS係統中使用的資源管理器的前身。需要先將所有的各種信息數據存放在各自的文件裏麵,當要使用這些信息數據的時候,將文件打開,讀取文件中的數據到內存中。當執行完信息處理計算過程後,將計算結果仍舊寫入到文件中去。這種工作方法雖然簡單,但有很多不足之處,如無法對數據進行有效的統一管理。應用程序的設計者需要對程序所使用的文件的邏輯結構和物理結構都了解得非常清楚。如有若幹個格式相差很大的文件協同工作,程序編製工作就會變得複雜,這樣就大大增加了編程的工作量,從而使得在文件級別上開發應用程序的效率非常低下,嚴重影響應用軟件的發展。基於操作係統的文件係統一般都不支持並行工作,這樣對於計算機來說,大多數部件在工作中處於等待狀態,對於計算機資源浪費極大。

基於文件係統的數據管理缺乏整體性、統一性,在數據的結構、編碼、表示格式等諸多方麵不能做到標準化、規範化,不同的操作係統有風格迥異的表示方式,因此在一定程度上造成了數據管理的混亂。另外,基於文件係統的數據管理的缺陷,從理論到實踐都進行了一係列的改進,至20世紀70年代初,E。F。Codd在總結當時存在的各種數據庫模型優缺點的基礎上,提出了關係數據模型的概念,提出了關係代數和關係演算(直到今天,E。F。Codd的這些基本理論還在左右著數據庫係統的發展,也依然是高校計算機專業課堂上所要講述的重要內容)。在整個70年代,關係數據庫係統無論從理論上還是實踐上都取得了豐碩的成果。在理論上,確立了完整的關係模型理論、數據依賴理論和關係數據庫的設計理論(在後麵將重點講述這些關係數據庫的基本理論);在實踐上,世界上出現了很多著名的關係數據庫係統,比較著名的如INGRES、Oracle、Sybase等。

關係模型建立在嚴密的數學概念之上,它用“二維表格”來表示事物及事物之間的聯係。反映事物的信息數據是二維表格中的元素,而二維表格即表示關係。表格中的一行稱為一個元組,相當於一個記錄;表格中的一列稱為一個屬性,相當於一個字段。屬性的取值範圍稱為域。一個或若幹個屬性的集合稱為關鍵字,它惟一地標識一個元組。表格有幾列,則稱這種關係為幾元關係。關係應滿足:①二維表中每一列中的元素是類型相同的數據;②列的順序可以任意;③行的順序也可以任意;表中的元素是不可再分的最小數據項,即一列隻能有一個屬性;表中任意兩行的記錄不能相同,表中不允許有表。因此,關係數據庫中的每一個記錄是惟一的,所有的記錄具有相同個數和類型的字段,即每一個記錄都有固定的長度和格式。具有:①對事物描述的一致性,即事物和事物之間的聯係都用關係表來表示;②可以直接表示“多對多”的聯係,如上級業務主管部門可以向各地對口部門或企業收取多種業務報表,基層單位也可以向多個上級業務部門遞送同一張業務報表;③關係規範化,不允許有表中表存在;④概念簡單、操作方便,數據獨立性高,用戶使用方便、容易掌握。

2.非關係數據庫

關係式數據庫的出現,使得大部分信息資源數據庫應用都可以使用這種方式予以解決。但是,也應看到,關係式數據庫是基於字段的記錄結構,對於文本類型的信息存儲、檢索、修改等等仍有許多不便之處,不便於對大量文本內容的查詢,而此項工作恰恰是辦公室事務處理中的重頭戲,需要一種麵向文檔處理的數據庫。非關係式數據庫就是為適應這類問題的處理而產生的。著名的LotusDomino中的數據庫就是這類數據庫的代表。首先,Notes是一個文檔數據庫管理係統。在Notes中,所有的應用都以數據庫的形式出現,所處理的對象實際就是數據庫中的文檔。這裏所說的文檔可以將其理解為前麵所講關係數據庫中的“記錄”。關係數據庫是由一個個“記錄”組成,Notes數據庫則是由一個個“文檔”組成,用戶可以使用按需求設計的數據庫管理程序在數據庫中建立文檔,並且按照定製的工作流程對文檔進行處理。每個數據庫都可以包含不同格式和類型的文檔。

文檔數據庫優於一般的關係型數據庫係統的一大特征是:它實現了對非結構化信息的存儲和管理。而這正是一般關係型數據庫係統的不足之處。

為了方便信息的管理,Notes提供了以下功能:①RTF文本域:可以在Notes文檔的RTF(一種可以在不同結構的計算機中通用的文件格式)文本域中保存多種類型的信息,例如:從其他程序(如字處理軟件、電子郵件、繪圖或關係型數據庫等)獲得的文本、表格、OLE對象、Web頁麵以及圖片、聲音和動畫等多媒體信息。②視圖和文件夾:使用視圖和文件夾來組織數據庫中的文檔,它們能方便用戶查詢數據庫中的文檔。在形似樹狀目錄結構的視圖和文件夾結構中,用戶可以根據自己的需要來選擇不同的視圖或文件夾,通過不同的視角查詢和處理文檔。③鏈接和熱點:Notes文檔中可以包含指向一個文檔、視圖(或文件夾)或數據庫的鏈接,當用戶單擊代表該鏈接的圖標時,當前窗口將切換到鏈接所指向的對象。另外,在Notes文檔中還可以包含各種熱點文本,用戶單擊熱點文本時可以顯示出文本提示框或者執行預先指定的操作。這樣,用戶就可以在一個文檔中同時訪問多個數據庫中的信息,從而提高了Notes文檔的靈活性和實時性。④搜索和索引:Notes帶有內置的全文搜索引擎,用戶可以在數據庫的搜索條件框中輸入搜索條件來搜索所需的文檔,並可按某種條件對搜索結果進行排序。另外,還可以對數據庫進行全文索引,這樣可以加速對數據庫的搜索。⑤版本跟蹤:為了體現多用戶協同工作的特性,適應工作組協同行動的需要,Notes提供了文檔的版本跟蹤功能。當一個用戶在共享數據庫中保存了文檔之後,他不必擔心因其他用戶的編輯而丟失自己所保存的內容。對文檔實行了版本跟蹤以後,Notes將把對文檔所做的修改另存為新的文檔,即原文檔的新版本。這樣,用戶對文檔進行修改就不會影響到其他用戶的工作內容。

3.多媒體型數據庫

多媒體數據庫技術是計算機多媒體處理技術與數據庫技術的結合,是當前最有吸引力的數據庫技術之一。多媒體數據信息的數據庫管理方法就是要像傳統商業數據的數據庫管理方法一樣,以數據模型為中心,支持多媒體數據間的語義關聯,相應地,把支持這種管理方式的軟件稱為多媒體數據庫管理係統(MDBMS)。由於多媒體數據庫所處理的對象比傳統的關係數據庫管理係統(RDBMS)所處理的對象要複雜得多,因此,在實現上應采取不同的技術措施,以滿足多媒體信息管理的要求。

多媒體數據庫中包含的多媒體數據有字符、數字、文本、聲音、圖像(包括視頻、動畫)、圖形等主要類型。然而聲音與圖像的媒體形式較多,如聲音可以用音樂數據:五線譜、簡譜、波表等,也有語音數據:波形數據,還可以有單聲道數據或多聲道數據。圖像數據就更複雜了。由於一種媒體格式往往又可以演變成多種,不同的媒體類型需要一些不同的處理方法,這就要求多媒體數據庫係統要有一定的可擴展性,以支持新的媒體類型和相應的處理方法。多媒體數據庫所具有的數據量龐大、類型種類多、聯係複雜、需要多種媒體的綜合表現和處理等特點,使得現有的文件係統和基於字符、數值型的數據庫管理技術難以滿足對多媒體數據管理的要求,必須研究和探索新的多媒體數據管理技術。

目前,因對多媒體數據管理的強烈要求,眾多關係數據庫廠商紛紛推出其支持多媒體數據管理的數據庫產品,一般是采取擴展關係係統的方式來實現的。其擴展體現在數據類型、存取方式、開發工具等層次上,如Borland公司的Paradox for windows就增加了四種數據類型用以管理多媒體數據,它們是動態注釋(Dynamic memo)、格式注釋(Formatted memo)、圖形(Graph)和二進製大對象(BLOB)。前兩種用於存儲文本數據,格式注釋類型還可用於描述文本的字體大小、顏色等屬性,圖形屬性可用於存儲具有標準圖形圖像格式的圖形圖像文件(如BMP、EPS、GIF、TIF及PCX等格式),BLOB類型可用於存儲任意類型的二進製數據,如可用BLOB存儲音頻和運動視頻、CAD中的圖形等。Microsoft公司的FoxPro2.5forWindows中引入了一個新的屬性類型General,它可以存放包括文本、圖形、圖像或聲音在內的任何一種多媒體數據。Informix在Informix--Online中引入了BLOB類型,使之可以把高達2GB的數據存放到該域之中,考慮到係統的效率,專門開設了BLOB空間區,使之與非BLOB數據分開存儲。Sybase、Oracle都在此方麵做了一些努力,如Oracle7.0有文本和視頻兩個服務器及一個源程序編輯工具集Media Object。

但是我們也應看到,在多媒體信息數據檢索、索引等方麵,尚有許多沒有解決的問題,因此多媒體數據庫尚屬於需要進一步完善探討的技術,使用現有的多媒體數據庫時必須注意條件和範圍。

4.數據倉庫

現代政府機構經常麵臨各種挑戰和決策,如何最大限度地挖掘各種有用信息,也為計算機信息處理技術提出了新的要求。例如,如何支持數據集成,因為在政府的發展過程中已建立了許多的應用係統,如公文管理、財務管理及人事管理等,積累了大量數據,並且原有應用可能是針對某個部門獨立設計的,這樣,如何去運行新的應用,使這些應用可以用到已有的數據;又如,業務部門除對日常業務數據進行增、刪、改等事務處理和簡單彙總外,決策者往往要綜合利用曆史的和現在的各種數據進行綜合分析。這些應用對於業務處理頻繁的數據庫係統而言,將成為沉重的負擔。

數據倉庫麵向複雜的數據分析,以支持決策過程,而且可以集成企業範圍內的數據。它把支持決策的數據進行收集、歸納、整理,使企業的業務操作環境和信息分析環境分離,從而有效地提供實施的信息服務。

數據倉庫有這樣幾個基本特性:①數據倉庫是“麵向主題的數據組織方式”,即對應於某一個宏觀分析的領域所涉及的分析對象,可以根據最終用戶的觀點組織和提供數據。②數據倉庫是集成數據的統一體。即數據倉庫的內容來自於前幾節所描述的各種傳統數據庫內所累積的大量事務處理數據。經處理後將不同數據庫的數據形成了整合的、結構化的、易於導航的數據,能夠對決策分析進行快速、正確的響應。③數據倉庫在一定時間內保持穩定性。一般事務性操作的數據庫按工作需要經常進行數據增加、刪除、修改的操作,而數據倉庫的內容主要是大量曆史數據,是對不同時期數據資料的綜合、重組、統計導出的數據集合,一般關注於查詢,僅必要時更新數據。所以數據倉庫在一個較長的時期內要保持數據穩定,對其操作一般都是數據的讀取。④數據倉庫比較強調時間序列性。數據倉庫的內容是對事務性數據庫內容的帶有時間標記的整合,以時間變化的動態過程來發現和挖掘事物發展和變化的規律,使得決策查詢變得更容易、有效。

由這些特點我們可以看出,數據倉庫是麵向高層決策者使用的信息數據資源。而數據倉庫是要建立在平時基礎應用數據庫內大量數據積累的基礎之上的,隻有搞好基礎信息資源建設,才能為決策服務提供堅實的信息數據依據。

*+,%&;amp;-。/0123456

由於信息資源要被有共享權的一切單位和個人使用,因此,信息資源的利用和計算機網絡的使用是分不開的。分布在計算機網絡中每一個節點上的計算機,必須要通過一種數據存取的體係結構來獲得信息資源,並通過技術手段得到維護和發展。這對於信息資源的利用和信息資源的安全很重要。了解信息資源數據庫在網絡中的工作結構,正確利用技術手段也是很必要的。

1.客戶/服務器型

客戶/服務器結構包括連接在一個網絡中的多台計算機。那些處理應用程序、請求另一計算機的服務的計算機稱為客戶機(Client)。而處理數據庫的計算機稱為服務器(Server)。所有用戶都擁有自己的計算機來處理應用程序。

客戶機計算機可以是大型機、小型機或微機,但是由於微機具有成本優勢,因此常被作為客戶機使用。同樣地,服務器通常是一台微機,但在需要較大能力時,也可以使用大型機或小型機。在數據庫環境下,通過若幹稱作中間件的程序設計接口,客戶機可以與服務器通信。這些接口提供應用程序和數據庫之間的連通性。

雖然上麵圖中隻有一個服務器,但客戶/服務器結構也可以包括多個服務器。然而在這種情況下,每個服務器必定隻處理一個不同的數據庫或提供一個惟一的服務。(注意:使用兩個或多個服務器來處理同一個數據庫的結構不認為是客戶/服務器係統,相反它是一個分布式數據庫係統)。

客戶/服務器是將處理工作分散到工作站和服務器上去處理,服務器不僅負責存取數據,還要對數據作一定的處理工作,這樣在數據發送給工作站之前即求得查詢結果集,從而在大部分情況下可大大減少網絡傳輸的開銷,因此,也減輕了工作處理負擔,從而隻需關心用戶界麵的處理工作即可。