當前位置:首頁 > 百科知識 > 工控 > 正文

數(shù)據(jù)

數(shù)據(jù)(data)是事實或觀察的結果,是對客觀事物的邏輯歸納,是用于表示客觀事物的未經加工的的原始素材。 數(shù)據(jù)是信息的表現(xiàn)形式和載體,可以是符號、文字、數(shù)字、語音、圖像、視頻等。數(shù)據(jù)和信息是不可分離的,數(shù)據(jù)是信息的表達,信息是數(shù)據(jù)的內涵。數(shù)據(jù)本身沒有意義,數(shù)據(jù)只有對實體行為產生影響時才成為信息。 數(shù)據(jù)可以是連續(xù)的值,比如聲音、圖像,稱為模擬數(shù)據(jù)。也可以是離散的,如符號、文字,稱為數(shù)字數(shù)據(jù)。 在計算機系統(tǒng)中,數(shù)據(jù)以二進制信息單元0,1的形式表示。

  基本介紹

  在計算機系統(tǒng)中,各種字母、數(shù)字符號的組合、語音、圖形、圖像等統(tǒng)稱為數(shù)據(jù),數(shù)據(jù)經過加工后就成為信息。

  在計算機科學中,數(shù)據(jù)是指所有能輸入到計算機并被計算機程序處理的符號的介質的總稱,是用于輸入電子計算機進行處理,具有一定意義的數(shù)字、字母、符號和模擬量等的通稱。是組成地理信息系統(tǒng)的最基本要素,種類很多。

  分類

  按性質分為

  ①定位的,如各種坐標數(shù)據(jù);

  ②定性的,如表示事物屬性的數(shù)據(jù)(居民地、河流、道路等);

 ?、鄱康?,反映事物數(shù)量特征的數(shù)據(jù),如長度、面積、體積等幾何量或重量、速度等物理量;

  ④定時的,反映事物時間特性的數(shù)據(jù),如年、月、日、時、分、秒等。

  按表現(xiàn)形式分為

  ①數(shù)字數(shù)據(jù),如各種統(tǒng)計或量測數(shù)據(jù)。數(shù)字數(shù)據(jù)在某個區(qū)間內是離散的值[1];

 ?、谀M數(shù)據(jù),由連續(xù)函數(shù)組成,是指在某個區(qū)間連續(xù)變化的物理量,又可以分為圖形數(shù)據(jù)(如點、線、面)、符號數(shù)據(jù)、文字數(shù)據(jù)和圖像數(shù)據(jù)等,如聲音的大小和溫度的變化等。

  按記錄方式分為

  地圖、表格、影像、磁帶、紙帶。按數(shù)字化方式分為矢量數(shù)據(jù)、格網(wǎng)數(shù)據(jù)等。在地理信息系統(tǒng)中,數(shù)據(jù)的選擇、類型、數(shù)量、采集方法、詳細程度、可信度等,取決于系統(tǒng)應用目標、功能、結構和數(shù)據(jù)處理、管理與分析的要求。

  數(shù)據(jù)庫

  數(shù)據(jù)庫的定義

  數(shù)據(jù)庫是依照某種數(shù)據(jù)模型組織起來并存放二級存儲器中的數(shù)據(jù)集合。這種數(shù)據(jù)集合具有如下特點:盡可能不重復,以最優(yōu)方式為某個特定組織的多種應用服務,其數(shù)據(jù)結構獨立于使用它的應用程序,對數(shù)據(jù)的增、刪、改和檢索由統(tǒng)一軟件進行管理和控制。從發(fā)展的歷史看,數(shù)據(jù)庫是數(shù)據(jù)管理的高級階段,它是由文件管理系統(tǒng)發(fā)展起來的。

  數(shù)據(jù)庫的層次

  數(shù)據(jù)庫的基本結構分三個層次,反映了觀察數(shù)據(jù)庫的三種不同角度。

  (1)物理數(shù)據(jù)層。它是數(shù)據(jù)庫的最內層,是物理存貯設備上實際存儲的數(shù)據(jù)的集合。這些數(shù)據(jù)是原始數(shù)據(jù),是用戶加工的對象,由內部模式描述的指令操作處理的位串、字符和字組成。

  (2)概念數(shù)據(jù)層。它是數(shù)據(jù)庫的中間一層,是數(shù)據(jù)庫的整體邏輯表示。指出了每個數(shù)據(jù)的邏輯定義及數(shù)據(jù)間的邏輯聯(lián)系,是存貯記錄的集合。它所涉及的是數(shù)據(jù)庫所有對象的邏輯關系,而不是它們的物理情況,是數(shù)據(jù)庫管理員概念下的數(shù)據(jù)庫。

  (3)邏輯數(shù)據(jù)層。它是用戶所看到和使用的數(shù)據(jù)庫,表示了一個或一些特定用戶使用的數(shù)據(jù)集合,即邏輯記錄的集合。

  數(shù)據(jù)庫的特點

  數(shù)據(jù)庫不同層次之間的聯(lián)系是通過映射進行轉換的。數(shù)據(jù)庫具有以下主要特點:

  (1)實現(xiàn)數(shù)據(jù)共享。數(shù)據(jù)共享包含所有用戶可同時存取數(shù)據(jù)庫中的數(shù)據(jù),也包括用戶可以用各種方式通過接口使用數(shù)據(jù)庫,并提供數(shù)據(jù)共享。

  (2)減少數(shù)據(jù)的冗余度。同文件系統(tǒng)相比,由于數(shù)據(jù)庫實現(xiàn)了數(shù)據(jù)共享,從而避免了用戶各自建立應用文件。減少了大量重復數(shù)據(jù),減少了數(shù)據(jù)冗余,維護了數(shù)據(jù)的一致性。

  (3)數(shù)據(jù)的獨立性。數(shù)據(jù)的獨立性包括數(shù)據(jù)庫中數(shù)據(jù)庫的邏輯結構和應用程序相互獨立,也包括數(shù)據(jù)物理結構的變化不影響數(shù)據(jù)的邏輯結構。

  (4)數(shù)據(jù)實現(xiàn)集中控制。文件管理方式中,數(shù)據(jù)處于一種分散的狀態(tài),不同的用戶或同一用戶在不同處理中其文件之間毫無關系。利用數(shù)據(jù)庫可對數(shù)據(jù)進行集中控制和管理,并通過數(shù)據(jù)模型表示各種數(shù)據(jù)的組織以及數(shù)據(jù)間的聯(lián)系。

  (5)數(shù)據(jù)一致性和可維護性,以確保數(shù)據(jù)的安全性和可靠性。主要包括:①安全性控制:以防止數(shù)據(jù)丟失、錯誤更新和越權使用;②完整性控制:保證數(shù)據(jù)的正確性、有效性和相容性;③并發(fā)控制:使在同一時間周期內,允許對數(shù)據(jù)實現(xiàn)多路存取,又能防止用戶之間的不正常交互作用;④故障的發(fā)現(xiàn)和恢復:由數(shù)據(jù)庫管理系統(tǒng)提供一套方法,可及時發(fā)現(xiàn)故障和修復故障,從而防止數(shù)據(jù)被破壞。

  數(shù)據(jù)倉庫

  數(shù)據(jù)倉庫的定義

  著名的數(shù)據(jù)倉庫專家W.H.Inmon在其著作《buildingthedatawarehouse》一書中給予如下描述:數(shù)據(jù)倉庫(datawarehouse)是一個面向主題的(subjectoriented)、集成的(integrate)、相對穩(wěn)定的(non-volatile)、反映歷史變化(timevariant)的數(shù)據(jù)集合,用于支持管理決策。對于數(shù)據(jù)倉庫的概念我們可以從兩個層次予以理解,首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構的數(shù)據(jù)源有效集成,集成后按照主題進行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。

  數(shù)據(jù)倉庫的特點

  根據(jù)數(shù)據(jù)倉庫概念的含義,數(shù)據(jù)倉庫擁有以下四個特點:

  1、面向主題。操作型數(shù)據(jù)庫的數(shù)據(jù)組織面向事務處理任務,各個業(yè)務系統(tǒng)之間各自分離,而數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進行組織。主題是一個抽象的概念,是指用戶使用數(shù)據(jù)倉庫進行決策時所關心的重點方面,一個主題通常與多個操作型信息系統(tǒng)相關。

  2、集成的。面向事務處理的操作型數(shù)據(jù)庫通常與某些特定的應用相關,數(shù)據(jù)庫之間相互獨立,并且往往是異構的。而數(shù)據(jù)倉庫中的數(shù)據(jù)是在對原有分散的數(shù)據(jù)庫數(shù)據(jù)抽取、清理的基礎上經過系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉庫內的信息是關于整個企業(yè)的一致的全局信息。

  3、相對穩(wěn)定的。操作型數(shù)據(jù)庫中的數(shù)據(jù)通常實時更新,數(shù)據(jù)根據(jù)需要及時發(fā)生變化。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個數(shù)據(jù)進入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。

  4、反映歷史變化。操作型數(shù)據(jù)庫主要關心當前某一個時間段內的數(shù)據(jù),而數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時點(如開始應用數(shù)據(jù)倉庫的時點)到目前的各個階段的信息,通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預測。

  數(shù)據(jù)倉庫的建設

  企業(yè)數(shù)據(jù)倉庫的建設,是以現(xiàn)有企業(yè)業(yè)務系統(tǒng)和大量業(yè)務數(shù)據(jù)的積累為基礎。數(shù)據(jù)倉庫不是靜態(tài)的概念,只有把信息及時交給需要這些信息的使用者,供他們做出改善其業(yè)務經營的決策,信息才能發(fā)揮作用,信息才有意義。而把信息加以整理歸納和重組,并及時提供給相應的管理決策人員,是數(shù)據(jù)倉庫的根本任務。因此,從產業(yè)界的角度看,數(shù)據(jù)倉庫建設是一個工程,是一個過程。


內容來自百科網(wǎng)