企業(yè)數(shù)據(jù)的采集信息

  

  

企業(yè)數(shù)據(jù)的采集信息的數(shù)據(jù)可以匯聚不同于數(shù)據(jù)采集,數(shù)據(jù)采集有一定的數(shù)據(jù)生產(chǎn)屬性,將終端的用戶行為信息通過特定的方法記錄后,通過中間系統(tǒng)的流轉(zhuǎn)寫入目標(biāo)存儲(chǔ)中。當(dāng)然,也能通過某種形式在某個(gè)數(shù)據(jù)源中落地,如數(shù)據(jù)庫或日志文件等,然后通過數(shù)據(jù)匯聚的能力實(shí)現(xiàn)數(shù)據(jù)采集和存儲(chǔ)。


企業(yè)數(shù)據(jù)的采集信息


從數(shù)據(jù)組織形式來分,數(shù)據(jù)主要分成三類:

結(jié)構(gòu)化數(shù)據(jù):規(guī)則、完整,能夠通過二維邏輯來表現(xiàn)的數(shù)據(jù),嚴(yán)格遵循數(shù)據(jù)格式與長(zhǎng)度規(guī)范,常見的有數(shù)據(jù)庫表、Excel等二維表。

半結(jié)構(gòu)化數(shù)據(jù):數(shù)據(jù)規(guī)則、完整,同樣嚴(yán)格遵循數(shù)據(jù)格式與長(zhǎng)度規(guī)范,但無法通過二維關(guān)系來表現(xiàn),常見如JSON、XML等形式表達(dá)的復(fù)雜結(jié)構(gòu)。

非結(jié)構(gòu)化數(shù)據(jù):數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,不方便用二維邏輯表來表現(xiàn),需要經(jīng)過復(fù)雜的邏輯處理才能提取其中的信息內(nèi)容,如辦公文檔、圖片、圖像和音視頻等。
  
相關(guān)資訊

推薦軟件