跳到主要內容

CKAN資料模型研究

  • ckan版本:2.7
  • 測試日期:2018/10/03

CKAN (Comprehensive Knowledge Archive Network)是由英國Open Knowledge International(本來叫Open Knowledge Foundation)所開發的資料管理系統,廣泛為各國家政府資料公開入口網採用,如美國、英國、日本、巴西、歐盟‧‧‧等都採用CKAN。

CKAN主要是由Python語言寫成,採用PCA(PyUtilib Component Architecture)擴充其功能,資料庫使用PostgreSQL,搜尋引擎使用Solr,HTTP伺服器使用Apache和Nginx

CKAN的資料模型如下圖

image

CKAN資料模型特色有五:

1.以package為中心,以organization-package-resource為主軸的三層式架構

2.package屬於組織或群組,只可以屬於單一組織,可以屬於多個群組

3.package包含許多resource,resource代表不同資料格式的package,例如一個資料集,可以有csv、excel、xml三種資料格式

4.描述package的詮釋資料,只定義極精簡的幾個主要欄位,其他未定義部分,則留給各網站利用package_extra的方式進行擴充

  • 位於核心的package,也稱作資料集(dataset)只定義名稱(name)、標題(title)、版本(version)、網址(url)、作者(author)、授權條款(license)、附註(notes)七個詮釋資料欄位,其餘的詮釋資料,都以package_extra欄位形式進行擴充。
  • 資源(resource)也稱作發布(distribution),也只定義網址(url)、格式(format)、描述(description)、雜湊(hash) 四個詮釋資料欄位,其餘的詮釋資料再由應用開發者自行擴充

5.CKAN沒有目錄(Catalog)的概念,目錄在DCAT是用來組織與收集資料集之用,CKAN是以Organization/Group來組織與收集資料,而組織在DCAT是屬於發行者這個詮釋資料欄位。

留言

這個網誌中的熱門文章

CKAN Template Index.html架構

(1)Index.html頁面呈現 (2)Index.html實際架構 (3)Index.html內容 (4)layout1.html(snippet)內容 (5)Bootstrap2 Grid System Ckan首頁的例子是用2個span6,也就是平均分配

ISO/IEC 25012資料品質研究

ISO/IEC 25012共定義了15種資料品質特性,可以被歸類3個主要的分類 第一類:固有資料品質(Inherent Data Quality) 第二類:系統相依資料品質(System-Dependent Data Quality) 第三類:固有及系統相依資料品質(Inherent and System-Dependent Data Quality )

CKAN Template Index.html snippets內容

(1)promted.html內容 (2)search.html內容 (3)featured_group.html內容 (4)featured_organization.html內容