跳到主要內容

發表文章

RDF在語義網中的定位

(一)W3C 語義網概觀 (二)W3C語義網細觀 (三)語義網相關國際標準
最近的文章

RDF技術簡介

RDF(Resource Description Framework,資源描述框架)是 –W3C定義,描述網際網路上「資源」的「資料模型」     •資源可以是任何事物,包含文件、人物、實體物件和抽象概念‧‧‧等 –RDF使用三元組(Triple)的方式來描述「資源」     •三元組為<主詞><述詞><受詞> ( <subject> <predicate> <object> )     •RDF可形成一有向圖網路    –RDF概念範例     •<Bob> <is a> <person>.     •<Bob> <is a friend of> <Alice>.     •<Bob> <is born on> <the 4th of July 1990>.     •<Bob> <is interested in> <the Mona Lisa>.     •<the Mona Lisa> <was created by> <Leonardo da Vinci>.     •<the video 'La Joconde à Washington'> <is about> <the Mona Lisa>      –LD(Linked Data)即是將資料表示為RDF,各資源互相鏈結 RDF的主詞、述詞與受詞 RDF資料格式 –RDF為資料模型,實際應用時需表現為資料格式    •RDFa用於網頁    •Turtle用於資料交換、config檔    •JSON-LD為JSON的LD版本

DCAT-AP資料模型研究

DCAT-AP(Data Catalog Vocabulary Application Profile)是歐盟以W3C公布的DCAT為基礎所設計的資料目錄推薦標準 DCAT-AP的資料模型如下圖 DCAT-AP資料模型的特色有: 1.以Dataset為中心,以Catalog-Dataset-Distribution為主軸的三層式架構

DCAT資料模型研究

DCAT(Data Catalog Vocabulary)是W3C公布的資料目錄推薦標準 DCAT的資料模型如下圖 DCAT資料模型的特色有: 1.是RDF字彙,大量重用既有的RDF字彙,如Dublin Core字彙、FOAF字彙、SKOS字彙與XML Data Type字彙,RDF字彙在W3C Semactic Web Stack中佔重要位置 2.以Dataset為中心,以Catalog-Dataset-Distribution為主軸的三層式架構 3.以SKOS(Simple Knowledge Organization System,簡單知識整理系統)做為分類的字彙,Dataset的dcat:theme採用skos:Concept,Catalog的dcat:themeTaxonomy採用skos:ConceptScheme 4.定義了以profile進行DCAT擴充的做法,profile可對DCAT進行以下的擴充 最少的必需詮釋資料欄位 新增DCAT中沒包含的類別和屬性 定義控制字彙或URI來做為屬性的可接受值 新增特定的資料存取機制 歐盟的DCAT-AP(Application profile)即是DCAT profile的一個好例子。

ISO/IEC 25012資料品質研究

ISO/IEC 25012共定義了15種資料品質特性,可以被歸類3個主要的分類 第一類:固有資料品質(Inherent Data Quality) 第二類:系統相依資料品質(System-Dependent Data Quality) 第三類:固有及系統相依資料品質(Inherent and System-Dependent Data Quality )

CKAN資料模型研究

ckan版本:2.7 測試日期:2018/10/03 CKAN (Comprehensive Knowledge Archive Network)是由英國Open Knowledge International(本來叫Open Knowledge Foundation)所開發的資料管理系統,廣泛為各國家政府資料公開入口網採用,如美國、英國、日本、巴西、歐盟‧‧‧等都採用CKAN。 CKAN主要是由Python語言寫成,採用PCA(PyUtilib Component Architecture)擴充其功能,資料庫使用PostgreSQL,搜尋引擎使用Solr,HTTP伺服器使用Apache和Nginx CKAN的資料模型如下圖 CKAN資料模型特色有五: 1.以package為中心,以organization-package-resource為主軸的三層式架構 2.package屬於組織或群組,只可以屬於單一組織,可以屬於多個群組 3.package包含許多resource,resource代表不同資料格式的package,例如一個資料集,可以有csv、excel、xml三種資料格式 4.描述package的詮釋資料,只定義極精簡的幾個主要欄位,其他未定義部分,則留給各網站利用package_extra的方式進行擴充 位於核心的package,也稱作資料集(dataset)只定義名稱(name)、標題(title)、版本(version)、網址(url)、作者(author)、授權條款(license)、附註(notes)七個詮釋資料欄位,其餘的詮釋資料,都以package_extra欄位形式進行擴充。 資源(resource)也稱作發布(distribution),也只定義網址(url)、格式(format)、描述(description)、雜湊(hash) 四個詮釋資料欄位,其餘的詮釋資料再由應用開發者自行擴充 5.CKAN沒有目錄(Catalog)的概念,目錄在DCAT是用來組織與收集資料集之用,CKAN是以Organization/Group來組織與收集資料,而組織在DCAT是屬於發行者這個詮釋資料欄位。

一塊錢的啟示

今年中秋,我們上觀霧過節,全家都很興奮。 原本六月多就有規劃要去,當時遇到颱風環流下雨,就向觀霧山莊延期,改去野柳,這次又在同樣的地方、遇到同樣的情景:遇到下雨、在竹東橫山交界處停等、太太覺得危險不想去、開始survey可以改去什麼地方、準備向觀霧山莊延期‧‧‧ 我有點氣餒,全家要挪出時間不容易,觀霧又是容易下雨的地方,這樣下去,我覺得會去不成,然後預交的保證金會送給觀霧,嗚‧‧‧嗚‧‧‧嗚‧‧‧ 我看了氣象,發現下午6點雨會停,然後隔天只有中午到下午3點有雨,抱著就相信中央氣象局這一回,和太太溝通,然後懷抱著信心和勇氣出發! (過程略‧‧‧‧) 隔天早上,看完日出,吃完美味豐盛的早餐,重頭戲就是要走步道,但這時快四歲的女兒,怎麼都不肯走!任憑我和太太用盡各種方法都不肯走,平常有效的餅乾、優格都失去效用了,好不容易上山了,又遇到這種情形,又不能生氣>.< 最後是太太先往前走,我帶著女兒在山莊附近繞,山莊附近有個便利店,便利店外有個公用電話,女兒一直不走,一直要打電話,還說都沒有聲音,我隨手投了一塊錢,這樣就會有聲音了,後來女兒把電話掛掉,一塊錢掉出來,她覺得很希奇,我靈機一動,和她說:「我們快告訴媽媽,電話掉出一塊錢了!」她說好,我們就趕快往前走!步道就走成了!!! 這件事給我的啟示是:就算只有一塊錢,只要用對地方,也能發揮不可思議的功用! BTW,全台灣的父母,大家辛苦了!