文章詳情頁(yè)
關(guān)聯(lián)數(shù)據(jù)入門(mén)——RDF應(yīng)用
瀏覽:113日期:2022-06-04 11:11:02
引言
語(yǔ)義網(wǎng)(Semantic Web)是一種數(shù)據(jù)的網(wǎng)絡(luò),讓數(shù)據(jù)得以共享,而不僅僅是被應(yīng)用程序束縛。
但語(yǔ)義網(wǎng)也不僅僅是把數(shù)據(jù)放在互聯(lián)網(wǎng)上,而是試圖將數(shù)據(jù)聯(lián)系起來(lái),并產(chǎn)生數(shù)據(jù)與現(xiàn)實(shí)事物的聯(lián)系,以方便人與機(jī)器閱讀與理解這些數(shù)據(jù)。
The Semantic Web isn"t just about putting data on the web. It is about making links, so that a person or machine can explore the web of data.
——Linked Data Design Issues . Tim Berners-Lee
關(guān)聯(lián)數(shù)據(jù)(Linked Data)是第一種可行的語(yǔ)義網(wǎng)表達(dá)形式,它采用RDF數(shù)據(jù)模型,利用URI(統(tǒng)一資源標(biāo)識(shí)符)命名數(shù)據(jù)實(shí)體,來(lái)發(fā)布和部署實(shí)例數(shù)據(jù)和類(lèi)數(shù)據(jù),從而可以通過(guò)HTTP協(xié)議揭示并獲取這些數(shù)據(jù),同時(shí)強(qiáng)調(diào)數(shù)據(jù)的相互關(guān)聯(lián)、相互聯(lián)系以及有益于人機(jī)理解的語(yǔ)境信息。
Linked data is a set of best practices for publishing and deploying instance and class data using the RDF data model, and uses uniform resource identifiers (URIs) to name the data objects. The approach exposes the data for access via the HTTP protocol, while emphasizing data interconnections, interrelationships and context useful to both humans and machine agents.
——Linked Data FAQ . M.K. Bergman
因?yàn)檎Z(yǔ)義網(wǎng)是一項(xiàng)龐大的工程,并相伴著各種困難,使其成為一種長(zhǎng)期目標(biāo)與愿景,而關(guān)系數(shù)據(jù)是一類(lèi)實(shí)踐活動(dòng),其可行并實(shí)用,成為當(dāng)前語(yǔ)義網(wǎng)實(shí)現(xiàn)的一種最佳可行方案。
RDF的特點(diǎn)
資源描述框架(Resource Description Framework),作為XML(Extensible Markup Language)的一種衍生版本,他是關(guān)聯(lián)數(shù)據(jù)的基本數(shù)據(jù)模型。蒂姆·伯納斯-李(Tim Berners-Lee)在設(shè)計(jì)它的時(shí)候面臨了以下兩個(gè)問(wèn)題:
•怎樣去設(shè)計(jì)方便易學(xué)易于傳播并適合標(biāo)準(zhǔn)化的語(yǔ)言?
•怎樣去設(shè)計(jì)離散數(shù)據(jù)的入口和出口?
為了解決這兩個(gè)問(wèn)題,RDF有以下一些特點(diǎn):
•使用XML作為基本語(yǔ)言
•使用URIs作為現(xiàn)實(shí)事物的名字
•使用HTTP URIs使人們知道如何通過(guò)名字在網(wǎng)絡(luò)中尋找數(shù)據(jù)(即創(chuàng)建離散數(shù)據(jù)入口)
•包含與其他URIs的聯(lián)系,使人們可以通過(guò)其找到更多有用的東西(即創(chuàng)建離散數(shù)據(jù)出口)
•使用三元組(Triple)形式存儲(chǔ)數(shù)據(jù)
實(shí)際上,一些RDF版本并非使用XML語(yǔ)言,這里主要指的是初始版本。
一個(gè)簡(jiǎn)單的RDF例子
復(fù)制代碼 代碼如下:
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.w3.org/">
<dc:title>World Wide Web Consortium</dc:title>
</rdf:Description>
</rdf:RDF>
將該RDF例子通過(guò)W3C RDF驗(yàn)證服務(wù),會(huì)出現(xiàn)以下列表:
Triples of the Data Model
Number Subject Predicate Object 1 http://www.w3.org/ http://purl.org/dc/elements/1.1/title "World Wide Web Consortium"
這是啥東東?
三元組(Triple),RDF數(shù)據(jù)模型的基本表現(xiàn)單元。所謂三元組就是:主(Subject)-謂(Predicate)-賓(Object)。
A triple store is designed to store and retrieve identities that are constructed from triplex collections of strings (sequences of letters). These triplex collections represent a subject-predicate-object relationship that more or less corresponds to the definition put forth by the RDF standard.
——Triple Store . Jack Rusher
不同于關(guān)系數(shù)據(jù),其數(shù)據(jù)本身沒(méi)有龐大的聯(lián)系(這在數(shù)據(jù)網(wǎng)絡(luò)如此龐大的數(shù)據(jù)面前也是不可行的),而是使用類(lèi)似人類(lèi)陳述語(yǔ)句(Statement)的方式來(lái)存儲(chǔ)數(shù)據(jù),例如:
•Tom is a man.(Tom是個(gè)男人)
•Tom lives in a red house.(Tom住在一個(gè)紅房子里)
•Tom married with Lili.(Tom和Lili結(jié)婚了)
可見(jiàn)三元組形式也有強(qiáng)大的數(shù)據(jù)存儲(chǔ)表達(dá)潛力,人類(lèi)正是這種形式的長(zhǎng)期受益者。當(dāng)然像上面這么表述對(duì)人類(lèi)友好,但對(duì)機(jī)器卻不怎么友好,因?yàn)檫@種謂語(yǔ)對(duì)于賓語(yǔ)并沒(méi)有良好的限定,至少機(jī)器不這么認(rèn)為。所以我們應(yīng)該寫(xiě)成這樣的模式:
•Tom(Tom) sex(性別) man(男)
•Tom(Tom) house(房子) red(紅色)
•Tom(Tom) wife(妻子) Lili(Lili)
回到標(biāo)題,這是什么東東?其表述了下列內(nèi)容:
1.http://www.w3.org (表示該陳述是描述的主體是什么,由于HTTP URI映射現(xiàn)實(shí)事物,所以可以看做該是對(duì)什么現(xiàn)實(shí)事物的描述)
2.http://purl.org/dc/elements/1.1/title (主體的屬性,一般表示賓體的類(lèi)型,例如dc:title是都柏林核心中用來(lái)指明資源名稱(chēng)的,即客體是該資源的一個(gè)名字)
3.World Wide Web Consortium (客體)
別人是如何獲得RDF的?
下圖說(shuō)明了這個(gè)過(guò)程:
•首先先對(duì)HTTP URI進(jìn)行請(qǐng)求。
•通常瀏覽器HTTP請(qǐng)求頭是:text/html、application/xhtml+xml類(lèi)型,故服務(wù)器返回一般html/xhtml文檔。
•但對(duì)于語(yǔ)義瀏覽器,其HTTP請(qǐng)求頭是:application/rdf+xml類(lèi)型,故服務(wù)器進(jìn)行303重定向,得到相應(yīng)RDF文件。
也就是說(shuō),對(duì)于一個(gè)HTTP URI可以返回兩種表達(dá)形式:文檔和數(shù)據(jù)。這樣就建立了兩種不同的網(wǎng)絡(luò),一個(gè)利于人類(lèi)閱讀的文檔網(wǎng),另一種是利于機(jī)器閱讀的數(shù)據(jù)網(wǎng)。
語(yǔ)義網(wǎng)(Semantic Web)是一種數(shù)據(jù)的網(wǎng)絡(luò),讓數(shù)據(jù)得以共享,而不僅僅是被應(yīng)用程序束縛。
但語(yǔ)義網(wǎng)也不僅僅是把數(shù)據(jù)放在互聯(lián)網(wǎng)上,而是試圖將數(shù)據(jù)聯(lián)系起來(lái),并產(chǎn)生數(shù)據(jù)與現(xiàn)實(shí)事物的聯(lián)系,以方便人與機(jī)器閱讀與理解這些數(shù)據(jù)。
The Semantic Web isn"t just about putting data on the web. It is about making links, so that a person or machine can explore the web of data.
——Linked Data Design Issues . Tim Berners-Lee
關(guān)聯(lián)數(shù)據(jù)(Linked Data)是第一種可行的語(yǔ)義網(wǎng)表達(dá)形式,它采用RDF數(shù)據(jù)模型,利用URI(統(tǒng)一資源標(biāo)識(shí)符)命名數(shù)據(jù)實(shí)體,來(lái)發(fā)布和部署實(shí)例數(shù)據(jù)和類(lèi)數(shù)據(jù),從而可以通過(guò)HTTP協(xié)議揭示并獲取這些數(shù)據(jù),同時(shí)強(qiáng)調(diào)數(shù)據(jù)的相互關(guān)聯(lián)、相互聯(lián)系以及有益于人機(jī)理解的語(yǔ)境信息。
Linked data is a set of best practices for publishing and deploying instance and class data using the RDF data model, and uses uniform resource identifiers (URIs) to name the data objects. The approach exposes the data for access via the HTTP protocol, while emphasizing data interconnections, interrelationships and context useful to both humans and machine agents.
——Linked Data FAQ . M.K. Bergman
因?yàn)檎Z(yǔ)義網(wǎng)是一項(xiàng)龐大的工程,并相伴著各種困難,使其成為一種長(zhǎng)期目標(biāo)與愿景,而關(guān)系數(shù)據(jù)是一類(lèi)實(shí)踐活動(dòng),其可行并實(shí)用,成為當(dāng)前語(yǔ)義網(wǎng)實(shí)現(xiàn)的一種最佳可行方案。
RDF的特點(diǎn)
資源描述框架(Resource Description Framework),作為XML(Extensible Markup Language)的一種衍生版本,他是關(guān)聯(lián)數(shù)據(jù)的基本數(shù)據(jù)模型。蒂姆·伯納斯-李(Tim Berners-Lee)在設(shè)計(jì)它的時(shí)候面臨了以下兩個(gè)問(wèn)題:
•怎樣去設(shè)計(jì)方便易學(xué)易于傳播并適合標(biāo)準(zhǔn)化的語(yǔ)言?
•怎樣去設(shè)計(jì)離散數(shù)據(jù)的入口和出口?
為了解決這兩個(gè)問(wèn)題,RDF有以下一些特點(diǎn):
•使用XML作為基本語(yǔ)言
•使用URIs作為現(xiàn)實(shí)事物的名字
•使用HTTP URIs使人們知道如何通過(guò)名字在網(wǎng)絡(luò)中尋找數(shù)據(jù)(即創(chuàng)建離散數(shù)據(jù)入口)
•包含與其他URIs的聯(lián)系,使人們可以通過(guò)其找到更多有用的東西(即創(chuàng)建離散數(shù)據(jù)出口)
•使用三元組(Triple)形式存儲(chǔ)數(shù)據(jù)
實(shí)際上,一些RDF版本并非使用XML語(yǔ)言,這里主要指的是初始版本。
一個(gè)簡(jiǎn)單的RDF例子
復(fù)制代碼 代碼如下:
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.w3.org/">
<dc:title>World Wide Web Consortium</dc:title>
</rdf:Description>
</rdf:RDF>
將該RDF例子通過(guò)W3C RDF驗(yàn)證服務(wù),會(huì)出現(xiàn)以下列表:
Triples of the Data Model
Number Subject Predicate Object 1 http://www.w3.org/ http://purl.org/dc/elements/1.1/title "World Wide Web Consortium"
這是啥東東?
三元組(Triple),RDF數(shù)據(jù)模型的基本表現(xiàn)單元。所謂三元組就是:主(Subject)-謂(Predicate)-賓(Object)。
A triple store is designed to store and retrieve identities that are constructed from triplex collections of strings (sequences of letters). These triplex collections represent a subject-predicate-object relationship that more or less corresponds to the definition put forth by the RDF standard.
——Triple Store . Jack Rusher
不同于關(guān)系數(shù)據(jù),其數(shù)據(jù)本身沒(méi)有龐大的聯(lián)系(這在數(shù)據(jù)網(wǎng)絡(luò)如此龐大的數(shù)據(jù)面前也是不可行的),而是使用類(lèi)似人類(lèi)陳述語(yǔ)句(Statement)的方式來(lái)存儲(chǔ)數(shù)據(jù),例如:
•Tom is a man.(Tom是個(gè)男人)
•Tom lives in a red house.(Tom住在一個(gè)紅房子里)
•Tom married with Lili.(Tom和Lili結(jié)婚了)
可見(jiàn)三元組形式也有強(qiáng)大的數(shù)據(jù)存儲(chǔ)表達(dá)潛力,人類(lèi)正是這種形式的長(zhǎng)期受益者。當(dāng)然像上面這么表述對(duì)人類(lèi)友好,但對(duì)機(jī)器卻不怎么友好,因?yàn)檫@種謂語(yǔ)對(duì)于賓語(yǔ)并沒(méi)有良好的限定,至少機(jī)器不這么認(rèn)為。所以我們應(yīng)該寫(xiě)成這樣的模式:
•Tom(Tom) sex(性別) man(男)
•Tom(Tom) house(房子) red(紅色)
•Tom(Tom) wife(妻子) Lili(Lili)
回到標(biāo)題,這是什么東東?其表述了下列內(nèi)容:
1.http://www.w3.org (表示該陳述是描述的主體是什么,由于HTTP URI映射現(xiàn)實(shí)事物,所以可以看做該是對(duì)什么現(xiàn)實(shí)事物的描述)
2.http://purl.org/dc/elements/1.1/title (主體的屬性,一般表示賓體的類(lèi)型,例如dc:title是都柏林核心中用來(lái)指明資源名稱(chēng)的,即客體是該資源的一個(gè)名字)
3.World Wide Web Consortium (客體)
別人是如何獲得RDF的?
下圖說(shuō)明了這個(gè)過(guò)程:

•首先先對(duì)HTTP URI進(jìn)行請(qǐng)求。
•通常瀏覽器HTTP請(qǐng)求頭是:text/html、application/xhtml+xml類(lèi)型,故服務(wù)器返回一般html/xhtml文檔。
•但對(duì)于語(yǔ)義瀏覽器,其HTTP請(qǐng)求頭是:application/rdf+xml類(lèi)型,故服務(wù)器進(jìn)行303重定向,得到相應(yīng)RDF文件。
也就是說(shuō),對(duì)于一個(gè)HTTP URI可以返回兩種表達(dá)形式:文檔和數(shù)據(jù)。這樣就建立了兩種不同的網(wǎng)絡(luò),一個(gè)利于人類(lèi)閱讀的文檔網(wǎng),另一種是利于機(jī)器閱讀的數(shù)據(jù)網(wǎng)。
標(biāo)簽:
XML/RSS
排行榜
