完整地圖資訊的幕後推手-地形圖與語意網的對話

楊錦松/成大測量及空間資訊學系,近年空間資訊領域發展令人興奮驚奇,歡迎一起研究結合空間資訊及人類生活環境之相關發展。

徐百輝/臺大土木系助理教授,臺灣地理資訊學會理事長,一個喜歡進行空間聯想及推理的人。近年來偏好於影像處理及地理資訊整合之技術發展,期待空間資訊能更貼近於生活的日常。

地形圖所蘊涵的特殊密碼
各類地圖有不同的生產目的及特性,地形圖是各國的重要基礎地圖,其具備種類豐富、帶有符號設計、定期更新及品質受規範等特色,因此廣為政府單位及民間所使用。此外,各領域使用者可專心發展各類應用,由地形圖提供某一時間的空間定位與參考,整合各領域的資料,形成具備空間資訊的應用系統。

地形圖的資料種類又稱地形分類,可想像為一種圖鑑目錄,該分類為資料提供一個完整的名稱及定義,讓測製及使用地形圖的人具有相同的討論觀點及應用基礎。我國以「地形資料分類架構」描述地形資料分類,各分類包括名稱、定義及代碼等內容,例如:各比例尺地形圖皆需生產河川資料,地形資料分類架構內有關「河川」的分類便能提供可共同參考的資訊。由於不同地形圖的測製規範中有關地形資料的名稱都以該架構為準,其是否具有足夠能力描述各類地形現象,是重要的考量。

圖一:地形資料分類架構示意圖,以「河川及附屬設施」為例,其上層為河川,以下分為五個子類別,顯示該資料具上下階層的特性。

資料分類採樹狀階層結構(圖一),由較上階層的粗略主題,持續分類到較下階層特定主題。另外,每一層分類都包括獨特的編碼,藉由組合不同層級的編碼,可唯一辨別特定主題的資料分類,例如:地形資料分類架構第一版,「河川」地形的分類代碼為9500000,下層接續區分不同的河川相關分類,像是「河川及附屬設施」的分類代碼為9510000、「面狀水域」是9520000、而「海岸」則是9530000等。

由於每個分類的詳細程度不一,也使得該架構相對具有彈性。圖一為「河川及附屬設施」的地形資料分類架構圖,其上層為河川,以下分為5個子類別,顯示具上下階層的地形資料分類。

那些悄然崛起的地圖服務
在資訊技術及網際網路快速發展帶動下,各種資料可被記錄在資料庫及雲端,不同領域的專家透過電腦做複雜運算,發展出許多應用。現今人們日常生活已大量使用的地圖導航及各種網路地圖服務,便是數值地圖、地理資訊系統、網際網路及智慧型手機長遠發展的成果。

地理資訊系統技術發展帶動了革命性的變化,讓地圖可使用數值坐標搭配屬性文字記錄,且以圖層方式作為管理機制。其中最大的改變是──人們可藉由螢幕與地圖進行互動,並將各種主題地圖層層套疊,例如:放大、縮小、檢視內容、即時取得其他社群或組織單位製作的主題資料、載入到目前的地圖後進行屬性查詢、空間分析或統計呈現等。這些在傳統紙質地圖上難以想像的功能,如今已經能輕易達成,應用系統所需的各種資料可來自不同網址,並在同一地圖介面與使用者互動並且展示呈現。

語意網及資訊整合的困境
民眾習以為常的網際網路,其實已歷經幾次大演化,而語意網(Semantic Web)便是其中一個非常重要的研究領域,是由網際網路之父伯納李(Tim Berners-Lee)於1998年所提出的一個概念。語意網的核心精神,就是將網際網路上的資料加上機器可讀的後設資料(metadata),機器可藉由這項工具對資料進行辨識與使用,而人類看待及使用資料的觀點,可同樣應用於機器上。比起人類,語意網的設計更適合機器,當網際網路上的資料可被機器使用並且整合,提供發展各式應用的基礎。

目前絕大多數的資訊以網頁呈現,網頁語言是HTML,這是一個資料語言與展示語言整合在一起的技術。以此為基礎所設計的各類搜尋引擎或爬蟲程式,需要爬梳大量資料,加上CSS及前端網頁語言(如JavaScript)的興起,更造就了網頁資料剖析處理的困難,也因此資料的記錄及解讀一直是語意網亟欲解決的問題。另外,目前網頁雖然有超連結,卻不能精準說明資料間的關係,兩者沒有被連結起來;即使取得一個資料後,也無法藉此挖掘出更多的資訊。

最後,仍有一個隱藏版問題:當全世界發布資料時,同一類資料可能有各自的解讀及設計,以河川資料為例,各國有不同的觀點及考量,其內容不盡相同,資料本身的定義或語意(semantics),可否與資料一併提供?尤其對具有空間資訊的地形資料與其他空間資料來說,時間跟坐標皆是各國藉由標準形成的參考框架,有各種標準編號及代碼,這些資訊如無法詳細記錄,會造成資料整合跟應用的錯誤。因此,迫切需要一個更適合記錄資料的語言及整體架構以描述資料內容、資料與資料之間的關係及資料的語意,並鼓勵大家以此技術將資料建立、連結並且公開發布。

集關係之大成的資料鏈結
為解決前述問題,伯納李於2006提出鏈結資料(linked data, LD),這是以語意網相關技術所提出的一個架構。他的主張是,開放資料必須要以所謂的「資源描述架構(Resource Description Frame, RDF)建立;RDF僅記錄資料內容,不包含資料展示的語法,並可記錄資料的語意。

圖三:RDF資料模型。

此外,不同資料間還可以建立鏈結(即是一種關係),此鏈結可以想像成網頁的超連結,RDF的識別及取用也是使用HTTP協定。與網頁不同的是,RDF間的鏈結可清楚解釋資料之間具有什麼意義。鏈結資料帶來非常重大的影響,藉由RDF建立開放資料且彼此鏈結後,可稱為鍵結開放資料(Linked Open Data, LOD)。

目前鏈結開放資料已有龐大的資料集,如維基百科的鏈結開放資料「DBpedia」,而全世界著名的鏈結開放資料形成的鏈結開放資料雲,可從這個網站(https://lod-cloud.net/)取得。這些鏈結開放資料形成了龐大的資訊及知識,並在人工智慧及其他領域的各種應用發展扮演重要的角色。IBM的Watson人工智慧曾贏得美國的電視智力競賽節目,其使用的資料即是來自於DBpedia及YAGO等兩個鏈結開放資料。圖二顯示DBpedia目前與其他資料的關係,深色部分是不同語言的DBpedia資料。

圖二:與DBpedia相關的鏈結開放資料。(The Linked Open Data Cloud, https://lod-cloud.net

全新語法下的資訊連連看
RDF是由全球資訊網協會(World Wide Web Consortium, W3C)訂定,為用於描述網路資源的架構,可作為網路上資料交換的標準模型。其語法以XML為基礎下去設計,並以一個敘述(statement)說明資料內容,每筆資料的欄位或每筆資料間的關係,都是以敘述來記錄。此外,每個敘述皆是三元組(triple),當中包含的有:資源(resource)、屬性(property)及屬性值(property value),可想像成一個資料的主體、資料的屬性及屬性值,此三元組之描述內容為:

1. 資源:資料主體,透過RDF描述的資料都可被稱為資源,可為一個完整網頁(web page)、網頁的一部分或網頁的集合,或要記錄的各種資料、實體、現象。
2. 屬性:用來描述資源特性、屬性或與其他資源間之關係,每個屬性及關係都有其特定意義。
3. 屬性值:可單純用文字記錄,或指定為另外一個「資源」。

RDF文件中之資源皆可自由定義,例如地理空間資料、各種科學資料、人文資料或是生物DNA。為區分不同組織所定義相同名稱的RDF資源及屬性並避免產生衝突,RDF內容開頭必須明確定義所使用的名稱空間(namespace),通常以特定「統一資源識別元(Uniform Resource Identifier, URI)表示,該空間用以說明RDF的每一個資源及屬性由哪一個單位所定義,以避免混淆。

RDF可以SPARQL語言作查詢,SPARQL也能透過網際網路存取所有公開的資料集,並呈現不同問題觀點的需求與結果,篩選出符合查詢的RDF資料。這是個非常彈性且有效率的查詢語言,試著想像,網路上的鏈結開放資料各具有不同的設計與內容,使用者可透過SPARQL進行查詢並立即呈現,查詢語法可設定符合屬性條件、空間條件或者時間條件,或是一個指定的連結,且可及時整合進行。假設資料A與資料B有關係、資料B與資料C有關係,使用者可藉查詢語法呈現資料A與資料C之間的關係。

鏈結開放資料的強大應用
地形資料可與其他各領域資料進行大量連結,例如:河川水位與河川之間存在位置的關係,可各自建立成RDF資料後再進行鏈結;取得某一條河川資訊後,可由此關係再取得河川水位。由此得知,在鏈結資料架構內,當使用者取得需要的資料之後,還能藉由查詢結果挖掘更多有關係的資料,且所有資料都是以RDF格式記錄。試想,當地形資料被建立為鏈結資料並與其他各領域資料進行鏈結,使用者便可藉由SPARQL語法取得感興趣的資料。例如:某學生想進行市場調查,研究一地區是否適合設立大賣場,可先取得相關地形資料,包括道路、地標、行政區域等資料,藉由資料鏈結,再獲得該行政區的人口資料、用電用水資料,並取得鄰近超市與便利商店的地標,分析相關如經濟部的消費資料。因資料被鏈結,故應用系統可以快速產生分析結果並以視覺化圖表呈現統計地圖。

前述應用中,地形資料分類架構的地形分類資訊,則可作為解讀地形分類語意的資料,增加地形資料的品質。每一個RDF檔案描述一個分類定義,使用Description語法描述一個特定分類之各種屬性(分類名稱、英文名稱、分類編碼、定義、來源或依據),其中來源或依據部分分類沒有內容,亦適合以XML為基礎的RDF檔案寫法。地形資料分類架構之定義,以「河川」分類為例,其分類代碼為95101002,中文名稱為河川,英文名稱為river,並具有一段文字作為定義,RDF內容可設計如圖4所示。當應用系統取得河川資料,可進一步取得其分類資訊,協助語意及知識之判讀。

圖四:地形資料分類架構之分類定義RDF檔(市區道路之範例)。

地形資料的未來在哪裡?
地形資料為國家發展的重要參考,地形資料分類則提供地形資料必要的語意。現今已是網路服務無所不在的時代,身為國家核心資料的地形資料亦需思考如何以最嶄新的科技提供更豐富的服務。本文闡述地形資料分類架構之結構及定義,未來可藉此建置地形資料分類系統之RDF,形成鏈結開放資料的地形資料分類知識庫。鏈結開放資料的潛力在於其架構之設計,只要資料依照標準建立,並建立彼此的鏈結,後續資料的取得與應用發展,可謂無遠弗屆。

透過語意網及鏈結開放資料架構,未來地形資料也可與其他鏈結開放資料整合。使用者取得地形資料後,不僅可連結更多資料,亦可透過地形資料分類協助地形資料使用,RDF的特性更可推動後續人工智慧的自動化程度,可期待地形資料與其他領域連結,創造出無所不在的地圖服務。

延伸閱讀
1. Semantic Web,https://bit.ly/2z29fGP。
2.Linked Data,https://bit.ly/21MR3Zt。
3.地形資料分類架構,https://bit.ly/2vInYGk。

沒有留言:

張貼留言