Google資料集搜尋引擎Dataset Search正式版索引仟萬個資料
Google Dataset Search資料集搜尋引擎【點我開啟】
Google在2018年發表資料集搜尋引擎Dataset Search,在本周邁入正式版,目前Dataset Search已索引了全球網路上近2,500萬個資料集,最受歡迎主題包括教育、天氣、癌症、犯罪、足球,以及小狗。
資料集搜尋引擎所搜尋的是經組織且結構化的資料,它或許以照片呈現,也可能是表格或文字,而當輸入「滑雪」時,它會出現全球最快滑雪選手成績列表,或全球滑雪旅館營收報告。
根據Google的統計,現在Dataset Search所索引的資料集中,內容最多的類別為地球科學、生物學及農業;而最受出版商歡迎的資料格式為表格,在2,500萬個資料中,就有超過600萬個是表格;此外絕大多數的政府都利用schema.org開放標準來描述這些資料集,而美國則是全球政府資料開放平台中,貢獻最多資料集的政府,有超過200萬個資料集被Google索引。
不管是學者、學生、各領域研究人員或一般使用者,都可利用Dataset Search找到更多的結構化資料集,邁入正式版的Dataset Search也新增了篩選功能,例如可以根據資料集的格式(文字、圖片或表格),或是資料集免費與否進行過濾,此外,原本只支援桌面的Dataset Search現在也有行動版了。
Google也鼓勵那些已建立資料集的業者,可遵循schema.org標準來描述資料,以確保這些資料集能被Google索引,並被使用者看見。
來源
謝謝收看
留言列表