close

Google資料集搜尋引擎Dataset Search正式版索引仟萬個資料

Google Dataset Search資料集搜尋引擎【點我開啟】  

Dataset Search.PNG

  Google在2018年發表資料集搜尋引擎Dataset Search,在本周邁入正式版,目前Dataset Search已索引了全球網路上近2,500萬個資料集,最受歡迎主題包括教育、天氣、癌症、犯罪、足球,以及小狗。

  資料集搜尋引擎所搜尋的是經組織且結構化的資料,它或許以照片呈現,也可能是表格或文字,而當輸入「滑雪」時,它會出現全球最快滑雪選手成績列表,或全球滑雪旅館營收報告。

  根據Google的統計,現在Dataset Search所索引的資料集中,內容最多的類別為地球科學、生物學及農業;而最受出版商歡迎的資料格式為表格,在2,500萬個資料中,就有超過600萬個是表格;此外絕大多數的政府都利用schema.org開放標準來描述這些資料集,而美國則是全球政府資料開放平台中,貢獻最多資料集的政府,有超過200萬個資料集被Google索引。

  不管是學者、學生、各領域研究人員或一般使用者,都可利用Dataset Search找到更多的結構化資料集,邁入正式版的Dataset Search也新增了篩選功能,例如可以根據資料集的格式(文字、圖片或表格),或是資料集免費與否進行過濾,此外,原本只支援桌面的Dataset Search現在也有行動版了。

  Google也鼓勵那些已建立資料集的業者,可遵循schema.org標準來描述資料,以確保這些資料集能被Google索引,並被使用者看見。


 

來源
謝謝收看

arrow
arrow
    創作者介紹

    john pan 發表在 痞客邦 留言(0) 人氣()