一些資料處理會碰到的詞彙

我發現我經常會收到類似的問題,所以我決定統整這些問題和簡單的回答。 

1. Metadata

直接翻譯的話是指"資料後",但定義是"data that provides information about other data",簡單來說,是指這個資料的一些訊息。

例如你今天有一份word檔案,data就是這份文檔中的文字,那metadata就是關於這份文檔的訊息,像是有幾頁、上次修改的時間、上次是誰修改的等等。在Word的file上面會顯示這些metadata,如下圖:


2. harmonize information =merge datasets

"Data harmonization refers to all efforts to combine data from different sources and provide users with a comparable view of data from different studies."(ICPSR)

3. Which GDP variable?

基本上,概念都是要把不同年份和不同國家的GDP拉到同一個尺度上去做比較;我們可以把這些單位(current US$, US2011, country's currency)當作不同的量尺。今天要用哪一把尺取決於你的研究問題和研究標的是甚麼。

GDP/current US$ 單一年份的跨國比較(cross-sectional)

GDP/US 2011 (平準化): 跨時間跨國比較(time-series and cross-section)

GDP/country’s currency (標準化): 僅比較這個國家(one panel, multiple time points)


Comments

Popular Posts