一些資料處理會碰到的詞彙
我發現我經常會收到類似的問題,所以我決定統整這些問題和簡單的回答。
1. Metadata
直接翻譯的話是指"資料後",但定義是"data that provides information about other data",簡單來說,是指這個資料的一些訊息。
例如你今天有一份word檔案,data就是這份文檔中的文字,那metadata就是關於這份文檔的訊息,像是有幾頁、上次修改的時間、上次是誰修改的等等。在Word的file上面會顯示這些metadata,如下圖:
2. harmonize information =merge datasets
"Data harmonization refers to all efforts to combine data from different sources and provide users with a comparable view of data from different studies."(ICPSR)
3. Which GDP variable?
基本上,概念都是要把不同年份和不同國家的GDP拉到同一個尺度上去做比較;我們可以把這些單位(current US$, US2011, country's currency)當作不同的量尺。今天要用哪一把尺取決於你的研究問題和研究標的是甚麼。
GDP/current US$ 單一年份的跨國比較(cross-sectional)
GDP/US 2011 (平準化): 跨時間跨國比較(time-series and cross-section)
GDP/country’s currency (標準化): 僅比較這個國家(one panel,
multiple time points)
Comments
Post a Comment