台灣選舉資料清理步驟

 下載選舉資料後,我們經常會發現一個問題,

選區是合併的,當用EXCEL把格子分開後,只有第一列有選區名字。

例如


1. 選取該列(Ctrl + A)

2.  Ctrl + G(這會跳出一個視窗出來)

3. 選special

4. 選blanks,然後確定(就會把該列所有的空格都選取起來)

5. 在第一個空格中填上你希望填入的文字的格子

6. 接著按Ctrl + Enter(它就會按照你的邏輯去依次填入資料)


Stata

確定是否有重複的資料

 sort name age sex

quietly by name age sex:  gen dup = cond(_N==1,0,_n)

*檢查某一部分資料

browse if dup==1

Comments

Popular Posts