台灣選舉資料清理步驟
下載選舉資料後,我們經常會發現一個問題,
選區是合併的,當用EXCEL把格子分開後,只有第一列有選區名字。
例如
1. 選取該列(Ctrl + A)
2. Ctrl + G(這會跳出一個視窗出來)
3. 選special
4. 選blanks,然後確定(就會把該列所有的空格都選取起來)
5. 在第一個空格中填上你希望填入的文字的格子
6. 接著按Ctrl + Enter(它就會按照你的邏輯去依次填入資料)
Stata
確定是否有重複的資料
sort name age sex
quietly by name age sex: gen dup = cond(_N==1,0,_n)
*檢查某一部分資料
browse if dup==1
Comments
Post a Comment