말도 많고 탈도 많았던 20대 대통령 선거가 막을 내리고 윤석열 후보가 20대 대한민국 대통령으로 선출되었습니다. 개인적인 소회는 여기에서 밝히지는 않겠습니다. 정말 할 말이 많지만 하지 않겠습니다.
어쨌든 밥도 먹고, 아이도 키우고, 돈도 벌고, 먹고 살아야 하기 때문에 정신 차리고 보면, 대통령 선거는 데이터 엔지니어들에게는 가장 좋은 기회입니다. 특히 파이썬을 공부하시는 분들에게는 이보다 더 좋은 기회가 없습니다. 저도 처음 파이썬을 공부할 때 맨 먼저 샀던 책이 '파이썬으로 데이터 주무르기'였고, 그 책에서 다룬 예제 중에 바로 19대 대선 결과 분석이었습니다. 공부할 때는 그런가 보다 하고 큰 감흥 없이 공부했었고 그 후로 까마득히 잊고 있었는데 이번에 20대 대선을 지켜보면서 공부할 때 기억이 떠올랐습니다. 파이썬을 공부하면 정말이지 데이터가 허투로 보이지 않습니다. 이 데이터가 말하고 싶은 것은 무엇이지? 이 데이터로 나는 무엇을 말하고 싶은 거지? 이 데이터로 나는 무엇을 할 수 있을까? 이런 질문을 내 자신에게 던지며 항상 고민합니다.
다시금 프로그램을 찾아 크롤링을 돌려보니 웹사이트가 조금 바뀌었고 달려져 있었습니다. 그래서 이틀간 손을 좀 보고 완성시켜 19대와 20대 득표수와 득표율 데이터를 비교하는 자료를 만들었습니다. 더 좋고, 더 정확하고, 더 객관적인 자료를 갖고 계신 분들도 계시겠지만 저는 엄연히 제가 공부한 대로, 제가 배운 대로 구현했고 그 결과를 공유하고자 합니다.
1. 데이터 소스 : 중앙선거관리위원회 선거통계시스템
- 모든 데이터 소스는 중앙선거관리위원회 선거통계시스템을 크롤링하여 가져왔습니다.
2. 참고 서적 : 파이썬으로 데이터 주무르기
- 저는 이 책의 저자도 아니고, 이 책을 판매할 목적으로 링크를 걸어둔 것은 아닙니다. 그저 공부하는데 참고했고 도움을 받았으므로 파이썬 프로그램의 내용이 궁금하시다면 직접 확인하시길 바라는 마음에서 알려드리는 것 뿐입니다.
3. 비교 결과표 : 표를 여기에 삽입해봤는데 가독성이 너무 떨어져 어쩔 수 없이 파일로 공유하니 마음껏 데이터를 가지고 편집 및 가공하시기 바랍니다.
4. 대선 결과 시각화 : '파이썬으로 데이터 주무르기' 예제를 따라하다 보면 Cartogram이라는 독특한 지도 표현 방식을 접하게 되고 배우게 됩니다. 우리나라 지도를 전국 250개 지자체로 구분하기 위해 독특한 모양으로 만든 지도인데 전국 단위의 데이터를 시각화하는데 이보다 더 좋은 방식은 없는 것 같습니다. 여기 19대와 20대 대통령 선거의 결과를 비교한 Cartogram 지도를 공유합니다.
크기가 작아서 불만이신 분들을 위해 크게 키워 아래에 다시 공유 드립니다. 참고로 파란색이 진할 수록, 빨간색이 진할 수록, 차이가 크다는 의미이고, 색깔이 연할 수록 차이가 적다는 의미입니다. 색깔 변화를 좀 더 다양하게 줄 수 있지만 저는 이 데이터로 민주당과 국민의힘의 득표 차이를 극명하게 보여주고 싶었기 때문에 이렇게 표현해본 것 뿐입니다. 아무튼 5년 동안 참 많은 일들이 있었던 모양입니다. 민심이 이렇게나 변하다니요. 탄핵과 촛불 시위는 이미 다 잊은 것 같네요.
어떠신가요? 한 눈에 이해가 확실히 되지 않나요? 대통령 선거 결과에 희노애락, 다양한 감정을 느끼셨을 텐데 그냥 저처럼 데이터에 푹 파묻혀 공부나 하시는 것은 어떠신가요? 저는 그러기로 했습니다. 안 그러면 술만 마실 것 같아서요. 꾹 참고 공부나 하기로 했습니다.
유현준 건축가의 청와대 용산 이전 관련 해명에 관한 의견 (2) | 2022.03.20 |
---|---|
[대선 특집] 제20대 대통령선거 : 그 결과와 영향 분석, 그리고 윤석열 후보의 공약 총정리 리포트 (2) | 2022.03.12 |
[대선 특집] 20대 대선 출구조사 결과 총정리 (0) | 2022.03.09 |
[대선 특집] 19대 대통령 선거 결과 요약 (2) | 2022.03.09 |
쿠데타, 정변, 정난 그리고 경제발전이라는 허울 (2) | 2022.02.23 |
댓글 영역