빅데이터 분석: 요람에서 대학까지
‘요람에서 대학까지: 2019 대한민국 양육비 계산기’를 통해 양육비를 계산해본 분들은 느끼셨을 겁니다. 아이 한 명을 키우는 데에 경제적 부담이 만만치 않다는 것을요. 이는 출산을 꺼리게 하는 주요 원인으로 꼽힙니다. 동아일보는 데이터 분석 전문업체 ‘아르스 프락시아’와 함께 우리 사회에서 저출산에 대한 논의가 최근 20년간 어떻게 진행됐는지, 저출산에 대한 사람들의 생각은 어떤지 빅데이터 분석을 통해 들여다보기로 했습니다.
저희는 동아일보를 비롯한 국내 5개 일간지에 실린 (저)출산 관련 기사 1만7963건을 대상으로 ‘텍스트 마이닝’을 진행했습니다. 또 기사 댓글과 인터넷 카페, 블로그 등 온라인 게시물 22만7000 건의 데이터에 대해서도 분석을 실시했습니다. 이를 소개합니다.
‘딴나라 이야기’였던 저출산
불과 20년 전만 해도 저출산을 다루는 언론 기사를 찾아보기 어려웠다. ‘저출산’이라는 낱말 자체가 톱10(하단 부록 참조)에 등장하지 않을 정도였다. 그러다가 2004년 저출산에 대한 내용이 가파르게 늘었고 대선 직후인 2008년에야 저출산 대책이 쏟아졌다.
연도별 저출산 관련 기사 개수
한국은 2004년 합계 출산율이 1.15명으로 내려가고 나서야 이듬해 9월 대통령 직속으로 ‘저출산·고령사회위원회’를 설치했다. 2006년 정부에서 1차 저출산·고령사회 기본계획을 발표한 다음부터 12년 간 153조 원을 쏟아 부었지만 이 기간 합계 출산율은 1.13명에서 0.98명으로 감소했다. 지난해만 저출산 관련 예산은 30조6002억 원. 지난해 태어난 아이가 32만6900명이나 출생아 1인당 9360만 원을 쓴 셈이다.
정부 대책이 비효율적이었다는 건 의미망 분석을 통해서도 알아볼 수 있다. 2008년까지 5개 일간지 기사 내용을 살펴보면 ‘정부 지원이 필요하다’, ‘종합대책 마련을 서둘러야 한다’는 등 원론적인 내용이 많았다. 부동산, 교육, 노동환경 등 저출산을 설명할 수 있는 구체적인 키워드가 톱10에 등장하기 시작한 건 2014년 이후다.
정부 대책과 연관된 저출산 기사 의미망 분석
연애와 결혼, 저출산의 함수
재미있는 건 2008년까지 없던 ‘연애’라는 낱말이 2009년 이후 기사 의미망 분석에 나타났다는 점이다. 게다가 ‘연애’가 ‘결혼’보다 ‘저출산’과 거리가 가깝다. 의미망 분석에서는 낱말 사이 거리가 가까울수록 서로 밀접한 관련을 맺고 있다는 뜻이다.
연애와 연관된 저출산 기사 의미망 분석
힌트는 온라인 반응에서 얻을 수 있다. 신문 기사가 주로 제도와 정책에 대해 언급한다면 댓글 등 온라인 게시물은 이용자들이 개인의 경험과 감정을 ‘날 것 그대로’ 표현한다.
그 결과 2014년을 기점으로 노동 여건 관련 게시물이 줄어드는 대신 부동산과 교육 관련 키워드가 함께 등장하는(주거×교육)¹ 게시물이 늘어난 것으로 나타났다.
그 결과 2014년을 기점으로 노동 여건 관련 게시물이 줄어드는 대신 부동산과 교육 관련 키워드가 함께 등장하는(주거×교육)¹ 게시물이 늘어난 것으로 나타났다.
¹ ‘주거×교육’ 접근법은 육아정책연구소에서 지난해 12월 펴낸 보고서 ‘4차 산업혁명 시대 육아정책의 이슈와 과제’에서 인용했다.
2014년에는 전체 게시물 중 13.1%가 노동 문제 관련 키워드를 포함했지만 2017년에는 7.7%로 줄었다. 같은 기간 부동산×교육 게시물은 11.3%에서 22.5%로 늘었다. 두 낱말이 함께 등장한 건 집값 부담과 (사)교육비 부담이 서로 연결되어 있는 것으로 생각하는 이들이 많다는 의미다.
저출산 요인 키워드별 게시물 비중
부동산×교육
근로 여건×교육
젠더
부동산
일자리
근로 여건
그런 의미에서 부동산×교육 게시물 가운데 제일 핵심적인 낱말로 ‘불안정’이 꼽힌 건 우연이 아니다. 의미망 분석을 진행하면 ‘불안정’은 ‘청년’, ‘신혼부부’와 연결되어 있다는 사실을 알 수 있다.
신혼부부/청년과 연관된 저출산 기사 의미망
한국보건사회연구원에서 지난해 펴낸 ‘2018 전국 출산력 및 가족보건·복지 실태조사’에 따르면 이 조사에 응한 20~44세 미혼남녀 2464명(남성 1140명, 여성 1324명) 중 71%(1750명)는 현재 연애 상태가 아니라고 답했다.
‘헬조선’이라는 낱말을 중심으로 의미망 분석을 진행하면 이런 어려움이 더욱 분명하게 드러난다. 높은 ‘집값’과 ‘사교육비’를 부담할 수 없는 상황에서 ‘금수저’가 아닌 이상 이 ‘헬조선’에 ‘노예’를 공급하지 않겠다는 극단적인 표현까지 등장하는 것이다.
헬조선과 연괸된 저출산 기사 의미망 분석
그래서 이들 미혼 남녀가 가장 필요한 결혼 지원 정책으로 가장 많이 꼽은 것도 ‘신혼집 마련 지원’(27.9%)이었고 ‘청년 고용 안정’(23.8%)이 뒤를 이었다.
미혼 남녀가 생각하는 가장 필요한 결혼 지원 정책
² 자료: 한국보건사회연구원
노동 문제 관련 온라인 게시물 숫자가 줄어든 이유도 경제적인 불안정과 무관치 않다. 육아정책연구소는 같은 분석 결과를 활용한 연구보고서 ‘산업형명 시대 육아정책의 이슈와 과제’에서 “노동 여건이 개선되어 언급량이 줄어든 것인지, 노동 여건이 더 나빠져 ‘워라밸’ 등 관련 키워드 언급이 ‘사치’로 여겨지는 사회적 분위기가 형성된 것은 아닌지 따져볼 필요가 있다”고 진단했다.
출산, 기사와 댓글 사이 간극
기사가 제도와 정책을 이야기하고 댓글은 경험과 감정을 이야기하는 만큼 같은 주제에 대해서도 서로 다른 낱말이 등장했다.
예를 들어 출산이라는 주제에 대해 의미망 분석을 진행하면 기사에서는 '건강', '육아휴직', '연령' 같은 낱말이 영향력이 높은(중요한) 낱말로 나타났지만 댓글에서는 '인생', '잘못', '피해', '바보' 같은 낱말이 중요했다. 또 '육아' 관련 기사에서는 '교육', '어린이집', '유치원'이 중요한 낱말이었던 반면 댓글에서는 '결혼', '인생', '피해', '행복' 같은 낱말의 영향력이 높았다. 사람들은 출산과 관련된 논의에서 직접적이든 간접적이든 개인적인 경험과 감정을 이야기하고 있으므로 정책 역시 개인이 체감할 수 있는 방식으로 나와야 한다는 점을 보여주는 대목이다.
저출산 기사 본문과 기사 댓글 비교
키워드 | 기사 의미망 | 댓글 의미망 |
결혼 | 약속, 예정, 계획 | 국민, 대통령, 현실, 세금, 일본 |
출산 | 건강, 육아휴직, 연령 | 인생, 잘못, 피해, 바보, 남편 |
아이 | 교실, 학원, 교사 | 이해, 마음, 걱정, 인성 |
육아 | 교육, 어린이집, 유치원 | 결혼, 인생, 피해, 행복, 미래 |
양육 | 이혼, 환경, 부부 | 자기, 인생, 행복, 책임, 잘못 |
보육 | 예산, 누리과정, 교육청 | 세금, 혜택, 미래, 엄마 |
돌봄 | 계획, 학교, 일자리, 정책, 예산 | 세금, 정규직, 혜택, 책임, 처벌 |
어린이집 | 누리과정, 교육청, 안전 | 사람, 피해, 마음 |
유치원 | 예산, 안전, 누리과정 | 국민, 대통령, 미래, 잘못, 현실 |
경력단절 | 육아, 일자리, 경력, 센터 | 결혼, 능력, 군대, 차별, 승진 |
근로시간 | 의원, 지급, 대책, 보장 | 현실, 세금, 월급, 운영 |
야근 | 직원, 스트레스, 문화, 저녁 | 결혼, 한국, 현실, 노력 |
가족친화 | 조성, 제도, 선정, 센터 | 노인, 차별, 피해, 젊은사람들 |
일가정양립 | 육아휴직, 회사, 제도, 도입 | 결혼, 자녀, 육아, 포기 |
성평등 | 소수자, 정치, 감독, 장관 | 한국, 군대, 의무, 결혼, 성희롱 |
부록: 연도별 저출산 기사 키워드 톱10
연도 | #1 | #2 | #3 | #4 | #5 | #6 | #7 | #8 | #9 | #10 |
1999 (횟수) |
인구 | 정부 | 노인 | 증가 | 성별 감별 | 복지 | 성비 불균형 | 억제 | 계몽 | 구성 |
5 | 4 | 3 | 3 | 2 | 2 | 2 | 2 | 2 | 2 | |
2000 | 인구 | 감소 | 출산율 | 저출산 | 여성 | 정부 | 국가 | 선진국 | 예측 | 전환 |
37 | 19 | 12 | 10 | 10 | 9 | 7 | 7 | 7 | 7 | |
2001 | 인구 | 저출산 | 출산율 | 아이 | 고령화 | 노동력 | 정부 | 노인 | 여성 | 복지 |
38 | 36 | 36 | 33 | 29 | 27 | 27 | 26 | 25 | 18 | |
2002 | 여성 | 출산율 | 정책 | 정부 | 저출산 | 기업 | 보육 | 인구 | 가족 | 일본 |
85 | 74 | 52 | 40 | 38 | 33 | 32 | 32 | 27 | 26 | |
2003 | 인구 | 여성 | 출산율 | 저출산 | 정부 | 정책 | 노인 | 고령화 | 결혼 (부담) | 지원 |
202 | 198 | 176 | 161 | 139 | 129 | 106 | 89 | 79 | 73 | |
2004 | 여성 | 저출산 | 정부 | 인구 | 지원 | 출산율 | 고령화 | 가족 | 정책 | 가정 |
385 | 367 | 330 | 238 | 214 | 207 | 201 | 182 | 182 | 178 | |
2005 | 저출산 | 정부 | 여성 | 인구 | 자녀 | 지원 | 고령화 | 대책 | 정책 | 가정 |
1,500 | 919 | 903 | 811 | 703 | 670 | 607 | 522 | 512 | 448 | |
2006 | 저출산 | 정부 | 여성 | 자녀 | 지원 | 인구 | 고령화 | 대책 | 정책 | 일본 |
2,255 | 1,784 | 1,237 | 1,073 | 960 | 939 | 833 | 816 | 781 | 701 | |
2007 | 정부 | 저출산 | 정책 | 지원 | 여성 | 경제 | 교육 | 국가 | 자녀 | 한국 |
927 | 919 | 668 | 614 | 589 | 432 | 432 | 420 | 394 | 365 | |
2008 | 정부 | 저출산 | 여성 | 지원 | 인구 | 정책 | 경제 | 교육 | 출산율 | 세계 |
732 | 715 | 688 | 522 | 468 | 432 | 407 | 329 | 308 | 298 | |
2009 | 저출산 | 지원 | 정부 | 자녀 | 여성 | 정책 | 출산율 | 가족 | 인구 | 교육 |
2,838 | 1,727 | 1,445 | 1,257 | 1,244 | 951 | 936 | 911 | 889 | 755 | |
2010 | 저출산 | 지원 | 정부 | 여성 | 정책 | 인구 | 결혼 | 자녀 | 가정 | 대책 |
3,202 | 2,457 | 2,211 | 1,826 | 1,598 | 1,409 | 1,327 | 1,222 | 1,030 | 965 | |
2011 | 저출산 | 복지 | 정부 | 지원 | 정책 | 여성 | 인구 | 자녀 | 교육 | 경제 |
2,029 | 1,771 | 1,413 | 1,395 | 946 | 925 | 829 | 762 | 708 | 657 | |
2012 | 정부 | 저출산 | 지원 | 정책 | 여성 | 복지 | 인구 | 경제 | 고령화 | 한국 |
1,354 | 1,301 | 1,219 | 1,079 | 1,040 | 975 | 904 | 769 | 630 | 602 | |
2013 | 저출산 | 정부 | 여성 | 인구 | 경제 | 지원 | 정책 | 고령화 | 복지 | 기업 |
1,061 | 941 | 820 | 809 | 671 | 671 | 616 | 474 | 405 | 401 | |
2014 | 저출산 | 인구 | 정부 | 여성 | 결혼 | 정책 | 싱글세 | 지언 | 고령화 | 복지 |
1,738 | 1,279 | 1,159 | 1,102 | 847 | 818 | 736 | 701 | 679 | 629 | |
2015 | 정부 | 저출산 | 정책 | 경제 | 인구 | 지원 | 결혼 | 여성 | 일자리 | 고령화 |
3,039 | 2,952 | 1,690 | 1,592 | 1,494 | 1,301 | 1,144 | 1,092 | 1,060 | 985 | |
2016 | 저출산 | 정부 | 인구 | 정책 | 지원 | 여성 | 경제 | 일본 | 자녀 | 한국 |
3,342 | 2,851 | 1,958 | 1,716 | 1,714 | 1,621 | 1,359 | 1,122 | 1,097 | 1,076 | |
2017 | 저출산 | 정부 | 정책 | 여성 | 일자리 | 지원 | 인구 | 경제 | 결혼 | 한국 |
4,171 | 3,554 | 2,733 | 2,496 | 2,336 | 2,192 | 1,974 | 1,507 | 1,355 | 1,250 | |
2018 | 저출산 | 정부 | 지원 | 정책 | 인구 | 여성 | 일자리 | 예산 | 확대 | 경제 |
6,900 | 4,730 | 4,084 | 4,051 | 3,424 | 3,184 | 2,339 | 2,276 | 2,128 | 2,123 | |
2019 | 인구 | 저출산 | 정부 | 한국 | 지원 | 정책 | 여성 | 일본 | 경제 | 결혼 |
3,603 | 3,028 | 2,411 | 1,761 | 1,725 | 1,719 | 1,628 | 1,404 | 1,220 | 1,175 |
관련 기사: 인터랙티브 기사
관련 기사: 대한민국 양육 명세표
후원
한국언론진흥재단