빅데이터 분석: 요람에서 대학까지

‘요람에서 대학까지: 2019 대한민국 양육비 계산기’를 통해 양육비를 계산해본 분들은 느끼셨을 겁니다. 아이 한 명을 키우는 데에 경제적 부담이 만만치 않다는 것을요. 이는 출산을 꺼리게 하는 주요 원인으로 꼽힙니다. 동아일보는 데이터 분석 전문업체 ‘아르스 프락시아’와 함께 우리 사회에서 저출산에 대한 논의가 최근 20년간 어떻게 진행됐는지, 저출산에 대한 사람들의 생각은 어떤지 빅데이터 분석을 통해 들여다보기로 했습니다.
저희는 동아일보를 비롯한 국내 5개 일간지에 실린 (저)출산 관련 기사 1만7963건을 대상으로 ‘텍스트 마이닝’을 진행했습니다. 또 기사 댓글과 인터넷 카페, 블로그 등 온라인 게시물 22만7000 건의 데이터에 대해서도 분석을 실시했습니다. 이를 소개합니다.

‘딴나라 이야기’였던 저출산

불과 20년 전만 해도 저출산을 다루는 언론 기사를 찾아보기 어려웠다. ‘저출산’이라는 낱말 자체가 톱10(하단 부록 참조)에 등장하지 않을 정도였다. 그러다가 2004년 저출산에 대한 내용이 가파르게 늘었고 대선 직후인 2008년에야 저출산 대책이 쏟아졌다.
연도별 저출산 관련 기사 개수
한국은 2004년 합계 출산율이 1.15명으로 내려가고 나서야 이듬해 9월 대통령 직속으로 ‘저출산·고령사회위원회’를 설치했다. 2006년 정부에서 1차 저출산·고령사회 기본계획을 발표한 다음부터 12년 간 153조 원을 쏟아 부었지만 이 기간 합계 출산율은 1.13명에서 0.98명으로 감소했다. 지난해만 저출산 관련 예산은 30조6002억 원. 지난해 태어난 아이가 32만6900명이나 출생아 1인당 9360만 원을 쓴 셈이다.
정부 대책이 비효율적이었다는 건 의미망 분석을 통해서도 알아볼 수 있다. 2008년까지 5개 일간지 기사 내용을 살펴보면 ‘정부 지원이 필요하다’, ‘종합대책 마련을 서둘러야 한다’는 등 원론적인 내용이 많았다. 부동산, 교육, 노동환경 등 저출산을 설명할 수 있는 구체적인 키워드가 톱10에 등장하기 시작한 건 2014년 이후다.
정부 대책과 연관된 저출산 기사 의미망 분석

연애와 결혼, 저출산의 함수

재미있는 건 2008년까지 없던 ‘연애’라는 낱말이 2009년 이후 기사 의미망 분석에 나타났다는 점이다. 게다가 ‘연애’가 ‘결혼’보다 ‘저출산’과 거리가 가깝다. 의미망 분석에서는 낱말 사이 거리가 가까울수록 서로 밀접한 관련을 맺고 있다는 뜻이다.
연애와 연관된 저출산 기사 의미망 분석
힌트는 온라인 반응에서 얻을 수 있다. 신문 기사가 주로 제도와 정책에 대해 언급한다면 댓글 등 온라인 게시물은 이용자들이 개인의 경험과 감정을 ‘날 것 그대로’ 표현한다.
그 결과 2014년을 기점으로 노동 여건 관련 게시물이 줄어드는 대신 부동산과 교육 관련 키워드가 함께 등장하는(주거×교육)¹ 게시물이 늘어난 것으로 나타났다.
¹ ‘주거×교육’ 접근법은 육아정책연구소에서 지난해 12월 펴낸 보고서 ‘4차 산업혁명 시대 육아정책의 이슈와 과제’에서 인용했다.
2014년에는 전체 게시물 중 13.1%가 노동 문제 관련 키워드를 포함했지만 2017년에는 7.7%로 줄었다. 같은 기간 부동산×교육 게시물은 11.3%에서 22.5%로 늘었다. 두 낱말이 함께 등장한 건 집값 부담과 (사)교육비 부담이 서로 연결되어 있는 것으로 생각하는 이들이 많다는 의미다.
저출산 요인 키워드별 게시물 비중
부동산×교육
근로 여건×교육
젠더
부동산
일자리
근로 여건
그런 의미에서 부동산×교육 게시물 가운데 제일 핵심적인 낱말로 ‘불안정’이 꼽힌 건 우연이 아니다. 의미망 분석을 진행하면 ‘불안정’은 ‘청년’, ‘신혼부부’와 연결되어 있다는 사실을 알 수 있다.
신혼부부/청년과 연관된 저출산 기사 의미망
한국보건사회연구원에서 지난해 펴낸 ‘2018 전국 출산력 및 가족보건·복지 실태조사’에 따르면 이 조사에 응한 20~44세 미혼남녀 2464명(남성 1140명, 여성 1324명) 중 71%(1750명)는 현재 연애 상태가 아니라고 답했다.
‘헬조선’이라는 낱말을 중심으로 의미망 분석을 진행하면 이런 어려움이 더욱 분명하게 드러난다. 높은 ‘집값’과 ‘사교육비’를 부담할 수 없는 상황에서 ‘금수저’가 아닌 이상 이 ‘헬조선’에 ‘노예’를 공급하지 않겠다는 극단적인 표현까지 등장하는 것이다.
헬조선과 연괸된 저출산 기사 의미망 분석
그래서 이들 미혼 남녀가 가장 필요한 결혼 지원 정책으로 가장 많이 꼽은 것도 ‘신혼집 마련 지원’(27.9%)이었고 ‘청년 고용 안정’(23.8%)이 뒤를 이었다.
미혼 남녀가 생각하는 가장 필요한 결혼 지원 정책
² 자료: 한국보건사회연구원
노동 문제 관련 온라인 게시물 숫자가 줄어든 이유도 경제적인 불안정과 무관치 않다. 육아정책연구소는 같은 분석 결과를 활용한 연구보고서 ‘산업형명 시대 육아정책의 이슈와 과제’에서 “노동 여건이 개선되어 언급량이 줄어든 것인지, 노동 여건이 더 나빠져 ‘워라밸’ 등 관련 키워드 언급이 ‘사치’로 여겨지는 사회적 분위기가 형성된 것은 아닌지 따져볼 필요가 있다”고 진단했다.

출산, 기사와 댓글 사이 간극

기사가 제도와 정책을 이야기하고 댓글은 경험과 감정을 이야기하는 만큼 같은 주제에 대해서도 서로 다른 낱말이 등장했다.
예를 들어 출산이라는 주제에 대해 의미망 분석을 진행하면 기사에서는 '건강', '육아휴직', '연령' 같은 낱말이 영향력이 높은(중요한) 낱말로 나타났지만 댓글에서는 '인생', '잘못', '피해', '바보' 같은 낱말이 중요했다. 또 '육아' 관련 기사에서는 '교육', '어린이집', '유치원'이 중요한 낱말이었던 반면 댓글에서는 '결혼', '인생', '피해', '행복' 같은 낱말의 영향력이 높았다. 사람들은 출산과 관련된 논의에서 직접적이든 간접적이든 개인적인 경험과 감정을 이야기하고 있으므로 정책 역시 개인이 체감할 수 있는 방식으로 나와야 한다는 점을 보여주는 대목이다.
저출산 기사 본문과 기사 댓글 비교
키워드기사 의미망댓글 의미망
결혼약속, 예정, 계획국민, 대통령, 현실, 세금, 일본
출산건강, 육아휴직, 연령인생, 잘못, 피해, 바보, 남편
아이교실, 학원, 교사이해, 마음, 걱정, 인성
육아교육, 어린이집, 유치원결혼, 인생, 피해, 행복, 미래
양육이혼, 환경, 부부자기, 인생, 행복, 책임, 잘못
보육예산, 누리과정, 교육청세금, 혜택, 미래, 엄마
돌봄계획, 학교, 일자리, 정책, 예산세금, 정규직, 혜택, 책임, 처벌
어린이집누리과정, 교육청, 안전사람, 피해, 마음
유치원예산, 안전, 누리과정국민, 대통령, 미래, 잘못, 현실
경력단절육아, 일자리, 경력, 센터결혼, 능력, 군대, 차별, 승진
근로시간의원, 지급, 대책, 보장현실, 세금, 월급, 운영
야근직원, 스트레스, 문화, 저녁결혼, 한국, 현실, 노력
가족친화조성, 제도, 선정, 센터노인, 차별, 피해, 젊은사람들
일가정양립육아휴직, 회사, 제도, 도입 결혼, 자녀, 육아, 포기
성평등소수자, 정치, 감독, 장관한국, 군대, 의무, 결혼, 성희롱
부록: 연도별 저출산 기사 키워드 톱10
연도#1#2#3#4#5#6#7#8#9#10
1999
(횟수)
인구정부노인증가성별
감별
복지성비
불균형
억제계몽구성
5433222222
2000 인구감소출산율저출산여성정부국가선진국예측전환
371912101097777
2001 인구저출산출산율아이고령화노동력정부노인여성복지
38363633292727262518
2002 여성출산율정책정부저출산기업보육인구가족일본
85745240383332322726
2003 인구여성출산율저출산정부정책노인고령화결혼
(부담)
지원
202198176161139129106897973
2004 여성저출산정부인구지원출산율고령화가족정책가정
385367330238214207201182182178
2005 저출산정부여성인구자녀지원고령화대책정책가정
1,500919903811703670607522512448
2006 저출산정부여성자녀지원인구고령화대책정책일본
2,2551,7841,2371,073960939833816781701
2007 정부저출산정책지원여성경제교육국가자녀한국
927919668614589432432420394365
2008 정부저출산여성지원인구정책경제교육출산율세계
732715688522468432407329308298
2009 저출산지원정부자녀여성정책출산율가족인구교육
2,8381,7271,4451,2571,244951936911889755
2010 저출산지원정부여성정책인구결혼자녀가정대책
3,2022,4572,2111,8261,5981,4091,3271,2221,030965
2011 저출산복지정부지원정책여성인구자녀교육경제
2,0291,7711,4131,395946925829762708657
2012 정부저출산지원정책여성복지인구경제고령화한국
1,3541,3011,2191,0791,040975904769630602
2013 저출산정부여성인구경제지원정책고령화복지기업
1,061941820809671671616474405401
2014 저출산인구정부여성결혼정책싱글세지언고령화복지
1,7381,2791,1591,102847818736701679629
2015 정부저출산정책경제인구지원결혼여성일자리고령화
3,0392,9521,6901,5921,4941,3011,1441,0921,060985
2016 저출산정부인구정책지원여성경제일본자녀한국
3,3422,8511,9581,7161,7141,6211,3591,1221,0971,076
2017 저출산정부정책여성일자리지원인구경제결혼한국
4,1713,5542,7332,4962,3362,1921,9741,5071,3551,250
2018 저출산정부지원정책인구여성일자리예산확대경제
6,9004,7304,0844,0513,4243,1842,3392,2762,1282,123
2019 인구저출산정부한국지원정책여성일본경제결혼
3,6033,0282,4111,7611,7251,7191,6281,4041,2201,175
총괄 기획
김유영 디지털뉴스팀 차장
기획 및 취재
황규인 디지털뉴스팀 기자,
강은지 정책사회부 기자,
김형민 경제부 기자
(이상 동아일보)
빅데이터 분석
웹페이지 기획/구현
후원
한국언론진흥재단