빅데이터에 대한 관심이 증가하고, 그 중요성이 확대되면서 데이터의 수집, 발굴, 분석을 지원하는 분야에 대한 수요가 급증하고 있다. 특히 사물인터넷(IoT), 클라우드(Cloud), 빅데이터(Big data), 모바일(Mobile) 기술과 인공지능(AI)의 결합으로 초연결·초지능화된 4차 산업혁명 시대의 핵심 기반 기술이 빅데이터이다. 버스 운행 정보가 지금은 일반적인 서비스가 되었지만, 2009년 경기도의 고등학교 2학년 학생이 서울과 경기도에서 제공하는 버스 운행 정보를 이용해 원하는 버스가 어떤 정거장에 언제 도착하는지 알려주는 앱을 만들어 폭발적인 인기를 끌었다. 또한 우리나라 프로야구에서도 경기 기록 데이터를 분석하여 선수들이 경기에 활용하고 있다. 메이저리그의 가장 가난한 구단이었던 오클랜드 애슬레틱스가 빌리 빈(Billie Beane) 단장 부임 이후 부자 구단들을 물리치고 4년 연속 포스트시즌 진출이라는 쾌거를 올린 것 역시 선수들의 방대한 데이터를 활용한 사례로 볼 수 있다. ‘21세기의 원유(Oil)’로 불리는 빅데이터는 국방, 의료, 비즈니스, 교육 등 다양한 분야에서 활용됨에 따라 그 응용 범위가 확대되고 있다. 교육에대한 국민적 관심이 높은 우리의 경우 산적한 고민들을 해결하기 위해 보다 적극적인 적용과 활용이 요구되고 있다. 일반적으로 빅데이터는 정형, 반정형, 비정형으로 분류하고 이러한 기준에 의하여 [표 1]과 같이 교육 데이터를 분류할 수 있다.
최근에는 교육 빅데이터 분야에서 학습과 관련된 데이터를 수집하고 분석하는 학습 분석(Learning Analytics)기술이 주목을 받고 있다. 2016년 가트너 보고서는 교육과 관련된 정보통신기술 분야에서 가장 기대되는 유망 기술을 학습 분석이라고 내다보았다([그림] 참조). 학습 분석은 학습자로부터 발생하는 다양한 데이터를 분석해 효과적인 학습 모델을 구축하는 것으로 학습자의 성적뿐만 아니라 행동, 성격 등 다양한 데이터를 수집해 풍부한 프로파일을 제공함으로써 개별화된 맞춤형(Personalized) 교육을 가능케 한다. 이미 오래전부터 미국의 대학들은 학습 분석기술을 도입하여 효과를 톡톡히 보고 있다.
애리조나 주립대학은 입학생들 중 다수가 대학교육을 따라가기 힘든 수학능력 부족 상태에 있었다. 기초수학 과목부터 중도 포기 학생이 늘고 학업성취도가 낮아 고민이던 대학 측은 이를 극복하기 위해 학생들의 학습시간, 학습 참여, 문제풀이 등 데이터를 수집하여 개별적으로 학생들을 분석했다. 그 결과 기초수학 과정 이수율이 65%에서 85%로 향상되었으며, 수업 만족도도 높아졌다. 조지아 주립대학은 2011년 처음으로 대학 자문위원회에 S/W 기업을 포함시키고 약 1년간 데이터를 수집하여 3만 명의 학생과 관련된 800개의 변수를 분석, 5만회 이상의 학생 상담을 유도했다. 그 결과 2012년 대비 2016년에는 졸업생이 지출한 수업료에서 1500백만 달러를 절약하고 대학은 3백만 달러의 투자 수익률(Return on Investment)을 달성하였다. 미시건 대학은 대규모 강좌에서 맞춤형 메시지 및 데이터 그래프를 개별 학생에게 제공해주는 지능형 시스템을 통하여 학업성과를 10~20% 높였다고 한다. 이와 같이 학습 분석기술은 교수-학습적인 측면에서도 효과가 있지만 효율적인 학교경영에도 도움이 되고 있다.
미국의 NMC(New Media Consortium)와 CoSN(Consortium for School Networking)이 공동으로 출간한 호라이즌 보고서(Horizon Report)는 초·중등교육과 고등교육 분야에 적용될 기술을 [표 2]와 같이 3단계로 분석하여 제시했다.
학습 분석의 장점은 교수-학습을 돕고 학습자의 학습활동을 이해할 수 있다는 데 있다. 즉, 학습자의 학습 맥락(Context)을 이해하고 측정(Measure)과, 분석이 가능하기 때문에 발생 가능한 상황을 선제적으로 파악하여 대처할 수 있게 된다는 것이다. 또한 교수자는 실시간 통계를 통하여 학습자가 어떻게 반응하는지 확인할 수도 있고, 다른 학습자의 반응을 참조할 수도 있으며 학습자와 상호작용을 활발히 할 수 있다. 또 학습자는 다른 학습자(Peers)의 학습 과정을 참고함으로써 학습동기(Motivation)를 부여받을 수 있게 된다. 국내에서도 온라인 활동이 중심인 사이버대학의 경우 과목당 재등록률을 높이기 위해 학생의 학습 시간, 습관, 참여도 등을 분석하여 대응하고 있는 사례를 흔히 볼 수 있다. 하버드 대학 입학보다 더 어렵다는 파괴적 혁신(Disruptive Innovation)의 아이콘 미네르바 스쿨의 교수-학습 과정에서도 실시간으로 학습자의 상호작용을 분석하여 수업에 참여도를 높이는 교수법을 사용하고 있다.
4차 산업혁명 시대의 교육은 3차 산업혁명으로 촉발된 다양성을 지능적으로 지원하고 학습자 개인이 직접 문제를 해결하는 메이커(Maker)가 될 수 있도록 새로운 역량을 키워주는 시스템으로 패러다임이 전환되어야 한다. 이때, 빅데이터와 학습 분석기술을 적절하게 사용하기 위해 우리는 교육 데이터가 축적되는 플랫폼에 먼저 관심을 가질 필요가 있다. 현재 교육행정 및 재정정보는 나이스(NEIS)와 에듀파인 플랫폼에 축적되고 있고, 초·중등교육과 관련된 교수-학습자료는 에듀넷, 방송통신중고등학교, EBS, 시·도교육청에서 운영하는 정보시스템, 학교 홈페이지 등에 산재되어 있다. 고등교육 데이터는 각 대학이 보유하고 있으며, 교수-학습과 관련된 데이터는 KOCW, K-MOOC 등에 수집되어 서비스되고 있다. 그리고 1998년부터 시행된 ‘공공기관의 정보공개에관한법률’에 의해 정보가 공시되고 있고 관련 통계가 수집 및 공개 서비스(edss.keris.o.rkr)되고 있다.
미래사회는 플랫폼 경쟁이라고 해도 과언이 아닐 것이다. 궁극적으로 교육과 관련된 데이터를 통합하는 플랫폼이 구축되어 모든 학생이 활동하는 공간이 된다면 빅데이터와 학습 분석을 통하여 지능화된 개인별 맞춤 교육을 지원할 수 있게 된다. 아울러 최소한 각 플랫폼 간의 연계를 통하여 서비스를 개발한다면 대한민국 교육의 효율성을 높이는 실마리를 찾을 수 있을 것으로 기대된다. 특히 온라인 활동이 보편화되어 있고 그 효과성도 검증되고 있는 대학교 이상의 성인학습자를 위한 빅데이터와 학습 분석기술에 대한 대학과 정부의 적극적인 노력이 필요하다.