디지털교과서, 학습데이터에 성패 달렸다

2023.05.08 10:30:00

챗GPT에 대한 관심이 뜨겁다. 인공지능 기술이 교육의 패러다임을 송두리째 바꿀 것이라는 전망이 지배적이다. 이에 맞춰 우리나라에서도 디지털교과서가 2025년 도입된다. 영어·수학·정보교과부터 시작이다. 과목은 앞으로 더 늘어날 수 있다.

 

AI 등 첨단기술을 활용해서 학생들에게 개인의 역량, 학생들의 배움 속도에 맞는 맞춤 교육을 제공한다는 게 디지털교과서 도입의 가장 큰 목적이다. 학생 한 명 한 명을 소중한 인재로 키우고, 교사들은 학생과의 인간적 연결에 더욱 집중할 수 있도록 해 인성·창의성·비판적사고력 같은 이런 디지털시대에 필요한 역량을 키우도록 하겠다는 것이 교육부의 설명이다.

 

선진국에서는 이미 시작됐다. 영국의 경우에는 학교에서 교원의 업무경감, 학생의 학습성과 향상, 학교의 효율적 경영 등 다양한 분야에서 디지털기술을 사용하고 있다. 독일도 2019년부터 전국에 디지털 인프라를 구축하는 ‘디지털팍트(DigitalPakt Schule)’ 사업을 추진하고 있다. 일본은 확산 속도가 우리보다 한참 앞서 있다.

 

현재 우리가 추진하고 있는 디지털교과서의 경우, 수학은 AI 튜터링이라는 맞춤형 학습 제공 기능으로 학생들의 맞춤 학습을 지원한다. 영어는 음성인식 기술을 통해서 듣기 뿐만 아니라 말하기 교육을 강화한다. 또한 정보과목에서는 학부모들이 부담을 많이 느끼는 코딩 교육을 교육과정 내에서 실습을 할 수 있는 방향으로 추진된다.

 

하지만 과제도 만만치 않다. 먼저 일선 학교들이 제대로 준비가 돼 있느냐 하는 점이다. 무엇보다 학교 유무선 통신망 등 인프라와 교사들의 역량이다. 교사들이 능숙하게 다루고 데이터 분석이 가능하도록 연수를 한다고 하지만 얼마나 성과를 거둘지 의문이다. 기술만 있고 철학은 없다는 지적도 있다. 속도보다 방향을 강조하는 목소리가 나오는 것도 이 때문이다.

 

이와 더불어 AI 교육시대, 가장 중요한 것은 교사다. 교사가 어떤 역할을 하느냐가 성패를 가르는 관건이다. AI를 활용한 학생 개별지도는 물론 학생들이 유해 사이트나 앱에 접근할 수 없도록 차단하는 안전장치 구축과 인공지능 윤리에 대한 교육도 교사 몫이다.

 

이번 호는 윤석열 정부 교육정책의 핵심으로 꼽히는 디지털교과서를 다룬다. 새롭게 선보일 디지털교과서는 어떤 모습이며, 어떤 방식으로 수업에 활용되는지 알아본다. 디지털교과서에 담기는 AI 기술 수준도 함께 다룬다. 이어 우리보다 앞선 일본의 사례와 함께 미국·영국·호주 등 각국의 디지털교과서 개발 및 보급 현황을 살펴본다.

 

아울러 디지털교과서 등장과 함께 교사의 역할은 어떻게 달라져야 하는지, 교사들은 어떤 역량을 준비해야 하는지, 그리고 기대와 우려가 교차하는 디지털교과서에 대한 전문가들의 의견도 모아 본다.


AI가 가져오는 변화

 


챗GPT와 같은 AI 기능을 가진 디지털교과서가 교실에 들어오게 되면 우리 교육은 어떻게 변화하게 될까? 교사는 어떤 역할을 수행해야 하는 것일까? 


SF 영화에서 보았을 법한 AI가 도입된다면 교육에는 분명 엄청난 변화가 일어날 것이다. 그러나 현재의 AI 기술 수준이 아직 거기까지는 미치지 않는 것 같다. 그렇다면 2025년에 도입된다는 AI 디지털교과서는 어느 정도 수준이 될 수 있을까? 이를 가늠해 보기 위해서는 현재 적용 가능한 AI 기술을 살펴보는 것도 중요하지만, AI를 교과서라는 체제 속에 어느 정도 담을 수 있는지 파악하는 것도 매우 중요하다.

 

 

AI 코칭의 원리와 교과서
AI, 즉 인공지능은 사람을 모델로 문제해결방법을 찾아내는 컴퓨터 프로그램이다. 따라서 최근에는 사람처럼 판단하고자 사람의 신경구조를 본떠서 판단하고 추론하는 딥러닝 알고리즘을 많이 활용하고 있다. 이러한 딥러닝 알고리즘은 사람의 신경망을 그대로 흉내 낸 인공신경망을 활용하여 판단과 추론을 수행한다. 그리고 이러한 딥러닝 알고리즘을 이용해 학습코칭을 해주는 방법의 하나가 DKT(Deep Knowledge Tracing)이다. DKT는 학생의 학습능력을 예측한다. 그래서 학생이 알 수 있는 내용과 모를 수 있는 내용을 판단할 수 있다. DKT를 통해 학생의 학습능력을 예측할 수 있는 것은 학생의 학습이력을 분석함으로써 가능하다. 


최근 토플이나 토익시험을 보지 않고도 학습자의 점수를 예측해 틀릴 수 있는 문제에 대한 영어학습을 집중시켜 주는 AI 영어서비스에서 그 예를 찾아볼 수 있다. 하지만 이러한 서비스는 한 가지 전제 조건이 있다. 학습자가 실제 토익이나 토플시험을 치르지 않았지만, 학습능력을 판단하기 위한 사전평가나 학습과정이 반드시 이루어져야 한다는 것이다. 


그 이유는 학습자의 학습능력을 예측하기 위해서는 그와 관련된 데이터 분석이 필요한데 그런 데이터는 사전평가나 학습과정을 통해 모아지기 때문이다. 결국은 실제 토익이나 토플시험 점수를 예측하기 위해서는 관련 데이터가 반드시 필요하다는 의미이다.

 

다음과 같은 수학 시험지가 있다고 가정하자. 1번은 자연수 개념에 관한 문제이고, 2번은 사칙연산에 관한 문제이며, 3번은 분수의 개념에 관한 문제, 4번은 분수의 덧셈에 관한 문제이다. A라는 학생이 4번 문제를 맞힐 수 있는지 DKT를 통해 예측할 수 있다. DKT를 통해 예측하는 방법은 학생 A가 1번·2번·3번 문제를 먼저 풀어야만 가능하다. 분수의 덧셈은 자연수 개념과 사칙연산 그리고 분수의 개념을 알아야 풀 수 있는 문제이기 때문이다. 이 중 하나라도 정확하게 알지 못하는 부분이 있다면 학생 A가 4번 분수의 덧셈 문제를 맞힐 확률은 낮아지게 된다. 즉 ‘1번·2번·3번 각각의 문제들이 4번 문제와 어느 정도의 연관성을 가지는가?’에 따라 4번 문제의 정답률을 예측하게 되는 것이다. 다시 말하면 각 1번·2번·3번 문제들의 정·오답률에 기반해 4번 문제의 정·오답률이 계산되는 것이다. 

 

아주 쉽게 단순화하여 한 가지 예를 더 들어보자. 분수의 덧셈 문제를 풀기 전에 학생 A가 사전에 학습한 1번 자연수 개념, 2번 사칙연산, 3번 분수 개념의 정답률이 80%, 50%, 60%라고 각각 가정해 보면 이때 학생 A가 4번 분수의 덧셈 문제를 맞힐 수 있는 정답률은 0.8×0.5×0.6=0.24, 즉 24%가 되는 것으로 계산할 수 있다(물론 DKT는 이보다 훨씬 더 복잡한 알고리즘을 통해 정답률을 계산한다). 그리고 여기에 1번·2번·3번 각각의 문제 개념과 4번 문제의 개념 간 연관성이 고려된다. 즉 1번 자연수의 개념이 4번 분수의 덧셈과 어느 정도의 연관성이 있는지 수치가 결정되면, 1번 문제의 정답률에 따라 4번 문제의 정답률을 예측하는 정확도가 더 높아지게 된다. 그리고 이러한 두 문제 간의 연관성은 이론적으로 명확히 정의된 것들이 거의 없어 처음부터 완벽하게 설정할 수 없다. 따라서 처음에는 임의의 값으로 설정한 후 학생들이 문제를 푼 경험치를 적용해 두 문제의 개념 간 연관성을 수정해 가게 된다. 결국 새로운 학생들이 문제를 풀 때마다 정확도는 조금씩 높아지도록 조정되므로 문제를 푸는 학생들이 많아질수록 연관성의 정확도는 높아지게 되는 것이다.


이상의 복잡한 설명을 결론적으로 요약한다면 A 학생의 4번 문제 정답률을 예측하기 위해서는 1번·2번·3번 문제와 4번 문제 간의 연관성을 분석할 수 있는 방대한 데이터와 A 학생의 1번·2번·3번 문제의 정답률을 계산할 수 있는 학습이력 데이터가 반드시 필요하다는 것이다. 그리고 1번·2번·3번 문제와 관련된 A 학생의 학습이력 데이터가 많을수록 4번 문제의 정답률 예측은 정확해진다.

 

 

또한 이러한 DKT 방법을 통한 학습능력 예측은 개인뿐만 아니라 집단 단위로도 가능하다. 특정 학급뿐만 아니라 특정 학교, 특정 지역의 학생들에 대한 학습능력도 예측할 수 있게 된다. 그리고 단순 예측에만 그치는 것이 아니라 이를 기반으로 학습패턴을 모델링하고, 이 모델을 근거로 가장 효과적인 학습방법을 찾아낼 수도 있으며, 찾아낸 학습방법을 통해 교육효과를 높일 수 있다. 결국 DKT는 사전학습 데이터가 충분히 쌓여 있다면 이 데이터 분석을 기초로 학생들에게 매우 효과적인 학습방법을 안내할 수 있게 되는 것이다.


그렇다면 이와 같은 DKT가 디지털교과서에 접목되기 위해서는 사전학습 데이터가 충분히 쌓여 있어 학생들에게 의미 있는 학습을 코칭해 줄 수 있어야 한다. 그러나 이러한 사전학습 데이터는 짧은 시간 내에 충분히 축적하기는 매우 어렵다. 교과서는 신뢰성이 높아야 하기 때문에 많은 학생이 오랜 기간 사용을 통해 쌓은 방대한 데이터가 필요하다. 도입 초기에는 사전 데이터가 부족하여 코칭의 정확도가 떨어질 수 있다는 해명은 교과서로써 용인되기 어렵기 때문이다.


이러한 조건에 비추어본다면 2025년에 도입될 수 있는 AI 디지털교과서는 충분한 사전학습 데이터가 갖추어진 교과목만이 가능하다고 볼 수 있으며, 이런 교과목은 민간 교육기업에서 지난 몇 년 동안 AI 서비스가 이루어진 수학과 영어에 불과하다. 그리고 프로그램 개발자 양성과 평가과정에서 AI 코칭이 적용되고 있는 코딩교육 분야를 추가할 수 있다.


이러한 의미에서 지난 2월에 교육부가 2025년에 도입될 AI 디지털교과서의 교과로 수학·영어·정보를 발표한 것은 매우 타당하다고 볼 수 있다. 


그렇다면 나머지 교과들은 2025년 AI 디지털교과서 도입이 불가능한 것일까? 하지만 교과 나름대로의 특성을 찾아 수학·영어·정보와 같은 학습능력의 예측에 의한 코칭이 아닌 다른 기술들의 적용을 검토할 수 있다. 예를 들어 챗GPT와 같은 생성 AI를 교과내용만으로 한정지어 학생의 질의에 대한 응답을 생성해 코칭하는 방법도 가능하고, 학습활동 과정별로 학생의 학습이력 데이터가 수집되어 학습과정을 분석하여 코칭하는 방법도 가능하다. 하지만 이러한 예들도 모두 사전에 충분한 시범 적용을 통해 충분한 데이터가 확보되어야 더 의미 있는 AI 코칭이 가능할 것으로 여겨진다.

 

마무리
2025년에 도입될 AI 디지털교과서의 모습을 단정하기는 어렵지만, 현재의 기술 및 시장 상황과 교과서의 특성을 고려할 때 모든 교과에 적용하기는 어려움이 있고 지금까지 민간이 주도해 온 교육시장에서 어느 정도 경험치와 데이터가 확보된 분야만 가능할 것으로 판단된다. 어떤 과목은 학습내용 전체에 AI 코칭을 적용할 수 있겠지만, 어떤 과목은 일부의 학습내용에만 AI 코칭이 적용될 수밖에 없을 것이다.
따라서 2025년 도입 초기에는 AI 코칭이 기대에 미치지 못해 실망을 느낄 가능성도 있다. 하지만 AI 코칭은 학습이력 데이터가 많이 쌓여갈수록 의미 있는 다양한 분석이 가능해지므로 점점 효과성이 높아질 것은 분명하다. 

 


 

 

 

안성훈 경인교대 교수
ⓒ 한국교육신문 www.hangyo.com 무단전재 및 재배포 금지

구독 문의 : 02) 570-5341~2 광고 문의: sigmund@tobeunicorn.kr ,TEL 042-824-9139, FAX : 042-824-9140 한국교원단체총연합회 | 등록번호 : 서울 아04243 | 등록일(발행일) : 2016. 11. 29 | 발행인 : 문태혁 | 편집인 : 문태혁 | 주소 : 서울 서초구 태봉로 114 | 창간일 : 1961년 5월 15일 | 전화번호 : 02-570-5500 | 사업자등록번호 : 229-82-00096 | 통신판매번호 : 2006-08876 한국교육신문의 모든 콘텐츠는 저작권 보호를 받는 바 무단 전재, 복사, 배포 등을 금합니다.