2026.05.08 (금)

  • 맑음동두천 18.8℃
  • 구름많음강릉 19.7℃
  • 맑음서울 19.8℃
  • 맑음대전 20.8℃
  • 맑음대구 21.5℃
  • 구름많음울산 21.3℃
  • 맑음광주 20.3℃
  • 구름많음부산 22.9℃
  • 맑음고창 18.3℃
  • 맑음제주 19.6℃
  • 맑음강화 19.4℃
  • 맑음보은 19.3℃
  • 맑음금산 20.1℃
  • 맑음강진군 21.7℃
  • 맑음경주시 21.7℃
  • 구름많음거제 21.6℃
기상청 제공
상세검색

제언·칼럼

AI기반 서·논술형 평가, 현장 안착 넘어 ‘학교교육의 존재 이유’를 물어야

교육청·교사들의 노력은 평가혁신의 소중한 출발점
평가는 “무엇을 채점할 것인가”보다
“인간은 무엇을 배워야 하는가”에서 출발해야

AI 기반 서·논술형 평가가 학교 현장의 새로운 평가체제로 주목받고 있다. 객관식 중심 평가의 한계를 넘어 학생의 사고력, 문제해결력, 표현력, 논리적 설명 능력을 평가하려는 시도는 분명 중요한 변화다. 특히 이를 학교 현장에 안착시키기 위해 교육청과 교육연구기관, 현장 교사들이 기울여 온 노력은 정당하게 평가받아야 한다.

 

한국교육개발원은 7일 오후 서울 프레지던트호텔에서 ‘AI 기반 서·논술형 평가의 현장 안착과 실천 과제’를 주제로 2026년 제2회 교육정책네트워크 교육정책 토론회를 개최했다. 이번 토론회는 교육부, 서울특별시교육청, 인천광역시교육청, 경기도교육청, 교육정책네트워크가 공동 주최하고 한국교육개발원이 주관했으며, KEDI TV를 통해 유튜브 생중계도 진행됐다.

 

 

이번 토론회는 미래형 학생평가로서 서·논술형 평가의 방향을 모색하고 AI 기술을 활용한 평가 혁신이 학교 현장에 안정적으로 정착할 수 있는 방안을 논의하기 위해 마련됐다. 한국교육개발원은 교육현장의 주요 현안을 다각적으로 분석하고 교육수요자의 의견 수렴을 통한 실제적 교육정책 개선 방안을 모색하고자 하였다.

 

교육청과 교사들의 노력은 인정되어야 한다

이번 논의에서 먼저 확인해야 할 것은 교육청과 현장 교사들의 수고다. AI 기반 서·논술형 평가가 아직 완성된 제도가 아님에도 서울·경기·인천교육청은 각자의 방식으로 평가 혁신을 실험하고 있다. 서울시교육청은 교사 주도성을 강화하는 지능형 채점 지원 시스템 ‘채움AI’의 구축 성과와 공정성 확보 방안을 제시했고, 경기도교육청은 하이러닝 AI 서·논술형 평가시스템 기반 채점 표준화 성과와 2026년 교과 확대를 포함한 단계적 정착 전략을 설명하는 것으로 안내됐다. 인천교육청의 현장교사는 ‘생각을 꺼내는 교육’을 위한 AI기반 서·논술형 평가와 서·논술형 평가의 현장 경험과 AI 활용 가능성을 중심으로 토론하였다.

 

현장 교사들의 노력도 가볍게 보아서는 안 된다. 서·논술형 평가는 객관식 평가보다 문항 설계, 루브릭 구성, 채점, 피드백, 재지도 과정에서 훨씬 많은 시간과 전문성을 요구한다. 특히 교사는 단순히 답안을 채점하는 사람이 아니라 학생의 사고 과정을 읽고 수업과 다시 연결해야 하는 부담을 안고 있다.

 

이번 토론회에서도 현장 교사들은 AI 활용의 가능성과 한계, 채점 부담, 피드백의 어려움, 평가를 학습으로 확장할 가능성을 함께 제시했다. 이는 AI 평가가 단순한 기술 도입이 아니라 교사의 전문성과 학교 현장의 실천 위에서만 가능하다는 사실을 보여준다. 따라서 AI 기반 평가시스템에 대한 비판적 질문은 교육청과 교사들의 노력을 부정하는 것이 아니다. 오히려 지금까지의 실천을 더 큰 교육적 질문으로 확장하기 위한 것이다.

 

그러나 질문은 더 근본적이어야 한다

이번 토론회의 공식 초점은 “AI 기반 서·논술형 평가의 현장 안착”이었다. 이는 현실적으로 필요한 논의다. 학교 현장에서는 채점의 공정성, 교사 업무부담 완화, AI 기반평가의 신뢰성, 평가 기준의 일관성 문제가 매우 절박하다. 그러나 AI 평가시스템의 출발점은 여기에서 멈추어서는 안 된다. 더 근본적인 질문은 이것이다.

 

AI 기반 평가시스템을 과연 왜 운영하려 하는가.

단지 객관식 평가의 한계를 보완하기 위해서인가. 교사의 채점 부담을 줄이기 위해서인가. 학생의 글쓰기 능력을 더 정교하게 평가하기 위해서인가. 아니면 생성형 AI 등장 이후, 장차 AGI와 ASI까지 논의되는 시대에 인간은 무엇을 해야 하며 학교는 무엇을 가르쳐야 하는지를 묻기 위해서인가. 이 질문에 대한 답에 따라 AI 기반 평가시스템은 전혀 다른 길로 갈 수 있다.

 

객관식에서 논술식으로 바꾸는 것만으로는 충분하지 않다

그동안 학생들의 학습 결과에 대한 평가는 정답을 찾는 능력에 익숙했다. 학생이 얼마나 정확히 기억하는지, 얼마나 빠르게 문제를 푸는지, 정답을 얼마나 잘 고르는지가 중요한 평가 기준이었다. 그러나 생성형 AI의 등장은 이 전제를 흔들고 있다. 이제 정보검색, 요약, 번역, 글쓰기, 자료 분석, 코딩, 이미지 생성은 인간만의 독점적 능력이 아니다. 그렇다고 해서 객관식을 서·논술형으로 바꾸는 것만으로 교육혁신이 이루어지는 것은 아니다.

 

생성형 AI는 이미 글도 쓴다. 논리적 문단도 구성한다. 반론과 재반론 형식도 만들어낸다. 그렇다면 서·논술형 평가는 무엇을 평가해야 하는가. 학생이 쓴 문장의 유려함인가. 정해진 구조에 맞춘 답안인가. AI가 높게 평가할 만한 표현인가. 아니면 학생이 자기 생각을 만들고, 근거를 찾고, 오류를 고치고 더 나은 판단으로 나아가는 과정인가. 이 구분이 중요하다. 서·논술형 평가가 단순히 “좋은 답안 쓰기”로 흐르면 객관식 문제풀이 경쟁은 논술형 글쓰기 경쟁으로 바뀔 뿐이다.

 

조선시대의 과거식 글쓰기 경쟁을 경계해야 한다

‘조선, 시험지옥에 빠지다’라는 이한 작가의 책에서 조선시대의 입시에 관한 이야기를 재미있고 깊이 있게 서술하고 있다. AI 서·논술형 평가가 대입과 강하게 연결되면 조선시대 과거시험처럼 제도화된 글쓰기 경쟁으로 변질될 위험이 있다. 조선시대의 과거가 본래 인재 선발 제도였으나 시간이 흐르면서 과거문 작성 기술, 암기, 사교육, 출세 경쟁으로 흘렀던 것처럼 현대의 서·논술형 평가도 대입과 결합하면 “생각하는 교육”이 아니라 “선발에 유리한 문장 생산”으로 흐를 수 있다.

 

특히 AI가 채점 기준을 제공하고, 루브릭이 공개되며, 대학입시가 이를 선발 자료로 활용하게 되면 사교육은 곧바로 대응할 것이다. AI가 선호하는 문장 구조, 고득점 답안 유형, 성장 포트폴리오 구성 방식, 면접용 자기성찰 서사까지 상품화될 수 있다. 그렇게 되면 AI 기반 평가는 교육혁신이 아니다. 그것은 객관식 경쟁을 논술형 경쟁으로 바꾼 새로운 입시 체제일 뿐이다.

 

AI는 채점자가 아니라 성장 기록자가 되어야 한다

AI 기반 평가시스템이 교육적으로 의미를 가지려면 학생을 한 번에 점수화하는 도구가 되어서는 안 된다. AI는 학생 답안을 빠르게 채점하는 기계가 아니라 학생의 사고 과정과 성장 과정을 기록하는 보조도구가 되어야 한다. 학생이 처음에는 주장만 있고 근거가 부족했으나 피드백과 재작성 과정을 거쳐 그 자료를 바탕으로 자기 생각을 설명할 수 있게 되었다면 그것이 성장이다. 학생이 개념을 오해했지만 토론과 질문, 재작성 과정을 거쳐 자신의 오류를 고쳤다면 그것이 평가되어야 한다.

 

이때 AI가 할 일은 점수를 확정하는 것이 아니다. 학생의 이전 답안과 현재 답안을 비교하고 변화된 부분을 분석하며 교사가 개별 피드백을 제공할 수 있도록 돕는 것이다. 최종 판단은 교사의 몫이어야 한다. 하민수 서울대 교수는 AI 기반 평가가 교사의 평가를 대체하는 것이 아니라 지원하는 교사 주도형 도구로 자리 잡아야 한다고 강조하였다. 결국 AI는 평가의 주체가 아니라 지원자다. 교사는 여전히 학생을 이해하고 해석하는 최종 교육 전문가다.

 

대학입시와 연결할수록 더 조심해야 한다

대학이 학생 선발 과정에서 최소한의 학업역량을 요구하는 것은 필요하다. 대학 수업을 따라가기 위한 문해력, 수리·논리력, 표현력, 전공에 따른 기초역량은 확인되어야 한다. 그러나 최소능력 확인과 학생 서열화는 구분되어야 한다. AI 서·논술형 평가 결과를 대입에 직접 반영한다면 위험은 커질 수도 있다. “AI 논술력 점수”, “AI 성장지수”, “AI 사고력 등급” 같은 방식으로 활용되는 순간 그것은 새로운 입시 점수가 된다.

 

학생은 성장하기보다 점수를 잘 받는 답안 구조를 훈련하게 되고 학교는 학생의 배움을 지원하기보다 기록을 관리하는 기관으로 변할 수 있다. 따라서 AI 성장평가 결과를 대입과 연결한다면 직접 점수로 반영해서는 안 된다. 학생부 세부능력 및 특기사항, 성장 포트폴리오, 면접 참고자료 등으로 제한적으로 활용해야 한다.

 

대학은 AI 점수를 보는 것이 아니라 학생의 초안, 피드백, 수정 과정, 교사 확인, 자기성찰을 통해 학습 가능성과 전공 적합성을 읽어야 한다. 최소 학업역량은 별도로 확인하되 그 기준을 넘은 학생에 대해서는 성장 과정과 학습 태도, 전공 관련 탐구의 지속성을 보는 방식이 더 타당하다.

 

평가 논의는 학교교육의 존재 이유로 확장되어야 한다

이번 토론회는 AI 기반 서·논술형 평가의 현장 안착을 논의했다는 점에서 의미가 크다. 교육청과 교사들이 평가 혁신을 위해 축적해 온 경험과 실천은 존중받아야 한다. 특히 교사 주도형 AI 기반 평가, 공정성 확보, 채점 부담 완화, 학생 피드백 강화는 학교 현장에서 반드시 해결해야 할 과제다.

 

이제 논의는 한 걸음 더 나아가야 한다.AI 기반 평가시스템의 핵심은 “어떻게 채점할 것인가”가 아니라 “무엇을 인간의 능력으로 볼 것인가”여야 한다. AI가 답을 찾아주는 시대에 학교는 좋은 질문을 만드는 능력을 가르쳐야 한다. AI가 글을 써주는 시대에 학교는 자기 관점을 세우고 책임 있게 표현하는 능력을 길러야 한다.

 

AI가 자료를 분석하는 시대에 학교는 자료의 진위와 맥락을 판단하는 능력을 가르쳐야 한다. AI가 빠르게 결과물을 만드는 시대에 학교는 인간의 성찰, 윤리, 협업, 공적 책임을 가르쳐야 한다. 그렇다면 평가는 학생을 더 정교하게 줄 세우는 장치가 아니라 학생이 질문하고 판단하고 표현하고 수정하며 성장하는 과정을 읽어내는 교육적 해석이어야 한다.

 

노력은 인정하되, 출발선은 다시 물어야 한다

AI 기반 서·논술형 평가는 평가 혁신의 중요한 시도다. 교육청의 정책적 노력, 교육연구기관의 지원, 현장 교사들의 실천과 노고는 충분히 인정되어야 한다. 이들의 시도 없이 학교 교육평가는 여전히 선택형 문항 중심의 관성에 머물렀을 가능성이 크다.

 

그러나 그 노력의 의미를 더 크게 만들기 위해서는 질문의 출발선을 다시 세워야 한다. AI 기반 평가시스템은 단순히 객관식 평가를 보완하기 위해 존재하는가. 교사의 채점을 돕기 위해 존재하는가. 학생의 답안을 더 정확히 점수화하기 위해 존재하는가. 아니면 AI 시대에 인간다운 배움과 성장을 다시 정의하기 위해 존재하는가.

 

이번 토론회가 현장 안착의 과제를 다루었다면 다음 논의는 학교 교육의 존재 이유를 물어야 한다. 생성형 AI 등장 이후의 학교는 지식을 더 많이 외우게 하는 곳도, AI 보다 더 빠르게 답을 내게 하는 곳도 될 수 없다.

 

학교는 학생이 좋은 질문을 만들고 자기 생각을 다듬고 타인과 협력하며 책임 있는 판단을 할 수 있도록 돕는 곳이어야 한다. AI 기반 평가시스템은 바로 그 성장을 기록하고 해석하는 도구가 되어야 한다. 그럴 때 비로소 AI 기반 서·논술형 평가는 또 다른 시험 기술이 아니라 학교 교육의 본질을 회복하는 계기가 될 수 있다.


배너



배너

배너
배너