2024.10.18 (금)

  • 흐림동두천 15.6℃
  • 흐림강릉 20.0℃
  • 서울 17.6℃
  • 대전 19.4℃
  • 흐림대구 23.1℃
  • 흐림울산 23.1℃
  • 흐림광주 25.1℃
  • 흐림부산 24.0℃
  • 흐림고창 22.8℃
  • 구름많음제주 29.8℃
  • 흐림강화 14.6℃
  • 흐림보은 19.8℃
  • 흐림금산 20.6℃
  • 흐림강진군 24.5℃
  • 흐림경주시 24.0℃
  • 흐림거제 22.7℃
기상청 제공
상세검색

학교경영

[박남기의 교단춘추] 생성 AI 시대 보고서 부과 및 평가방법

 

들어가며
9월호에서 이야기한 것처럼 생성 AI를 사용하는 사람들은 의존성과 중독성을 보일 가능성이 높다. 특히 인지가 충분히 발달하지 않은 청소년이 교사가 요청한 과제를 수행하면서 AI에 의존할 경우에는 뇌 발달이 제대로 이뤄지지 못하고, 필요한 지식과 역량을 제대로 갖추지 못하게 될 가능성 또한 크다.

 

특히 대입에 영향을 미칠 고등학교 수행평가 과제의 경우에는 학생이 AI를 활용하고자 하는 유혹이 아주 클 것이므로 학교와 교사는 더욱 세심하게 대비해야 한다. 이 글에서는 입시에 영향을 주는 수행평가와 일반 보고서 과제를 부과하는 방법 및 평가방법 그리고 허용되지 않은 방식으로 AI를 활용했을 경우의 처벌 방향 등을 제시하고자 한다.

 

중·고등학교의 수행평가
대학생들이 보고서 수행과정에서 AI를 활용한 부정행위를 저지른 사례가 지속적으로 적발되고 있다. 서울 사립대 A 교수는 각자 집에서 온라인으로 중간고사를 보면서 각종 자료를 참고할 수 있도록 했더니, 대화형 인공지능(AI) 서비스인 ‘챗GPT’가 알려준 내용을 그대로 답안지에 적어낸 학생이 상당수 있었음을 나중에 알게 되었다. 그래서 기말고사는 대면 방식으로 변경했다고 한다. 이 경우에는 챗GPT를 사용하지 않아 상대적으로 낮은 점수를 받은 학생들만 손해를 보게 되어, 학생들은 더욱 적극적으로 활용하게 될 것으로 보인다(조재현, 2023). 


이러한 문제는 우리나라 고등학교에서도 나타나고 있다. 학생부종합전형에서 자기소개서 항목이 폐지되고, 그 결과 수행평가 점수가 차지하는 비중이 커지고 있어서 고등학교의 ‘AI 커닝’을 포함한 수행평가 공정성 문제는 향후 커다란 이슈가 될 것으로 예상된다. 이를 막기 위해 중·고등학교 수행평가는 수업시간에 학생이 직접 작성하는 것을 원칙으로 하고 있다. 하지만 태블릿PC 등 디지털 기기를 사용하면서 챗GPT 답변을 참고하는 것까지 막을 수 없는 실정이라고 교사들은 하소연한다(고은이, 2024). 


교사들이 이러한 하소연을 하는 이유는 ‘AI 커닝’에 대한 학교 차원의 상세한 기준과 처벌 등이 명시적으로 제시되지 않았기 때문이다. 가령 ‘수행평가시간에는 모든 전자기기를 소지할 수 없다. 만일 이를 어기고 전자기기를 소지하고 있거나, 이를 활용하다가 적발될 경우에는 수행평가 무효처리뿐만 아니라 학칙에서 정하고 있는 시험 부정행위에 준하는 처벌을 한다’는 등의 명확한 기준이 마련되어 있다면, 교사들은 어려움을 하소연하지 않을 것이다. 수능의 경우에는 전자기기 소지를 금지하는 명시적 규정과 처벌기준이 있기 때문에 감독관들이 이 문제를 하소연하지 않는 것과 같다. 


현재 수행평가만이 아니라 독후감·경진대회 등에서도 챗GPT를 활용하는 학생이 많아지고 있는 것으로 나타나고 있다. 보고서를 작성할 때 챗GPT를 포함한 생성 AI를 활용했는지 여부를 감별해 주는 AI도 등장했다. 실제로 고양국제고·미추홀외국어고·서울과학고·청심국제고 등 수행평가가 중요한 특목고들이 ‘GPT 킬러’를 도입했다(고은이, 2024).

 

이처럼 생성 AI를 활용했는지 여부를 판단해 주는 프로그램이 있기는 하지만, 업체 홍보와는 달리 학생들이 이의를 제기할 경우 그 프로그램 판단결과를 ‘AI 커닝’ 근거로 제시하기에는 오류 비율이 너무 높다. 교수들이 이러한 프로그램 활용을 금하는 미국 대학이 늘고 있는 이유는 이 때문이다.

 

또 다른 문제는 학생들도 보고서를 제출하기 전에 자기 학교가 사용하는 ‘GPT 킬러’를 활용하여 자신의 보고서를 검토할 수 있다는 점이다. 활용 확률이 높다고 표시되면 학생들은 일부 내용을 변형시켜 활용 확률을 낮춘 후 제출할 것이다. 이렇게 되면 원래 의도와는 달리 AI 커닝은 잡아낼 수 없게 된다. 


이러한 문제를 완화하려면 각 교육청 차원에서 수행평가 관련 ‘AI 커닝’ 판단기준과 처리방침 등에 대한 큰 원칙을 만들어 각급학교에 내려보내야 한다. 각급학교는 교육청 지침을 근거로 교사와 학생들이 숙의하여 학교 상황에 적합한 구체적인 판단기준과 처벌기준을 만들어야 한다.

 

일차적인 목적은 AI 커닝을 줄이는 것이지만, 보다 근본적으로는 학생들이 AI에 의존하거나 중독되는 것을 막기 위함임을 학생들에게 알려야 한다. 이렇게 하면 AI 커닝을 줄일 수 있을 뿐만 아니라 학생들이 자신의 뇌를 활용해 과제를 처리함으로써 기본지식을 제대로 습득하게 하고, 나아가 고급역량을 기를 수 있도록 유도할 수 있다. 

 

일반 과제평가 
학생들이 혼자서 공부하다가 동영상이나 교재 내용 중에서 이해가 잘 안되는 부분, 혹은 스스로 궁금한 점을 찾아볼 목적으로 생성 AI를 활용한다면 공부할 내용에 대한 이해도는 더 높아질 것이다. 하지만 생성 AI에게 의존하여 과제를 수행할 경우에는 과제 수행과정을 통해 길러주고자 했던 학생의 이해력·논리적 사고력·분석력·비판력·창의력 등의 다양한 역량은 길러지지 않게 될 것이다. 


교실에서 교사의 감독하에 과제를 수행하도록 하지 않는 한, 과제 수행과정에서 AI 활용을 금할 수 없는 상황이 되었다. 이러한 상황에서는 학생이 자력으로 과제를 수행했다고 가정하여 이를 평가하고, 피드백해 주는 것이 무의미해진다. 그렇다면 어떤 방식으로 학생들에게 보고서를 부과하고 평가할 때, 학생역량 발달이라는 목적을 달성할 수 있을까? 이하 글은 박남기(2024)의 <생성 AI 시대 교수법> 내용을 발췌하여 수정·보완한 것이다. 


과거에도 그러했지만, 생성 AI 시대에는 인터넷 검색을 통해 답을 짜깁기할 수 있는 수준의 보편적인 과제 부과는 더욱 무의미해졌다. 따라서 반드시 AI가 해낼 수 없는 부분이 포함된 과제를 부과해야 한다. 수업 중에 배웠던 지식을 토대로, 교사가 제시하는 아주 구체적인 상황과 조건에 부합하는 해결책이나 아이디어를 제시하도록 하는 과제가 그 예이다.

 

프로젝트학습 및 문제해결학습을 포함해 이미 초·중·고와 대학에서는 그러한 유형의 과제를 부과하고 있기는 하다. 학생 자신의 느낌을 포함하고, 주위 사람들을 대상으로 한 조사연구가 포함되는 과제도 하나의 예가 될 수 있다. 직접 체험하고 이를 기술하게 하며, 그때 느낀 점을 서술하게 하고, 그 과정을 찍은 동영상이나 사진도 첨부하게 하면 학생들이 생성 AI에만 의존하지 않고 과제를 부과한 교사가 목표한 역량을 기르게 될 것이다.

 

이러한 과제를 평가할 때, 보고서에 포함된 분석틀이 생성 AI에게만 의존한 것인지 아니면 학생 스스로 다양한 노력을 기울여 만든 것인지를 알려면 분석틀을 만든 과정을 상세하게 기술하도록 하면 된다. 


과제를 통해 달성하고자 하는 목적에 ‘AI와의 협업 및 공존역량 강화’를 추가할 필요도 있다. 생성 AI 활용을 막을 수 없다면, 생성 AI가 내놓은 답을 예시로 제시하고, 그 답을 뛰어넘는 답을 작성하도록 유도하는 것도 하나의 방법이다. 스스로 노력하기보다는 생성 AI에 단어나 수식어를 바꾸어 입력하며 교사가 예시로 보여준 생성 AI의 답을 보완하려는 학생도 있을 것이다. 이를 막기 위해서는 보편적인 질문이 아니라 최근에 발생한 구체적인 사건 혹은 지역사회·학교의 특성 등이 반영된 구체적인 과제를 해결하도록 유도할 필요도 있다. 


생성 AI와의 협업이 가능한 과제일 경우에는 먼저 학생의 생각을 정리하고, 인터넷 검색 기능을 통해 수집한 자료를 바탕으로 생각을 추가한 후, 생성 AI가 제시한 답까지 활용하여 종합한 보고서를 제출하도록 하는 것도 필요하다. 이 경우에는 생성 AI가 제시한 방안에 대해 느낀 점까지 포함하는 것도 권장할 만하다.

 

과제 수행과정에 어떤 방식으로 생성 AI를 활용했는지 상세히 기술하게 하고, 생성 AI를 사용할 때와 사용하지 않을 때 어떤 차이가 있었는지를 기술하게 하는 것도 방안이다. 이 과정에서 생성 AI에게 던진 질문과 받은 결과물을 부록으로 제시하도록 할 필요도 있다. 이러한 노력을 기울이면 생성 AI에 대한 의존도가 높아지면서 학생들의 역량이 급속도로 저하되는 문제를 완화할 수 있을 것이다. 


그 이외에 여러 가지 대안들이 있다. 가령 학생들이 협업을 통해서만 해결할 수 있는 과제를 부과하고, 그 보고서 완성까지의 협업과정을 상세히 기술하게 하면 생성 AI에만 의존하는 것을 막을 수 있다. 가장 효과적인 방법은 보고서 자체를 평가하기보다는 수업 중에 보고서를 발표하게 하고 이를 평가하는 것이다.

 

AI가 학생 대신 발표할 수는 없기 때문이다. 발표할 때와 질의응답을 할 때 가능하면 자료를 보지 못하게 한다면 발표하는 내용에 포함된 보편적인 지식을 자기의 것으로 소화시켜 준비해야 하기에 기초·기본지식을 습득하는 데에도 보탬이 될 것이다. 


발표평가를 위해서는 발표평가에 활용할 기준표(rubrics)를 만들어 학생들에게 제시해야 한다. 평가기준표는 생성 AI를 활용하면 쉽게 만들 수 있다. 과제명·과제목표·과제내용과 길러주고자 하는 역량, 평가대상 학생 등을 구체적으로 제시하면 기대에 부합하는 평가기준표를 얻을 수 있다. 생성 AI가 제시한 평가기준표를 수정·보완하여 학생들에게 미리 제공하면 학생들이 발표 준비를 할 때 보탬이 될 것이다. 아울러 원하는 역량도 기르도록 유도할 수 있을 것이다. 


보고서에 포함된 지식과 인용 구절에 대해서는 반드시 출처만이 아니라 이 자료를 어떻게 찾았는지까지 밝히게 하면, 스스로 자료를 찾을 가능성이 높아진다. 이는 학생들을 괴롭히기 위함이 아니라, 학생들 스스로 관련 자료를 찾아 읽으면서 깊이 있는 지식을 쌓아가고, 생각의 폭과 깊이를 더하게 하고자 함임을 강조해서 이야기해 주어야 한다. 그리고 보고서를 평가할 때도 그러한 역량을 보이는지에 초점을 두어야 한다. 


전통적인 방식으로 국어·영어 혹은 사회시간에 특정 주제에 대한 글쓰기 과제를 부과하고자 한다면, 교사가 먼저 다양한 방식으로 생성 AI를 통해 답을 구한 후, 학생들이 제시한 과제와의 유사도를 검토해 보는 것도 하나의 방법이다. AI에게 보고서 작성을 시키면서도 이를 밝히지 않은 것으로 판단될 때는 일차적으로 ‘ZeroGPT’, ‘GPT 킬러’ 등을 활용해 기본 검사를 해볼 수도 있다. 만일 활용 확률이 높은 것으로 나타나면 학생과의 상담을 통해 사실 여부를 확인하고 감점할 것임을 사전에 공지하는 것도 방안이다. 

 

맺는말
학습이란 인간이 자신의 뇌를 활용하여 사유한 결과물이다. 과제 수행 시 AI에 너무 의존하면 학생의 뇌가 아니라 AI만 발달할 것이다. 학생들로 하여금 공부의 궁극적인 목적 그리고 해당 과제 수행의 목적을 명확히 깨닫도록 하는 기회를 자주 만들어야 한다. 


수업시간에 기회가 될 때마다 학생이 자신의 뇌를 활용한 독창적인 작업을 해야만 자신의 아이디어와 기술 개발에 도움이 됨을 설명하고 설득해야 한다. 또한 공부하고 과제를 수행하는 과정에서 정직과 독창적인 사고의 중요성을 강조함으로써, 학문적 정직성 유지 문화를 조성하는 것도 필요하다. 과제 수행에 어려움을 겪을 때 생성 AI가 아니라 교사에게 도움을 요청하도록 격려할 필요도 있다. 


때로는 불시에 생성 AI를 활용하지 못하는 교실상황에서 직접 주어진 주제에 대한 글쓰기를 하게 할 것임을 미리 알려주고 시행하는 것도 하나의 방법이다. 그리하면 생성 AI에 의존하여 과제를 수행하는 것이 결국은 별로 도움이 되지 않음을 깨닫게 될 것이다. 학교와 교사가 이상의 제반 노력을 기울여야만, 생성 AI가 학생 교육과 학생들의 학습 자세에 미칠 부정적인 영향을 최소화하면서 긍정적인 효과를 키울 수 있을 것이다.

관련기사


배너



배너


배너
배너