개인적으로 분야는 다르지만 “박사과정을 마무리하며”라는 블로그 시리즈로 유명하신 KAIST 김주호 교수님의 연구를 항상 재미있게 읽고 있다. 항상 CHI라는 HCI Top-tier Conference에서 Community에게 좋은 평가를 받아오셨고, 이번에도 Best Paper를 지도하셨다.
내용을 정리하면 아래와 같은데… 아직까지 이런 연구들은 AI에게 대체되기는 어려울 것 같다. 흠냐… 나도 뭔가 이런 연구를 하는 방법을 배우는 것도 재밌을 것 같은데… second PhD… ㄱ?!
논문 요약
1. 연구 배경 및 목적
•
대형 언어 모델(LLM)이 학생들의 영어 쓰기를 단계적으로 돕는 훌륭한 도구가 될 것이라는 기대가 큽니다.
•
하지만 제한된 시간과 학생들의 다양한 실력 차이가 존재하는 '실제 오프라인 교실' 환경에서 실시간으로 AI를 썼을 때의 효과에 대해서는 연구가 부족했습니다.
•
이를 확인하기 위해 연구진은 한국의 중학교 2학년(8학년) 학생 157명을 대상으로 6주간 AI 작문 보조 도구(WRITEAID)를 실제 정규 수업에 투입하여 관찰했습니다.
2. 주요 발견 (실험 결과)
•
수준별 극명한 활용 차이: 상위권 학생들은 단순 단어 번역이나 확인 같은 '하위 수준의 작업'만 AI에게 맡기고 스스로 글을 구성했습니다. 반면, 하위권 학생들은 문장 생성 자체(고차원적 핵심 작업)를 AI에게 통째로 외주 주는 경향을 보였습니다.
•
정답을 안 주는 '스캐폴딩'의 역효과: AI가 정답 대신 힌트를 주며 스스로 생각하게 유도하는 방식(스캐폴딩)은 상위권에겐 유용했습니다. 하지만 45분이라는 시간 압박 속에서 하위권 학생들에게는 오히려 동기를 꺾고 짜증과 좌절을 유발하며 AI에 대한 의존도만 높이는 부작용을 낳았습니다.
•
교실 내 상호작용의 붕괴와 소외 현상: 소극적인 학생들은 교사나 친구에게 묻는 대신 만만한 AI에게만 의존하게 되었습니다. 그 결과, 원래 적극적이던 소수의 외향적인 학생들만 교사의 관심을 독차지하는 불평등이 발생했습니다.
•
교사의 시야 상실 (Illusion of Competence): AI가 개별 학생의 오류를 매끄럽게 다 고쳐주다 보니, 교사 입장에서는 반 전체 학생들이 공통으로 어려워하는 부분이 무엇인지 파악하고 적시에 개입하기가 매우 힘들어졌습니다.
3. 결론 및 향후 과제 (해결책 제안)
•
AI 튜터는 무작정 교육학적 이상(힌트 주기)만 고집할 것이 아니라, 학생의 실제 실력과 교실의 '시간제한'을 고려하여 유연하게 피드백을 조절해야 합니다.
•
교실 내에서 교사와 AI의 역할을 명확히 분리해야 합니다 (AI는 단순 반복 질문 처리, 교사는 고차원적 지도).
•
겉보기엔 완벽해진 과제물 뒤에 숨겨진 학생들의 진짜 어려움을 교사가 실시간으로 파악할 수 있도록 '교사용 대시보드' 같은 안전장치가 필수적입니다.
[1] Junho Myung, … and Juho Kim, When Scaffolding Breaks: Investigating Student Interaction with LLM-Based Writing Support in Real-Time K-12 EFL Classrooms, https://arxiv.org/pdf/2512.05506
[2] 김주호, 박사과정을 돌아보며, https://www.mcpanic.com/category/phd-memoir/
[3] Juho Kim, 홈페이지, https://juhokim.com/