Jun 27, 2025

CLOVA Studio를 통해 문해력 문제 해결에 도전하다ㅣAI 포텐데이 우승작 ‘뉴퀴즈(NewQuiz)’ 이야기

Image for CLOVA Studio를 통해 문해력 문제 해결에 도전하다ㅣAI 포텐데이 우승작 ‘뉴퀴즈(NewQuiz)’ 이야기

포텐데이는 서비스 기획자, 개발자, 디자이너가 함께 10일간 몰입해 IT 서비스를 만드는 온라인 해커톤입니다. 예비 개발자 지원과 클라우드, AI 기술 저변 확대에 힘쓰는 네이버클라우드와 마음이 맞아, 작년부터 ‘AI 포텐데이’ 해커톤을 함께 주최하고 있어요.


올해 초 열린 AI 포텐데이에서는 ‘10대 청소년의 문해력 향상’을 주제로, 뉴스 사설 기반의 AI 퀴즈 학습 서비스를 기획한 뉴퀴즈(NewQuiz) 팀이 데모데이에서 우승을 차지했습니다. 그 중심에는 CLOVA Studio가 있었는데요. 한국어에 강한 AI를 활용해 뉴스를 학습 콘텐츠로 활용하고, 문해력 향상이라는 사회적 주제에 접근한 방식이 인상적이었습니다. 이 글에서는 CLOVA Studio를 통해 어떻게 AI 서비스를 설계하고 구현했는지, 뉴퀴즈팀의 사례를 중심으로 소개합니다.


뉴퀴즈 기획과 PM을 맡은 심은혜 님, UX 디자이너 박수현 님, UI 디자이너 정민주 님, 백엔드 개발자 오세연 님, 프론트엔드 개발자 김윤 님과 함께. AI 기술이 어떻게 학습의 몰입도를 높이고 사용자 경험을 확장하는지에 대한 생각을 나누었는데요. 네이버 1784에서 만난 다섯 멤버의 이야기를 전합니다.


문해력이라는 본질에 AI로 답하다

심은혜(PM) : 뉴퀴즈는 HyperCLOVA X를 활용해 만든 ‘뉴스 퀴즈/요약 기반 스마트 학습 서비스’입니다. HyperCLOVA X가 한국어 텍스트의 요약과 구조화에 강점을 가진다는 점에 착안해, 이를 ‘학습’에 접목해보자는 취지로 프로젝트를 시작했죠.


최근 청소년 문해력 저하가 사회적 문제로 떠오르고 있는 점에 주목했어요. 사회적 이슈를 기술로 해결해보고자 뉴스 사설을 기반으로 한 학습 흐름을 설계했습니다. HyperCLOVA X를 탑재한 CLOVA Studio를 활용해 기사 내용을 문단 단위로 분석하고, 문맥에 맞는 어휘 및 내용 퀴즈를 자동 생성하며, 사설 요약에 대한 AI 피드백도 제공하는 서비스에요. 이를 통해 학습자는 독해와 어휘력을 기를 수 있을 뿐 아니라, 핵심 내용을 스스로 요약하며 능동적으로 학습할 수 있습니다.


단순히 정보를 ‘읽고 끝내는 것’이 아니라, ‘이해하고 답하는’ 과정이 뉴퀴즈의 핵심이죠. 단편적인 정보 소비가 익숙한 환경 속에서, 오히려 AI의 언어 이해와 생성 능력을 활용해 문해력이라는 본질적인 문제에 접근하고자 했습니다.


CLOVA Studio로 구현한 학습 서비스

오세연(백엔드 개발) : 뉴퀴즈의 주요 기능에는 AI 기술이 적극 활용됐습니다. Playground를 이용해서 HyperCLOVA X 모델을 활용하고, API 기반으로 연동해 사설을 내용에 따라 4가지 카테고리로 ‘분류’한 뒤, 그 결과를 바탕으로 퀴즈를 ‘생성’하는 핵심 기능을 구현했죠. 여기에 사용자가 직접 작성한 요약문을 평가하고, AI가 생성한 요약과 비교해주는 ‘피드백’ 과정까지 더해져, 자연스럽게 순환하는 학습 흐름을 완성할 수 있었습니다. 이 모든 과정은 별도의 모델 학습 없이도 프롬프트만으로 빠르게 구현할 수 있어서 만족스러웠어요.


그중에서도 뉴퀴즈의 심장이라 할 수 있는 ‘퀴즈 생성’ 기능은 CLOVA Studio와 궁합이 잘 맞다고 느꼈습니다. 뉴스처럼 구조가 자유로운 비정형 한국어 텍스트도 정확하게 이해하고, 학습자가 어려움을 느낄 만한 어휘를 뽑아내거나, 유사한 표현으로 변형해 선택지를 구성하는 데 탁월한 성능을 발휘했거든요. 단순한 문장 생성이 아닌, 문맥을 고려한 결과물을 제공하여 퀴즈의 완성도와 품질을 높은 수준으로 유지할 수 있었습니다.


AI 응답 품질을 높인 프롬프트 설계 노하우

오세연 : 저희는 프롬프트 설계에 가장 많은 고민과 노력을 기울였습니다. 여러 시도 끝에 가장 효과적이었던 프롬프트 구조는 다음과 같아요.


▲역할과 목표 ▲AI에게 제공할 데이터 ▲어투 및 응답 형식 ▲예시 입력과 기대 응답 ▲ 주의할 점까지 – 총 5개 구조입니다. 응답 품질을 일관되게 유지하고, 사용자 경험을 최적화 하고, 답변을 체계적으로 DB화 해서 활용성을 늘리고, 오류를 줄여 신뢰도를 높이는 것을 목표로 했어요.


예시 입력, 기대 응답 등 구체적인 프롬프트 화면


이 중에서도 AI의 응답 품질에 가장 큰 영향을 미친 요소는 단연 ‘예시 입력과 기대 응답’이었습니다. 단순히 “~하지 마세요”, “~는 예외 처리해주세요”와 같은 명령어나 조건만으로는 원하는 수준의 응답을 끌어내기 어려웠어요. 반면, 실제 입력 예시와 함께 기대하는 응답, 특히 예외 상황까지 포함한 구체적인 예시를 제시했을 때는 AI의 이해도와 응답의 정교함이 눈에 띄게 향상되었죠. 사람도 구체적으로 설명할수록 오해 없이 정확하게 이해되잖아요. AI도 마찬가지라고 느꼈습니다.


초기 프롬프트 & 수정 후 프롬프트 비교


프롬프트를 단순화하는 것도 중요합니다. 뉴퀴즈에는 사용자가 사설을 요약하고, 이를 AI가 요약한 결과와 비교해 피드백을 제공하는 기능이 있는데요. 처음에는 이 작업을 하나의 프롬프트로 처리했는데, 응답 품질이 낮고 일관성도 떨어졌습니다.


원래 의도는 사용자의 요약문에 AI가 피드백을 주는 것이었지만, 실제로는 AI가 스스로 생성한 ‘정답 요약’을 기준 삼아 본문과 비교하고 피드백을 주는 오류가 자주 발생했어요. ‘정답 생성’과 ‘피드백 제공’이라는 두 역할을 한 프롬프트에 동시에 요구한 나머지 AI가 자기 답안을 스스로 평가하는 우스꽝스러운 상황이 벌어진 거죠.


이 문제를 해결하기 위해 두 역할을 분리했습니다. 먼저 정답 요약을 생성하는 프롬프트를 따로 만들고, 생성된 결과를 명시적으로 AI에 제공했습니다. 이후 피드백 프롬프트에서는 이 정답과 사용자 요약만을 비교하도록 제한했죠. 프롬프트를 분리하자 AI가 확실히 각 역할에 집중하기 시작했습니다. 응답 정확도와 품질도 눈에 띄게 향상되었고요. 하나의 프롬프트에 여러 기능을 담기보다는, 역할을 나누고 명확히 구분하는 것이 고품질 응답을 이끌어내는 가장 효과적인 방법이라는 점을 확실히 깨달았습니다.


기획자와 개발자가 함께 만든 AI

오세연 : 프롬프트 설계 이외에도 AI 응답의 품질을 높이기 위해, 기획자와 개발자가 함께 프롬프트 실험을 진행하는 협업 방식을 택했습니다. 단순히 개발자가 API 연동하고 테스트하는 수준을 넘어서, 팀 전체가 CLOVA Studio의 사용법을 공유하고 각 기능의 설계 의도와 응답 방향성을 지속적으로 논의했는데요. 덕분에 프롬프트 수정 주기도 빨랐고, 응답의 일관성과 품질도 좋아졌고, 우승의 비결이 됐습니다. (웃음) CLOVA Studio는 기술 전공자가 아니어도 바로 사용할 수 있을 만큼 사용자 친화적인 인터페이스와 구조를 갖추고 있기에 가능한 일이었습니다.


사설 요약 피드백을 위한 프롬프트 화면


심은혜 : 프롬프트 실험 중에서도 ‘사설 요약 피드백 기능’에 가장 많은 시간과 노력을 들였어요. 사용자 요약에 대해 총평을 제공하고, 5점 척도로 점수를 매기는 기능이라 피드백의 명확성과 신뢰도가 무엇보다 중요했거든요. 단순히 “좋아요”, “잘했어요” 같은 표현이 아니라, AI가 상·중·하 수준을 판단해 구체적인 총평을 제공해야 했기 때문에 프롬프트 고도화에 특히 공을 들였습니다.


예를 들어, ‘상’은 고등학생 수준의 핵심 요약, ‘중’은 1~2줄 정도의 간단한 요약, ‘하’는 주제를 제대로 파악하지 못한 경우로 나누고, 각 수준에 맞는 예시 응답을 프롬프트에 함께 포함했어요. 이렇게 기준을 명확히 제시한 덕분에, AI가 사용자의 요약을 더 정교하게 평가하고 수준에 맞는 맞춤형 피드백을 제공하게 되었습니다.


사실 저는 이전에 AI를 다뤄본 경험이 많지 않아 기술적인 배경이 깊지 않아요. 그럼에도 불구하고 CLOVA Studio를 활용해 개발자와 함께 프롬프트를 실험하고 최적의 구조를 찾아가는 과정을 통해, 기획자도 충분히 AI 모델을 설계하고 조정할 수 있다는 자신감을 얻을 수 있었습니다.


미세한 조정, 확실한 차이: 파라미터 제어

오세연: CLOVA Studio의 강점 중 하나는 파라미터 제어를 통해 AI의 응답 스타일을 정밀하게 제어할 수 있다는 점이었습니다. ChatGPT나 Gemini 같은 생성형 AI 도구들은 응답 톤이나 스타일을 바꾸려면 주로 프롬프트에 의존해야 했어요. 예를 들어, “간결하게 작성해줘”, “창의적으로 답변해줘” 같은 식으로 어조나 응답 형식을 유도했지만, 기대와 다르게 동작하거나 답변의 일관성이 떨어지는 경우가 많았습니다.


파라미터 값에 따라 달라지는 결괏값 예시


CLOVA Studio는 Temperature, Top-p, Repetition Penalty 등의 파라미터를 직접 조정할 수 있어서, 프롬프트 없이도 응답 스타일과 품질을 정밀하게 컨트롤할 수 있었습니다. 예를 들어 정답 요약을 생성할 때, 초기에는 너무 창의적인 표현이나 본문에 없는 단어들이 포함된 경우가 많았는데요. 이때 Temperature 값을 낮춰 생성의 창의성을 제한하자, 보다 안정적이고 맥락에 충실한 요약 결과를 얻을 수 있었습니다. 이 경험을 통해, CLOVA Studio는 교육, 문해력, 요약처럼 응답의 정확성과 일관성이 중요한 분야에 특히 강점을 가진 생성형 AI 도구라는 확신을 갖게 되었습니다.


아이디어를 서비스로, 초고속 검증이 필요하다면

심은혜 : 팀 단위로 다양한 프롬프트를 실험하며 아이디어를 빠르게 구체화하고 검증해야 한다면, CLOVA Studio가 좋은 선택지가 될 수 있습니다. 제가 그랬듯 AI 모델이나 코드를 몰라도 누구나 쉽게 쓸 수 있거든요. 한 달도 안 되는 기간 동안에 뉴퀴즈처럼 퀄리티 높은 서비스를 만든 데에는 CLOVA Studio의 쉬운 사용성도 큰 몫을 했다고 생각합니다. 비전공자도 괜찮습니다. 마케팅, 기획, 교육, 고객 대응 등 다양한 분야에서 생성형 AI를 실무에 적용해보고 싶은 분들께 적극 추천드립니다.



AI 최적화 UI/UX로 디테일을 완성하다


박수현(디자이너) : 사용자들이 ‘AI 기반 서비스’를 직관적으로 인식할 수 있도록 돕는 시각적인 장치를 많이 고민했어요. 예를 들어, AI가 답변을 생성하는 과정에 간단한 모션을 넣고, AI가 만든 콘텐츠에는 아이콘 같은 시각적 단서를 더했죠. 특히 주 사용자가 청소년인 점을 감안해서 초반에는 로봇 캐릭터를 활용해 좀 더 친근한 인상을 주려고 하기도 했고요.


정민주(디자이너) : UI 측면에서는, AI 피드백 결과를 보여주는 화면에 사용자가 해당 피드백을 평가할 수 있는 기능을 추가했어요. 아무리 정교한 AI라도 판단에 오류가 생길 수 있으니까요. 이 기능은 AI 결과에 문제가 있을 경우 사용자로부터 피드백을 받아 개선하기 위한 장치이자, 사용자와 간접적으로 소통하는 창구 역할도 합니다.


김윤(프론트엔드) : 문제를 제출한 뒤 AI가 채점하는 동안 생기는 로딩 시간도 중요한 포인트였어요. 처음엔 단순한 이미지만 보여줬는데, 로딩 시간이 길다 보니 지루하다는 피드백이 있었죠. 이후엔 디자이너분이 제작해 주신 ‘로티 애니메이션’을 적용해 생동감 있고 기다림이 덜 느껴지도록 개선했습니다.




CLOVA Studio에서 시작된 뉴퀴즈 팀의 도전은 단순한 해커톤 프로젝트를 넘어, AI 기술이 청소년의 학습 경험을 어떻게 변화시킬 수 있는지를 보여준 의미 있는 사례입니다. AI가 우리의 사고와 학습을 어떻게 더 깊고 풍부하게 만들 수 있을지에 대한 가능성을 직접 탐색한 이번 시도가, AI와 교육의 접점을 고민하는 많은 분들께 작은 영감이 되기를 바랍니다.