본문 바로가기

1. IT & 개발/- AI & 인공지능

AI의 2024학년도 수능 점수 - GPT와 Claude의 수능 등급 알아보기

목차

     

    안녕하세요, 오늘은 흥미로운 실험 결과를 소개해 드리려고 합니다. 바로 최신 AI 모델들이 한국의 대학수학능력시험(수능)을 치른 결과입니다. (시사IN)

    1. 실험 개요

    - 대상 AI: GPT-4o(OpenAI)Claude 3.5 Sonnet(Anthropic)
    - 시험 내용: 2023년 11월 16일 시행된 수능 기출문제
    - 진행 방식: 실제 수능과 최대한 유사한 환경 조성

     

    2. 주요 결과

    1) 언어 영역 우수

    - Claude: 국어 82점(2등급), 영어 87점(2등급), 일본어(2등급)
    - GPT: 국어 59점, 영어 79점, 일본어(3등급)



    국어영역_정답표.pdf
    0.08MB
    국어영역_문제지.pdf
    2.83MB

     

    2) 수리/과학 영역 취약

    - Claude: 수학 34점(6등급), 과학탐구 5-6등급
    - GPT: 수학 66점(3등급), 과학탐구 6-7등급

     

    수학영역_문제지.pdf
    0.74MB
    수학영역_정답표.pdf
    0.08MB

     

     

     

     

    3) 종합 성적

    - Claude가 전반적으로 우수한 성적 기록
    - 두 AI 모두 인간 수험생 평균에는 미치지 못함

    3. 주목할 만한 점

    - AI의 언어 능력이 인간 평균을 상회
    - 수학, 과학 분야에서는 아직 인간에 미치지 못함
    - 한국어 문제 해석에 어려움을 겪는 경우 발생

    4. 전문가 의견

    이제현 박사(한국에너지기술연구원): AI의 성능을 단순히 기출문제 학습 여부로 판단하기 어려움
    - 김호진 원장(토마스아카데미): AI 성적으로는 서울권 대학 지원 불가, 지방 중위권 대학 정도 가능

    5. 시사점

    - AI의 빠른 발전 속도를 고려할 때, 향후 수능에서 더 높은 성적 예상

    - 수능 중심의 평가 방식에 대한 재고 필요성 제기

    이번 실험은 AI의 현재 수준을 가늠해볼 수 있는 흥미로운 시도였습니다. AI 기술은 빠르게 발전하고 있지만, 아직 모든 분야에서 인간을 뛰어넘지는 못했음을 확인할 수 있었습니다. 

    앞으로 AI 기술이 어떻게 발전할지, 그리고 그에 따라 우리의 교육과 평가 시스템은 어떻게 변화해야 할지 함께 고민해볼 필요가 있겠습니다.

    여러분의 생각은 어떠신가요? 댓글로 의견을 나눠주세요!