3대 AI 모델의 위험 평가 불일치로 AI 일자리 예측의 신뢰성 하락

새로운 연구에 따르면, 일자리 대체를 예측하는 바로 그 AI 모델들이 어떤 직업이 위험에 처해 있는지에 대해 서로 합의하지 못하며, 최대 25%의 경우에서 의견 차이를 보이는 것으로 나타났습니다.

세계 최고의 인공지능 모델들이 어떤 직업이 자동화에 가장 많이 노출되어 있는지에 대해 서로 다르고 종종 상충되는 예측을 내놓고 있다는 새로운 연구 결과가 발표되었습니다. 이는 AI 기반 경제 예측의 신뢰성에 의문을 제기합니다. 미국 국가경제연구소(NBER)에서 발표한 이 워킹 페이퍼는 정책 입안자와 노동자 모두에게 시급한 관심사가 된 이 분야의 불확실성을 강조하며, 일자리 위험에 대한 상위 3개 모델 간의 의견 불일치를 보여줍니다.

"저 개인적으로는 '오, 내 직업을 바꿔야겠다'거나 '내 아이의 전공을 바꿔야겠다'고 말하기 위해 단 하나의 수치에만 의존하지는 않을 것입니다."라고 이번 연구의 공동 저자인 노스웨스턴 대학교의 미셸 인(Michelle Yin)은 말했습니다. 이 연구는 AI가 스스로의 영향을 예측하는 데 사용되고 있지만 그 결과가 일관되지 않음을 시사하며, 이러한 예측을 그대로 받아들이는 것에 대해 주의를 촉구합니다.

미셸 인, 노스웨스턴 대학교의 호아 부(Hoa Vu), 아메리칸 대학교의 클라우디아 페르시코(Claudia Persico)가 공동 집필한 이 연구는 OpenAI의 ChatGPT-5, Google Deepmind의 Gemini 2.5, Anthropic의 Claude 4.5 등 세 가지 주요 AI 모델의 직업 노출 순위를 조사했습니다. 예를 들어, Claude는 회계사를 AI에 매우 취약한 직업으로 평가한 반면, Gemini는 훨씬 낮은 위험도를 부여했습니다. 또한 광고 관리자와 최고 경영자 같은 역할의 취약성에 대해서도 모델들은 의견을 달리했습니다.

이러한 결과는 전략적 인력 계획을 위해 AI가 생성한 '노출 점수'에 의존하는 투자자와 기업에 과제를 제시합니다. ChatGPT와 Gemini가 약 25%의 빈도로 의견이 일치하지 않는 상황에서, 이 연구는 현재 세대의 AI가 미래의 파괴에 대한 명확한 통찰력을 제공하기보다 도입 과정에서의 기존 편향을 반영하고 있을 수 있음을 시사합니다.

모델 간의 불일치

연구의 핵심은 노동부 데이터베이스의 과업들을 AI 모델에 입력하여 어떤 과업을 수행할 수 있는지 확인하는 것이었습니다. 경제학자들은 모델 간의 합의 수준이 놀라울 정도로 낮다는 것을 발견했습니다. ChatGPT와 Gemini가 가장 일치했지만, 여전히 상당 부분의 직업에 대해 서로 다른 평가를 내놓았습니다.

이러한 차이는 매우 중요한데, 이러한 노출 점수가 인력 교육 및 지원에 관한 결정을 내리는 데 지침이 되는 컨설팅 백서, 연구 노트 및 정책 보고서에서 점점 더 많이 사용되고 있기 때문입니다. 연구진은 이러한 차이 중 일부가 모델의 훈련 데이터에서 기인할 수 있다고 가정합니다. 금융 분석과 같은 분야의 초기 도입자들이 더 많은 AI 관련 데이터를 생성하고, 이것이 다시 모델로 하여금 해당 전문직을 더 많이 노출된 것으로 분류하게 만들 수 있다는 것입니다.

인력 계획에 미치는 영향

AI 생성 점수의 불신뢰성은 상당한 시사점을 갖습니다. 실직 노동자를 위한 지원 시스템을 설계하려는 정책 입안자들과 학생들에게 'AI 방어형' 커리어를 조언하는 교육 기관들이 결함이 있는 데이터로 운영되고 있을 수 있습니다. 경제학자들은 단일 AI 모델에 의존하는 대신 연구자들이 다양한 모델을 살펴보고 예측의 불확실성에 대해 더 투명해야 한다고 제안합니다.

투자자들에게 이 연구는 단순한 AI 대체 담론에 기반하여 부문별 베팅을 하는 것에 대한 경고 역할을 합니다. AI 모델 간의 합의 부족은 노동 시장에 미치는 실제 영향이 많은 보고서가 제시하는 것보다 더 미묘하고 예측하기 어려울 것임을 시사합니다. 특정 직업의 진정한 노출 정도는 모델의 이론적 능력보다는 AI가 실제로 경제 전반에 어떻게 구현되는지에 달려 있으며, 이 과정에는 더 강력한 조사와 인간 참여형(human-in-the-loop) 분석이 필요합니다.

이 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.