업스테이지 AI 모델 표절 논란 일단락.. "검증 엄밀하지 못해" 사이오닉AI 사과
이승아 기자
2026-01-05
국내 AI 업계를 달궜던 업스테이지와 사이오닉AI 간 ‘중국 모델 파생’ 논란이 사흘 만에 일단락됐다. 의혹을 제기했던 사이오닉AI 측이 공식 사과에 나섰고, 업스테이지는 이를 수용하며 공개 검증 과정을 마무리했다.
논란은 지난 1일 고석현 사이오닉AI 대표가 업스테이지의 대형 언어모델 ‘솔라 오픈 100B(Solar-Open-100B)’가 중국 지푸AI(Zhipu AI)의 GLM 계열 모델과 유사하다는 분석을 공개하면서 시작됐다. 특히 일부 LayerNorm 파라미터에서 높은 유사도가 나타났다는 점을 근거로, 정부 예산이 투입된 ‘독자 AI 파운데이션 모델’ 프로젝트의 정당성에 의문을 제기했다.
LayerNorm은 AI 모델 학습 과정에서 계산값이 과도하게 흔들리지 않도록 잡아주는 일종의 ‘균형 장치’다. 대부분의 대형 언어모델은 이 값을 1로 설정한 상태에서 학습을 시작한다. 값이 학습 과정에서도 크게 변하지 않는 경우가 많아, 서로 다른 모델 간에도 유사도가 높게 나타날 수 있다는 점이 쟁점으로 떠올랐다.
업스테이지는 즉각 반박에 나섰다. 김성훈 대표는 의혹 제기 다음 날 공개 검증회를 열고 학습 로그와 중간 체크포인트를 공개하며 해당 모델이 외부 가중치를 사용하지 않은 프롬 스크래치(from scratch) 방식으로 개발됐다고 설명했다. LayerNorm은 구조적 특성상 서로 다른 모델에서도 유사도가 높게 나타날 수 있으며, 전체 파라미터 중 극히 일부만으로 도용 여부를 판단하는 것은 통계적 착시에 가깝다는 주장이다.
검증회 이후 고 대표는 SNS를 통해 “LayerNorm의 코사인 유사도만으로 가중치 공유 여부를 단정하기 어렵다”며 검증이 충분하지 못했음을 인정하고 사과했다. 그는 향후 민감한 사안일수록 검증 기준과 소통 방식을 더욱 엄밀히 하겠다고 밝혔다. 이에 김 대표는 사과를 수용하면서도, 논의 과정에서 드러난 분석의 한계를 정리해 공개적으로 공유해 달라고 요청했다.
이번 사태는 단순한 표절 공방을 넘어, 국책 AI 사업에서 ‘독자 모델’을 어떻게 정의하고 어떤 기준으로 검증할 것인지에 대한 논의를 촉발했다는 평가를 받는다. 업계 안팎에서는 기업이 학습 과정과 데이터를 공개하며 기술적 논쟁을 검증으로 풀어낸 드문 사례라는 점에서 향후 소버린 AI 정책과 평가 기준을 정교화하는 계기가 될 수 있다는 분석도 나온다.
논란은 지난 1일 고석현 사이오닉AI 대표가 업스테이지의 대형 언어모델 ‘솔라 오픈 100B(Solar-Open-100B)’가 중국 지푸AI(Zhipu AI)의 GLM 계열 모델과 유사하다는 분석을 공개하면서 시작됐다. 특히 일부 LayerNorm 파라미터에서 높은 유사도가 나타났다는 점을 근거로, 정부 예산이 투입된 ‘독자 AI 파운데이션 모델’ 프로젝트의 정당성에 의문을 제기했다.
LayerNorm은 AI 모델 학습 과정에서 계산값이 과도하게 흔들리지 않도록 잡아주는 일종의 ‘균형 장치’다. 대부분의 대형 언어모델은 이 값을 1로 설정한 상태에서 학습을 시작한다. 값이 학습 과정에서도 크게 변하지 않는 경우가 많아, 서로 다른 모델 간에도 유사도가 높게 나타날 수 있다는 점이 쟁점으로 떠올랐다.
업스테이지는 즉각 반박에 나섰다. 김성훈 대표는 의혹 제기 다음 날 공개 검증회를 열고 학습 로그와 중간 체크포인트를 공개하며 해당 모델이 외부 가중치를 사용하지 않은 프롬 스크래치(from scratch) 방식으로 개발됐다고 설명했다. LayerNorm은 구조적 특성상 서로 다른 모델에서도 유사도가 높게 나타날 수 있으며, 전체 파라미터 중 극히 일부만으로 도용 여부를 판단하는 것은 통계적 착시에 가깝다는 주장이다.
검증회 이후 고 대표는 SNS를 통해 “LayerNorm의 코사인 유사도만으로 가중치 공유 여부를 단정하기 어렵다”며 검증이 충분하지 못했음을 인정하고 사과했다. 그는 향후 민감한 사안일수록 검증 기준과 소통 방식을 더욱 엄밀히 하겠다고 밝혔다. 이에 김 대표는 사과를 수용하면서도, 논의 과정에서 드러난 분석의 한계를 정리해 공개적으로 공유해 달라고 요청했다.
이번 사태는 단순한 표절 공방을 넘어, 국책 AI 사업에서 ‘독자 모델’을 어떻게 정의하고 어떤 기준으로 검증할 것인지에 대한 논의를 촉발했다는 평가를 받는다. 업계 안팎에서는 기업이 학습 과정과 데이터를 공개하며 기술적 논쟁을 검증으로 풀어낸 드문 사례라는 점에서 향후 소버린 AI 정책과 평가 기준을 정교화하는 계기가 될 수 있다는 분석도 나온다.