인공지능(AI) 모델 경량화 및 최적화 기술 기업 노타가 세계적 머신러닝 학회 'ICML 2026'에서 연구 성과를 냈다.
노타는 이번 학회의 'Resource-Adaptive Foundation Model Inference(AdaptFM)' 워크숍에서 자사의 MoE(Mixture-of-Experts) 특화 양자화 알고리즘 논문 2편이 최종 채택됐다고 11일 밝혔다.
이번에 채택된 첫 번째 논문은 'DREAM-MoE'다. 이 논문은 대규모 AI 모델을 여러 구간으로 나눠 양자화할 때 발생하는 판단 흐름의 변화를 줄이는 방법을 제안한다. 앞쪽 구간의 작은 오차가 뒤쪽 구간의 전문가 선택을 바꿀 수 있는데, 노타는 양자화 이후에도 모델이 원래와 유사하게 필요한 전문가를 선택하도록 설계했다.
두 번째 논문은 'SRA-MoE'다. 이 연구는 모델 결과에 큰 영향을 주는 핵심 입력을 선별해 우선적으로 보호하는 방법을 담았다. 핵심 입력에서 전문가 선택이 흔들리지 않도록 설계해 제한된 자원으로도 모델 품질을 효과적으로 유지할 수 있다. 두 연구 모두 최신 MoE 특화 양자화 기법들과 비교해 더 높은 성능을 기록했다.
MoE는 여러 전문가 모델 중 필요한 일부만 선택해 동작하는 방식이다. 대형 AI 모델의 성능과 효율을 동시에 높일 수 있어 최신 대형 언어 모델(LLM)의 핵심 구조로 확산하고 있다. 다만 모델 구조가 복잡해 이를 작고 가볍게 만드는 양자화 과정에는 기존과 다른 특화된 접근이 필요하다.
ICML은 머신러닝과 인공지능 분야를 대표하는 세계적 학회다. 이번 논문이 채택된 AdaptFM 워크숍은 대규모 AI 모델을 제한된 컴퓨팅 자원에서도 효율적으로 실행하는 기술을 다룬다. 아마존, 메타 등 글로벌 기업과 주요 연구기관 연구자들이 조직위원회에 참여하고 있으며, 엔비디아·퀄컴 AI 리서치·오픈AI·애플·마이크로소프트 등 주요 AI 기업 연구자들도 프로그램 위원으로 함께하고 있다.
노타는 높은 메모리와 연산 자원을 요구하는 대형 AI 모델 최적화에 집중하고 있다. 앞서 노타는 엔비디아 네모트론 해커톤에서 데이터 기반 MoE 양자화 기법으로 트랙 우승과 종합우승을 차지했다. 또한 업스테이지 컨소시엄의 독자 파운데이션 모델 과제에서 'Solar MoE'와 같은 대규모 모델 최적화를 추진 중이며, 엔비디아 네모트론 3 나노 모델 양자화 경험을 네모트론 울트라 등 최신 대형 모델로 확장하고 있다.
채명수 노타 대표는 "이번 논문 채택은 노타가 MoE에 특화된 양자화 기술을 꾸준히 고도화해온 성과"라며 "엔비디아 네모트론 해커톤 종합우승에 이어 ICML 2026 AdaptFM 워크숍에서도 연구 성과를 선보이게 된 만큼, 대규모 AI 모델을 더 효율적으로 활용할 수 있는 최적화 기술 개발을 이어가겠다"고 말했다.
한편 노타는 서울 삼성동 코엑스에서 열리는 ICML 2026 기간 중 'Nota AI - Korea Efficient Days'를 개최한다. 한국을 찾는 글로벌 연구자·엔지니어·기업 관계자들과 Efficient AI의 연구 흐름과 산업 적용 가능성을 공유할 예정이다. 노타는 이 행사를 통해 대규모 AI 모델 최적화 분야의 연구 성과를 소개하고 기술 협력과 비즈니스 접점을 넓혀갈 계획이다.
