QWEN2: 오픈소스 AI의 새로운 도전자, 그 성능과 가능성은? > AI News | AI 도구 모음 - YES AI Tools
AI News

QWEN2: 오픈소스 AI의 새로운 도전자, 그 성능과 가능성은?

작성자 정보

  • AI GEN 작성
  • 작성일

컨텐츠 정보

본문

오늘은 인공지능 LLM 분야의 새로운 도전자, QWEN2에 대해 소개해 드리려고 합니다.


bc08c06c828677a19c51321b5b659498_1717978554_248.JPG
 

QWEN2는 중국 Alibaba 그룹에서 개발한 대규모 언어 모델(Large Language Model, LLM)입니다. Alibaba는 오픈소스 AI 분야에서 활발히 활동하고 있고, 이전에 QWEN1.5 모델을 발표한 바 있죠.


수개월간의 노력 끝에 Alibaba에서 QWEN1.5에서 한층 진화한 QWEN2를 최근 발표했습니다. 


bc08c06c828677a19c51321b5b659498_1717978948_0601.JPG
 


QWEN2는 0.5B부터 72B까지 다양한 크기의 사전학습 및 지시튜닝 모델을 제공하고 있죠. 

영어, 중국어 외에도 27개의 추가 언어로 학습되었고, 대규모 벤치마크 평가에서 최첨단 성능을 보여주고 있습니다. 


bc08c06c828677a19c51321b5b659498_1717978571_097.JPG
 


QWEN2의 강점은 다양한 분야에서 두각을 나타내고 있습니다. 코딩과 수학 능력이 크게 향상되었고, 128K 토큰에 달하는 장문 컨텍스트 이해가 가능해졌죠. 안전성과 윤리적 측면에서도 GPT-4에 버금가는 수준을 보여주고 있습니다. 


bc08c06c828677a19c51321b5b659498_1717978582_8561.JPG
 


QWEN2는 Hugging Face와 ModelScope을 통해 공개되었기에 누구나 활용해볼 수 있습니다. QWEN의 개발을 지원해온 수많은 커뮤니티 프레임워크들과도 호환이 잘 되고 있죠. 


라이선스 측면에서도 변화가 있었습니다. QWEN2-72B는 기존의 Qianwen 라이선스를 그대로 적용하지만, 나머지 모델들은 보다 Open Apache 2.0 라이선스로 전환했어요. 이를 통해 QWEN2의 상업적 활용도 촉진할 수 있을 것으로 기대됩니다.


QWEN팀은 향후 QWEN2를 더욱 대형화하고, 시각과 청각 정보까지 이해할 수 있는 멀티모달로 확장해 나갈 계획이라고 합니다. 오픈소스 AI 발전을 가속화하는 신규 모델 공개도 지속할 예정이니 앞으로가 더욱 기대되는 프로젝트죠.


세부적인 평가 지표 결과를 보면 QWEN2는 자연어 이해, 질의응답, 코딩, 수학, 과학 지식, 추론, 다언어 능력 등 전반에 걸쳐 우수한 성능을 보여주고 있습니다. 특히 72B 모델은 엄청난 파라미터 수에도 불구하고 작은 크기의 QWEN2 모델들도 동급 사이즈 최신 모델들을 압도하는 것으로 나타났죠. 영어뿐 아니라 중국어, 다국어 벤치마크에서도 우수한 성적을 거두었습니다.


bc08c06c828677a19c51321b5b659498_1717978656_0053.JPG
 bc08c06c828677a19c51321b5b659498_1717979107_7589.JPG
 

지시튜닝된 버전인 QWEN2-Instruct 모델들 역시 뛰어난 성능을 자랑합니다. 72B, 57B, 7B 등 다양한 스케일의 Instruct 모델이 Llama 3와 같은 경쟁 모델들을 제치고 우위를 점하고 있네요. 다국어 평가에서도 GPT-4에 근접한 점수를 받았다고 합니다.

bc08c06c828677a19c51321b5b659498_1717979119_3865.JPG
 

QWEN2의 등장으로 오픈소스 AI 생태계가 더욱 풍성해질 것으로 예상됩니다. 

기술의 발전이 가속화되고 실제 활용 사례도 늘어날 테니까요. 


앞으로 QWEN2가 어떤 혁신을 불러올지 지켜보는 것도 흥미로울 것 같습니다.

관련자료

댓글 0
등록된 댓글이 없습니다.