GPT4 Vision을 능가하는 Grok 1.5 Vision 출시 : 멀티모달 AI의 새로운 지평을 열다 > AI News | YES AI Tools
 
AI News

GPT4 Vision을 능가하는 Grok 1.5 Vision 출시 : 멀티모달 AI의 새로운 지평을 열다

작성자 정보

  • AI GEN 작성
  • 작성일

컨텐츠 정보

본문

grok AI의 최신 버전인 grok 1.5 Vision이 출시되었습니다. 

e116f9fdca9d223e755554e92f9ae1ed_1713404719_9291.JPG
 

일론 머스크와 그의 팀이 개발한 이 AI 모델은 텍스트뿐만 아니라 이미지, 다이어그램, 차트 등 다양한 시각 정보를 이해하고 처리할 수 있는 멀티모달 기능을 갖추고 있죠. 불과 6개월 만에 이런 놀라운 성과를 이뤄낸 건 정말 대단한 것 같아요.


e116f9fdca9d223e755554e92f9ae1ed_1713404728_6816.JPG
 

grok 1.5v는 여러 분야에서 뛰어난 성능을 보여주고 있습니다. 특히 물리적 세계를 이해하는 능력이 돋보이는데요. 다른 경쟁 모델들과 비교했을 때도 새로운 실제 공간 이해도 벤치마크에서 높은 점수를 받았다고 해요.


grok 1.5v의 놀라운 기능들을 직접 확인해 볼까요? 

손으로 그린 다이어그램을 파이썬 코드로 변환하기, 사진 속 영양 성분표를 보고 칼로리 계산하기, 간단한 그림을 보고 동화 만들기, 밈 이미지 속 유머 코드 분석하기 등 다양한 예시를 통해 grok의 성능을 확인할 수 있었어요. 심지어 코딩 문제 스크린샷을 보고 해답 코드를 작성하기까지! 정말 놀라운 수준이에요.


e116f9fdca9d223e755554e92f9ae1ed_1713404764_1957.JPG
 

제 생각에 grok의 놀라운 성능 뒤에는 Tesla와 Twitter 등을 통해 수집한 방대한 양의 데이터가 있는 것 같아요. 이런 양질의 데이터를 학습에 활용한 것이 grok만의 차별화 포인트가 아닐까 싶네요. 


e116f9fdca9d223e755554e92f9ae1ed_1713404774_9045.JPG
 

앞으로도 grok의 발전에 큰 기대를 걸어봅니다. 머지않아 업계 최고의 AI 모델로 자리 잡지 않을까 기대되네요. 빠른 시일 내에 오픈 소스로 공개되어 누구나 사용해 볼 수 있기를 바랍니다!

관련자료

댓글 0
등록된 댓글이 없습니다.