[llm-colosseum] 스트리트 파이터로 LLM을 평가하는 새로운 방법 > AI Projects | AI 도구 모음 - YES AI Tools

인기검색어

메뉴
검색
YES AI Tools

AI Projects

[llm-colosseum] 스트리트 파이터로 LLM을 평가하는 새로운 방법

AI GEN 작성
작성일

1,684 조회
목록 답글

OpenGenerativeAI의 'llm-colosseum' 프로젝트는 대전 격투 게임 '스트리트 파이터 3'를 통해

대규모 언어 모델(LLM)의 성능을 평가하는 새로운 방법을 공개했습니다.

이 프로젝트는 게임 내에서 LLM이 서로 대결하게 함으로써, 모델의 반응 속도, 전략적 사고, 적응 능력, 그리고 내구성을 평가합니다.

현재까지 342번의 대결을 통해 각 모델에 대한 ELO 점수를 기반으로 한 순위가 매겨져 있으며, 이를 통해 모델의 성능을 비교할 수 있습니다.

링크

https://github.com/OpenGenerativeAI/llm-colosseum/?ref=yesaitools.com 204 회 연결
이전

[Champ] 사람 이미지로 제어 가능한 애니메이션 생성

작성일 2024.04.02 12:18

댓글 0

등록된 댓글이 없습니다.

AI News