벤치마킹1 생성 AI/LLM 성능 평가 지표 (벤치마크) 종류 지난 블로그 포스팅에서는 생성 AI 또는 LLM의 성능을 평가하기 위해서 어떤 평가 지표 (벤치마크) 방법들이 있는지에 대해서 알아보았습니다. 생성 AI/LLM 성능 평가 지표 (벤치마크) 방법지금까지 인공지능 또는 LLM이 만들어지는 과정, 사용 사례 등에 대해서 깊게 알아보았습니다. 모든 제품들에는 성능과 품질을 확인하는 기준이 있는데요, 그렇다면 이렇게 만들어진 LLM은 어떤hope2solveproblems.com 이번 블로그 포스팅에서는 각 방법들의 주요 벤치마크와 그 역할들에 대해서 자세히 알아가 보도록 하겠습니다.주요 벤치마크와 그 역할LLM 분야에서의 벤치마크란 특정 태스크, 태스크 수행을 위한 데이터 셋, 수행능력을 평가하는 메트릭(Accuracy, F1 스코어, 부적절 발언 발생률 등).. 2025. 2. 10. 이전 1 다음