누가 제일 잘했을까요?
여러분, AI 모델들이 서로 실력을 겨뤘다는 소식 들어보셨나요? 갈릴레오라는 회사에서 이 대결을 열었어요. 이번에는 22개의 AI 모델이 참가했대요. 그 중에서 10개는 비밀스러운 모델이고, 12개는 누구나 볼 수 있는 모델이래요.
누가 제일 잘했을까요?
가장 잘한 모델은 '클로드 3.5 소네트'예요. 이 모델은 앤트로픽이라는 회사에서 만들었대요. 모든 시험에서 정말 잘했대요. 심지어 아주 긴 글도 잘 이해할 수 있대요.
다른 모델들은 어땠나요?
- 구글이 만든 '제미나이 1.5 플래시'는 돈을 적게 들이고도 좋은 성적을 냈대요.
- 알리바바의 '큐원2 72B'는 누구나 볼 수 있는 모델 중에서 제일 잘했어요.
- 오픈AI의 모델들은 이전만큼 좋은 성적을 내지 못했대요.
시험은 어떻게 봤을까요?
시험은 글의 길이에 따라 세 가지로 나눠서 봤어요:
- 짧은 글 (5000단어 이하)
- 중간 길이의 글 (5000~25000단어)
- 긴 글 (40000~100000단어)
'클로드 3.5 소네트'는 짧은 글과 긴 글에서 1등을 했고, '제미나이 1.5 플래시'는 중간 길이의 글에서 1등을 했어요.
누구나 볼 수 있는 모델들의 활약
이번 시험에서 특별히 주목할 점은 누구나 볼 수 있는 모델들이 많이 좋아졌다는 거예요. '제미나이', '라마', '큐원' 같은 모델들이 계속 실력을 키우고 있대요. 이 모델들은 돈을 많이 들이지 않고도 좋은 성능을 낼 수 있어요.
AI 모델들이 얼마나 좋아졌나요?
이번 시험 결과를 보면, AI 모델들이 정말 많이 좋아졌다는 걸 알 수 있어요:
- 긴 글도 잘 이해할 수 있게 됐어요.
- 글의 내용을 정확하게 파악할 수 있어요.
- 작은 모델도 큰 모델만큼 잘하는 경우가 있어요.
앞으로 어떻게 될까요?
이번 시험 결과를 보면, AI 기술이 정말 빠르게 발전하고 있다는 걸 알 수 있어요. 특히 누구나 볼 수 있는 모델들이 많이 좋아지고 있어서, 앞으로 더 많은 사람들이 AI를 사용할 수 있게 될 것 같아요.
오픈AI라는 회사는 이번에 좋은 성적을 내지 못했어요. 그래서 이 회사는 더 좋은 모델을 만들기 위해 열심히 노력할 것 같아요. 첫끗빨이 개끗빨인가요?
출처 AI 타임즈
'뉴 스' 카테고리의 다른 글
라마 4 (1) | 2024.08.02 |
---|---|
젠-3 알파 터보 (0) | 2024.08.02 |
챗GPT, 이제 말하는 기능도 (0) | 2024.08.01 |
AI로 부동산 감정평가를 쉽게 (0) | 2024.08.01 |
AI 법안 만들기 (0) | 2024.08.01 |