문화적 정렬

AI vs. Human Judgment of Content Moderation: LLM-as-a-Judge and Ethics-Based Response Refusals

AI가 AI를 평가하면 생기는 일? ‘도움 드릴 수 없습니다’ 답변을 32% 더 좋아해

5월 23, 2025

AI vs. Human Judgment of Content Moderation:LLM-as-a-Judge and Ethics-Based Response Refusals GPT-4o와 라마 모델, 윤리적 거부 응답에 32%포인트 높은 점수 대규모 언어 모델(LLM)이 다른…

문화적 정렬

AI가 AI를 평가하면 생기는 일? ‘도움 드릴 수 없습니다’ 답변을 32% 더 좋아해

Trending

“돈은 관심 없다”…오픈클로 개발자, 저커버그 제안 거절하고…

구글, 제미나이 3.1 Pro 출시…추론 성능 전작…

구글(Google) 제미나이(Gemini) 앱, AI 음악 생성 기능…