AI 평가 기준 - AI매터스

AI 평가 기준

AI 채점 방식 바꿨더니 GPT-5 이겼다... 의료 분야 세계 1등 달성

대학 연구팀이 만든 AI 채점 방식 바꿨더니 GPT-5 이겼다… 의료 분야 세계 1등 달성

1월 20, 2026

AI 챗봇이 얼마나 똑똑한지 정확하게 평가하는 것은 여전히 어려운 문제다. 특히 “좋은 에세이를 써줘” 같은 정답이 정해지지 않은 질문에 AI가 얼마나 잘 대답했는지 판단하기 어렵다. 해당 논문에 따르면, 중국 전기차…

A framework for considering the use of generative AI for health

스탠포드 의료AI·디지털헬스 전문가 54명이 밝힌 의료용 AI의 치명적 위험과 해결책

5월 22, 2025

A framework for considering the use of generative AI for health 스탠포드 대학 54명 전문가가 제시한 의료용 AI 안전 가이드 스탠포드 대학교(Stanford University) 디지털헬스센터…

Fairness through Difference Awareness: Measuring Desired Group Discrimination in LLMs

모든 차별이 나쁜가?… AI 공정성에 대한 스탠포드 연구진의 새로운 제안

2월 11, 2025

Fairness through Difference Awareness: Measuring Desired Group Discrimination in LLMs 스탠포드 대학교 연구진이 발표한 논문 “차이를 인식하는 공정성: LLM에서 집단 간 차별의 측정”에 따르면,…

1
2
3

Trending

"네이버 시대 끝나나"… 챗GPT 이용률 54% 돌파, 10대는 이미 이동

“네이버 시대 끝나나”… 챗GPT 이용률 54% 돌파,…

권나혜 에디터 1월 27, 2026

엑셀에 클로드 들어왔다… "복잡한 재무제표, 이제 AI한테 물어보세요"

엑셀에 클로드 들어왔다… “복잡한 재무제표, 이제 AI한테…

권나혜 에디터 1월 28, 2026

"AI 100명이 동시에 일한다"… 중국 AI 신기술 공개

“AI 100명이 동시에 일한다”… 중국 AI 신기술…

권나혜 에디터 1월 28, 2026

AI 평가 기준 - AI매터스