Explainable Artificial Intelligence Credit Risk Assessment using Machine Learning
인도 SRM 대학교 연구진이 은행 대출 심사에 혁신을 가져올 AI 시스템을 개발했다. 기존 은행에서 사람이 직접 하던 신용평가는 시간이 오래 걸리고 실수가 생기기 쉬웠다. 연구진은 이런 문제를 해결하기 위해 대출자가 돈을 갚지 못할 위험을 정확하게 예측하는 AI를 만들었다. 특히 이 AI는 자신이 내린 판단의 이유를 사람이 이해할 수 있도록 설명해 주는 기능까지 갖췄다.
LightGBM이 90.07%로 1위: 다른 AI들을 크게 앞서
연구 결과 LightGBM이라는 AI가 90.07%의 정확도로 가장 뛰어난 성능을 보였다. 이는 구글이 자주 사용하는 XGBoost(88.74%)와 아마존이 선호하는 랜덤포레스트(82.03%)보다 훨씬 높은 수치다. LightGBM은 속도가 빠르면서도 정확한 것이 특징이다. 마치 바둑에서 가장 유리한 수를 먼저 두는 것처럼, 데이터에서 가장 중요한 패턴을 우선적으로 학습한다. 이 때문에 복잡한 금융 데이터를 다룰 때도 빠르고 정확하게 결과를 낼 수 있다.
연구진은 AI가 공정하게 학습할 수 있도록 데이터를 미리 정리했다. 빠진 정보는 적절한 값으로 채우고, 좋은 고객과 나쁜 고객의 비율을 맞춰 AI가 편향되지 않도록 했다.
외부 신용평가사 정보가 가장 중요한 판단 기준
AI가 대출 위험을 판단할 때 가장 중요하게 보는 것은 다른 신용평가회사에서 매긴 점수였다. EXT_SOURCE라고 불리는 이 정보가 세 가지 AI 모델 모두에서 1순위 판단 기준으로 나타났다. LightGBM의 경우 외부 신용점수 외에도 가족 구성원 수, 주거 형태, 소득 대비 대출 비율 등을 종합적으로 고려해 판단을 내렸다. 이는 기존 신용평가회사들의 정보가 여전히 매우 중요하다는 것을 보여준다. 흥미롭게도 랜덤포레스트는 젊은 사람들을 위험하다고 판단하는 경향을 보였다. 반면 LightGBM은 나이보다는 가족 상황과 주거 안정성을 더 중요하게 봤다.
95% 승인하면서도 손실은 최소화: 은행에겐 꿈같은 시스템
LightGBM은 비즈니스 관점에서도 최고의 성과를 보였다. 대출 신청자의 95%를 승인하면서도 그 중에서 실제로 돈을 갚지 못하는 비율은 가장 낮았다. 이는 은행 입장에서 더 많은 고객에게 대출을 해주면서도 손실은 줄일 수 있다는 의미다. XGBoost도 비슷한 승인률을 보였지만 승인받은 사람 중 돈을 못 갚는 비율이 더 높았다. 랜덤포레스트는 신중하게 대출을 승인했지만 그럼에도 손실이 가장 컸다. 결국 LightGBM이 고객 만족도와 은행 수익성을 모두 잡은 셈이다.
AI가 자신의 판단 이유를 설명한다: 더 이상 ‘블랙박스’ 아니야
이 시스템의 가장 혁신적인 부분은 AI가 왜 그런 판단을 내렸는지 사람이 이해할 수 있게 설명해 준다는 점이다. SHAP과 LIME이라는 기술을 사용해 각 요소가 결정에 얼마나 영향을 미쳤는지 그래프로 보여준다. 예를 들어 대출이 거절됐다면 “외부 신용점수가 낮아서 30% 영향, 소득이 불안정해서 20% 영향” 이런 식으로 구체적인 이유를 알 수 있다. 긍정적인 요소는 초록색으로, 부정적인 요소는 빨간색으로 표시돼서 한눈에 파악할 수 있다.
이런 투명성은 금융업계에서 매우 중요하다. 고객들도 왜 대출이 안 되는지 알 수 있고, 은행 직원들도 AI의 판단을 신뢰할 수 있다. 또한 규제 당국에서도 AI가 공정하게 판단하는지 확인할 수 있다.
FAQ
Q: LightGBM이 다른 AI보다 신용평가에서 뛰어난 이유는?
A: LightGBM은 가장 중요한 정보부터 우선적으로 학습하는 방식을 사용합니다. 마치 시험 공부할 때 중요한 부분부터 먼저 보는 것처럼, 효율적으로 패턴을 파악해서 빠르고 정확한 결과를 냅니다.
Q: 설명 가능한 AI가 왜 중요한가요?
A: AI가 단순히 “승인/거절”만 말하는 게 아니라 그 이유까지 설명해 주면 사람들이 더 신뢰할 수 있습니다. 특히 금융처럼 중요한 결정에서는 왜 그런 판단을 내렸는지 아는 것이 매우 중요합니다.
Q: 이 AI 시스템이 기존 방식보다 좋은 점은?
A: 사람이 직접 심사하면 시간도 오래 걸리고 실수도 생길 수 있습니다. 하지만 이 AI는 1초 만에 정확한 판단을 내리고, 24시간 지치지 않고 일할 수 있어서 훨씬 효율적입니다.
해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.