Search

KETI, 색상 레시피 추천하는 AI 모델 개발

color generative AI
이미지 출처: 구글 Imazen3

RESEARCH ON COLOR RECIPE RECOMMENDATION BASED ON UNSTRUCTURED DATA USING TENN

한국전자기술연구원(KETI)이 비정형 데이터를 활용해 색상 레시피를 추천하는 인공지능(AI) 모델 ‘TENN(Tokenizing Encoder Neural Network)’을 개발했다. 이 기술은 특히 중소기업의 색상 관련 제조 공정에 도움을 줄 것으로 기대된다.

감성적 언어 처리로 색상 레시피 추론

TENN은 자연어로 된 비정형 데이터를 처리해 색상 레시피를 추론하는 AI 모델이다. 기존의 색상 예측 및 레시피 추론 시스템들이 주로 구조화된 표준 데이터를 사용한 것과 달리, TENN은 비표준화된 비정형 데이터와 암묵지를 처리할 수 있다.

연구팀은 RGB 컬러 코드 차트를 샘플 데이터셋으로 사용했다. 각 RGB 색상 코드에 대해 자연어 텍스트 데이터를 입력 데이터로, RGB 색상 코드를 출력 데이터로 설정했다. 이를 통해 모델은 텍스트 데이터 내의 감성 정보를 인식하고 RGB 코드 조합 레시피를 출력할 수 있게 됐다.

KETI 연구팀은 “도장, 합성수지 생산, 페인트 제조, 사출 성형 등 색상 공학과 관련된 많은 공정들이 색상 기술자의 직관과 암묵지에 크게 의존하고 있어 이 지식을 디지털화하기 어려웠다”며 “일부 기업들은 이 정보를 영업 비밀로 취급해 디지털 전환과 AI를 통한 공정 효율성 및 생산성 향상이 어려웠다”고 설명했다.

토크나이징 인코더 신경망 구조 적용

TENN 모델은 토크나이징 인코더를 신경망의 전처리 레이어로 구성했다. 이는 기존의 복잡한 자연어 처리 알고리즘 구조보다 효율적이면서도 감성 정보와 비정형 데이터를 학습할 수 있는 구조다.

모델 구조는 총 12개 레이어, 38,731개의 파라미터로 구성됐다. 첫 번째 전처리 레이어에서 토크나이징과 인코딩 기능을 수행한다. 데이터셋은 8:2 비율로 학습용과 테스트용으로 나눠 실험을 진행했다.

연구팀은 “기존의 LSTM(Long Short-Term Memory), RNN(Recurrent Neural Network), T5, GPT, BART, BERT 등의 복잡한 구조는 대규모 애플리케이션과 대형 언어 모델(LLM)에 적합하지만, 이 연구에 사용될 경우 효율성과 컴퓨팅 리소스 측면에서 문제가 있다”고 밝혔다.

정규화 방법 비교 실험

TENN 모델에 가장 적합한 정규화 방법을 찾기 위해 연구팀은 MinMaxScaler, MaxAbsScaler, RobustScaler, StandardScaler 등 다양한 전처리 기법의 결과를 비교했다. 동일한 레이어 수와 노드를 가진 모델에서 각 방법을 적용한 후 학습 결과의 정확도를 기준으로 최적의 방법을 선택했다.

실험 결과, MinMaxScaler가 0.79로 가장 높은 정확도를 보였고, 그 다음으로 StandardScaler(0.73), MaxAbsScaler(0.68), RobustScaler(0.42) 순이었다. 연구팀은 이 결과를 바탕으로 MinMaxScaler를 TENN 모델의 정규화 방법으로 채택했다.

실험 결과 및 성능 검증

연구팀은 300개 이상의 샘플 데이터셋으로 TENN의 성능을 확인했다. 학습된 모델에 비정형 색상 정보 데이터를 입력해 얻은 RGB 레시피가 유사한 색상에 해당하는지 검증했다.

30개의 샘플 데이터에 대해 CIEDE2000 표준 색상 차이 공식을 사용해 계산한 결과, 색상 거리는 평균 73.8(Delta E 값)을 기록했다. CIELAB 기반 Delta E는 국제조명위원회(CIE)가 만든 표준 측정 단위로, 두 색상 간의 차이를 수치화한다. Delta E 값이 낮을수록 정확도가 높고, 값이 높을수록 큰 차이를 나타낸다.

연구팀은 “책, 뉴스 등의 텍스트 데이터를 사용한 기존 감성 정보 추론 시스템 연구들의 정확도(80-85%)와 비교해 약 5% 낮은 수준의 정확도를 달성했다”고 밝혔다.

또한 “매우 연한 회색과 코코아 브라운 색상의 경우, 참조 색상과 모델이 추천한 색상을 육안으로 구별할 수 있었다”며 “Delta E 값이 크더라도 훈련 데이터셋 범위를 벗어난 경우에도 견고성을 보여주었다”고 설명했다.

향후 연구 방향

연구팀은 “향후 중소기업의 실제 도장 공정에서 사용되는 안료 및 배합 레시피 데이터셋을 활용할 계획”이라고 밝혔다. 또한 “다양한 알고리즘을 언어 모델에 적용하고, 연합 학습 등의 방법론을 통해 보안 문제를 극복하여 TENN을 개선할 것”이라고 덧붙였다.

TENN 모델의 개발은 중소기업의 색상 관련 제조 공정에 큰 도움이 될 것으로 기대된다. 특히 표준화된 데이터가 부족한 중소기업들이 비정형 데이터와 감성적 표현을 활용해 색상 레시피를 추론할 수 있게 되어, 생산성 향상과 디지털 전환에 기여할 수 있을 것으로 보인다.

한국전자기술연구원의 논문은 링크에서 확인할 수 있다.


본 기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




KETI, 색상 레시피 추천하는 AI 모델 개발 – AI 매터스 l AI Matters