LG AI연구원(원장 배경훈)이 시각과 언어 AI(인공지능)의 융합 트렌드를 주도하기 위해 발빠르게 움직이고 있다.

LG AI연구원은 글로벌 AI 연구자를 대상으로 다음달 1일부터 오는 4월 말까지 온라인으로 ‘LG 글로벌 AI 챌린지’를 진행한다고 31일 밝혔다. ‘LG 글로벌 AI 챌린지’는 ‘제로샷 이미지 캡셔닝(Zero-Shot Image Captioning)’을 주제로 ‘AI가 처음 본 이미지를 얼마나 정확하게 이해하고 설명하는지 평가’하는 대회다.

‘제로샷 이미지 캡셔닝’은 AI가 사람의 시각 인지 능력처럼 처음 본 사물이나, 동물, 풍경 등이 포함돼 있는 이미지를 봤을 때나 일러스트레이션, 그래픽 등 표현 방식이 다른 이미지를 봤을 때 기존 학습한 데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 설명할 수 있는 기술이다. 토끼를 한 번도 본 적이 없는 사람이 토끼와 고양이가 함께 있는 것을 봤을 때, 각 생김새와 특성의 공통점과 차이점을 학습하고 ‘토끼도 털은 있지만 고양이와는 다르게 귀가 길고, 뒷다리가 발달했다’라고 설명할 수 있는 것처럼 ‘제로샷 이미지 캡셔닝’의 작동 구조도 이와 유사하다.