AI/ML

[Case Study] 게티이미지코리아

The Customer

게티이미지코리아는 세계적인 디지털 미디어 및 콘텐츠 제공업체입니다. 국내외 많은 작가와 사진작가들의 작품을 포괄하여 독창적이고 다양한, 영상, 음악을 저작권으로 제공하고 있습니다. 다양한 분야의 창조, 마케팅, 홍보 등 많은 산업에서 콘텐츠를 활용할 수 있도록 제공하고 있습니다. 창의적이고 혁신적인 비주얼 콘텐츠를 통해 기업, 언론, 광고 에이전시, 출판사 등 다양한 고객들에게 영감을 주는 솔루션을 제공합니다. 고품질의 스톡 이미지, 일러스트레이션, 영상 클립 등을 포함한 방대한 라이브러리를 보유하고 있어, 고객들의 다양한 크리에이티브 요구를 충족시킬 수 있습니다. 이러한 노력을 통해 빠르게 변화하는 미디어 환경에서도 고객들에게 최적의 비주얼 솔루션을 제공하고 있습니다.

The Challenge

기존의 키워드 중심 검색 방식에서 벗어나, 사용자가 자연어로 원하는 이미지를 찾을 수 있도록 검색 엔진 서비스를 고도화해야 하는 과제에 직면했습니다. 오픈 소스 CLIP 모델을 통해 이 요구사항을 일부 구현할 수 있었지만, 사진의 촬영 기법이나 그림의 분위기 같은 세부적인 특징들을 모두 만족시키기는 어려웠습니다. 또한, 지속적으로 추가되는 새로운 사진들에 대해 자동으로 메타데이터를 생성하고, 수백만 건의 이미지 파일을 대상으로 비용 효율적이면서도 성능이 우수한 검색을 지원해야 한다는 요구사항이 추가적인 도전 과제로 대두되었습니다.

The Solution

Amazon Bedrock의 Claude 모델을 활용하여 이미지 캡셔닝 데이터를 자동으로 생성하는 기능을 추가했습니다. 이를 통해 각 이미지에 대한 상세하고 관련성 높은 메타데이터를 작성할 수 있게 되었습니다. 이는 검색 결과의 정확도와 관련성을 크게 향상시키는 데 기여했습니다.

또한, 사용자의 검색 의도를 더욱 정확하게 파악하고 관련성 높은 이미지를 제공하기 위해, Amazon Titan 멀티모달 임베딩 모델을 활용했습니다. 이 모델을 사용하여 이미지와 그에 대한 Labeling 데이터를 함께 임베딩하고, 이를 OpenSearch Serverless에 구축했습니다. 이러한 접근 방식은 자연어 쿼리와 이미지 데이터 간의 의미론적 연결을 강화하여, 검색의 정확도를 한층 더 높였습니다.

결과적으로, Amazon Bedrock의 다양한 AI 모델들과 OpenSearch Serverless를 결합한 우리의 통합 솔루션은 대규모 이미지 데이터셋에 대한 효율적인 처리, 정확한 메타데이터 생성, 그리고 의미 기반의 검색 기능을 제공하게 되었습니다. 이는 사용자의 복잡한 검색 요구를 충족시키는 동시에, 시스템의 확장성과 비용 효율성을 보장하는 강력한 이미지 검색 플랫폼의 구축을 가능케 했습니다.

The Result

Amazon Bedrock의 Titan Multimodal 모델을 활용하여 비용 효율적인 이미지 임베딩 솔루션을 구현했습니다. 이러한 고도화된 솔루션을 통해, 자연어 쿼리를 효과적으로 매칭하는 별도의 복잡한 알고리즘 개발 없이도 원래의 요구사항을 성공적으로 실현할 수 있었습니다. 이는 개발 시간과 비용을 크게 절감하면서도, 사용자에게 더욱 직관적이고 정확한 검색 경험을 제공할 수 있게 해주었습니다.

수백만 건의 이미지 데이터 처리에 있어, 단일 호출 방식 대신 배치 추론 방식을 도입함으로써 획기적인 성능 향상을 이루었습니다. 기존에는 이미지 임베딩부터 데이터 저장까지 1일 이상 소요되던 프로세스를 단 수십 분 만에 완료할 수 있게 되었습니다. 이러한 최적화는 대규모 데이터 처리의 효율성을 크게 높이고, 비용면에서도 기존 단일 호출보다 1/2 가격으로 추론 가격을 최적화 할 수 있었습니다.

게시글을 평가해주세요
태그 :

필자: GS Neotek

전체 게시물수 : 238

전체 조회수 : 2556

게시물 공유하기