AI/ML

[re:invent 2024] Amazon Nova 출시 및 소개

Nova?

2024년 12월 3일 발표된 Amazon Nova가 출시되었습니다.

수수수 수퍼노바

(이 노바는 아니고요….)


Nova는 Amazon의 AWS의 최첨단 AI 기술을 바탕으로 개발된 멀티 모달 FM로, 특히 한국어를 포함한 15개 언어에 대해 우수한 처리 능력을 소개하고 있습니다.

공개된 Nova 모델 버전은 다음과 같으며, Amazon Bedrock에서 제공하고 있습니다. (Model support by AWS Region in Amazon Bedrock)

  • Amazon Nova Micro : 텍스트 전용 모델. 최대 토큰 : 128k. Fine-tuning 지원
  • Amazon Nova Lite : 멀티 모달 모델. 최대 토큰 : 300k. Fine-tuning 지원
  • Amazon Nova Pro : 멀티 모달 모델. 최대 토큰 : 300k. Fine-tuning 지원
  • Amazon Nova Premier : 훈련 중. 2025년 초 출시 목표
  • Amazon Nova Canvas : 이미지 생성 모델, Max input characters: 1,024
  • Amazon Nova Reel : 비디오 생성 모델. Max input characters: 521

본 블로그 글에서는 Amazon Nova 라인업 중 Micro, Lite, Pro에 대해 알아보려 합니다.

AWS는 이미 자사 파운데이션 모델인 Amazon Titan이 있습니다. 그럼에도 새로운 모델인 Nova를 출시한 이유는 무엇일까요? 한국어 성능은 어떨까요? 성능, 비용, 경쟁 모델과의 비교, 그리고 실제 사용 사례를 간단히 살펴보겠습니다.

Amazon Nova 특징 및 성능

Amazon Nova는 “업계 최고의 가격 대비 성능을 제공하는 차세대 최첨단 FM”로 출시됐습니다.
Nova Pro, Lite, Micro는 각각 다른 성능 목표를 가지고 최적화된 모델로, Nova 모델 시리즈 report의 평과 결과에 의하면 각각의 목표에서 차별화된 강점을 보여줍니다.

  • Micro: 최소 지연 시간(low latency)와 높은 효율성
  • Lite: 빠른 처리 속도와 멀티모달 처리 지원
  • Pro: 최고 정확도와 기능 제공. 멀티모달 처리 지원

The Amazon Nova family of models: Technical report and model card 내용을 기반으로 벤치마크 결과를 확인해 보겠습니다.

아래는 Amazon Nova Pro, Lite, Micro 모델의 Core capability text benchmarks 결과입니다.

위 Core capability text benchmarks 외 주요 벤치마크에서 속도, 정확도, 토큰 처리 효율성과 응답 시간에 있어 뛰어난 성능을 보여주고 있습니다.

Nova는 다양한 벤치마크에서 우수한 결과를 보여주며, 주목할 만한 특징 중 하나는 long context 처리입니다.

Nova는 최대 300k 토큰까지 지원합니다. Long context 성능 평가에서도 높은 성능을 보여주며, 긴 문맥 이해 및 요약에 강점을 가지고 있습니다.
Nova는 200개 이상의 언어 지원하며, 한국어를 포함한 15개 주요 언어에 최적화된 모델입니다. 번역 및 다국어 처리에서 높은 성능을 기대할 수 있겠습니다.

각 CSP에서 Context window 크기를 경쟁적으로 광고 하지만, 해당 보고서에 따르면 SQuALITY와 LVBench 벤치마크에서 Amazon Nova 모델은 우수한 성능을 기록했습니다. 단순히 창의 크기가 크다고 해서 더 나은 결과를 보장하는 것은 아니라는 점을 확인할 수 있습니다.

또한, Nova는 Responsible AI를 위해 다양한 접근 방식을 구성하고 있으며, 데이터 보호 측면에서는 학습 데이터에 대한 접근을 철저히 제어하고, 개인 데이터를 제거하는 절차를 통해 데이터 프라이버시를 보호합니다.
또한, 생성된 이미지와 비디오 콘텐츠에 워터마크를 삽입하여 콘텐츠의 추적 가능성과 신뢰성을 보장한다고 합니다.

Amazon Bedrock에서 제공하는 모델과의 비교를 위해, Artificial Analysis의 AI 모델 비교 정보를 참조하였습니다.

아래는 품질, 속도, 비용 세부 비교입니다.

품질 평가

  • Claude 3.5 Sonnet v2이 가장 품질이 높고, 그 이후 Nova Pro 순입니다.

속도

  • Nova Micro가 확실히 속도가 빠릅니다.

비용

  • Nova 모델들이 성능 대비 저렴한 가격을 제공합니다.

경쟁 모델 간 성능 비교를 확인하면 다음과 같습니다.

  • Nova Micro는 초당 약 200tokens로, 모든 모델 중 가장 빠르고, 저렴한 모델입니다. 다만, 품질 점수는 다소 낮습니다.
    • Llama 3.1 70B Latency Optimized 모델 보다도 빠르며, 성능은 다소 낮지만 비용이 더 저렴합니다.
    • 비슷한 품질을 제공하는 Llama 3.1 70B Standard 모델 보다 큰 차이로 빠르고, 저렴합니다.
  • Nova Lite는 초당 약 150tokens로, 경제적이면서 품질과 속도의 균형을 갖춘 모델로 보입니다.
    • 비슷한 품질을 제공하는 Llama 3.1 70B Latency Optimized 모델보다 input은 22.5배 저렴하고, output은 6.43배 저렴합니다.
  • Nova Pro는 초당 약 100tokens로, 경쟁 모델 간 가격 대비 높은 성능을 갖춘 모델입니다.
    • Claude 3.5 Sonnet v1와 품질 점수는 큰 차이가 없지만, 약 2배 정도 빠른 것을 확인할 수 있습니다.
    • Claude 3.5 Sonnet v2는 NovaPro에 비해 높은 성능을 보이고 있습니다. 다만, 가격과 특히 속도면에서는 Nova Pro가 높은 성능을 보여줍니다.
    • Claude 모델과 가격 비교는 input 가격은 약 3.75배, output은 4.7배 저렴합니다.

Amazon Nova는 기존 모델과 비교할 때, 성능 대비 더 낮은 비용으로 제공하므로 경제성 측면에서 이점을 가져갈 수 있겠습니다.

한국어 비교: Claude vs Nova

한국어로 테스트하고 결과를 비교해보면 좋을 것 같습니다.

Bedrock playground의 Compare mode를 활용하여 Claude 3.5 Sonnet과 Nova를 간단히 비교해보려고 합니다.
추론 파라미터(Inference parameters)는 콘솔 상에서 가능한 동일하게 설정하여 진행했습니다. Top K의 경우 Claude 모델에서는 설정 가능했지만, Nova에서는 설정이 불가하여 기본값으로 진행했습니다.

샘플 프롬프트는 다음과 나누어 결과를 확인했습니다. Adjusted Latency는 Output token 수를 Nova Pro를 기준으로 조정한 수치입니다.

  • 짧은 질문
  • 긴 설명 요청
  • PDF 파일 기반 질문

짧은 질문

AI가 뭐야?

모델Input tokenoutput tokenLatencyAdjusted Latency
Amazon Nova Lite89437534 ms5449 ms
Amazon Nova Pro86828801 ms8801 ms
Claude 3.5 Sonnet153238654 ms18273 ms

긴 설명 요청

머신 러닝의 역사를 자세하게 설명해줘.

모델Input tokenoutput tokenLatencyAdjusted Latency
Amazon Nova Lite28196915841 ms15407 ms
Amazon Nova Pro28191524831 ms24831 ms
Claude 3.5 Sonnet3185424850 ms55723 ms

PDF 파일 기반 질문

AWS ELEMENTAL MEDIATAILOR의 주요 특징과 이점은?

모델Input tokenoutput tokenLatencyAdjusted Latency
Amazon Nova Lite6233138312503 ms8200 ms
Amazon Nova Pro623390713876 ms13876 ms
Claude 3.5 Sonnet714458817891 ms27597 ms

Nova 모델은 속도 측면에서 더 좋은 결과를 확인했습니다. 토큰 최적화에서는 좀 더 확인이 필요하지만, Nova는 효율적인 토큰 사용으로 경쟁 모델 대비 Input Token 수를 줄이는 것으로 보입니다.
토큰은 비용과 직결되기 때문에 Tokenize 최적화는 중요한 요소이며, 비교를 위해서는 실제 Tokenizer를 사용한 시뮬레이션이 필요합니다.
본 블로그 글에서는 위 결과만을 기반하여 input token 결과를 확인했습니다.

결과에서 확인할 수 있는 공통점은 Nova 모델의 Output token 수가 Claude 대비 약 2배 혹은 그 이상이라는 점입니다.
Nova model report 내 long context 부분에서 성능이 우수하다는 것은 위에서 말씀드렸습니다.
이 점으로 추측해 보자면, Nova 모델은 long context로 주로 학습을 하였고, 이로 인해 출력이 길게 나온다는 가능성이 있습니다.
따라서 비용 절감을 위해 Nova에 적합한 프롬프트 엔지니어링이 필요하겠습니다.

위 결과에서 한국어 성능을 직접적으로 비교할 수는 없었지만 사용자 경험으로 적어보자면,
아직까지는 Nova 보다는 Claude 모델이 한국어의 미묘함을 보다 이해하고, 번역, 요약, 문장 생성 작업에서 정확하고 매끄러운 결과를 보여주는 것 같습니다. 하지만 두개의 모델 모두 계속해서 업데이트를 하고 있는 만큼, 시간에 따라 한국어 성능 격차가 줄어늘 가능성이 있습니다.

Claude 모델은 이미 어느 정도 한국어 활용 사례가 쌓여 있어 ‘대체로 안정적이고 자연스럽다.’는 평가가 많은 편이고,
Nova 모델은 정보가 상대적으로 부족한 상황이라 ‘개선되고는 있으나 어느 정도 수준인지는 좀 더 검증이 필요하다.’는 인식이 강합니다.

현재까지 한국어 성능에 대한 모델간의 뚜렷한 비교는 제한적입니다. 워크로드에 Nova 도입을 고려한다면, PoC를 통한 실제 환경에서 검증을 통해 사전에 성능과 안정성을 확인을 권장 드립니다.

ㅇㅇ

ㅇㅇ

Amazon Nova 비용 확인

Amazon Bedrock Pricing에서 리전 변경 후 비용 확인이 가능합니다.

  • Understanding Models : Amazon Nova Micro, Lite, Pro는 텍스트, 이미지, 비디오 입력을 받아들이고 텍스트 출력을 생성하는 이해 모델입니다.
  • Creative Content Generation Models : Amazon Nova Canvas와 Nova Reel은 텍스트와 이미지 입력을 받아들이고 이미지나 비디오 출력을 생성하는 창의적인 콘텐츠 생성 모델입니다.
  • 각각 Amazon Nova Mirco, Lite, Pro 가격

  • Amazon Nova Canvas, Reel 가격

모델 활성화 방법

현재 Amazon Nova 전 모델군은 버지니아 북부 리전에서만 사용 가능합니다.
Nova Micro, Lite, Pro 모델은 cross-region inference로 오레곤, 오하이오 리전에서 사용 가능합니다.

https://docs.aws.amazon.com/bedrock/latest/userguide/models-regions.html

AWS 콘솔에서 모델 활성화 방법은
Amazon Bedrock > 좌측 패널 맨 하단 Bedrock configurations 내 모델 액세스 선택 > 모델 액세스 권한 수정 선택에서 권한 수정 가능합니다.

Amazon Nova?

Titan이라는 이미 알려진 모델이 있음에도 불구하고 Nova를 출시한 이유는 공식적으로 구체적인 차별화 포인트를 밝히지 않았습니다. 다만 새로운 기술이나 기능을 구현하고 시장 세분화를 통한 경쟁력 강화를 목표로 하는 기업적·기술적 전략이라고 추측하고 있습니다.
“차세대 모델”이라는 이미지를 강조해 변화하는 시장 수요에 대응하고, 새 브랜드로 출시하여 AWS 고객에게 더 광범위한 포트폴리오를 제공할 가능성이 있겠죠.

결론으로 Amazon Nova에 대해 정리하자면,
Amazon Nova는 대화형 AI 작업에서 경쟁 모델과 유사한 성능을 제공하며, 확실히 처리 속도, 비용 측면에서 충분한 경쟁력을 가진 것으로 생각됩니다. 한국어 성능은 경쟁 모델과의 정확한 비교가 필요하지만, 지속적으로 개선될 가능성이 있습니다.

텍스트뿐만 아니라 이미지, 비디오 같은 멀티모달 입력도 효과적으로 처리하며, 다국어 데이터를 학습하여 다양한 언어와 문맥에서 최적화된 토큰화를 제공합니다. 또한 Nova Pro와 Lite는 커스텀 파인튜닝 및 지식베이스 통합을 통해 특정 도메인에서의 성능 최적화가 가능할 것으로 보입니다.
빠른 응답이 필요한 애플리케이션, 비용을 절감하면서 대량의 데이터를 처리해야 하는 워크로드, AWS 인프라를 이미 활용하고 있다면 적합할 것 같습니다.

Amazon Nova Micro, Lite, Pro는 각각 다른 사용 사례와 성능 요구사항을 충족하도록 설계되었습니다. 모델별 특징과 적합한 사용 사례를 비교하면 다음과 같습니다.

특징/모델Nova MicroNova LiteNova Pro
출력 속도가장 빠름빠름비교적 느림
품질중하위중간상위
비용가장 저렴중간가장 비쌈
사용 사례실시간 처리, 단순 작업균형 잡힌 응답 생성, 간단 요약고품질 콘텐츠 및 정밀 응답
추천 작업채팅봇, 대량 데이터 처리고객 서비스, 콘텐츠 초안 작성복잡한 문서 작성, 마케팅 및 연구

결론을 맺으며 블로그 글을 정리하겠습니다.

  1. 경제성과 속도가 중요한 경우 :
    • Nova Pro는 가장 경제적이며, 속도와 품질의 균형이 뛰어납니다.
    • Claude 모델 대비 속도는 2배, 출력 비용은 1/4 수준 입니다.
  2. 품질이 더 중요한 경우 :
    • Claude 3.5 Sonnet은 Nova Pro보다 품질이 높으나, 높은 비용과 낮은 속도를 고려해야 합니다.
    • 특히, Claude 3.5 Sonnet v2는 최고의 품질을 제공합니다. 다만, 비용과 속도에서 제약이 있습니다.

감사합니다.

참고

[1] AWS What’s new : https://aws.amazon.com/ko/about-aws/whats-new/2024/12/amazon-nova-foundation-models-bedrock/
[2] AWS Blog : https://aws.amazon.com/ko/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/
[3] Amazon Nova : https://aws.amazon.com/ko/ai/generative-ai/nova/
[4] Amazon Bedrock Pricing : https://aws.amazon.com/ko/bedrock/pricing/
[5] Amazon Nova Documentation : https://docs.aws.amazon.com/nova/latest/userguide/what-is-nova.html
[6] Amazon Science Nova Model Card : https://www.amazon.science/publications/the-amazon-nova-family-of-models-technical-report-and-model-card

5/5 - (평가 개수 : 1)
태그 : ,

필자: 최 원희

전체 게시물수 : 1

전체 조회수 : 201

게시물 공유하기