반응형

오늘, 우리는 Claude 3.5 Sonnet을 출시합니다. Claude 3.5 모델 제품군의 첫 출시 제품입니다. Claude 3.5 Sonnet은 업계의 지능 기준을 높여 다양한 평가에서 경쟁 모델과 Claude 3 Opus를 앞지르고, 중간 계층 모델인 Claude 3 Sonnet의 속도와 비용을 제공합니다.

 

Claude 3.5 Sonnet은 현재 Claude.ai와 Claude iOS 앱에서 무료로 사용할 수 있으며, Claude Pro 및 Team 플랜 구독자는 상당히 높은 요금 한도로 액세스할 수 있습니다. 또한 Anthropic API, Amazon BedrockGoogle Cloud의 Vertex AI를 통해서도 사용할 수 있습니다.

 

이 모델은 200K 토큰 컨텍스트 윈도우와 함께 100만 개의 입력 토큰당 3달러, 100만 개의 출력 토큰당 15달러입니다.

Claude 3.5 Sonnet 로드맵

2배 빠른 속도의 프런티어 인텔리전스

Claude 3.5 Sonnet은 대학원 수준의 추론(GPQA), 학부 수준의 지식(MMLU), 코딩 능력(HumanEval)에 대한 새로운 산업 벤치마크를 설정합니다. 뉘앙스, 유머, 복잡한 지시를 이해하는 데 현저한 개선이 있으며, 자연스럽고 공감할 수 있는 톤으로 고품질 콘텐츠를 작성하는 데 뛰어납니다.

 

Claude 3.5 Sonnet은 Claude 3 Opus보다 두 배 빠른 속도로 작동합니다. 이러한 성능 향상과 비용 효율적인 가격이 결합되어 Claude 3.5 Sonnet은 상황에 맞는 고객 지원 및 다단계 워크플로 조정과 같은 복잡한 작업에 이상적입니다.

 

반응형

 

내부 에이전트 코딩 평가 에서 Claude 3.5 Sonnet은 문제의 64%를 해결하여 38%를 해결한 Claude 3 Opus보다 성능이 우수했습니다. 당사 평가는 원하는 개선 사항에 대한 자연어 설명이 주어졌을 때 모델의 버그 수정 또는 오픈 소스 코드베이스에 기능 추가 능력을 테스트합니다.

 

관련 도구가 제공되고 지시를 받으면 Claude 3.5 Sonnet은 정교한 추론 및 문제 해결 기능으로 코드를 독립적으로 작성, 편집 및 실행할 수 있습니다. 코드 변환을 쉽게 처리하여 레거시 애플리케이션을 업데이트하고 코드베이스를 마이그레이션하는 데 특히 효과적입니다.

Claude 3.5 Sonnet 와 ChatGPT 비교 테이블

최첨단 비전

Claude 3.5 Sonnet은 표준 비전 벤치마크에서 Claude 3 Opus를 능가하는 지금까지 가장 강력한 비전 모델입니다. 이러한 단계적 개선은 차트와 그래프를 해석하는 것과 같이 시각적 추론이 필요한 작업에서 가장 두드러집니다. Claude 3.5 Sonnet은 또한 불완전한 이미지에서 텍스트를 정확하게 필사할 수 있습니다.

 

이는 소매, 물류 및 금융 서비스의 핵심 기능으로, AI가 텍스트만 사용하는 것보다 이미지, 그래픽 또는 일러스트레이션에서 더 많은 통찰력을 얻을 수 있습니다.

 

Claude 3.5 Sonnet 와 ChatGPT 비교 테이블

아티팩트 - Claude를 사용하는 새로운 방법

오늘 우리는 또한 Claude.ai에서 Artifacts를 소개합니다. 이는 사용자가 Claude와 상호 작용하는 방식을 확장하는 새로운 기능입니다. 사용자가 Claude에게 코드 조각, 텍스트 문서 또는 웹사이트 디자인과 같은 콘텐츠를 생성하도록 요청하면 이러한 Artifacts가 대화와 함께 전용 창에 나타납니다. 이를 통해 Claude의 작품을 실시간으로 보고, 편집하고, 빌드할 수 있는 동적 작업 공간이 생성되어 AI에서 생성된 콘텐츠를 프로젝트와 워크플로에 원활하게 통합합니다.

 

이 미리보기 기능은 Claude가 대화형 AI에서 협업 작업 환경으로 진화한 것을 보여줍니다. 이는 곧 팀 협업을 지원하도록 확장될 Claude.ai에 대한 더 광범위한 비전의 시작일 뿐입니다. 가까운 미래에 팀과 결국 전체 조직은 Claude가 주문형 팀원 역할을 하면서 지식, 문서 및 진행 중인 작업을 하나의 공유 공간에 안전하게 중앙 집중화할 수 있게 될 것입니다.

 

안전과 개인정보 보호에 대한 노력

저희 모델은 엄격한 테스트를 거쳤으며 오용을 줄이도록 훈련되었습니다. Claude 3.5 Sonnet의 지능이 크게 향상되었음에도 불구하고, 저희의 레드 팀 평가 결과 Claude 3.5 Sonnet은 ASL-2 에 머물러 있습니다. 자세한 내용은 모델 카드 부록 에서 확인할 수 있습니다.

 

안전과 투명성에 대한 우리의 헌신의 일환으로, 우리는 외부 전문가와 협력하여 이 최신 모델 내의 안전 메커니즘을 테스트하고 개선했습니다. 우리는 최근 Claude 3.5 Sonnet을 영국의 인공지능 안전 연구소(UK AISI)에 사전 배치 안전 평가를 위해 제공했습니다.

 

UK AISI는 3.5 Sonnet의 테스트를 완료하고 올해 초에 발표된 미국과 영국 AISI 간의 파트너십을 통해 가능해진 양해각서의 일환으로 US AI Safety Institute(US AISI)와 결과를 공유 했습니다.

 

우리는 외부 주제 전문가의 정책 피드백을 통합하여 평가가 견고하고 학대의 새로운 추세를 고려하도록 했습니다. 이러한 참여를 통해 우리 팀은 다양한 유형의 학대에 대해 3.5 Sonnet을 평가하는 능력을 확장할 수 있었습니다. 예를 들어, Thorn 의 아동 안전 전문가의 피드백을 사용하여 분류기를 업데이트하고 모델을 미세 조정했습니다.

 

AI 모델 개발을 안내하는 핵심 헌법 원칙 중 하나는 개인정보 보호입니다. 사용자가 명시적으로 허가하지 않는 한 사용자가 제출한 데이터로 생성 모델을 훈련하지 않습니다. 지금까지 생성 모델을 훈련하는 데 고객 또는 사용자가 제출한 데이터를 사용하지 않았습니다.

 

곧 출시 예정

저희의 목표는 몇 달마다 지능, 속도, 비용 간의 트레이드오프 곡선을 크게 개선하는 것입니다. Claude 3.5 모델 패밀리를 완성하기 위해 올해 말에 Claude 3.5 Haiku와 Claude 3.5 Opus를 출시할 예정입니다.

 

차세대 모델 패밀리를 개발하는 것 외에도, 기업용 애플리케이션과의 통합을 포함하여 기업을 위한 더 많은 사용 사례를 지원하기 위한 새로운 모달리티와 기능을 개발하고 있습니다. 저희 팀은 또한 클로드가 사용자의 선호도와 상호 작용 기록을 지정된 대로 기억할 수 있도록 하는 메모리와 같은 기능을 탐색하고 있으며, 이를 통해 사용자 경험을 더욱 개인화하고 효율적으로 만들 수 있습니다.

 

저희는 Claude를 개선하기 위해 끊임없이 노력하고 있으며, 사용자들의 의견을 듣는 것을 좋아합니다. Claude 3.5 Sonnet에 대한 피드백을 제품 내에서 직접 제출하여 개발 로드맵을 알리고 팀이 사용자 경험을 개선하는 데 도움을 줄 수 있습니다. 언제나 그렇듯이, Claude로 무엇을 만들고, 만들고, 발견하는지 보고 싶습니다.

 

*참고한 원본 글: https://www.anthropic.com/news/claude-3-5-sonnet

반응형

+ Recent posts