인공지능/뉴스

PC를 제어하는 인공지능, Claude3.5

airoot 2024. 10. 24. 11:22

 

지난 봄 투자자들에게 발표한 피치에서 Anthropic은 연구를 수행하고 이메일을 답변하며 백오피스 작업을 자동으로 처리할 수 있는 가상 비서를 위한 AI를 개발할 계획이라고 발표했다. 이 AI는 "AI 자기 학습을 위한 차세대 알고리즘"으로 불렸으며, 회사는 이 기술이 궁극적으로 경제의 큰 부분을 자동화할 수 있을 것이라고 믿었다.

 

그 AI는 시간이 지나 이제 점차 현실화되고 있다. Anthropic은 Claude 3.5 Sonnet 모델을 업그레이드하여 데스크톱 애플리케이션과 상호작용할 수 있는 능력을 갖춘 버전을 발표했다. 새로운 "Computer Use" API는 키 입력, 버튼 클릭, 마우스 제스처 등을 모방하여 실제 사람처럼 PC를 조작할 수 있도록 설계되었다.

 

Anthropic은 Claude가 화면을 보고 소프트웨어 도구를 사용해 작업을 수행할 수 있도록 훈련되었으며, 사용자가 원하는 작업을 자동화할 수 있도록 컴퓨터 명령을 처리한다고 설명했다. 개발자들은 Anthropic의 API, Amazon Bedrock, Google Cloud의 Vertex AI 플랫폼을 통해 이 기능을 테스트할 수 있다.

 

그러나 이 기술은 여전히 완벽하지는 않다. 예를 들어, 항공편 예약 수정과 같은 간단한 작업에서 Claude 3.5 Sonnet은 절반 이상의 작업을 성공적으로 수행하지 못했고, 제품 반품과 같은 작업에서도 3분의 1가량 실패했다. 또한 스크롤이나 확대/축소와 같은 기본적인 기능에서도 오류가 발생할 수 있다. Anthropic은 이 모델이 여전히 느리고 오류가 발생할 가능성이 높다고 인정하며, 개발자들에게 저위험 작업부터 시작해볼 것을 권장했다.

 

위험성도 존재한다. 최근 연구에 따르면 OpenAI의 GPT-4와 같은 모델조차도 다중 단계 에이전트 작업을 통해 잠재적으로 해로운 행동을 수행할 수 있다는 결과가 나왔다. 특히 데스크톱 앱에 접근할 수 있는 모델은 악의적인 목적에 악용될 가능성이 높다. Anthropic은 이러한 위험성을 인지하고 있으며, 현재 모델의 잠재적인 문제를 관찰하면서 동시에 보안 기능을 개발하고 강화할 계획이라고 밝혔다.

 

또한, Anthropic은 사용자 스크린샷과 명령을 AI 학습에 사용하지 않으며, 웹 접속도 제한했다고 설명했다. 회사는 모델이 사회적 위험성이 높은 작업을 하지 않도록 유도하는 안전 장치를 도입했고, 모델이 감지된 문제로 인해 추가적인 웹사이트 접근을 제한할 수 있는 기능도 갖추었다고 덧붙였다.

 

뿐만 아니라, Anthropic은 곧 출시될 저비용 모델인 Claude 3.5 Haiku를 소개했다. 이 모델은 낮은 대기 시간, 개선된 명령 처리, 그리고 사용자 맞춤형 경험을 생성하는 데 적합한 성능을 제공할 것으로 기대된다. Claude 3.5 Haiku는 텍스트 기반 모델로 처음 출시되며, 이후 텍스트와 이미지를 분석할 수 있는 멀티모달 패키지로 확장될 예정이다.