No.006 [ 인사이트 ]

클로드 신규모델 업데이트 6분정리 (+게임 만들기)

Claude Opus 4.7이 출시되었습니다. 이미지 인식 3배 향상, 유저 지시 수행능력 개선.. 실제로 써먹을 만한 부분만 4.6과 직접 비교 테스트해서 전달드립니다.

Opus 4.7 달라진 점?

Opus 4.7 달라진 점?

Claude Opus 4.7이 나왔습니다. 이번 업데이트의 핵심은 멋진 발표 문구가 아니라 실제 작업에서 바로 드러나는 차이입니다. 이미지를 더 잘 읽고, 지시를 덜 비틀고, 코딩 작업에서 결과물을 더 빨리 밀어붙입니다.

4.6 모델은 사실 이미지를 잘 읽지 못해서 너가 대신 읽어줘야 됩니다. 이전에는 역으로 “이거 테스트인가요?”라고 질문을 하더라고요. 바로 해볼까요?

여기서 Claude 치고 하이픈 2개, 모델하고 Claude 오푸스 4.7로 입력하고 엔터를 누르면 4.7로 뜹니다. “지금 모델 뭐야?”라고 답변을 들으면 4.7 모델이라고 하겠죠. 여기 보시면 4.7 모델이 나와있죠. 그냥 실행했을 때는 4.6 버전으로 뜨게 됩니다.

이미지 인식 비교 테스트

이미지 인식 비교 테스트

일단 이미지부터 시켜보죠. 글자부터 한번 시켜볼게요. 이 정도의 글씨는 저도 간신히 눈을 집중해서 읽어야 되는 부분인데 복사해서 붙여 넣고 둘 다 이미지를 읽도록 해볼게요.

4.7은 답변 속도부터 달랐습니다. 바로 읽고 바로 정리했습니다. 4.6은 파일을 참조하는 듯 버벅였고, 실제 결과도 4.7 쪽이 훨씬 정확했습니다. “논점을 정면으로 다루는 위치는 없다”라고 실제로 적어줬고, 4.6은 약간 이상한 말을 했네요.

이건 체감 차이가 큽니다. 이미지 인식은 확실히 4.7 쪽이 앞섭니다. 설명도 덜 늘어지고, 사용자가 원하는 답으로 더 빨리 들어갑니다. 모델 업데이트가 숫자놀이가 아니라 실제 작업 시간 단축으로 이어지는 지점입니다. 여기서 신뢰가 갈립니다. 읽어야 할 이미지를 못 읽는 모델은 결국 사용자가 다시 검수해야 하고, 그 순간 자동화는 실패합니다.

랜딩페이지에서는 어떤 차이가 날까?

랜딩페이지에서는 어떤 차이가 날까?

다음은 UI 작업을 해볼까요? 똑같은 명령어를 줘보도록 하겠습니다. “한 페이지짜리 랜딩 페이지를 만들어줘. 제품은 내가 쓰고 있는 데이브레이크로 하면 되고, 어떤 계획도 세우지 말고 그냥 바로 작성해.”

4.6은 “이렇게 하겠다”는 계획을 먼저 보여주며 옆길로 샜습니다. 반면 4.7은 지시를 그대로 받아 바로 작성했습니다. 결과도 먼저 나왔고, 약 1분 40초 만에 랜딩페이지를 완성했습니다.

제가 말한 그대로 따르고 있네요. “어떤 계획도 세우지 말고 그냥 바로 작성해”라는 지시에 어떤 것도 참조하지 않고 바로 작성한 것 같아요. 퀄리티를 보면 되게 세련된 것 같고, 클릭하면 제일 밑으로 내려가네요.

AI들의 특징이 텍스트를 너무 작게 해버리곤 하는데, 여기는 그런 게 없어서 좋습니다. 애니메이션도 잘 들어가 있고, 터미널에서 열 때 자연스러워요. 다만 여기는 AI 티가 좀 많이 나긴 하네요.

일단 비교 섹션도 있고, 인용 섹션까지 가격까지 잘 해놨습니다. 이건 귀엽게 잘했네요. 1분 40초 만에 이 정도면 정말 빠른 거네요.

어딘가 모자란 4.6 모델

어딘가 모자란 4.6 모델

이제 4.6이 만든 버전을 보면 차이가 더 선명합니다. 4.6은 실제로 파일을 참조했지만 결과물은 처참합니다. 이대로는 발행하기 어렵습니다.

카드 디자인이 좋지 않아요. 카드의 오른쪽에 엄청나게 많은 여백이 있고, 텍스트를 회색으로 만들었는데 4.7과 달리 흰색으로 하지 않아서 검은색 배경에 잘 안 보입니다.

데이브레이크에 대한 설명을 하고 있죠. 이거 누르고 다운로드하고 “안녕하세요, 저는 달비라고 합니다”는 말이 그대로 나오는데, 이건 중요하지 않고요. 뭔가 데모 요소가 부족한 것 같아서 아쉽네요.

‘지시 잘 따르는 능력’이 왜 중요할까?

'지시 잘 따르는 능력'이 왜 중요할까?

Opus 4.7의 핵심은 지시 추종 능력입니다. 방금 결과에서 바로 보였습니다. 4.6의 경우에는 하라고 말한 적도 없는 데이브레이크에 대해 조사하고 실행을 했어요.

4.7은 제가 말했던 그대로 절대 아무런 계획도 세우지 않고 그냥 바로 작성을 해버렸죠. 4.6은 하지 말라는 것도 해버리고 하라는 것도 안 해버리는 경우가 너무 많았어요.

이미지 인식도 이전 모델보다 3배 이상 개선됐는데, 아까 초반에 확인했듯이 훨씬 더 좋은 인식률을 보여줍니다.

비용은 늘어날까? 토큰 사용량은?

비용은 늘어날까? 토큰 사용량은?

다만 공짜 개선은 아닙니다. 직접적인 업그레이드이지만 토큰 사용에 영향을 미치는 변경이 있습니다. 더 많이 생각하는 모델은 더 많은 비용을 만들 수 있습니다. 그래서 지침은 더 짧고 압축해서 줘야 합니다. 모델이 똑똑해질수록 사용자의 통제권도 더 중요해집니다. 방치하면 좋은 모델도 비용 문제로 망합니다. 그래서 이번 업데이트는 성능만 보는 게 아니라, 어디까지 맡기고 어디서 끊을지 정하는 운영 감각까지 같이 봐야 합니다. 이제.

둘째, 오푸스 4.7은 특히 에이전트 설정에서 뒤쪽 턴으로 갈수록 더 많이 생각합니다. 어려운 문제에서는 신뢰성이 올라가지만, 현실적으로는 잘못 방치하면 비용이 커질 수 있다는 뜻입니다.

로그라이크 게임, 만들 수 있을까?

로그라이크 게임, 만들 수 있을까?

이제 진짜 테스트입니다. 로그라이크 게임을 만들어달라는 프롬프트를 두 모델에 똑같이 줍니다. 로그라이크를 모르는 분이라면 뱀파이어 서바이버류 게임을 떠올리면 됩니다.

벌써부터 차이점이 보여요. 4.7은 게임 만들어 달라고 하니까 테스크를 생성해서 프로젝트의 콘텍스트를 쭉 탐색하는 모습입니다. 반면 4.6은 뭘 하고 있는지 추적하기가 어렵네요.

4.7은 질문 없이 진행하라는 명령을 그대로 따랐습니다. 중간에 불필요한 확인을 끼워 넣지 않고, 스스로 판단해 프로젝트를 끝까지 밀었습니다. 여기서 에이전트 성능 차이가 드러납니다. 코딩 에이전트에서 제일 위험한 문제는 못 만드는 것이 아니라, 멈춰서 계속 사용자에게 판단을 떠넘기는 것입니다.

4.6이 먼저 만들었네요. 스타트 해보니 충분히 괜찮은 게임이 나왔어요. 게임을 플레이해보니 셰터드 픽셀 던전 같은 느낌이 납니다. 적도 있고, 물약도 있고, 방어력도 올라가네요.

이 정도면 재미있어 보이지만, 다른 버전과 비교해보려고 해요.

뱀서라이크를 프롬프트 2줄로 만든다면

뱀서라이크를 프롬프트 2줄로 만든다면

이제 뱀서류를 만들고 싶다고 입력해 보겠습니다. 4.6이 속도는 훨씬 빠르네요. 둘 다 켜서 플레이해봅시다.

최신 버전(Opus 4.7)이 만들어준 게 왼쪽입니다. 오른쪽의 “Echos of the Fallen”은 Opus 4.6이 만들어준 거네요. 4.6 버전부터 봅시다. 들어가자마자 뭔가 잘못됨을 느껴집니다.

새로 고침을 해도 아무것도 조작되지 않습니다. 버그입니다. 반대로 최신 모델이 만든 버전은 바로 움직이고 공격도 됩니다. 게임은 설명보다 실행이 전부인데, 여기서 승부가 끝났습니다.

아까 보셨겠지만 저 프롬프트는 딱 두 줄이었어요. 이건 진짜 원클릭인데 단검, 채찍, 방어력 같은 요소들이 모두 구현되어 있습니다.

게임을 플레이해보면 생각보다 훨씬 그럴듯합니다. 레벨업, 5종류의 적, XP, 보석, 데미지, 무기 효과까지 들어가 있습니다. 화염구 같은 스킬도 빨간색으로 날아갑니다. 두 줄 프롬프트로 이 정도면 장난감이 아니라 프로토타입입니다. 4.6 버전은 조작부터 깨졌고, 4.7 버전은 플레이 루프가 살아 있었습니다. 이 차이는 단순 취향이 아니라 성공과 실패의 차이입니다.

마무리

마무리

결론은 간단합니다. Opus 4.7은 4.6보다 실전 작업에 더 가깝습니다. 이런 게임이 바로 나온다는 게 말이 안 됩니다. 킬 수와 스킬 정보도 표시되고, 플레이 루프도 돌아갑니다. 이게 딱 두 줄 프롬프트로 완성됐습니다.

프롬프트는 첫 번째 “로그라이크 게임 만들어줘”, 두 번째 “뱀서류로 만들고 싶음” 이렇게 두 줄뿐입니다. 정말 좋은 퀄리티네요.

게임 개발자분들 죄송합니다. 고정 댓글에 프롬프트를 남겨둘 테니 터미널에서 바로 돌려보면 됩니다. 이번 업데이트는 “조금 좋아졌다”가 아니라, 짧은 지시로 실제 결과물을 뽑는 능력이 한 단계 올라갔다는 쪽에 가깝습니다.

#AI 게임#AI 코딩#Anthropic#Claude Code#Claude Opus 4.7#Vampire Survivors#로그라이크#뱀서라이크