로컬에서 일반 LLM을 굴릴 욕심이면, 그냥 ChatGPT Plus나 Claude를 구독하는 게 모든 면에서 낫다. 가성비도, 품질도, 속도도, 전기·소음도.
다만 — 코드 어시스턴트 셀프호스팅(OpenClaw·Hermes Agent류)이라면 이야기가 다르다. 그 한 가지 용도라면 산다. 내가 산다면 사양은 맥미니 M4 Pro 48GB. 맥스튜디오까지 갈 필요는 없었다.
이 글이 다루는 것
- 용도 둘만: 로컬 LLM 일반, 코드 어시스턴트 셀프호스팅 (OpenClaw / Hermes Agent)
- 제품 둘만: 맥미니, 맥스튜디오 (MacBook은 휴대 가성비가 다른 트랙이라 제외)
- 왜 좁혔나: 두 제품 다 "책상 위에 24/7 켜놓고 모델을 서빙한다"는 같은 사용 패턴이다. 같은 시나리오에서 두 제품을 두고 사양을 가르는 게 이 글의 일이다.
현재 라인업·가격 — 2026-05-28 기준
| 제품 | 칩 | 메모리 | 시작가 (KRW) | 비고 |
|---|---|---|---|---|
| 맥미니 | M4 (10/10코어) | 16GB·512GB | $799부터 | 2026-05-01 미국 base 인상 |
| 맥미니 | M4 Pro (12/16코어) | 24GB·512GB | ₩209만원부터 | 대역폭 ~273GB/s, TB5 |
| 맥미니 | M4 Pro | 48GB·1TB | 약 ₩299만원 | 본 글 권장 |
| 맥미니 | M4 Pro | 64GB·… | (apple.com/kr 확인) | |
| 맥스튜디오 | M4 Max 14/32 | 36GB·512GB | ₩329만원부터 | |
| 맥스튜디오 | M4 Max 16/40 | 48GB·1TB | ₩404만원 | |
| 맥스튜디오 | M3 Ultra 28/60 | 96GB·1TB | ₩659만원부터 | |
| 맥스튜디오 | M3 Ultra 최상위 | 512GB·16TB | ₩2,174만원 |
루머: M5 맥미니 = 2026년 가을 / M5 맥스튜디오 ≈ 2026-10 (DRAM 공급난). 맥스튜디오 가격은 2025-03 출시 기준.
용도 1 — 일반 LLM이 목적이면 살 이유가 없다
먼저 정의부터. 일반 LLM 작업이란 — 대화, 요약, 번역, 글 다듬기, 자료 분석. ChatGPT/Claude를 평소 쓰는 그 용도다. 이 용도에서 진짜 만족스러우려면 최소한 GPT-4o나 Claude Sonnet 4.6 수준의 품질이 필요하다. 한 번 익숙해지면 그 아래는 답답해진다. 그 클래스는 70B를 훌쩍 넘는 frontier 모델이다.
맥에서 굴릴 수 있는 건 그게 아니다. 맥미니 M4 Pro 48GB에서 편안하게 돌아가는 건 14B class(Q4 양자화 기준), 욕심내면 32B class다. 70B는 맥미니에선 Q3-Q4로 겨우 욱여넣어 tok/sec 5~10 수준. 한 줄 답하는 데 수 초가 걸린다. 일상용으론 못 쓴다. 맥스튜디오 M3 Ultra까지 가야 70B가 굴러가지만, 그래도 frontier 품질엔 못 미친다.
회수기간을 보자. ChatGPT Plus는 $20/월, 1년에 $240. 맥미니 M4 Pro 48GB는 한국에서 ₩299만원, 환율 1,380원 기준 약 $2,170. 회수에 9년이 걸린다. 그동안 frontier 모델은 몇 세대 더 진화한다. 거기에 24/7 운영 전기비, 팬 소음, 모델 다운로드·셋업·업데이트 시간을 더하면 격차는 더 벌어진다.
꼭 그래야 할 사정이 있다면 다르다. 내 데이터가 절대 외부로 나가면 안 된다, 또는 오프라인 환경에서 LLM이 필요하다 — 그런 게 정말 있다면 이야기가 달라진다. 하지만 일반 사용자에게 이건 거의 합리화에 가깝다. 사고 싶은 욕심을 정당화하는 명분. 솔직해지면, 일반 LLM은 API다.
용도 2 — 코드 어시스턴트 셀프호스팅이면 다른 게임이다
여기선 계산이 뒤집힌다. 이유는 세 가지다.
쓰임이 다르다. 코드 작업은 호출이 잦다(자동완성·툴 호출·멀티턴 에이전트 루프), 한 번에 처리하는 컨텍스트는 보통 짧다, 그리고 코드 자체가 자산이라 프라이버시가 진짜 변수다. 자동완성 레이턴시는 100~300ms 차이가 체감으로 온다. 이런 사용 패턴은 로컬이 강한 자리다.
API 비용이 가파르게 오른다. 단순 채팅이라면 월 $20 안에서 끝난다. 그러나 OpenClaw·Hermes 같은 에이전트형 도구는 자동완성에 멀티턴 reasoning에 툴 호출을 곱해버린다. 진지하게 쓰면 월 $50~200이 쉽게 나간다. 이런 조건에선 회수가 빨라진다. 월 $100 가정하면 연 $1,200, 맥미니 M4 Pro 48GB는 약 1.8년에 회수된다. 하드웨어는 그 뒤로도 그대로 굴러간다.
로컬 모델이 코드에선 따라잡았다. 일반 대화에서는 못 따라가도, 특정 도메인의 좁은 작업에서는 specialist 모델이 frontier에 근접한다. Qwen 2.5 Coder 32B, DeepSeek-Coder 33B 같은 코더 전용 모델은 코드 보완·리팩터링·테스트 작성 같은 좁은 작업에서 GPT-4o mini 클래스에 붙는다. 이게 가능한 이유는 단순하다 — 일반 추론이 아니라 코드 패턴 매칭이 핵심인 작업이기 때문이다.
이제 스택별로 보자.
OpenClaw + Ollama. 14B 로컬 모델 + 최소 64k 컨텍스트가 권장이다. 14B Q4가 ~10GB, 64k 컨텍스트의 KV 캐시가 모델 아키텍처에 따라 10~20GB 더해진다. 합쳐 실사용 25~35GB. 24GB 맥미니로는 컨텍스트 길이와 모델 사이에서 한쪽을 깎아야 한다. 48GB면 둘 다 편안하다.
Hermes Agent + Ollama. Nous Research가 2026년 2월 출시한 에이전트로, 권장 시작 모델은 Qwen3.5-9B(8GB+ 양자화 가능). 핵심은 멀티-모델 추론 — 코더 모델 + 추론 모델 + 비전/브라우저 모델을 동시에 로딩해서 작업을 분담시킨다. 단일 모델만 굴리면 9B로 16GB도 되지만, 멀티-모델 풀스택을 노린다면 40GB+ 헤드룸에서야 의미가 생긴다.
두 스택 모두에서, 48GB가 "충분히 여유 있고, 다음 티어로 가지 않아도 되는" 구간이다.
사양 결정 매트릭스
| 구성 | 가격 (KRW) | 적합 용도 | tok/sec | verdict |
|---|---|---|---|---|
| 맥미니 M4 24GB | 120만원대 | 7B 자동완성 한정 | 20~30 | △ 풀 에이전트엔 부족 |
| 맥미니 M4 Pro 24GB | 209만원 | 14B 좁은 컨텍스트 OR 멀티모델 (택1) | 30~50 | △ 타협 강제 |
| 맥미니 M4 Pro 48GB | 299만원 | OpenClaw 14B+64k / Hermes 멀티-모델 둘 다 | 30~50 | ◎ 권장 |
| 맥미니 M4 Pro 64GB | 350만원대 | 32B 코더 + 큰 컨텍스트 + 동시실험 | 30~50 | ○ 여유 (단일유저엔 과지출) |
| 맥스튜디오 M4 Max 36GB | 329만원 | 32B+ 다중 워크로드, 영상편집 겸용 | 50~80 | ○ 다용도 시 |
| 맥스튜디오 M4 Max 48GB | 404만원 | 위 + 헤드룸 | 50~80 | ○ |
| 맥스튜디오 M3 Ultra 96GB | 659만원 | 70B 양자화, 다중사용자 서빙 | 8~15 | ✕ 코드엔 과함, LLM엔 API 우위 |
RAM만 보지 말고 — 숨은 2번 레버는 메모리 대역폭이다
LLM 추론은 메모리-바운드 작업이다. 모델 파라미터를 RAM에서 GPU/뉴럴 엔진으로 매 스텝마다 흘려보내야 하는데, 그 흐름을 막는 건 컴퓨트가 아니라 대역폭이다. 그래서 같은 RAM이어도 칩이 다르면 체감이 다르다.
- M4 base: ~120GB/s
- M4 Pro: ~273GB/s (약 2.3배)
- M4 Max: ~410~540GB/s
맥미니 라인 안에서는 RAM보다 "Pro냐"가 결정적이다. 24GB Pro가 32GB base보다 빠르다. 같은 14B 모델을 굴려도 답하는 속도가 다르다.
지금 살까, 가을 M5를 기다릴까
여기가 가장 시의적인 부분이다. 변수가 셋.
변수 1 — M5 맥미니가 2026 가을 출시 루머. WWDC(6월) 가능성도 있지만 가을이 더 유력하다. 발표되면 칩 세대가 한 단계 점프한다: AI/그래픽 성능 강화, Fusion Architecture 도입 가능성, RAM 옵션은 M5 16/24/32GB, M5 Pro 24/48/64GB로 유지될 전망.
변수 2 — Apple이 2026-05-01에 맥미니 base 가격을 올렸다. 기존 $599(16GB/256GB)를 단종하고 $799(16GB/512GB)부터 시작한다. M4 라인이 더 비싸졌다. M5에서도 이 추세가 이어질 가능성이 있다.
변수 3 — DRAM 공급난. AI 하드웨어 수요 급증으로 DRAM이 부족해서 M5 맥스튜디오는 ~2026-10으로 지연됐다. M5 맥미니도 영향 받을 수 있고, 가격이 더 오를 수도 있다.
세 시나리오로 갈린다.
시나리오 A — 셀프호스팅이 지금 절박하다. 코딩용 API 요금이 매월 $100+ 청구되고 있고, 코드 프라이버시 요구가 실제로 있다면 → 지금 산다. 가을까지 5~6개월의 사용 가치가 M4→M5 점프보다 크다. M4 Pro 48GB는 한동안 셀프호스팅에 충분하다.
시나리오 B — 버틸 수 있다. API 요금이 아직 견딜 만하고, 셀프호스팅이 "있으면 좋겠다" 수준이라면 → 가을 대기. M5 가격 인상 위험은 있지만 그땐 M4 재고 할인을 노릴 수도 있다. 가격·성능을 같이 평가한 뒤 결정한다.
시나리오 C — M5 맥스튜디오가 핵심. 70B 모델 욕심이거나 다중 사용자 서빙이 목표라면 → 무조건 10월 이후 대기. DRAM 공급난으로 더 늦어질 수 있음을 인지하고, 그 사이는 API로 버틴다.
내 콜은 — 산다면 지금이다. 가격 인상 추세 + DRAM 변수를 보면 가을 M5는 더 비싸질 위험이 더 크다고 본다. 하지만 곧 이야기하듯, 지금 안 산다.
그래서 내 결론
나는 코드 어시스턴트 셀프호스팅(OpenClaw 또는 Hermes Agent)을 한다면 맥미니 M4 Pro 48GB를 본다. 이유는 셋.
- OpenClaw가 14B 모델 + 64k 컨텍스트를 권장한다. 24GB로는 컨텍스트와 모델 사이에서 한쪽을 깎아야 한다. 48GB는 둘 다 편하다.
- Hermes Agent의 멀티-모델 운영(코더+추론+비전 동시 로딩)은 40GB 헤드룸에서야 의미가 생긴다.
- 64GB는 단일 사용자에겐 다음 티어 과지출이다. 그 사이 spot이 정확히 48GB.
다만 — 일반 LLM이 목적이라면 같은 ₩299만원으로 약 9년치 ChatGPT Plus를 산다. 품질·속도·전기·소음 모두 API가 압승이다. 그래서 "셀프호스팅 욕구가 코드에 한정될 때만" 산다. 그게 아니면 안 산다.
그리고 한 발 더 솔직하게 — 나는 지금 OpenClaw도 Hermes도 안 쓴다. Claude만으로 충분하다. 셀프호스팅으로 가는 비용·시간보다 Claude를 그대로 쓰는 가치가 더 크다, 적어도 지금까진. 그래서 산다면 지금이지만, 안 산다. 셀프호스팅이 필요해지는 날이 오면 그땐 망설일 이유 없이 M4 Pro 48GB(혹은 그때의 M5 Pro 48GB)를 본다.
당신이 X면, 다른 걸 사라
- 단순 자동완성 + 프라이버시만 → 맥미니 M4 24GB로 충분.
- 70B+ 끝까지 굴린다 / 다중 사용자 서빙 → 맥스튜디오 M3 Ultra. 솔직히는 NVIDIA GPU 서버가 더 효율적.
- 휴대성 우선 → MacBook Pro. 이 글 범위 밖.
- 일반 LLM 욕심밖에 없다 → 사지 마라. API 써라. 이 글이 가장 강하게 말하는 부분.
자주 묻는 것들
Q. 맥미니로 ChatGPT를 대체할 수 있나요?
일반 대화·번역·요약은 품질 차이가 크다. ChatGPT Plus 구독을 못 끊는다. 다만 코드 specialist 모델(Qwen 2.5 Coder 32B 등)은 좁은 코딩 작업에선 GPT-4o mini 수준에 붙는다. 그래서 코드 한정으로는 대체 가능하다.
Q. 왜 64GB가 아니고 48GB인가요?
단일 사용자 셀프호스팅 워크로드는 40GB 헤드룸이면 OpenClaw 14B+64k 컨텍스트와 Hermes 멀티-모델 운영 둘 다 커버된다. 64GB는 그 위에 동시실험 욕심을 더 부릴 때만 의미가 있는데, 그땐 가격이 한 티어 더 올라간다.
Q. RAM 말고 메모리 대역폭이 더 중요한가요?
맥미니 라인 안에서는 그렇다. M4 Pro의 대역폭(~273GB/s)은 base(~120GB/s)의 약 2.3배다. LLM 추론이 메모리-바운드라 같은 RAM이어도 base는 Pro보다 한참 느리다. 그래서 24GB Pro > 32GB base.
Q. M5 맥미니를 기다려야 하나요?
절박하면 지금 산다. 버틸 수 있으면 가을(2026)에 발표 보고 결정한다. 다만 DRAM 공급난으로 M5 가격이 더 오를 수 있다는 변수가 있다.
Q. 맥스튜디오는 언제 의미가 있나요?
70B+ 모델을 진지하게 굴리거나, 다중 사용자에게 서빙하거나, LLM이 부수고 영상편집·3D 등이 메인일 때. 단일 사용자 코드 어시스턴트 셀프호스팅엔 과지출이다.
사양 정리 & 구매 링크
- 권장 구성: 맥미니 M4 Pro / 48GB / 1TB SSD — apple.com/kr/shop/buy-mac/mac-mini
- 가격 스냅샷: 약 ₩299만원 (게시 시점 재확인)
- 함께 볼 것: M5 발표 = 2026년 가을 — 발표 후 별도 갱신 글로 다룸.
※ 2026-05-28 기준. 가격은 출하 시점에 따라 달라질 수 있다. 이 글은 "이거 살까" 시리즈의 첫 편이다. Apple은 어필리에이트 프로그램이 없어 권장 구성 링크는 Apple 직링이며, 이 PoC는 인용·트래픽까지만 측정한다.