Blog
이거 살까

맥미니, 용도와사양.

맥미니 정면 위에서 본 모습. 중앙에 Apple 로고.
맥미니

주관적인 생각이고, 가격을 비롯한 정보는 상황에 따라 달라질 수 있다.

로컬에서 일반 LLM을 굴릴 욕심이면, 그냥 ChatGPT Plus나 Claude를 구독하는 게 모든 면에서 낫다. 가성비도, 품질도, 속도도, 전기·소음도.

다만 — 코드 어시스턴트 셀프호스팅(OpenClaw·Hermes Agent류)이라면 이야기가 다르다. 그 한 가지 용도라면 산다. 내가 산다면 사양은 맥미니 M4 Pro 48GB. 맥스튜디오까지 갈 필요는 없었다.

이 글이 다루는 것

현재 라인업·가격 — 2026-05-28 기준

제품메모리시작가 (KRW)비고
맥미니M4 (10/10코어)16GB·512GB$799부터2026-05-01 미국 base 인상
맥미니M4 Pro (12/16코어)24GB·512GB₩209만원부터대역폭 ~273GB/s, TB5
맥미니M4 Pro48GB·1TB약 ₩299만원본 글 권장
맥미니M4 Pro64GB·…(apple.com/kr 확인)
맥스튜디오M4 Max 14/3236GB·512GB₩329만원부터
맥스튜디오M4 Max 16/4048GB·1TB₩404만원
맥스튜디오M3 Ultra 28/6096GB·1TB₩659만원부터
맥스튜디오M3 Ultra 최상위512GB·16TB₩2,174만원

루머: M5 맥미니 = 2026년 가을 / M5 맥스튜디오 ≈ 2026-10 (DRAM 공급난). 맥스튜디오 가격은 2025-03 출시 기준.

용도 1 — 일반 LLM이 목적이면 살 이유가 없다

먼저 정의부터. 일반 LLM 작업이란 — 대화, 요약, 번역, 글 다듬기, 자료 분석. ChatGPT/Claude를 평소 쓰는 그 용도다. 이 용도에서 진짜 만족스러우려면 최소한 GPT-4o나 Claude Sonnet 4.6 수준의 품질이 필요하다. 한 번 익숙해지면 그 아래는 답답해진다. 그 클래스는 70B를 훌쩍 넘는 frontier 모델이다.

맥에서 굴릴 수 있는 건 그게 아니다. 맥미니 M4 Pro 48GB에서 편안하게 돌아가는 건 14B class(Q4 양자화 기준), 욕심내면 32B class다. 70B는 맥미니에선 Q3-Q4로 겨우 욱여넣어 tok/sec 5~10 수준. 한 줄 답하는 데 수 초가 걸린다. 일상용으론 못 쓴다. 맥스튜디오 M3 Ultra까지 가야 70B가 굴러가지만, 그래도 frontier 품질엔 못 미친다.

회수기간을 보자. ChatGPT Plus는 $20/월, 1년에 $240. 맥미니 M4 Pro 48GB는 한국에서 ₩299만원, 환율 1,380원 기준 약 $2,170. 회수에 9년이 걸린다. 그동안 frontier 모델은 몇 세대 더 진화한다. 거기에 24/7 운영 전기비, 팬 소음, 모델 다운로드·셋업·업데이트 시간을 더하면 격차는 더 벌어진다.

꼭 그래야 할 사정이 있다면 다르다. 내 데이터가 절대 외부로 나가면 안 된다, 또는 오프라인 환경에서 LLM이 필요하다 — 그런 게 정말 있다면 이야기가 달라진다. 하지만 일반 사용자에게 이건 거의 합리화에 가깝다. 사고 싶은 욕심을 정당화하는 명분. 솔직해지면, 일반 LLM은 API다.

용도 2 — 코드 어시스턴트 셀프호스팅이면 다른 게임이다

여기선 계산이 뒤집힌다. 이유는 세 가지다.

쓰임이 다르다. 코드 작업은 호출이 잦다(자동완성·툴 호출·멀티턴 에이전트 루프), 한 번에 처리하는 컨텍스트는 보통 짧다, 그리고 코드 자체가 자산이라 프라이버시가 진짜 변수다. 자동완성 레이턴시는 100~300ms 차이가 체감으로 온다. 이런 사용 패턴은 로컬이 강한 자리다.

API 비용이 가파르게 오른다. 단순 채팅이라면 월 $20 안에서 끝난다. 그러나 OpenClaw·Hermes 같은 에이전트형 도구는 자동완성에 멀티턴 reasoning에 툴 호출을 곱해버린다. 진지하게 쓰면 월 $50~200이 쉽게 나간다. 이런 조건에선 회수가 빨라진다. 월 $100 가정하면 연 $1,200, 맥미니 M4 Pro 48GB는 약 1.8년에 회수된다. 하드웨어는 그 뒤로도 그대로 굴러간다.

로컬 모델이 코드에선 따라잡았다. 일반 대화에서는 못 따라가도, 특정 도메인의 좁은 작업에서는 specialist 모델이 frontier에 근접한다. Qwen 2.5 Coder 32B, DeepSeek-Coder 33B 같은 코더 전용 모델은 코드 보완·리팩터링·테스트 작성 같은 좁은 작업에서 GPT-4o mini 클래스에 붙는다. 이게 가능한 이유는 단순하다 — 일반 추론이 아니라 코드 패턴 매칭이 핵심인 작업이기 때문이다.

이제 스택별로 보자.

OpenClaw + Ollama. 14B 로컬 모델 + 최소 64k 컨텍스트가 권장이다. 14B Q4가 ~10GB, 64k 컨텍스트의 KV 캐시가 모델 아키텍처에 따라 10~20GB 더해진다. 합쳐 실사용 25~35GB. 24GB 맥미니로는 컨텍스트 길이와 모델 사이에서 한쪽을 깎아야 한다. 48GB면 둘 다 편안하다.

Hermes Agent + Ollama. Nous Research가 2026년 2월 출시한 에이전트로, 권장 시작 모델은 Qwen3.5-9B(8GB+ 양자화 가능). 핵심은 멀티-모델 추론 — 코더 모델 + 추론 모델 + 비전/브라우저 모델을 동시에 로딩해서 작업을 분담시킨다. 단일 모델만 굴리면 9B로 16GB도 되지만, 멀티-모델 풀스택을 노린다면 40GB+ 헤드룸에서야 의미가 생긴다.

두 스택 모두에서, 48GB가 "충분히 여유 있고, 다음 티어로 가지 않아도 되는" 구간이다.

사양 결정 매트릭스

구성가격 (KRW)적합 용도tok/secverdict
맥미니 M4 24GB120만원대7B 자동완성 한정20~30△ 풀 에이전트엔 부족
맥미니 M4 Pro 24GB209만원14B 좁은 컨텍스트 OR 멀티모델 (택1)30~50△ 타협 강제
맥미니 M4 Pro 48GB299만원OpenClaw 14B+64k / Hermes 멀티-모델 둘 다30~50◎ 권장
맥미니 M4 Pro 64GB350만원대32B 코더 + 큰 컨텍스트 + 동시실험30~50○ 여유 (단일유저엔 과지출)
맥스튜디오 M4 Max 36GB329만원32B+ 다중 워크로드, 영상편집 겸용50~80○ 다용도 시
맥스튜디오 M4 Max 48GB404만원위 + 헤드룸50~80
맥스튜디오 M3 Ultra 96GB659만원70B 양자화, 다중사용자 서빙8~15✕ 코드엔 과함, LLM엔 API 우위

RAM만 보지 말고 — 숨은 2번 레버는 메모리 대역폭이다

LLM 추론은 메모리-바운드 작업이다. 모델 파라미터를 RAM에서 GPU/뉴럴 엔진으로 매 스텝마다 흘려보내야 하는데, 그 흐름을 막는 건 컴퓨트가 아니라 대역폭이다. 그래서 같은 RAM이어도 칩이 다르면 체감이 다르다.

맥미니 라인 안에서는 RAM보다 "Pro냐"가 결정적이다. 24GB Pro가 32GB base보다 빠르다. 같은 14B 모델을 굴려도 답하는 속도가 다르다.

지금 살까, 가을 M5를 기다릴까

여기가 가장 시의적인 부분이다. 변수가 셋.

변수 1 — M5 맥미니가 2026 가을 출시 루머. WWDC(6월) 가능성도 있지만 가을이 더 유력하다. 발표되면 칩 세대가 한 단계 점프한다: AI/그래픽 성능 강화, Fusion Architecture 도입 가능성, RAM 옵션은 M5 16/24/32GB, M5 Pro 24/48/64GB로 유지될 전망.

변수 2 — Apple이 2026-05-01에 맥미니 base 가격을 올렸다. 기존 $599(16GB/256GB)를 단종하고 $799(16GB/512GB)부터 시작한다. M4 라인이 더 비싸졌다. M5에서도 이 추세가 이어질 가능성이 있다.

변수 3 — DRAM 공급난. AI 하드웨어 수요 급증으로 DRAM이 부족해서 M5 맥스튜디오는 ~2026-10으로 지연됐다. M5 맥미니도 영향 받을 수 있고, 가격이 더 오를 수도 있다.

세 시나리오로 갈린다.

시나리오 A — 셀프호스팅이 지금 절박하다. 코딩용 API 요금이 매월 $100+ 청구되고 있고, 코드 프라이버시 요구가 실제로 있다면 → 지금 산다. 가을까지 5~6개월의 사용 가치가 M4→M5 점프보다 크다. M4 Pro 48GB는 한동안 셀프호스팅에 충분하다.

시나리오 B — 버틸 수 있다. API 요금이 아직 견딜 만하고, 셀프호스팅이 "있으면 좋겠다" 수준이라면 → 가을 대기. M5 가격 인상 위험은 있지만 그땐 M4 재고 할인을 노릴 수도 있다. 가격·성능을 같이 평가한 뒤 결정한다.

시나리오 C — M5 맥스튜디오가 핵심. 70B 모델 욕심이거나 다중 사용자 서빙이 목표라면 → 무조건 10월 이후 대기. DRAM 공급난으로 더 늦어질 수 있음을 인지하고, 그 사이는 API로 버틴다.

내 콜은 — 산다면 지금이다. 가격 인상 추세 + DRAM 변수를 보면 가을 M5는 더 비싸질 위험이 더 크다고 본다. 하지만 곧 이야기하듯, 지금 안 산다.

그래서 내 결론

나는 코드 어시스턴트 셀프호스팅(OpenClaw 또는 Hermes Agent)을 한다면 맥미니 M4 Pro 48GB를 본다. 이유는 셋.

  1. OpenClaw가 14B 모델 + 64k 컨텍스트를 권장한다. 24GB로는 컨텍스트와 모델 사이에서 한쪽을 깎아야 한다. 48GB는 둘 다 편하다.
  2. Hermes Agent의 멀티-모델 운영(코더+추론+비전 동시 로딩)은 40GB 헤드룸에서야 의미가 생긴다.
  3. 64GB는 단일 사용자에겐 다음 티어 과지출이다. 그 사이 spot이 정확히 48GB.

다만 — 일반 LLM이 목적이라면 같은 ₩299만원으로 약 9년치 ChatGPT Plus를 산다. 품질·속도·전기·소음 모두 API가 압승이다. 그래서 "셀프호스팅 욕구가 코드에 한정될 때만" 산다. 그게 아니면 안 산다.

그리고 한 발 더 솔직하게 — 나는 지금 OpenClaw도 Hermes도 안 쓴다. Claude만으로 충분하다. 셀프호스팅으로 가는 비용·시간보다 Claude를 그대로 쓰는 가치가 더 크다, 적어도 지금까진. 그래서 산다면 지금이지만, 안 산다. 셀프호스팅이 필요해지는 날이 오면 그땐 망설일 이유 없이 M4 Pro 48GB(혹은 그때의 M5 Pro 48GB)를 본다.

당신이 X면, 다른 걸 사라

자주 묻는 것들

Q. 맥미니로 ChatGPT를 대체할 수 있나요?

일반 대화·번역·요약은 품질 차이가 크다. ChatGPT Plus 구독을 못 끊는다. 다만 코드 specialist 모델(Qwen 2.5 Coder 32B 등)은 좁은 코딩 작업에선 GPT-4o mini 수준에 붙는다. 그래서 코드 한정으로는 대체 가능하다.

Q. 왜 64GB가 아니고 48GB인가요?

단일 사용자 셀프호스팅 워크로드는 40GB 헤드룸이면 OpenClaw 14B+64k 컨텍스트와 Hermes 멀티-모델 운영 둘 다 커버된다. 64GB는 그 위에 동시실험 욕심을 더 부릴 때만 의미가 있는데, 그땐 가격이 한 티어 더 올라간다.

Q. RAM 말고 메모리 대역폭이 더 중요한가요?

맥미니 라인 안에서는 그렇다. M4 Pro의 대역폭(~273GB/s)은 base(~120GB/s)의 약 2.3배다. LLM 추론이 메모리-바운드라 같은 RAM이어도 base는 Pro보다 한참 느리다. 그래서 24GB Pro > 32GB base.

Q. M5 맥미니를 기다려야 하나요?

절박하면 지금 산다. 버틸 수 있으면 가을(2026)에 발표 보고 결정한다. 다만 DRAM 공급난으로 M5 가격이 더 오를 수 있다는 변수가 있다.

Q. 맥스튜디오는 언제 의미가 있나요?

70B+ 모델을 진지하게 굴리거나, 다중 사용자에게 서빙하거나, LLM이 부수고 영상편집·3D 등이 메인일 때. 단일 사용자 코드 어시스턴트 셀프호스팅엔 과지출이다.

사양 정리 & 구매 링크

※ 2026-05-28 기준. 가격은 출하 시점에 따라 달라질 수 있다. 이 글은 "이거 살까" 시리즈의 첫 편이다. Apple은 어필리에이트 프로그램이 없어 권장 구성 링크는 Apple 직링이며, 이 PoC는 인용·트래픽까지만 측정한다.