Anthropic 하네스 디자인의 40가지 핵심을 스킬 하나에 담다 — Skill Wizard Harness 제작기
Anthropic이 공개한 Harness Design for Long-Running Application Development는 AI 에이전트가 장시간 복잡한 작업을 수행할 때 겪는 구조적 실패를 해결하는 실전 […]
Anthropic이 공개한 Harness Design for Long-Running Application Development는 AI 에이전트가 장시간 복잡한 작업을 수행할 때 겪는 구조적 실패를 해결하는 실전 […]
AI 코딩 에이전트의 자기평가 편향과 AI 슬롭 문제를 Anthropic의 3-에이전트 하네스 패턴으로 해결한 Claude Code 스킬 개발기.
Anthropic ‘Harness Design for Long-Running Application Development’ 논문의 세 에이전트 구조를 임의 주제의 뉴스 다이제스트 도메인에 이식한 Claude Code 스킬 v1.0.0의 설계 기록. 왜 단일 에이전트 요약이 반드시 실패하는지, 어떻게 주제 정합성을 2× 가중으로 방어하는지, 스타일 자석과 컨텍스트 불안은 어떻게 구조로 봉쇄하는지 정리.
“오늘의 AI 뉴스 정리해줘.” 이 한 마디에 에이전트가 웹을 검색하고, 뉴스를 요약하고, 예쁜 HTML 페이지까지 만들어준다면 어떨까? 그런데 문제가 있다.
Claude Code로 여러 프로젝트를 동시에 굴리다 보면 터미널 창이 기하급수로 늘어난다. 어떤 창이 무슨 작업이었는지 기억이 안 나고, 우선순위는 뒤섞이며,
코드를 작성하고 나면 항상 따라오는 질문이 있다. “테스트는 충분한가?” 대부분의 개발자는 유닛 테스트 몇 개를 작성하고 넘어가거나, 시간에 쫓겨 테스트를
📌 TL;DR 왜 필요했는가 Claude Code를 몇 주만 써보면 다음과 같은 상황을 한두 번은 겪는다. 원인은 Claude Code의 저장 구조에
TL;DR Anthropic의 엔지니어링 아티클 “Harness Design for Long-Running Application Development”에서 제시한 Planner → Generator → Evaluator 3-에이전트 Harness 패턴을 코드가
AI 코딩 에이전트에게 “이 앱 만들어줘”라고 맡기면 처음 20분은 인상적이다. 파일이 생기고, 서버가 뜨고, UI가 나타난다. 그런데 1시간쯤 지나면 이상한