주제 불문 뉴스 다이제스트 자동화 — Planner→Generator→Evaluator 하네스 스킬 만들기

Anthropic ‘Harness Design for Long-Running Application Development’ 논문의 세 에이전트 구조를 임의 주제의 뉴스 다이제스트 도메인에 이식한 Claude Code 스킬 v1.0.0의 설계 기록. 왜 단일 에이전트 요약이 반드시 실패하는지, 어떻게 주제 정합성을 2× 가중으로 방어하는지, 스타일 자석과 컨텍스트 불안은 어떻게 구조로 봉쇄하는지 정리.

AI 에이전트가 혼자서 뉴스를 수집하고, 디자인하고, 검증까지 한다면?

“오늘의 AI 뉴스 정리해줘.” 이 한 마디에 에이전트가 웹을 검색하고, 뉴스를 요약하고, 예쁜 HTML 페이지까지 만들어준다면 어떨까? 그런데 문제가 있다. … Read more

Full Test Orchestrator: 10개 도메인 테스트 자동화가 필요한 이유

코드를 작성하고 나면 항상 따라오는 질문이 있다. “테스트는 충분한가?” 대부분의 개발자는 유닛 테스트 몇 개를 작성하고 넘어가거나, 시간에 쫓겨 테스트를 … Read more

AI가 사업계획서를 쓰면 왜 항상 뻔할까? — Anthropic Harness 설계를 사업계획에 적용한 이야기

TL;DR Anthropic의 엔지니어링 아티클 “Harness Design for Long-Running Application Development”에서 제시한 Planner → Generator → Evaluator 3-에이전트 Harness 패턴을 코드가 … Read more

AI 코딩 에이전트가 6시간 동안 혼자 앱을 만들게 하려면 — Harness-Driven Dev 스킬 제작기

AI 코딩 에이전트에게 “이 앱 만들어줘”라고 맡기면 처음 20분은 인상적이다. 파일이 생기고, 서버가 뜨고, UI가 나타난다. 그런데 1시간쯤 지나면 이상한 … Read more

Claude Code로 Threads 포스트 자동화 스킬 만들기 — 사용법과 장점

Claude Code에서 Threads 포스트를 자동으로 작성하고 게시할 수 있는 스킬을 만들었습니다. Meta Threads API를 활용하여 텍스트, 이미지, 캐러셀 포스트는 물론 … Read more