바이브코딩 및 LLM Agent 개발 · 2025
AI Agent 프로젝트
포스코에서 진행한 산업용 AI Agent 프로젝트 강의입니다. 철강 현장 데이터와 사내 운영 시스템을 전제로, 데모 수준이 아닌 운영 가능한 Agent 설계를 다뤘습니다.
안녕하세요, 권앤컴퍼니의 권기현입니다. 이번에는 포스코에서 진행한 AI Agent 프로젝트 강의를 소개하려고 합니다. 산업 현장 데이터를 다루는 Agent를 어떻게 설계했고, 어떤 안전 장치를 박았는지에 대한 기록입니다.
기업의 LLM Agent 도입을 검색하다 이 페이지에 도착하셨다면, 비슷한 고민을 가지고 계실 가능성이 높습니다.
공정 데이터·안전 리포트가 PDF·SCADA에 흩어져 있어 LLM에 붙이는 첫 단계부터 막힙니다.
Agent가 잘못된 도구를 호출하면 곧장 현장 사고로 연결될 수 있어 가드레일 설계 기준이 필요합니다.
내부 보안 정책 안에서 외부 모델·사내 모델을 어떻게 분리해 운영해야 하는지 정리가 안 되어 있습니다.
이 강의는 위 세 가지 질문에 대한 개발자·실무 관점의 답을 16시간 안에 정리해 드리는 과정으로 설계되었습니다.
한 줄 요약
워크샵 직후부터 사내에서 바로 PoC 시작이 가능한 Agent 아키텍처·RAG·function calling·운용 패턴을 한 번에 다룹니다.
철강 산업 데이터 특성과 안전·환경 규제를 전제로 두고, 작은 PoC가 아닌 현장에서 동작 가능한 Agent를 설계하는 흐름으로 구성했습니다.
네 개 모듈로 나누어 진행했습니다
1. LLM Agent 아키텍처 — 토이 데모와 프로덕션 사이의 거리
철강 도메인은 공정·품질·안전·환경 데이터가 따로 살아 있고, 한 질문에 답하려면 이 네 시스템 모두에 닿아야 하는 경우가 많습니다. 단일 LLM 호출 한 번으로는 풀리지 않습니다.
이 모듈에서는 다음 내용을 도메인 시나리오에 묶어 다룹니다.
- Router·Planner·Executor 분리와 산업 시나리오에서의 책임 범위
- Agent loop의 반복 횟수·타임아웃을 제약 조건으로 박는 방법
- 공정·품질·안전 시스템을 다단계 의사결정으로 묶는 패턴
- Human-in-the-loop이 필요한 지점과 자동 실행이 가능한 지점의 경계 설정
아키텍처 그림이 없는 Agent는 운영 단계에서 항상 무너집니다. 첫 모듈에서 그 그림을 손으로 그릴 수 있는 수준까지 끌어올립니다.
2. RAG 시스템 설계 — 검색 품질이 곧 답변 품질입니다
철강 도메인 매뉴얼·규정·안전 보고서는 분량이 크고 표·도면이 섞여 있어, 청크 단위 설계만 잘못되어도 RAG가 첫 줄부터 무너집니다.
이 모듈에서는 다음 내용을 다룹니다.
- 운영 매뉴얼·안전 규정 청크 단위 설계와 메타데이터(라인·공정·일자)
- 키워드와 벡터를 묶는 하이브리드 검색 구성
- 컨텍스트 압축·재랭킹으로 비용·지연을 잡는 기법
- 검색 품질 자체를 측정하는 지표 (recall, MRR, hit rate)
청크 한 단위가 잘못 끊어져 있으면 Agent의 모든 답변이 같은 패턴으로 틀립니다. RAG 모듈에서 그 첫 단추를 묶습니다.
3. function calling · tool use — Agent와 사내 시스템을 안전하게 잇는 법
Agent가 사내 공정 시스템에 호출을 보낼 때, 어떤 호출은 단순 조회이고 어떤 호출은 라인을 멈출 수도 있습니다. 그 경계를 함수 스키마부터 분리합니다.
이 모듈에서는 다음 내용을 실제 사내 API 스타일로 다룹니다.
- read-only 함수와 stateful 함수의 분리 — 스키마·권한·로그를 다른 레인으로
- 내부 API 인증을 Agent에 노출하지 않는 호출 구조
- tool 결과 검증과 사용자 confirm 단계 삽입 시점
- 권한·감사 로그·이상 호출 알림을 미들웨어 한 줄로
현장에서는 Agent의 호출 한 건이 안전 사고로 직결될 수 있습니다. function 단위에서 가드레일을 박는 것이 가장 안전합니다.
4. 평가·모니터링·운용 — 데모로 끝내지 않기 위한 마지막 모듈
Agent가 데모에서 운영으로 넘어갈 때 항상 같은 지점에서 무너집니다. 평가 셋·모니터링·운용 정책이 빠져 있을 때입니다.
이 모듈에서는 다음 내용을 다룹니다.
- 산업 시나리오 평가 셋 설계와 회귀 테스트 자동화
- 추론 모델과 일반 LLM 혼용 시의 비용·정확도 균형 측정
- 프로덕션 트레이싱과 이상 호출 감지
- 점진 배포·롤백·rate limit 운영 정책
평가 셋이 없는 Agent는 운영팀이 매주 손으로 품질을 점검합니다. 마지막 모듈에서 그 시간을 자동화 영역으로 옮깁니다.
이런 분께 추천드립니다
- 사내 AI Agent 서비스를 처음부터 설계해야 하는 개발자·테크리드
- Agent PoC를 프로덕션까지 가져가야 하는 AX·DT 추진 임원
- 사내 데이터·API를 LLM과 안전하게 연결해야 하는 플랫폼·인프라 담당자
특히 포스코·현대제철처럼 공정·품질·안전 데이터가 함께 걸리는 산업 환경에서, 데모 Agent를 운영 가능한 Agent로 옮기는 단계에서 가장 큰 시간 절약이 됩니다.
다음 단계
회사 상황에 맞춰 16시간 과정을 그대로 진행하실 수도 있고, 8시간 또는 4시간 압축본으로 시작하셔서 차수를 늘려가시는 것도 가능합니다.
가장 빠른 길은 현재 회사 상황과 가능한 일정을 메일로 보내주시는 것입니다. 24시간 안에 비슷한 사례 2~3건과 견적 초안을 함께 회신드리겠습니다.
교육 담당자분께서 결재 라인에 공유해야 하시는 경우, 카탈로그 PDF를 먼저 받아두시는 편이 편리합니다.
강의 후 성과
- · 산업용 AI Agent 프로젝트 실증
Tags
같은 카테고리의 다른 강의
비슷한 강의를 우리 회사에 도입하고 싶다면
업종·규모·일정을 알려주시면 가장 가까운 진행 사례와 함께 회신드립니다. AI 도입 뉴스와 교육 사례가 궁금하다면 뉴스레터로 먼저 받아보셔도 좋습니다.