데이터 · 대기업
영업 데이터 자연어 질의 시스템
"지난주 매출 얼마야?" 한 줄을 사내 채팅창에 쓰면 5초 만에 답이 돌아옵니다. 임원이 SQL을 몰라도, 데이터팀 답변을 사흘 기다리지 않아도 됩니다. 이런 시스템을 어떻게 만들고, 도입 후 무엇이 달라지는지 한 페이지로 정리했습니다.

"지난주 우리 사업부 매출 얼마야?" — 사내 채팅창에 이 한 줄만 쓰면 회사 진짜 데이터에서 5초 만에 답이 돌아오는 시스템이 있습니다. 임원이 SQL을 몰라도, 데이터팀의 답을 사흘 기다리지 않아도, 한국어로 묻기만 하면 됩니다.
NL2SQL(Natural Language to SQL)이라고 부릅니다. ChatGPT 같은 LLM이 회사 데이터베이스에 안전하게 연결되어, 한국어 질문을 SQL 쿼리로 변환하고 결과를 다시 한국어 요약으로 돌려주는 구조입니다.
이 글은 NL2SQL이 사내에 자리 잡으면 무엇이 어떻게 달라지는지, 어떤 도구·모델 조합으로 만들 수 있는지, 도입 시 무엇을 미리 정해야 하는지를 한 페이지로 정리한 가이드입니다.
언제 쓰는 건가요?
회사 안에서 누가 "데이터 좀 보고 싶다"고 말할 때마다 작동합니다. 사내 슬랙·노션·자체 웹앱 어디서든 다음과 같은 한 줄짜리 질문이 그대로 통합니다.
"지난주 우리 부서 매출 얼마야?"
"이번 분기 신규 가입 고객 중 결제까지 간 비율은?"
"지난달 가장 많이 팔린 상품 TOP 5 보여줘."
"작년 같은 달 대비 우리 팀 비용은 어떻게 됐어?"
"이번 분기 채용 합격률을 부서별로 보여줘."
"어제 가입한 고객 중 강남 거주자 몇 명?"
질문을 던진 사람의 부서·권한에 맞게 데이터가 자동으로 필터링되고, 답은 한국어 요약과 표·차트로 동시에 도착합니다. 평균 응답 시간 5~10초. 매번 데이터팀에 슬랙을 보내는 것보다 빠르고, BI 대시보드를 여는 것보다 가볍습니다.
도입 전 vs 도입 후
한 번 자리 잡으면 회사가 데이터를 다루는 방식 자체가 바뀝니다. 가장 자주 보고되는 변화 다섯 가지입니다.
답이 오는 속도 — 도입 전 데이터팀에 요청해 평균 3일 → 도입 후 채팅창 한 줄로 평균 5초.
임원의 데이터 접근 — 보고서·BI 대시보드에 의존 → 한국어로 직접 묻고 직접 답을 받음.
데이터팀이 쓰는 시간 — 단순 쿼리 요청 응대에 주 20시간 → 전략 분석·모델링·신규 지표 설계에 집중.
같은 질문 반복 — 매주 같은 보고서를 다시 요청 → 한 번 답 → 시스템이 카탈로그에 학습 → 다음엔 자동 응답.
SQL 실수 가능성 — 사람이 직접 짜다 오타·집계 누락 발생 → LLM이 안전 가드 안에서만 생성 (읽기 전용, LIMIT 자동, 컬럼 화이트리스트).
한눈에 보는 데이터 흐름
한국어 질문이 안전한 SQL과 한국어 요약으로 돌아오기까지의 7단계입니다. 오렌지 박스가 LLM이 일하는 단계, 베이지 박스는 사내 자산 — 이 구조에서는 데이터 자체가 외부로 나가지 않습니다.
어떤 도구·모델로 만드나
모델 하나로 만들지 않습니다. 회사 데이터가 어디에 있는지, 외부로 보낼 수 있는지에 따라 권장 조합이 갈립니다. 첫 질문 하나로 옵션이 좁혀집니다.
옵션 A는 도입 비용이 가장 낮고 며칠 안에 PoC가 가동됩니다. 옵션 B는 한국어 도메인 학습과 사내 확산에 강합니다. 옵션 C는 금융·헬스케어·공공처럼 데이터를 외부로 보낼 수 없는 환경에서 채택되는 구성입니다.
시스템이 작동하는 방식
어떤 옵션을 택하든 작동 원리는 다음 4단계로 같습니다.
1단계 — 메트릭 카탈로그 구축. 비즈니스 용어를 SQL로 매핑한 카탈로그(dbt metrics, Cube.dev, Snowflake Cortex semantic model 중 택일)를 먼저 만듭니다. "매출"이 GMV인지 순매출인지, "고객"이 가입자인지 활성 사용자인지를 시스템이 알아야 합니다. 정확도의 70%가 여기서 결정됩니다.
2단계 — 자연어 → SQL 변환과 안전 가드. LLM이 SQL을 만들 때 읽기 전용 계정, LIMIT 자동 추가, 컬럼 화이트리스트, 위험 키워드 차단을 시스템에서 강제합니다. 풀스캔 쿼리는 사전 거부하고, 파티션 키 누락 시 사용자에게 다시 묻는 식입니다.
3단계 — 한국어 요약과 자동 시각화. SQL 결과를 다시 LLM에 넘겨 "이번 주 핵심 변화" 코멘터리를 생성합니다. 시계열·비교·집계 형태에 따라 차트 종류가 자동 선택됩니다.
4단계 — 답 전달과 피드백 루프. 슬랙·노션·자체 웹앱·기존 BI 어디에서 묻든 같은 답이 도착하도록 채널을 통합합니다. "맞다/틀리다" 피드백이 카탈로그를 키우는 학습 데이터로 쌓입니다.
도입할 때 자주 부딪히는 이슈
가장 흔한 실패는 LLM이 그럴듯한 거짓 SQL을 만드는 환각입니다. 메트릭 카탈로그를 먼저 만들고, 검증된 SQL 라이브러리에서 비슷한 질문을 검색해 few-shot 예시로 함께 던지는 패턴이 가장 효과적이라고 알려져 있습니다.
권한·보안 이슈는 row-level security와 부서별 읽기 전용 계정으로 분리합니다. LLM 프롬프트가 아니라 DB 권한 단에서 통제해야 안전합니다.
모호한 질문("이번 분기 어땠어?")에는 추정으로 답하지 않고 "어떤 지표를 보고 싶으세요? 매출·주문수·이익 중에서요" 같은 명확화 질문을 먼저 던지도록 워크플로우를 설계합니다.
마지막은 신뢰입니다. "이 답을 만든 SQL 보기" 토글 하나로 채택률이 두 배 이상 올라간다는 사례가 보고됩니다. 투명성이 곧 도입 성공의 KPI입니다.
성과 지표 (KPI 예시)
NL2SQL 어시스턴트의 성과는 다음 네 가지 지표로 측정하기를 권장합니다.
데이터팀 단순 쿼리 요청 수(주간) — 도입 6개월 후 70% 감소.
임원 자가 데이터 조회 비율 — 도입 전 대비 3배 이상.
답변 정확도(샘플 100문) — 90% 이상이면 확산 단계.
평균 응답 시간 — 15초 미만.
한 가지 덧붙이면, 정확도가 높아도 "내가 직접 묻는 것보다 데이터팀에 부탁하는 게 빨라"라는 인식이 남으면 도입은 실패합니다. UI/UX와 응답 품질을 동시에 잡아야 하고, 그래서 모델·도구만큼 카탈로그·온보딩 설계가 중요합니다.
자주 묻는 질문
회사 데이터를 외부 모델에 보내야 하나요?
데이터 자체를 LLM에 보내지 않는 구조가 가능합니다. 옵션 A·B는 LLM이 SQL만 생성하고 실행은 자사 DB에서 일어나며, 결과 요약 단계에서만 일부 행이 LLM에 전달됩니다. 결과조차 외부로 보내고 싶지 않다면 옵션 C(셀프호스팅)로 모든 추론을 사내에서 처리하는 구성이 일반적입니다.
어떤 BI 도구와 결합되나요?
Tableau, Looker, Power BI, Metabase, Mode, Hex 등 어디서든 작동합니다. NL2SQL 어시스턴트는 BI를 대체하는 도구가 아니라 "BI 위에 한국어로 묻는 입구"를 얹는 것이라 기존 자산을 그대로 살릴 수 있습니다.
도입에 얼마나 걸리나요?
옵션 A 기준 PoC 2주, 운영 안정화까지 6~8주가 일반적입니다. 메트릭 카탈로그가 이미 있는 회사는 절반으로 줄어들고, 데이터 정리부터 시작해야 하는 회사는 1.5배가 늘어납니다.
데이터팀이 없는데 가능한가요?
가능합니다. 오히려 데이터팀이 없는 중견기업·스타트업에서 ROI가 더 뚜렷한 경우가 많습니다. 메트릭 카탈로그 설계와 사내 챔피언 양성을 처음부터 함께 진행해 외부 의존도를 낮추는 방향이 권장됩니다.
더 깊이 들어가고 싶다면
이 가이드는 NL2SQL 도입 의사결정에 필요한 핵심을 한 페이지로 정리한 것입니다. 사내에서 직접 만들어보고 싶다면 1단계의 메트릭 카탈로그부터 차근차근 시작할 수 있고, 옵션 A의 도구 조합이 가장 짧은 학습 곡선을 제공합니다.
이런 시스템을 조직 차원에서 어떻게 도입할지, 부서별로 어떤 활용 시나리오가 있는지를 한 번에 정리해 듣고 싶다면 권앤컴퍼니의 사내 강의를 활용할 수 있습니다. 자체 데이터로 직접 PoC를 돌려보고 싶다면 2주 컨설팅 옵션도 준비되어 있습니다.
강의·PoC 모두 30분 무료 상담으로 가능성부터 함께 검토할 수 있습니다 → 상담 신청하기
같은 카테고리의 다른 프로젝트
ERP 비정형 데이터 구조화 파이프라인
"이 거래처 발주 패턴 정리해줘." 한 마디에 PDF·이메일·메신저 메모가 한꺼번에 떠오릅니다. 비정형 자료를 OCR과 LLM이 함께 읽고 표준 코드로 정리해 ERP에 자동 적재하는 파이프라인을 한 페이지로 정리했습니다.
매출 이상치 자동 탐지 알림
"어제 매출 왜 이래?" 회의 전에 슬랙에 먼저 알림이 와 있는 풍경. 통계 모델이 변동을 잡고 LLM이 한국어 코멘터리를 붙여 보내는 시스템을 어떻게 만들고 노이즈는 어떻게 줄이는지 한 페이지로 정리했습니다.
자동 BI 대시보드 인사이트 코멘터리
"숫자는 보이는데, 무슨 의미인지 한 줄로 적어줘." 매주 같은 요청이 반복되는 분석팀의 풍경. BI 대시보드를 LLM이 직접 읽고 임원·팀장·실무자별 코멘터리를 자동으로 적어주는 시스템을 한 페이지로 정리했습니다.
유사한 AI 프로젝트를 우리 회사에 도입하고 싶다면
업종·도메인·일정을 알려주시면 가장 가까운 진행 사례와 함께 회신 드립니다. 권앤컴퍼니의 AI 도입 뉴스와 프로젝트 사례는 뉴스레터로도 받아보실 수 있습니다.