top of page

[인터뷰] DB 장애 60% SQL서 시작…튜닝이 우선, 증설은 다음

오픈메이드컨설팅 솔루션사업본부 장철웅 상무 인터뷰

오픈메이드컨설팅 솔루션사업본부 장철웅 상무
오픈메이드컨설팅 솔루션사업본부 장철웅 상무

[아이티데일리] “DB 성능 장애의 60% 이상이 SQL에서 시작됩니다. 하드웨어를 증설하기 전에 SQL부터 최적화해야 합니다. 그것이 최고투자책임자(CIO)가 지금 당장 할 수 있는 가장 현실적인 비용 절감 전략입니다. 이를 ‘먼저 튜닝하고, 그 다음에 증설하라(Tune First, Expand Later)’고 말합니다.”


오픈메이드컨설팅 솔루션사업본부 장철웅 상무는 최근 본지(아이티데일리/컴퓨터월드)와의 인터뷰에서 인공지능(AI) 시대 인프라 비용 문제의 해법을 이같이 제시했다. 장 상무는 IT 업계에서 하드웨어부터 시스템 통합(SI), 빅데이터, DB까지 거쳐온 다년간 현장 경험을 바탕으로, 현재 오픈메이드컨설팅에서 AI 기반 SQL 자동 최적화 솔루션 ‘쿼리메딕(Query Medic)’ 영업을 총괄하고 있다.


“인프라 인플레이션 시대… SQL 최적화 없이 재무 통제 안 돼”


올해 기업 IT 환경은 복합적인 상황에 놓여 있다. 데이터베이스 성능 최적화 전문 기업 오픈메이드컨설팅이 최근 발표한 보고서에 따르면 글로벌 AI 서버 시장이 약 2,200억 달러 규모로 성장하면서 그래픽처리장치(GPU)와 메모리 반도체 가격이 폭등하고 DRAM 가격은 전년 대비 50% 이상 오를 것으로 전망된다.


이에 따라 서버를 증설하고 싶어도 물량 확보가 어렵고 확보하더라도 비용이 기하급수적으로 늘어나는 이른바 ‘인프라 인플레이션’ 국면이 이어지고 있다.


비용 절감을 위해 클라우드 전환을 택한 기업도 사정은 크게 다르지 않다. 클라우드 환경은 리소스 사용량에 따라 비용이 청구되는 구조다. 최적화되지 않은 SQL을 그대로 이관하면 불필요한 I/O와 CPU 소모가 곧바로 비용 상승으로 이어지는 셈이다. 업계 조사에 따르면 클라우드 지출의 10~30%가 비효율적 쿼리로 인해 낭비되고 있다.


장 상무는 “인프라를 아무리 늘려도 그 위에서 돌아가는 SQL이 비효율적이면 비용은 끝없이 새는 구조”라며 “CIO 입장에서는 서버를 사든 클라우드를 쓰든 SQL 최적화 없이는 재무적 통제가 불가능한 상황에 직면하고 있다”고 진단했다.


“SQL 튜닝 하루 3~4건이 한계…관리 사각지대 발생”


문제는 이 같은 SQL 최적화를 누가 하느냐다. 장 상무에 따르면 현장의 DB 관리 인력은 시스템 가용성 유지, 장애 대응 등 운영 업무를 감당하기에도 빠듯해 성능 개선까지 손댈 여력이 없다. 외부 전문 인력을 투입해 튜닝을 맡기는 경우도 있지만 숙련된 데이터베이스 관리자(DBA) 한 명이 하루에 처리할 수 있는 SQL 튜닝 건수는 3~4건이 한계다. 난이도가 높으면 한 건에 일주일이 걸리기도 한다.


장 상무는 “문제가 되는 쿼리 목록은 담당자 또는 팀별 관리를 하고 있고, 담당자의 경험을 합쳐 관리하는 수준”이라며 “알고 있는 것들은 그나마 관리가 되지만 모르고 있던 복병들이 쌓여서 어느 날 장애로 한꺼번에 터지는 것이 정말 위험하다”고 말했다.


이러한 문제는 개발 현장에서도 병목으로 작용하고 있다. 가령 한 IT 조직에서 개발자 300명이 있다고 하면, 각자 SQL을 작성하지만 자신이 작성한 쿼리의 성능을 검증해줄 튜닝 전문가가 부족한 상황이다. 개발자는 튜닝을 의뢰하고 싶어도 받아줄 사람이 없고 DBA는 자기 운영 업무에 쫓겨 남의 쿼리까지 봐줄 시간이 없다.


장 상무는 “개발 부서도, DB 운영 부서도 튜닝의 필요성은 절실하게 느끼고 있지만 서로 해결해줄 수 없는 상황”이라며 “그것이 지금 국내 IT 조직이 안고 있는 가장 큰 구조적 문제”라고 짚었다.


“탐지부터 튜닝·검증까지 전 과정 AI로 자동화”


쿼리메딕은 이 같은 문제를 해결하기 위해 탄생했다. 오픈메이드컨설팅은 21년간 금융권을 중심으로 DBA, 튜너, 모델러를 고객사에 파견하며 DB 성능 관리 현장을 쌓아왔고, 이 노하우를 집약해 ‘오픈팝(OpenPOP)’을 개발·운영해왔다. 오픈팝은 SQL의 개발 단계부터 운영까지 전 과정에 걸쳐 성능을 점검·검증·통제하고 운영 환경에서는 24시간 365일 성능 장애 예방 프로세스를 적용해 선제적으로 장애를 방지하는 솔루션이다.


장 상무에 따르면 고객사들로부터 “가이드 말고 튜닝 자체를 자동으로 해줄 수 없느냐”는 요구가 지속적으로 들어왔다고 한다. 문제를 찾아주는 데까지는 오픈팝으로 가능했지만, 실제로 SQL을 고치는 작업은 여전히 사람의 몫이었기 때문이다.


이에 따라 AI 기술이 급격히 발전하던 2년 전 본격적인 쿼리메딕 연구개발(R&D)에 착수했고 오픈팝의 탐지·검증 엔진 위에 거대언어모델(LLM)의 추론 능력을 결합했다. 성능 저하 SQL의 자동 추출부터 최적의 튜닝 결과를 생성, 튜닝 결과에 대한 검증까지 전 과정을 자동화한 것이 핵심이다. 지난해 10월 정식 출시됐다.


여기에 현장 경험에서 비롯된 세밀한 튜닝 로직도 반영됐다. 실제 DB 운영 환경에서는 같은 SQL이라도 언제, 어떤 목적으로 실행되느냐에 따라 최적의 튜닝 방법이 달라지는 경우가 많다.


예컨대 낮 시간에 사용자 요청에 즉시 응답해야 하는 온라인 트랜잭션(OLTP) 쿼리는 0.1초라도 빠르게 결과를 돌려주는 것이 관건이지만, 새벽에 수 시간씩 대량 데이터를 처리하는 배치(Batch) 쿼리는 개별 응답 속도보다 전체 처리량을 줄여 정해진 시간 안에 작업을 끝내는 것이 중요하다. 쿼리메딕은 대상 SQL의 유형과 실행 패턴을 자동으로 판별해 각 상황에 맞는 최적화 로직을 적용한다.


장 상무는 “일반 AI에 쿼리를 넣으면 교과서적인 답이 나오지만, 현장에서는 그게 통하지 않는 경우가 많다”며 “다년간 금융권 현장에서 부딪히며 쌓은 경험, 이를테면 이런 상황에서는 이렇게 튜닝하는 것이 실제로 더 낫다라는 판단 기준이 엔진에 담겨 있기 때문에 결과의 질이 다르다”고 설명했다.


“AI가 고친 SQL, 믿을 수 있느냐가 관건”


특히 장 상무가 쿼리메딕의 핵심 차별점으로 꼽은 것은 ‘AI 기반 검증’ 기능이다. 범용 AI 도구로도 SQL 튜닝 결과를 얻을 수는 있지만, 그 결과를 실무에 바로 적용할 수 있느냐는 전혀 다른 문제라는 설명이다.


장 상무는 “챗GPT나 제미나이에 SQL을 넣으면 그럴듯한 튜닝안이 나오긴 한다. 다만 결과의 일관성이 보장되지 않으니 운영 환경에 적용할 수가 없다”며 “실제로 많은 기업이 자체적으로 LLM 모델을 도입해 SQL 튜닝을 시도해봤지만, 결과를 신뢰할 수 없어 실무 적용을 포기한 사례가 대부분”이라고 말했다.


쿼리메딕은 AI가 생성한 튜닝안을 실제 운영 데이터가 담긴 DB 환경에서 직접 실행하고 튜닝 전후의 결과값과 데이터 건수가 정확히 일치하는지까지 자동으로 대조·검증한다.


장 상무는 “튜닝부터 검증까지 풀 스텝을 자동화한 솔루션은 국내는 물론 글로벌에서도 아직 없다”며 “이 검증 기능만큼은 특별하다”고 강조했다.


“DBA 한 명 월 60건, 쿼리메딕 하루 1000건 이상”


장 상무에 따르면 DBA 한 명이 하루에 처리할 수 있는 SQL 튜닝 건수는 대략 3건 수준이다. 단순히 계산하면 월 20일 근무 기준 60건, 연간 약 720건을 처리하는 셈이다. 쿼리메딕은 24시간 365일 자동으로 가동되며 하루 1,000개 이상의 SQL을 튜닝할 수 있다. 여기에 사람이 미처 인지하지 못한 잠재적 장애 SQL까지 전수 검사해 선제적으로 제거한다는 점에서, 장애 예방 효과까지 기대할 수 있다.


장 상무는 “사람이 관리하는 건 기록이 남아 있거나 담당자가 경험적으로 알고 있는 일부에 불과하다”며 “쿼리메딕은 전체 SQL을 전수 검사하기 때문에 그동안 아무도 모르고 있다가 어느 날 갑자기 장애로 터지는 복병까지 미리 잡아낼 수 있다”고 설명했다.


쿼리메딕에 대한 현장의 기대도 높다고 전했다. 장 상무는 “쿼리메딕을 소개하면 개발자와 DB 담당자, CIO의 반응이 가장 뜨겁다”며 “개발자 입장에서는 자신이 작성한 SQL의 품질을 즉시 검증받을 수 있는 수단이 생긴 것이고 CIO 입장에서는 서버 증설이나 인력 충원 없이도 운영 효율을 끌어올리고 비용을 통제할 수 있는 도구가 확보되는 것”이라고 말했다.


그러면서 “한 금융 고객사에서는 5~6년간 다양한 AI 모델을 도입해 비즈니스 성과를 내려 했지만 만족할 만한 결과를 얻지 못했다”며 “쿼리메딕 데모와 POC를 거친 뒤 해당 IT 부서에서 ‘AI로 실제 실적을 낼 수 있는 솔루션은 쿼리메딕밖에 없다’는 평가를 해주셨다”고 덧붙였다.


현재 쿼리메딕은 공공기관과 금융권을 중심으로 도입이 확대되고 있다. 공공기관의 시스템 재구축 사업에 쿼리메딕을 공급한 사례가 나왔으며 다수의 금융사와 공공기관에서 POC를 진행하거나 도입을 검토 중이다.


최근에는 제조업 분야에서도 관심이 늘고 있다. 장 상무는 “국내 대형 제조 기업들이 해외 생산라인을 운영하면서 현지 개발자가 작성한 SQL의 품질 문제로 성능 장애가 빈번하다”며 “생산라인이 멈추면 원가 손실이 막대한데, 그 원인의 상당 부분이 DB 위에서 돌아가는 SQL에 있다는 인식이 확산되면서 제조 분야 문의가 크게 늘었다”고 말했다.


“’튜닝이 먼저’라는 원칙, 현장에 심겠다”


쿼리메딕은 현재 오라클 환경을 지원하고 있으며 지원 대상 DB를 빠르게 넓혀가고 있다. 포스트그레SQL은 이미 개발이 거의 완료된 상태이고 국산 DB인 티베로는 2분기 내 지원이 예정됐다. MySQL은 하반기를 목표로 개발이 진행 중이다. 2027년부터는 서비스형 소프트웨어(SaaS)향도 제공할 계획이다.


장 상무는 “DB 튜닝이라는 전문 영역에서 21년간 쌓아온 기술적 신뢰가 있기에 가능한 일”이라며 “쿼리메딕이 도입된 시스템은 안전하다는 믿음을 시장에 심고 싶다”고 밝혔다.


이어 “더 이상 DBA가 밤을 새우며 쿼리를 하나하나 뜯어보는 시대는 끝나야 한다”며 “‘먼저 튜닝하고, 그 다음에 증설하라’는 원칙이 CIO들의 상식이 되는 날까지 현장에서 뛰겠다”고 덧붙였다.



제품 도입 및 컨설팅 등 영업 문의

02-6310-6167 / qm@openmade.co.kr 


출처 : 아이티데일리(http://www.itdaily.kr/news/articleView.html?idxno=238877)

양승갑 기자 seungyang@itdaily.kr 



#SQL튜닝  #AI #AI튜닝 #데이터베이스성능 #쿼리메딕 #QueryMedic #오픈메이드컨설팅 #DB최적화 #자동화솔루션 #DBA #개발자 #IT운영 #비용절감 #성능개선 #AI자동화 #DB성능관리 #인프라비용절감 #CIO

bottom of page