KR-20260061076-A - Hybrid Artificial Intelligence System for Providing Optimized Response Using a Plurality of AI Models and Operating Method Thereof

KR20260061076AKR 20260061076 AKR20260061076 AKR 20260061076AKR-20260061076-A

Abstract

본 발명은 복수의 인공지능 모델을 활용하여 최적화된 응답을 제공하는 하이브리드 인공지능 시스템(100) 및 그 동작 방법에 관한 것이다. 하이브리드 인공지능 시스템(100)은 사용자로부터 수신된 입력 프롬프트의 어휘 복잡도, 의존성 깊이 및 도메인 특성을 분석하는 질의 분석 모듈(140)과, 분석된 난이도 지표(DM)에 따라 최적 단일 모델로 처리하는 라우팅 모드 실행부(160)와, 복수의 제1 계층 인공지능 모델들(171a, 171b, 171c)의 병렬 처리 결과를 제2 계층 모델(172)이 전문성 가중치 및 외부 지식 베이스(190) 기반 팩트 체크를 통해 병합하는 에이전트 혼합 모드 실행부(170)와, 라우팅 모드 처리 중 낮은 확신도 점수(CS)가 감지되면 에이전트 혼합 모드로 즉시 전환하는 동적 전환부(180)를 포함한다. 이를 통해 연산 효율성과 응답 신뢰도를 동시에 최적화하며 환각 오류를 원천 차단한다.

Inventors

안범주

Assignees

안범주

Dates

Publication Date: 20260506
Application Date: 20260314

Claims (1)

복수의 인공지능 모델을 활용하여 최적화된 응답을 제공하는 하이브리드 인공지능 시스템에 있어서, 명령어들을 저장하는 메모리; 및 상기 명령어들을 실행하는 하나 이상의 프로세서를 포함하고, 상기 하나 이상의 프로세서는, 사용자로부터 입력 프롬프트(prompt)를 수신하고; 상기 수신된 입력 프롬프트의 복잡도, 요구 연산량, 및 도메인 특성 중 적어도 하나에 기초하여 라우팅 조건(routing condition)을 결정하며; 상기 라우팅 조건이 미리 설정된 제1 기준을 충족하는 경우, 복수의 후보 인공지능 모델들 중 상기 입력 프롬프트에 최적화된 단일 인공지능 모델을 선택하여 상기 입력 프롬프트를 처리하는 라우팅(Routing) 모드를 실행하고; 상기 라우팅 조건이 미리 설정된 제2 기준을 충족하는 경우, 상기 입력 프롬프트를 복수의 제1 계층 인공지능 모델들로 병렬 전송하여 복수의 초기 응답들을 획득하고, 상기 획득된 복수의 초기 응답들을 적어도 하나의 제2 계층 인공지능 모델에 입력하여 교차 검증 및 병합을 수행함으로써 최종 응답을 산출하는 에이전트 혼합(Mixture-of-Agents) 모드를 실행하도록 구성되는 것을 특징으로 하는, 하이브리드 인공지능 시스템.

Description

복수의 인공지능 모델을 활용하여 최적화된 응답을 제공하는 하이브리드 인공지능 시스템 및 그 동작 방법{Hybrid Artificial Intelligence System for Providing Optimized Response Using a Plurality of AI Models and Operating Method Thereof} 본 발명은 인공지능 제어 시스템 및 방법에 관한 것으로서, 보다 상세하게는 사용자 질의(Prompt)의 특성을 다차원적으로 분석하여 단일 인공지능 모델을 활용하는 라우팅(Routing) 모드와 복수의 인공지능 모델을 병렬로 활용하는 에이전트 혼합(Mixture-of-Agents, MoA) 모드를 동적으로 전환함으로써, 응답의 정확도와 연산 효율성을 동시에 극대화하는 하이브리드 인공지능 시스템(100) 및 그 동작 방법에 관한 것이다. 최근 초거대 언어 모델(Large Language Model, LLM)을 비롯한 인공지능 기술이 급격히 발전함에 따라, 자동 고객 응대, 법률 자문, 의료 진단 보조, 코드 생성 등 다양한 산업 도메인에서 인공지능 기반의 질의응답 시스템이 폭넓게 도입되고 있다. 이러한 시스템은 사용자로부터 자연어로 된 질의(Prompt)를 입력받아 이를 처리하고 적절한 응답을 생성하는 역할을 수행한다. 그런데 단일 초거대 언어 모델만을 사용하는 기존 시스템에는 구조적인 문제가 존재한다. 구체적으로, "오늘 날씨는 어때?"와 같은 단순 사실 확인형 질의에 대해서도 수십억 개의 파라미터로 구성된 대형 모델이 동원될 경우, 이에 수반되는 높은 연산량(Computation Load)과 API 호출 비용(API Cost), 그리고 응답 지연(Latency)이 불필요하게 발생한다. 이는 시스템 전체의 운영 비용을 증가시키는 주요 원인이 된다. 반대로, 연산 자원 절약을 위해 소형(lightweight) 언어 모델만을 운용할 경우에는 다단계 논리 추론, 법규 해석, 코드 버그 분석과 같이 심층적인 지식과 복잡한 추론 능력을 요구하는 고난도 질의에서 환각(Hallucination) 현상이 빈번하게 발생한다. 환각 현상이란 모델이 사실에 부합하지 않는 정보를 그럴듯한 어조로 생성하는 현상으로서, 특히 전문 지식이 필요한 도메인에서 시스템의 신뢰성을 심각하게 훼손한다. 이러한 문제들을 해결하기 위하여, 질의의 특성에 따라 처리 모델을 동적으로 선택하는 라우팅(Routing) 기술과, 여러 모델의 출력을 취합하여 더 높은 품질의 응답을 생성하는 에이전트 혼합(Mixture-of-Agents, MoA) 기술이 각각 연구되고 있다. 그러나 기존 기술들은 두 접근 방식을 개별적으로만 구현하고 있어, 각 방식의 장점을 취하면서 단점을 상호 보완하는 통합된 하이브리드 시스템에 대한 기술적 수요가 대두되고 있다. 특히, 라우팅 모드에서 단일 모델의 응답 신뢰도가 낮아지는 경우에도 이를 실시간으로 감지하고 다중 에이전트 처리로 전환하는 동적 안전망 메커니즘은 아직 충분히 제안된 바 없다. 도 1은 본 발명의 일 실시예에 따른 하이브리드 인공지능 시스템(100)의 전체 아키텍처를 나타내는 블록도이다. 도 2는 본 발명의 일 실시예에 따른 질의 분석 모듈(140)의 내부 구성을 나타내는 블록도이다. 도 3은 본 발명의 일 실시예에 따른 에이전트 혼합 모드 실행부(170)의 처리 흐름을 나타내는 블록도이다. 도 4는 본 발명의 일 실시예에 따른 하이브리드 인공지능 시스템(100)의 전체 동작 방법을 나타내는 순서도이다. 도 5는 본 발명의 일 실시예에 따른 동적 전환부(180)의 폴백 로직을 나타내는 순서도이다. 도 6은 본 발명의 다른 실시예에 따른 멀티모달 입력을 처리하는 하이브리드 인공지능 시스템(100)의 동작을 나타내는 블록도이다. 이하, 첨부된 도면들을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 본 명세서에서 어떤 구성 요소가 다른 구성 요소와 "연결되어 있다" 또는 "통신 가능하게 연결되어 있다"고 기재되는 경우, 두 구성 요소가 직접적으로 연결되어 있는 경우뿐만 아니라, 하나 이상의 중간 구성 요소를 통해 간접적으로 연결되어 있는 경우도 포함한다. 또한, "포함한다" 또는 "가진다"는 표현은 해당 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들의 조합이 존재함을 의미하는 것으로, 하나 이상의 다른 특징이나 구성 요소의 존재 또는 부가 가능성을 배제하지 않는다. 이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일부 실시예에불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다. 또한, 본 명세서에서 사용되는 경우 "포함한다(comprise, include)" 및/또는 "포함하는(comprising, including)"은 언급한 형상들, 숫자, 단계, 동작, 부재, 요소 및/또는 이들 그룹의 존재를 특정하는것이며, 하나 이상의 다른 형상, 숫자, 동작, 부재, 요소 및 /또는 그룹들의 존재 또는 부가를 배제하는 것이 아니다. 또한, 발명의 이해를 돕기 위하여, 첨부된 도면을 실제 축척 대로 도시된 것이 아니라 일부 구성요소의 치수가 과장되게 도시 될 수 있다. 또한, 서로 다른 실시예에서 동일한 구성요소에 대해서는 동일한 참조번호가 부여될 수 있다. 2개의 비교 대상이 ‘동일’하다는 언급은 ‘실질적으로 동일’한 것을 의미한다. 따라서 실질적 동일은 당업계에서 낮은 수준으로 간주되는 편차, 예를 들어 5% 이내의 편차를 가지는 경우를 포함할 수 있다. 또한, 소정 영역에서 어떠한 파라미터가 균일하다는 것은 평균적 관점에서 균일하다는 것을 의미할 수 있다. 비록 제1, 제2 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것으로, 특별히 반대되는 기재가 없는 한, 제1 구성요소는 제2 구성요소일 수도 있음은 물론이다. 명세서 전체에서, 특별히 반대되는 기재가 없는 한, 각 구성요소는 단수일 수도 복수일 수도 있다. 구성요소의 "상부(또는 하부)" 또는 구성요소의 "상(또는 하)"에 임의의 구성이 배치된다는 것은, 임의의 구성이 상기 구성요소의 상면(또는 하면)에 접하여 배치되는 것뿐만 아니라, 상기 구성요소와 상기 구성요소 상에(또는 하에) 배치된 임의의 구성 사이에 다른 구성이 개재될 수 있음을 의미할 수 있다. 또한 어떤 구성요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 상기 구성요소들은 서로 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성요소 사이에 다른 구성요소가 "개재"되거나, 각 구성요소가 다른 구성요소를 통해 "연결", "결합" 또는 "접속"될 수도 있는 것으로 이해되어야 할 것이다. 또한, 어떤 부분이 다른 부분과 전기적으로 연결(electrically coupled)되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우 뿐만 아니라 그 중간에 다른 소자를 사이에 두고 연결되어있는 경우도 포함한다. 명세서 전체에서 "A 및/또는 B"라고 할 때, 이는 특별한 반대되는 기재가 없는 한, A, B 또는 A 및 B를 의미한다. 즉, "및/또는"은 열거된 복수의 항목들의 모든 조합 또는 임의의 조합을 포함한다. "C 내지 D"라고 할 때, 이는 특별한 반대되는기재가 없는 한, C 이상이고 D 이하인 것을 의미한다. 본 명세서에서 사용되는 용어는 본 개시의 실시 예를 기술하기위한 것이며, 본 개시의 제한을 의도하지 않는다. 상기 제1 과제를 해결하기 위한 본 발명의 일 실시예에 따른 하이브리드 인공지능 시스템(100)은, 명령어들을 저장하는 메모리(110) 및 상기 명령어들을 실행하는 하나 이상의 프로세서(120)를 포함한다. 상기 프로세서(120)는, 사용자로부터 입력 프롬프트(Prompt)를 수신하는 질의 수신부(130)와, 상기 수신된 입력 프롬프트의 어휘 복잡도, 의존성 깊이, 요구 연산량 및 도메인 특성 중 적어도 하나를 평가하여 난이도 지표(Difficulty Metric, DM)를 산출하는 질의 분석 모듈(140)과, 상기 난이도 지표(DM)를 포함한 라우팅 조건에 따라 처리 모드를 결정하는 라우팅 결정부(150)를 기능적으로 구현한다. 상기 라우팅 결정부(150)는 상기 난이도 지표(DM)가 사전 설정된 임계값(Threshold, Th) 미만인 경우 제1 기준이 충족된 것으로 판단하여 라우팅 모드 실행부(160)를 활성화하고, 상기 난이도 지표(DM)가 상기 임계값(Th) 이상인 경우 제2 기준이 충족된 것으로 판단하여 에이전트 혼합 모드 실행부(170)를 활성화한다. 상기 라우팅 모드 실행부(160)는 복수의 후보 인공지능 모델들이 등록된 모델 풀(200)로부터 상기 입력 프롬프트에 최적화된 단일 인공지능 모델을 선택하는 모델 선택 유닛(161)과, 상기 선택된 단일 인공지능 모델이 생성한 응답의 확신도(Certainty Score, CS)를 평가하는 확신도 평가 유닛(162)을 포함한다. 상기 제2 과제를 해결하기 위하여, 상기 에이전트 혼합 모드 실행부(170)는 상기 입력 프롬프트를 복수의 제1 계층 인공지능 모델들(171a, 171b, 171c)로 병렬 전송하여 복수의 초기 응답들을 획득하는 제1 계층 모델 그룹(171)과, 상기 복수의 초기 응답들을 입력받아 교차 검증 및 병합을 수행하는 제2 계층 모델(172)과, 각 제1 계층 인공지능 모델(171a, 171b, 171c)의 전문성 가중치를 산출하는 가중치 산출 유닛(173)과, 외부 지식 베이스(190)를 호출하여 팩트 체크를 수행하는 팩트