KR-20260060729-A - METHOD, APPARATUS, AND PROGRAM FOR PROVIDING INTERACTIVE AI COMPANION
Abstract
전술한 바와 같은 과제를 실현하기 위한 본 발명의 다양한 실시예에 따른 대화형 AI 컴패니언 제공 방법이 개시된다. 상기 방법은, 사용자 입력 데이터를 획득하는 단계, 상기 사용자 입력 데이터를 분석하여 대화 맥락을 파악하는 단계, 상기 분석된 대화 맥락에 따라 적합한 AI 캐릭터 응답을 생성하는 단계 및 생성된 AI 캐릭터 응답을 사용자 단말로 전송할 것을 결정하는 단계를 포함할 수 있다.
Inventors
- 유제준
Assignees
- 하피챗 주식회사
Dates
- Publication Date
- 20260506
- Application Date
- 20241025
Claims (5)
- 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는 방법에 있어서, 사용자 입력 데이터를 획득하는 단계; 상기 사용자 입력 데이터를 분석하여 대화 맥락을 파악하는 단계; 상기 분석된 대화 맥락에 따라 적합한 AI 캐릭터 응답을 생성하는 단계; 및 생성된 AI 캐릭터 응답을 사용자 단말로 전송할 것을 결정하는 단계; 를 포함하는, 대화형 AI 컴패니언 제공 방법.
- 제1항에 있어서, 상기 방법은, 상기 사용자 단말로부터 AI 캐릭터의 외모, 성격 및 대화 스타일에 관한 캐릭터 정의 정보를 수신하는 단계; 상기 캐릭터 정의 정보에 기초하여 AI 캐릭터를 생성하는 단계; 설정된 시나리오에 따라 상기 AI 캐릭터의 대화 맥락을 정의하는 단계; 및 상기 정의된 대화 맥락에 기초하여 AI 캐릭터의 응답을 생성하는 단계; 를 포함하는, 대화형 AI 컴패니언 제공 방법.
- 제1항에 있어서, 상기 방법은, 상기 사용자 단말로부터 이모지 입력 정보를 수신하는 단계; 상기 수신된 이모지 입력 정보를 분석하여 해당 이모지에 대응하는 감정 상태를 인식하는 단계; 상기 인식된 감정 상태에 따라 AI 캐릭터의 대화 반응을 생성하는 단계; 및 상기 생성된 대화 반응을 사용자에게 출력하는 단계; 를 포함하는, 대화형 AI 컴패니언 제공 방법.
- 하나 이상의 인스트럭션을 저장하는 메모리; 및 상기 메모리에 저장된 상기 하나 이상의 인스트럭션을 실행하는 프로세서를 포함하고, 상기 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써, 제1항의 방법을 수행하는, 장치.
- 하드웨어인 컴퓨터와 결합되어, 제1항의 방법을 수행할 수 있도록 컴퓨터에서 독출가능한 기록매체에 저장된 컴퓨터프로그램.
Description
대화형 AI 컴패니언 제공 방법, 장치 및 프로그램{METHOD, APPARATUS, AND PROGRAM FOR PROVIDING INTERACTIVE AI COMPANION} 본 발명은 대화형 AI 컴패니언 제공 방법, 장치 및 프로그램에 관한 것으로, 구체적으로는 사용자와의 자연스러운 상호작용을 통해 감정적 유대감을 형성할 수 있는 AI 캐릭터를 생성하고, 이를 다양한 언어 및 시나리오에 맞게 대화를 진행할 수 있도록 하는 기술에 관한 것이다. 이 발명은 경기도와 경기도경제과학진흥원의 '2024년 글로벌 스타트업 사업화지원사업'의 지원으로 출원된 결과임 최근 인공지능(AI) 기술의 급격한 발전에 따라, 사용자와의 상호작용을 통해 감정적 유대감을 형성할 수 있는 대화형 AI 시스템이 각광받고 있다. 이러한 시스템은 단순히 명령을 수행하거나 질문에 답변하는 기존의 AI 비서와는 달리, 사용자와의 대화를 통해 더욱 자연스러운 인간-컴퓨터 상호작용을 가능하게 하고, 심리적 안정감이나 즐거움을 제공하는 역할을 수행할 수 있다. 특히, AI 컴패니언(Companion) 기술은 대화와 정서적 교류를 통해 사용자에게 친구, 조언자, 혹은 감정적 지지의 역할을 제공하는 것이 특징이다. 기존의 AI 시스템은 주로 사무적이고 기능적인 대화를 지원하는 데 그쳤지만, 최근에는 사용자의 기분, 대화 맥락 등을 인식하여 감정적인 상호작용을 할 수 있는 AI 기술이 개발되고 있다. 이는 고령화 사회의 증가, 1인 가구의 확대, 그리고 사회적 고립 문제에 대한 대안으로도 주목받고 있다. 그러나 기존의 AI 컴패니언 기술에는 몇 가지 한계가 존재한다. 첫째, 대화의 맥락을 충분히 이해하지 못하거나, 사용자의 감정 상태를 제대로 인식하지 못하여 단순하고 반복적인 응답을 제공하는 경우가 많다. 둘째, 다국어 지원에 대한 기술적 한계로 인해, 글로벌 사용자들에게 일관된 경험을 제공하기 어려운 점이 있다. 또한, 이모지와 같은 비언어적 요소를 통한 감정 표현에 대해 AI가 적절한 반응을 하지 못하는 문제점도 존재한다. 따라서, 사용자 정의 AI 캐릭터를 생성하고, 이를 기반으로 감정적 교류를 원활하게 지원하며, 다국어와 이모지와 같은 비언어적 표현을 인식할 수 있는 대화형 AI 컴패니언 기술의 필요성이 대두되고 있다. 다양한 양상들이 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 구체적인 세부사항들 없이 실시될 수 있음은 명백할 것이다. 도 1은 본 발명의 일 실시예와 관련된 대화형 AI 컴패니언 제공 방법을 구현하기 위한 시스템을 개략적으로 도시한 예시도이다. 도 2는 본 발명의 일 실시예와 관련된 대화형 AI 컴패니언 제공 방법을 수행하는 컴퓨팅 장치의 하드웨어 구성도이다. 도 3은 본 발명의 일 실시예와 관련된 대화형 AI 컴패니언 제공 방법의 예시적인 순서도를 도시한다. 다양한 실시예들이 이제 도면을 참조하여 설명된다. 본 명세서에서, 다양한 설명들이 본 발명의 이해를 제공하기 위해서 제시된다. 그러나, 이러한 실시예들은 이러한 구체적인 설명 없이도 실행될 수 있음이 명백하다. 본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭한다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정(procedure), 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있다. 일 컴포넌트는 하나의 컴퓨터 내에 로컬화 될 수 있다. 일 컴포넌트는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터의 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통해 전송되는 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다. 더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다. 또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하는 것으로 이해되어야 한다. 다만, "포함한다" 및/또는 "포함하는"이라는 용어는, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다. 당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있다. 다만, 그러한 구현의 결정들이 본 발명내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다. 제시된 실시예들에 대한 설명은 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이다. 여기에 정의된 일반적인 원리들은 본 발명의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예들로 한정되는 것이 아니다. 본 발명은 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다. 본 명세서에서, 컴퓨터는 적어도 하나의 프로세서를 포함하는 모든 종류의 하드웨어 장치를 의미하는 것이고, 실시 예에 따라 해당 하드웨어 장치에서 동작하는 소프트웨어적 구성도 포괄하는 의미로서 이해될 수 있다. 예를 들어, 컴퓨터는 스마트폰, 태블릿 PC, 데스크톱, 노트북 및 각 장치에서 구동되는 사용자 클라이언트 및 애플리케이션을 모두 포함하는 의미로서 이해될 수 있으며, 또한 이에 제한되는 것은 아니다. 이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다. 본 명세서에서 설명되는 각 단계들은 컴퓨터에 의하여 수행되는 것으로 설명되나, 각 단계의 주체는 이에 제한되는 것은 아니며, 실시 예에 따라 각 단계들의 적어도 일부가 서로 다른 장치에서 수행될 수도 있다. 도 1은 본 발명의 일 실시예와 관련된 대화형 AI 컴패니언 제공 방법을 구현하기 위한 시스템을 개략적으로 도시한 예시도이다. 도 1에 도시된 바와 같이, 본 발명의 실시예들에 따른 시스템은, 컴퓨팅 장치(100), 사용자 단말(200), 외부 서버(300) 및 네트워크(400)를 포함할 수 있다. 도 1에서 도시되는 컴포넌트들은 예시적인 것으로서, 추가적인 컴포넌트들이 존재하거나 또는 도 1에서 도시되는 컴포넌트들 중 일부는 생략될 수 있다. 본 발명의 실시예들에 따른 컴퓨팅 장치(100), 외부 서버(300) 및 사용자 단말(200)은 네트워크400)를 통해, 본 발명의 일 실시예들에 따른 시스템을 위한 데이터를 상호 송수신할 수 있다. 본 발명의 실시예들에 따른 네트워크(400)는 공중전화 교환망(PSTN: Public Switched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다. 또한, 여기서 제시되는 네트워크(400)는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다. 본 발명의 실시예들에 따른 네트워크(400)는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN: Personal Area Network), 근거리 통신망(WAN: Wide A