KR-102960836-B1 - The Method and Service Server That Provides Call Center Services with Voice Responses Based on Agent Chat Input
Abstract
본 발명은 상담사 채팅입력 기반의 음성응답 제공을 위한 콜센터서비스 제공방법 및 서비스서버로서, 사용자단말로부터 수신된 전화를 서비스서버에 연결하고, 사용자의 음성정보를 발화 간 공백에 기반하여 복수의 발화로 분할한 후, 복수의 발화를 STT모델에 입력하여 사용자발화텍스트로 변환하며, 변환된 사용자발화텍스트에 대해 유해텍스트 필터링 및 의미판단로직을 적용하여 의미발화텍스트 여부를 판단하고, 의미발화텍스트로 판단된 경우 이를 상담사단말로 송신하며, 상담사의 채팅입력을 통해 수신된 상담응답텍스트를 TTS모델을 통해 상담응답발화로 변환하여 사용자단말에 제공하는, 상담사 채팅입력 기반의 음성응답 제공을 위한 콜센터서비스 제공방법 및 서비스서버에 관한 것이다.
Inventors
- 최성집
Assignees
- 주식회사 퀀텀에이아이
Dates
- Publication Date
- 20260506
- Application Date
- 20250801
Claims (7)
- VoIP(Voice over Internet Protocol)모듈을 포함하는 서비스서버에 의해 수행되는, 사용자 음성정보를 분석하여 유해하거나 의미 없는 발화를 필터링하고, 상담과 관련된 유의미한 발화만을 상담사에게 제공하기 위한 콜센터서비스 제공방법으로서, VoIP모듈에 의하여, 사용자단말로부터 수신된 전화를 상기 서비스서버에 연결하는 전화연결단계; 연결된 전화에 포함된 사용자의 음성정보를 발화 간 공백에 기반하여 복수의 발화로 분할하고, 상기 복수의 발화 각각을 STT모델에 입력하여 사용자발화텍스트로 변환하는 발화텍스트생성단계; 상기 사용자발화텍스트를 상기 서비스서버에 기저장된 복수의 유해텍스트 각각과 매칭하고, 상기 유해텍스트와 매칭되지 않은 사용자발화텍스트를 유효발화텍스트로 선정하는 유해텍스트필터링단계; 상기 유효발화텍스트에 기설정된 복수의 의미판단로직을 적용하여, 상기 유효발화텍스트의 패턴, 길이 및 임베딩유사도를 기반으로 해당 유효발화텍스트가 의미가 부여된 의미발화텍스트인지 판단하는 의미판단단계; 및 상기 의미판단단계를 통해 상기 유효발화텍스트가 의미발화텍스트로 판단된 경우, 상기 의미발화텍스트를 상담사단말로 송신하는 상담응답요청단계;를 포함하고, 상기 콜센터서비스 제공방법은, 상기 상담사단말로부터 상기 의미발화텍스트에 대응되는 상담사의 채팅입력을 상담응답텍스트로 수신하고, 수신된 상담응답텍스트를 TTS모델에 입력하여 상담응답발화로 변환하는 상담응답생성단계; 및 VoIP모듈에 의하여, 상기 상담응답발화를 상기 사용자단말에 제공하는 상담응답제공단계;를 더 포함하고, 상기 상담응답생성단계는, 상기 상담사단말에 출력되는 상담인터페이스를 통해 상기 의미발화텍스트에 대응되는 상담사의 채팅입력을 상담응답텍스트로 수신하는 상담응답수신단계;를 포함하고, 상기 상담인터페이스는, 복수의 의미발화텍스트, 각각의 의미발화텍스트에 대응되는 복수의 상담응답텍스트 및 각각의 의미발화텍스트에 대응되는 복수의 자동응답텍스트를 시계열에 따라 표시하는 히스토리레이어; 상담사의 채팅입력에 따라 상담응답텍스트를 표시하는 채팅레이어; 및 상담사의 선택입력에 따라 매핑된 상담응답텍스트를 수신하는 1 이상의 단축응답엘리먼트를 표시하는 단축응답레이어;를 포함하고, 상기 상담응답생성단계는, 상기 상담사단말에 출력되는 설정인터페이스를 통해 상기 1 이상의 단축응답엘리먼트 각각에 대응되는 상담응답텍스트를 매핑하는 단축응답매핑단계;를 더 포함하고, 상기 설정인터페이스는, 상기 1 이상의 단축응답엘리먼트 각각에 대응되는 상담응답텍스트의 리스트를 표시하는 리스트레이어; 및 상담사의 선택입력에 따라 단축응답엘리먼트 및 해당 단축응답엘리먼트에 대응되는 상담응답텍스트를 추가로 매핑하기 위한 매핑레이어를 호출하는 호출엘리먼트;를 포함하고, 상기 매핑레이어는, 상담사의 입력에 따라 추가로 매핑하고자 하는 단축응답엘리먼트의 제목, 해당 단축응답엘리먼트에 대응되는 상담응답텍스트 및 해당 단축응답엘리먼트에 대응되는 단축키를 설정하는, 콜센터서비스 제공방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- VoIP(Voice over Internet Protocol)모듈을 포함하는 서비스서버에 의해 수행되는, 사용자 음성정보를 분석하여 유해하거나 의미 없는 발화를 필터링하고, 상담과 관련된 유의미한 발화만을 상담사에게 제공하기 위한 콜센터서비스 제공방법으로서, VoIP모듈에 의하여, 사용자단말로부터 수신된 전화를 상기 서비스서버에 연결하는 전화연결단계; 연결된 전화에 포함된 사용자의 음성정보를 발화 간 공백에 기반하여 복수의 발화로 분할하고, 상기 복수의 발화 각각을 STT모델에 입력하여 사용자발화텍스트로 변환하는 발화텍스트생성단계; 상기 사용자발화텍스트를 상기 서비스서버에 기저장된 복수의 유해텍스트 각각과 매칭하고, 상기 유해텍스트와 매칭되지 않은 사용자발화텍스트를 유효발화텍스트로 선정하는 유해텍스트필터링단계; 상기 유효발화텍스트에 기설정된 복수의 의미판단로직을 적용하여, 상기 유효발화텍스트의 패턴, 길이 및 임베딩유사도를 기반으로 해당 유효발화텍스트가 의미가 부여된 의미발화텍스트인지 판단하는 의미판단단계; 및 상기 의미판단단계를 통해 상기 유효발화텍스트가 의미발화텍스트로 판단된 경우, 상기 의미발화텍스트를 상담사단말로 송신하는 상담응답요청단계;를 포함하고, 상기 의미판단로직은, 상기 유효발화텍스트를 상기 서비스서버에 기저장된 복수의 패턴텍스트 각각과 매칭하고, 상기 패턴텍스트와 매칭된 유효발화텍스트를 의미가 부여되지 않은 비의미발화텍스트로 판단하는 제1로직; 상기 유효발화텍스트의 텍스트길이를 분석하고, 상기 텍스트길이가 기설정된 임계길이 이하인 경우, 해당 유효발화텍스트를 비의미발화텍스트로 판단하는 제2로직; 및 상기 유효발화텍스트를 학습된 인공신경망 기반의 임베딩모델에 입력하여 발화임베딩정보를 도출하고, 상기 발화임베딩정보를 복수의 비의미발화텍스트 각각에 대한 복수의 비의미임베딩정보가 기학습된 인공신경망 기반의 유사도도출모델에 입력하여, 상기 발화임베딩정보와 각각의 비의미임베딩정보 간의 의도유사도를 도출하고, 상기 발화임베딩정보와의 의도유사도가 기설정된 임계유사도 이상인 비의미임베딩정보가 1 이상 존재하는 경우, 해당 유효발화텍스트를 비의미발화텍스트로 판단하는 제3로직;을 포함하고, 상기 콜센터서비스 제공방법은, 상기 유효발화텍스트가 1 이상의 의미판단로직에 의하여 비의미발화텍스트로 판단된 경우, 상기 비의미발화텍스트에 대응되는 자동응답텍스트를 생성하고, 생성된 자동응답텍스트를 TTS모델에 입력하여 자동응답발화로 변환하는 자동응답생성단계; 및 VoIP모듈에 의하여, 상기 자동응답발화를 상기 사용자단말에 제공하는 자동응답제공단계;를 더 포함하고, 상기 서비스서버에는 임베딩카테고리 기반의 응답매칭규칙이 기저장되어 있고, 상기 임베딩카테고리는 동일한 자동응답텍스트가 매핑된 복수의 비의미발화텍스트 각각에 대한 비의미임베딩정보를 그룹핑하여 구성되고, 상기 자동응답생성단계는, 상기 발화임베딩정보와의 의도유사도가 가장 높게 도출된 비의미임베딩정보인 유사임베딩정보를 탐색하는 카테고리탐색단계; 및 상기 응답매칭규칙에 기반하여 상기 유사임베딩정보가 포함된 임베딩카테고리에 매핑된 자동응답텍스트를 상기 비의미발화텍스트에 대한 자동응답텍스트로 생성하는 자동응답매칭단계;를 포함하는, 콜센터서비스 제공방법.
Description
상담사 채팅입력 기반의 음성응답 제공을 위한 콜센터서비스 제공방법 및 서비스서버{The Method and Service Server That Provides Call Center Services with Voice Responses Based on Agent Chat Input} 본 발명은 상담사 채팅입력 기반의 음성응답 제공을 위한 콜센터서비스 제공방법 및 서비스서버로서, 사용자단말로부터 수신된 전화를 서비스서버에 연결하고, 사용자의 음성정보를 발화 간 공백에 기반하여 복수의 발화로 분할한 후, 복수의 발화를 STT모델에 입력하여 사용자발화텍스트로 변환하며, 변환된 사용자발화텍스트에 대해 유해텍스트 필터링 및 의미판단로직을 적용하여 의미발화텍스트 여부를 판단하고, 의미발화텍스트로 판단된 경우 이를 상담사단말로 송신하며, 상담사의 채팅입력을 통해 수신된 상담응답텍스트를 TTS모델을 통해 상담응답발화로 변환하여 사용자단말에 제공하는, 상담사 채팅입력 기반의 음성응답 제공을 위한 콜센터서비스 제공방법 및 서비스서버에 관한 것이다. 일반적으로 콜센터서비스는 고객과의 상담을 위해 상담사가 실시간 음성 통화를 통해 응대하는 구조로 운영된다. 기존 콜센터서비스에서는 상담사가 고객의 모든 발화를 청취하고 응답하여야 하므로, 응대 효율이 낮고 상담 인력의 신체적·정신적 피로도가 누적되는 문제가 있다. 특히, 고객의 발화 중에는 욕설이나 비속어 등 상담에 적절하지 않은 내용이 포함될 수 있으므로, 이와 같은 비의미적인 발화까지 상담사가 모두 처리해야 한다는 점에서, 실시간 응대 부담이 가중되는 한계가 존재한다. 또한, 다수의 고객으로부터 동시다발적인 상담 요청이 이루어지는 경우, 상담사의 인원의 한계로 인해 전체적인 상담 품질이 저하될 우려가 존재하는 상황이다. 종래의 콜센터시스템으로는, 대한민국 등록특허 제10-2299993호와 같이, 네트워크 기반의 콜센터 운영 시스템 및 그 방법이 있다. 상기 네트워크 기반의 콜센터 운영 시스템 및 그 방법은 다수의 고객 단말과 다수의 상담원 단말 간의 통신을 지원하고, 상담원의 상태 정보를 실시간으로 확인하며, 통화 내용, 고객 이력, 상담 이력 등의 데이터를 처리하고 녹취하는 구성에 대해 개시하고 있다. 한편, 종래의 콜센터시스템은 상담사가 고객과의 음성 통화를 통해 응대하는 방식으로 운영되며, 각 상담세션마다 상담사 1인과 고객 1인을 일대일로 연결하는 것을 기술적 특징으로 한다. 즉, 상담 인력의 부담을 완화하거나 1대다 병렬상담을 통하여 응대 효율을 향상시키기 위한 구성에 대해서는 개시하고 있지 않다. 그러므로 고객의 음성을 텍스트로 변환하여 상담사에게 제공하고, 상담사는 해당 텍스트에 대해 채팅입력을 기반으로 응답을 수행하며, 해당 응답을 음성으로 고객에게 제공함으로써, 상담사의 음성발화 부담을 줄이고, 한 명의 상담사가 복수의 고객에 대한 병렬 응대를 가능하게 하는 콜센터서비스 기술의 개발이 필요한 상황이다. 도 1은 본 발명의 일 실시예에 따른 상담사 채팅입력 기반의 음성응답 제공을 위한 콜센터서비스 제공방법을 수행하는 서비스서버를 개략적으로 도시한다. 도 2는 본 발명의 일 실시예에 따른 상담사 채팅입력 기반의 음성응답 제공을 위한 콜센터서비스 제공방법의 수행단계를 개략적으로 도시한다. 도 3은 본 발명의 일 실시예에 따른 전화연결단계 및 발화텍스트생성단계의 수행과정을 예시적으로 도시한다. 도 4는 본 발명의 일 실시예에 따른 유해텍스트필터링단계의 수행과정을 예시적으로 도시한다. 도 5는 본 발명의 일 실시예에 따른 상담응답생성단계 및 상담응답제공단계의 수행과정을 예시적으로 도시한다. 도 6은 본 발명의 일 실시예에 따른 상담사단말에 출력되는 상담인터페이스를 예시적으로 도시한다. 도 7은 본 발명의 일 실시예에 따른 상담사단말에 출력되는 설정인터페이스를 예시적으로 도시한다. 도 8은 본 발명의 일 실시예에 따른 키워드추천단계의 수행과정을 예시적으로 도시한다. 도 9는 본 발명의 일 실시예에 따른 상담인터페이스에 표시되는 상담목록레이어를 예시적으로 도시한다. 도 10은 본 발명의 일 실시예에 따른 유효발화텍스트에 제1로직을 적용하는 과정을 예시적으로 도시한다. 도 11은 본 발명의 일 실시예에 따른 유효발화텍스트에 제2로직을 적용하는 과정을 예시적으로 도시한다. 도 12는 본 발명의 일 실시예에 따른 발화임베딩정보를 도출하는 과정을 개략적으로 도시한다. 도 13은 본 발명의 일 실시예에 따른 의도유사도를 도출하는 과정을 개략적으로 도시한다. 도 14는 본 발명의 일 실시예에 따른 의도유사도에 따라 비의미발화텍스트를 판별하는 과정을 예시적으로 도시한다. 도 15는 본 발명의 일 실시예에 따른 임베딩카테고리를 예시적으로 도시한다. 도 16은 본 발명의 일 실시예에 따른 자동응답생성단계를 개략적으로 도시한다. 도 17은 본 발명의 일 실시예에 따른 카테고리갱신규칙에 따라 임베딩카테고리를 갱신하는 과정을 예시적으로 도시한다. 도 18은 본 발명의 일 실시예에 따른 컴퓨팅장치의 내부 구성을 예시적으로 도시한다. 이하에서는, 다양한 실시예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나 이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다. 또한, 다양한 양상들 및 특징들이 다수의 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있는 시스템에 의하여 제시될 것이다. 다양한 시스템들이, 추가적인 장치들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있다는 점 그리고/또는 도면들과 관련하여 논의된 장치들, 컴포넌트들, 모듈들 등 전부를 포함하지 않을 수도 있다는 점 또한 이해되고 인식되어야 한다. 본 명세서에서 사용되는 "실시예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다. 아래에서 사용되는 용어들 '~부', '컴포넌트', '모듈', '시스템', '인터페이스' 등은 일반적으로 컴퓨터 관련 엔티티(computer-related entity)를 의미하며, 예를 들어, 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어를 의미할 수 있다. 또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하지만, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다. 이하에서 언급되는 “사용자단말” 및 “상담사단말”은 네트워크를 통해 서버나 타 단말에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop) 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신장치로서, 스마트폰, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말 등과 같은 모든 종류의 핸드헬드 (Handheld) 기반의 무선 통신 장치를 포함할 수 있다. 또한, "네트워크"는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가가치 통신망(Value Added Network; VAN) 등과 같은 유선네트워크나 이동 통신망(mobile radio communication network) 또는 위성 통신망 등과 같은 모든 종류의 무선 네트워크로 구현될 수 있다. 또한, 본 발명의 실시예들에서, 별도로 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명의 실시예에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. 도 1은 본 발명의 일 실시예에 따른 상담사 채팅입력 기반의 음성응답 제공을 위한 콜센터서비스 제공방법을 수행하는 서비스서버(1000)를 개략적으로 도시하고, 도 2는 본 발명의 일 실시예에 따른 상담사 채팅입력 기반의 음성응답 제공을 위한 콜센터서비스 제공방법의 수행단계를 개략적으로 도시한다. 도