Search

KR-20260061037-A - INFORMATION PROCESSING METHOD

KR20260061037AKR 20260061037 AKR20260061037 AKR 20260061037AKR-20260061037-A

Abstract

[과제] 쿼리를 선택하는 기술을 개선한다. [해결 수단] 정보 처리 장치(10)가 실행하는 방법은, 검색 대상의 후보마다, 대응하는 도메인 키워드 및 타깃 프레이즈를 등록하는 것, 입력된 질문으로부터 특정된 검색 대상에 대응하는 도메인 키워드를 포함하는 쿼리를 취득하는 것, 쿼리를 검색 엔진에 입력하는 단계와, 검색 결과를 표시하는 화면 상에서 검색 대상에 대응하는 타깃 프레이즈를 포함하는 각 스니펫을 특정 및 카운트하는 단계와, 특정된 1 이상의 스니펫에 포함되는 키워드를 쿼리에 추가하는 단계를 포함하는 검색 처리를 복수회 실행하는 것, 복수회 실행된 검색 처리에 있어서, 타깃 프레이즈를 포함하는 스니펫의 카운트수가 가장 많았던 회의 검색 결과에 의거하여, 질문에 대한 회답을 취득하는 것, 및 취득된 회답을 출력하는 것을 포함한다.

Inventors

  • 가와이 히데키

Assignees

  • 도요타 지도샤(주)

Dates

Publication Date
20260506
Application Date
20251023
Priority Date
20241025

Claims (5)

  1. 정보 처리 장치가 실행하는 방법으로서, 검색 대상의 후보마다, 대응하는 도메인 키워드 및 타깃 프레이즈를 등록하는 것, 입력된 질문으로부터 특정된 상기 검색 대상에 대응하는 상기 도메인 키워드를 포함하는 쿼리를 취득하는 것, 상기 쿼리를 검색 엔진에 입력하는 단계와, 검색 결과를 표시하는 화면 상에서 상기 검색 대상에 대응하는 상기 타깃 프레이즈를 포함하는 각 스니펫을 특정 및 카운트하는 단계와, 특정된 1 이상의 상기 스니펫에 포함되는 키워드를 상기 쿼리에 추가하는 단계를 포함하는 검색 처리를 복수회 실행하는 것, 복수회 실행된 상기 검색 처리에 있어서, 상기 타깃 프레이즈를 포함하는 상기 스니펫의 카운트수가 가장 많았던 회의 상기 검색 결과에 의거하여, 상기 질문에 대한 회답을 취득하는 것, 및 취득된 상기 회답을 출력하는 것을 포함하는, 방법.
  2. 제 1 항에 있어서, 상기 타깃 프레이즈를 포함하는 상기 스니펫의 카운트수가 가장 많았던 회에 이용된 상기 쿼리로, 상기 도메인 키워드를 갱신하는 것을 추가로 포함하는, 방법.
  3. 제 1 항에 있어서, 상기 검색 처리에 있어서 상기 추가되는 상기 키워드는, 상기 타깃 프레이즈를 포함하는 상기 스니펫에 있어서 출현 빈도가 높은 키워드, 및 상기 타깃 프레이즈를 포함하는 상기 스니펫에만 출현하는 키워드 중 어느 것 또는 양방인, 방법.
  4. 제 1 항에 있어서, 상기 검색 처리는, 상기 쿼리 내의 상기 도메인 키워드 및 추가된 상기 키워드 중 일부를 상기 쿼리로부터 삭제하는 단계를 추가로 포함하는, 방법.
  5. 제 1 항에 있어서, 상기 타깃 프레이즈를 포함하는 상기 스니펫의 출현 비율이 문턱값 이상인 검색 결과가 얻어진 시점에서 상기 검색 처리의 실행을 종료하는 것을 추가로 포함하는, 방법.

Description

정보 처리 방법{INFORMATION PROCESSING METHOD} 본 개시는, 정보 처리 방법에 관한 것이다. 종래, 사용자의 질문에 대하여 회답을 제공하는 대화 시스템에 관한 기술이 알려져 있다. 예를 들면, 특허 문헌 1에는, 주어진 도메인의 문서에 의거하여, 대규모 언어 모델을 이용하여 당해 도메인에 특화된 대화봇을 생성하는 기술이 개시되어 있다. 도 1은 본 개시의 일 실시 형태와 관련된 시스템의 개략 구성을 나타내는 블록도이다. 도 2는 정보 처리 장치의 동작을 나타내는 플로우 차트이다. 이하, 본 개시의 실시 형태에 대해 설명한다. (실시 형태의 개요) 도 1을 참조하여, 본 개시의 실시 형태와 관련된 시스템(1)의 개요에 대해 설명한다. 시스템(1)은, 정보 처리 장치(10)와, 도메인 데이터 베이스(도메인 DB)(20)와, 단말 장치(30)를 구비한다. 시스템(1)은, 예를 들면 인터넷 및 이동체 통신망 등을 포함하는 네트워크(50)를 개재하여, 외부 서버(40)와 통신 가능하게 접속된다. 시스템(1)은 예를 들면, 자동차 판매의 사업자 등에 의한 「중고차의 사정 금액을 가르쳐줘」 등의 질문에 대한 회답을 출력하는 대화 시스템을 구축한다. 정보 처리 장치(10)는, 예를 들면 서버 장치 등의 컴퓨터이다. 도메인 DB(20)는, 각 검색 대상에 대해 검색 엔진으로의 입출력과 관련되는 정보를 저장하는 데이터 베이스이다. 도메인 DB(20)는 예를 들면, 클라우드 환경 또는 온프레미스 환경에 설치된 서버 등의 컴퓨터에 마련되어 있어도 되고, 또는 정보 처리 장치(10)에 마련되어 있어도 된다. 단말 장치(30)는 예를 들면, 스마트 폰, 휴대 전화기, 웨어러블 기기, 혹은 태블릿 등의 모바일 기기, 차량에 탑재되는 내비게이션 장치, PC(personal computer) 등의 범용 기기 혹은 전용 기기이지만, 이들에 한정되지 않는다. 또한, 도 1에 나타내는 외부 서버(40)는, LLM(대규모 언어 모델)(41)을 제공하는 사업체의 서버이다. LLM(41)은, 대규모인 데이터를 기계 학습함으로써 구축된 언어 모델이다. LLM(41)은, 사용자가 입력한 질문에 대한 회답을 출력한다. 외부 서버(40)는 추가로 RAG(검색 확장 생성)(42)를 구비한다. RAG(42)는, 사업체마다의 데이터 또는 리얼타임으로 검색한 데이터를 포함하는, LLM이 미학습의 데이터를 LLM에 전달하여, LLM이 행하는 회답 작성을 지원한다. 또한, RAG(42)는, 정보 처리 장치(10)의 일부로서 구성되어도 된다. 우선, 본 실시 형태의 개요에 대해 설명하고, 상세에 대해서는 후술한다. 정보 처리 장치가 실행하는 방법은, 검색 대상의 후보마다, 대응하는 도메인 키워드 및 타깃 프레이즈를 등록하고, 입력된 질문으로부터 특정된 검색 대상에 대응하는 도메인 키워드를 포함하는 쿼리를 취득한다. 그리고 본 방법은, 쿼리를 검색 엔진에 입력하는 단계와, 검색 결과를 표시하는 화면 상에서 검색 대상에 대응하는 타깃 프레이즈를 포함하는 각 스니펫을 특정 및 카운트하는 단계와, 특정된 1 이상의 스니펫에 포함되는 키워드를 쿼리에 추가하는 단계를 포함하는 검색 처리를 복수회 실행한다. 또한 본 방법은, 복수회 실행된 검색 처리에 있어서, 타깃 프레이즈를 포함하는 스니펫의 카운트수가 가장 많았던 회의 검색 결과에 의거하여, 질문에 대한 회답을 취득하고, 취득된 회답을 출력한다. 이와 같이, 본 실시 형태에 의하면, 검색 엔진을 이용한 검색 결과의 화면 상에서 타깃 프레이즈를 포함하는 스니펫수가 증가하도록 쿼리가 자동적으로 수정 및 확장되므로, 예를 들면 수동으로 선별한 복수의 적절한 쿼리를 미리 등록해 두는 방법과 비교하여 사용자의 부담을 저감하면서, 질문에 대한 회답의 정밀도를 향상시킬 수 있다. 따라서, 정밀도가 높은 회답의 출력 및 인적 비용의 저감이라고 하는 점에서, 적절한 쿼리를 선택하는 기술이 개선된다. 이어서, 시스템(1)의 각 구성에 대해 상세하게 설명한다. (정보 처리 장치의 구성) 도 1에 나타내는 바와 같이, 정보 처리 장치(10)는, 통신부(11)와, 기억부(12)와, 제어부(13)를 구비한다. 통신부(11)는, 도메인 DB(20) 및 네트워크(50)의 각각에 접속하는 1개 이상의 통신 인터페이스를 포함한다. 당해 통신 인터페이스는, 예를 들면 이동체 통신 규격, 유선 LAN(Local Area Network) 규격, 또는 무선 LAN 규격에 대응하지만, 이들에 한정되지 않고, 임의의 통신 규격에 대응해도 된다. 본 실시 형태에 있어서, 정보 처리 장치(10)는, 통신부(11) 및 네트워크(50)를 개재하여 도메인 DB(20), 단말 장치(30) 및 외부 서버(40)와 통신한다. 기억부(12)는, 1개 이상의 메모리를 포함한다. 기억부(12)에 포함되는 각 메모리는, 예를 들면 주기억 장치, 보조 기억 장치, 또는 캐시 메모리로서 기능해도 된다. 기억부(12)는, 정보 처리 장치(10)의 동작에 이용되는 임의의 정보를 기억한다. 기억부(12)는 예를 들면, 시스템 프로그램 및 애플리케이션 프로그램 등을 기억해도 된다. 본 실시 형태에 있어서 기억부(12)는, web 브라우저 및 임의의 검색 엔진의 애플리케이션 프로그램 및 검색 엔진에 입력하는 쿼리 등을 기억한다. 기억부(12)에 기억된 정보는, 예를 들면 통신부(11)를 개재하여 네트워크(50)로부터 취득되는 정보로 갱신 가능해도 된다. 제어부(13)는, 1개 이상의 프로세서, 1개 이상의 프로그래머블 회로, 1개 이상의 전용 회로, 또는 이들의 조합을 포함한다. 프로세서는, 예를 들면 CPU(Central Processing Unit) 혹은 GPU(Graphics Processing Unit) 등의 범용 프로세서, 또는 특정의 처리에 특화된 전용 프로세서이지만 이들에 한정되지 않는다. 프로그래머블 회로는, 예를 들면 FPGA(Field-Programmable Gate Array)이지만 이에 한정되지 않는다. 전용 회로는, 예를 들면 ASIC(Application Specific Integrated Circuit)이지만 이에 한정되지 않는다. 제어부(13)는, 정보 처리 장치(10) 전체의 동작을 제어한다. (도메인 DB의 구성) 도메인 DB(20)는, 각 검색 대상에 대해 검색 엔진으로의 입출력과 관련된 정보를 저장하는 데이터 베이스이다. 도메인 DB(20)는 예를 들면, 검색 대상과, 도메인 키워드와, 타깃 프레이즈를 저장한다. 도메인 DB(20)의 데이터 구조의 상세에 대해서는, 후술한다. (단말 장치(30)의 구성) 도 1에 나타내는 바와 같이, 단말 장치(30)는, 통신부(31)와, 기억부(32)와, 제어부(33)와, 출력부(34)와, 입력부(35)를 구비한다. 통신부(31)와, 기억부(32)와, 제어부(33)의 구성은, 정보 처리 장치(10)의 통신부(11)와, 기억부(12)와, 제어부(13)의 구성과 기본적으로 동일하므로, 설명을 간략화한다. 통신부(31)는, 네트워크(50)에 접속하는 1개 이상의 통신 인터페이스를 포함한다. 기억부(32)는, 1개 이상의 메모리를 포함한다. 본 실시 형태에 있어서 기억부(32)는, 정보 처리 장치(10)를 사용하는 사업자가 제공하는 대화 시스템의 애플리케이션 프로그램, 및 web 브라우저의 애플리케이션 프로그램 등을 기억한다. 제어부(33)는, 1개 이상의 프로세서, 1개 이상의 프로그래머블 회로, 1개 이상의 전용 회로, 또는 이들의 조합을 포함한다. 제어부(33)는, 기억부(32)에 기억된 애플리케이션 프로그램을 실행 가능하다. 출력부(34)는, 정보를 출력하는 1개 이상의 출력 장치를 포함한다. 당해 출력 장치는, 예를 들면 정보를 영상으로 출력하는 디스플레이, 또는 정보를 음성으로 출력하는 스피커 등이지만, 이들에 한정되지 않는다. 입력부(35)는, 조작자에 의한 조작을 접수하는 1개 이상의 입력 장치를 포함한다. 당해 입력 장치는, 예를 들면 물리 키, 정전 용량 키, 정전 용량 패널, 디스플레이와 일체적으로 마련된 터치스크린, 또는 음성 입력을 접수하는 마이크로폰 등이지만, 이들에 한정되지 않는다. (정보 처리 장치의 동작 플로우) 도 2를 참조하여, 본 실시 형태와 관련된 정보 처리 장치(10)의 동작에 대해 설명한다. 단계 S100: 제어부(13)는, 검색 대상의 후보마다, 대응하는 도메인 키워드 및 타깃 프레이즈를 등록한다. 구체적으로는, 검색 대상과, 검색 대상마다의 도메인 키워드 및 타깃 프레이즈가 단말 장치(30)의 입력부(35)를 개재하여 사업자에 의해 입력되고, 제어부(33)에 의해 통신부(31)를 개재하여 정보 처리 장치(10)에 송신되어, 정보 처리 장치(10)의 제어부(13)에 의해 도메인 DB(20) 내에 기억된다. 여기서, 표 1을 참조하여 도메인 DB(20)의 데이터 구조를 설명한다. 검색 대상은, 사업자가 입력한 질문(예를 들면 「중고차의 사정 금액을 가르쳐줘」)으로부터 특정되는, 질문문 중의 일부분 또는 주요한 단어(예를 들면 「사정 금액」)이다. 도메인 키워드는, 검색 엔진에 쿼리로서 입력하는 1개 이상의 단어(예를 들면 「중고」, 「사정」 및 「금액」 등의 1개 이상의 단어)이며, 검색 대상에 대응 지어 기억된다. 타깃 프레이즈는, 검색 대상에 대하여 검색한 결과로서 취득하고 싶은 정보의 1개 이상의 단어(예를 들면 「원」, 「\」 등의 사정 금액을 나타내는 단어 또는 「\*~\*」 등의 사정 금액의 범위를 나타내는 단어의 조합)이다. 검색 대상도메인 키워드타깃 프레이즈사정 금액중고 사정 금액[숫자열]만원~[숫자열]만원\[숫자열]~\[숫자열]\[숫자열]-\[숫자열]잔가율잔가율 년후[숫자열]%[숫자열]퍼센트실연비실연비[숫자열]km/L[숫자열]km/리터 단계 S101: 제어부(13)는, 입력된 질문으로부터 특정된 검색 대상에 대응하는 도메인 키워드를 포함하는 쿼리를 취득한다. 구체적으로는, 제어부(13)는, 단말 장치(30)의 입력부(35)를 개재하여 사업자에 의해 입력된 질문(예를 들면 「중고차의 사정 금액을 가르쳐줘」)을 단말 장치(30)로부터 통신부(11)를 개재하여