Search

KR-20260060880-A - A method for generating output results, which matches the GPT User's intention based on the characteristics of a GenAI model

KR20260060880AKR 20260060880 AKR20260060880 AKR 20260060880AKR-20260060880-A

Abstract

본 발명의 일 실시예에 따라 장치의 프로세서가 인공지능 모델을 활용하는 방법은, 최종 출력 데이터를 요청하는 제1 요청 데이터를 획득하는 단계; 기 저장된 적어도 하나의 배경지식 데이터 중 일부를 선정하는 단계; 사용 가능 용어 또는 사용 불가능 용어 리스트를 획득하는 단계; 상기 제1 요청 데이터, 상기 배경지식 데이터 중 일부, 및 상기 리스트를 포함하는 입력 데이터를 생성하는 단계; 상기 입력 데이터를 인공지능 모델에 입력하는 단계; 상기 인공지능 모델로부터 상기 입력 데이터에 대응하는 최종 출력 데이터를 획득하는 단계; 및 상기 최종 출력 데이터를 시각적으로 표시하는 단계;를 포함하여 요청(request) 데이터를 획득 시 자동적으로 인공지능 모델을 활용하여 과제를 수행하는, 즉 양질의 출력을 획득하는 방법을 제공할 수 있다. 결과적으로, 본 발명의 일 실시예에 따르면 인공지능 모델에 입력되는 데이터를 체계적으로 생성하고, 이를 바탕으로 사용자의 요구사항을 보다 정확하게 반영한 고품질의 출력 데이터를 획득하고, 모델의 성능을 최적화하는 데 기여함으로써, 인공지능 기술의 실용적 가치를 한층 높이는 효과를 가져올 수 있다.

Inventors

  • 남진우
  • 이민재
  • 조근식

Assignees

  • 주식회사 튜링

Dates

Publication Date
20260506
Application Date
20241025

Claims (19)

  1. 장치의 프로세서가 인공지능 모델을 활용하여 과제를 수행하는 방법에 있어서, 최종 출력 데이터를 요청하는 제1 요청 데이터를 획득하는 단계; 기 저장된 적어도 하나의 배경지식 데이터 중 일부를 선정하는 단계; 사용 가능 용어 또는 사용 불가능 용어 리스트를 획득하는 단계; 상기 제1 요청 데이터, 상기 배경지식 데이터 중 일부, 및 상기 리스트를 포함하는 입력 데이터를 생성하는 단계; 상기 입력 데이터를 인공지능 모델에 입력하는 단계; 상기 인공지능 모델로부터 최종 출력 데이터를 획득하는 단계; 및 상기 최종 출력 데이터를 시각적으로 표시하는 단계;를 포함하는, 방법.
  2. 제1항에 있어서, 상기 기 저장된 적어도 하나의 배경지식 데이터 중 일부를 선정하는 단계는, 상기 제1 요청 데이터로부터 요청 벡터를 획득하는 단계; 상기 적어도 하나의 배경지식 데이터로부터 적어도 하나의 배경지식 벡터를 획득하는 단계; 상기 적어도 하나의 배경지식 벡터에 대하여 요청 벡터와의 유사도를 산출하는 단계; 및 상기 유사도를 기초로 상기 적어도 하나의 배경지식 데이터 중 일부를 선정하는 단계;를 포함하는, 방법.
  3. 제2항에 있어서, 초기 데이터를 획득하는 단계;를 더 포함하고, 상기 제1 요청 데이터는 상기 초기 데이터를 가공하여 획득한 것인, 방법.
  4. 제3항에 있어서, 상기 초기 데이터는 문항 데이터와 선지(options) 데이터를 포함하고, 상기 제1 요청 데이터를 획득하는 단계는, 상기 초기 데이터 중 상기 문항 데이터와 상기 선지 데이터를 구분하는 단계; 및 상기 문항 데이터를 기초로 상기 제1 요청 데이터를 획득하는 단계;를 포함하는, 방법.
  5. 제2항에 있어서, 상기 유사도는 코사인 유사도 또는 유클리드 거리인, 방법.
  6. 제1항에 있어서, 상기 사용 가능 용어 또는 사용 불가능 용어 리스트를 획득하는 단계는, 상기 제1 요청 데이터로부터 카테고리 정보를 추출하는 단계; 및 기 저장된 하나의 사용 가능 용어 및 사용 불가능 용어 중 상기 카테고리 정보에 대응하는 적어도 하나의 사용 가능 용어 또는 사용 불가능 용어를 획득하는 단계;를 포함하는, 방법.
  7. 제1항에 있어서, 최종 출력 데이터의 예시를 획득하는 단계;를 더 포함하고, 상기 입력 데이터는 상기 예시를 포함하는, 방법.
  8. 제1항에 있어서, 상기 최종 출력 데이터의 예시를 획득하는 단계는, 상기 제1 요청 데이터로부터 요청 벡터를 획득하는 단계; 기 저장된 적어도 하나의 예시 데이터로부터 적어도 하나의 예시 벡터를 획득하는 단계; 상기 적어도 하나의 예시 벡터에 대하여 요청 벡터와의 상관도를 산출하는 단계; 및 상기 상관도를 기초로 상기 적어도 하나의 예시 데이터 중 일부를 선정하는 단계;를 포함하는, 방법.
  9. 제8항에 있어서, 상기 제1 요청 데이터로부터 요청 벡터를 획득하는 단계는, 상기 제1 요청 데이터 중 특정 단어를 삭제하는 단계;를 포함하는, 방법.
  10. 제8항에 있어서, 상기 상관도는 내적곱인, 방법.
  11. 제1항에 있어서, 상기 입력 데이터는 상기 최종 출력 데이터 외 중간 출력 데이터의 생성을 요청하는 제2 요청 데이터를 포함하는, 방법.
  12. 제1항에 있어서, 디스플레이를 포함하는 장치에 인공지능 모델을 기반으로 하는 어플리케이션을 배포하는 단계;를 더 포함하고, 상기 최종 출력 데이터를 시각적으로 표시하는 단계는, 상기 장치에 상기 최종 출력 데이터를 전송하여 상기 디스플레이에 상기 최종 출력 데이터가 시각적으로 표시되도록 하는, 방법.
  13. 장치의 프로세서가 문제의 힌트를 생성하는 방법에 있어서, 문제 데이터를 획득하는 단계; 및 제1항에 따른 방법을 통해 인공지능 모델을 활용하는 단계;를 포함하고, 상기 제1 요청 데이터는 상기 문제 데이터를 포함하는, 방법.
  14. 제13항에 있어서, 상기 사용 가능 용어 또는 사용 불가능 용어 리스트를 획득하는 단계는, 상기 제1 요청 데이터로부터 문제의 학년, 학기, 또는 단원 정보를 추출하는 단계; 및 추출한 학년, 학기, 또는 단원 정보에 기 정의된 리스트를 획득하는 단계;를 포함하는, 방법.
  15. 제13항에 있어서, 기 저장된 문제-힌트 쌍 중 적어도 하나를 획득하는 단계;를 더 포함하고, 상기 입력 데이터는 상기 쌍을 포함하는, 방법.
  16. 메모리; 및 프로세서;를 포함하고, 상기 프로세서는 최종 출력 데이터를 요청하는 제1 요청 데이터를 획득하여 상기 메모리에 저장하고, 기 저장된 적어도 하나의 배경지식 데이터 중 일부를 선정하고, 사용 가능 용어 또는 사용 불가능 용어 리스트를 획득하고, 상기 제1 요청 데이터, 상기 배경지식 데이터 중 일부, 및 상기 리스트를 포함하는 입력 데이터를 생성하여 상기 메모리에 저장하고, 상기 입력 데이터를 인공지능 모델에 입력하고, 상기 인공지능 모델로부터 최종 출력 데이터를 획득하고, 그리고 상기 최종 출력 데이터를 시각적으로 표시하는 , 인공지능 모델 활용 과제 수행 장치.
  17. 메모리; 및 문제 데이터를 획득하여 상기 메모리에 저장하고, 제1항에 따른 방법을 통해 인공지능 모델을 활용하는 프로세서;를 포함하고, 상기 제1 요청 데이터는 상기 문제 데이터를 포함하는, 힌트 생성 장치.
  18. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 장치의 프로세서에서 실행되는 경우, 인공지능 모델을 활용하여 과제를 수행하기 단계들을 수행하며, 상기 단계들은, 최종 출력 데이터를 요청하는 제1 요청 데이터를 획득하는 단계; 기 저장된 적어도 하나의 배경지식 데이터 중 일부를 선정하는 단계; 사용 가능 용어 또는 사용 불가능 용어 리스트를 획득하는 단계; 상기 제1 요청 데이터, 상기 배경지식 데이터 중 일부, 및 상기 리스트를 포함하는 입력 데이터를 생성하는 단계; 상기 입력 데이터를 인공지능 모델에 입력하는 단계; 상기 인공지능 모델로부터 최종 출력 데이터를 획득하는 단계; 및 상기 최종 출력 데이터를 시각적으로 표시하는 단계;를 포함하는, 프로그램.
  19. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 장치의 프로세서에서 실행되는 경우, 문제의 힌트를 생성하기 위한 단계들을 수행하며, 상기 단계들은, 문제 데이터를 획득하는 단계; 및 제1항에 따른 방법을 통해 인공지능 모델을 활용하는 단계;를 포함하고, 상기 제1 요청 데이터는 상기 문제 데이터를 포함하는, 프로그램.

Description

생성형 인공지능 모델의 특성에 기반하여 사용자의 의도에 부합하는 출력 결과물을 생성하는 방법 {A method for generating output results, which matches the GPT User's intention based on the characteristics of a GenAI model} 본 발명은 인공지능 모델을 활용한 과제 수행 방법에 관한 것으로, 더 상세하게는 인공지능 모델로부터 사용자에 의도에 부합하는 양질의 출력 결과물을 얻기 위하여 입력 데이터를 생성하는 인공지능 모델 활용 방법, 장치, 및 프로그램에 관한 것이다. 최근 생성형 인공지능 모델을 활용하여 과제 수행의 효율성을 극대화하려는 시도가 급격히 증가하고 있다. 이러한 모델들은 다양한 분야에서 혁신적인 해결책을 제시하며 업무 프로세스를 획기적으로 개선하고 있다. 그러나 생성형 인공지능 모델은 입력 데이터의 미세한 차이에도 크게 다른 출력을 생성하는 특성을 가지고 있어, 사용자들에게 새로운 도전 과제를 안겨주고 있다. 이러한 특성으로 인해 사용자는 원하는 결과를 얻기 위해 여러 단계의 복잡한 과정을 거쳐야 한다. 먼저, 출력 결과물을 세심하게 검토하고 분석해야 한다. 그 다음, 분석 결과를 바탕으로 입력 데이터를 정교하게 조정하고 반복적으로 수정해야 한다. 이 과정에서 사용자는 모델의 특성을 이해하고, 효과적인 프롬프트 엔지니어링 기술을 습득해야 하는 등 추가적인 노력과 시간 투자가 요구된다. 따라서 사용자 경험을 개선하고, 모델의 실용성을 높이는 등 생성형 인공지능 모델의 잠재력을 최대한 활용하기 위해서는 이러한 도전 과제를 효과적으로 해결할 수 있는 방법론과 도구의 개발이 시급히 필요한 상황이다. 도 1은 본 발명의 일 실시예에 따라 인공지능 모델을 활용하기 위해 사용되는 구성요소 간 상호작용을 나타내는 블록도이다. 도 2는 본 발명의 일 실시예에 따른 인공지능 모델을 활용하는 장치의 구성 요소를 나타내는 블록도이다. 도 3은 본 발명의 일 실시예에 따라 인공지능 모델을 활용하여 과제를 수행하는 방법을 설명하기 위한 순서도이다. 도 4는 본 발명의 일 실시예에 따라 배경지식 데이터를 선정하는 방법을 설명하기 위한 순서도이다. 도 5는 본 발명의 일 실시예에 따라 배경지식 데이터를 선정하는 방법을 설명하기 위한 또 다른 도면이다. 도 6은 본 발명의 일 실시예에 따라 사용 가능 용어 또는 사용 불가능 용어의 리스트를 획득하는 방법을 설명하기 위한 도면이다. 도 7은 본 발명의 일 실시예에 따라 예시 데이터를 획득하는 방법을 설명하기 위한 도면이다. 도 8은 본 발명의 일 실시예와 관련된 생성형 인공지능 모델의 동작 원리를 설명하기 위한 도면이다. 도 9는 본 발명의 일 실시예와 관련된 생성형 인공지능 모델에 데이터가 입력되는 방식을 설명하기 위한 도면이다. 도 10는 본 발명의 일 실시예에 따라 최종 출력 데이터를 시각적으로 표시하는 인터페이스의 예시도이다. 도 11은 본 발명의 일 실시예에 따라 최종 출력 데이터를 시각적으로 표시하는 인터페이스의 또 다른 예시도이다. 본 실시예들은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 특정한 실시 형태에 대해 범위를 한정하려는 것이 아니며, 본 발명의 실시 예의 다양한 변경(modifications), 균등물(equivalents), 및/또는 대체물(alternatives)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 본 개시를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다. 덧붙여, 하기 실시 예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 기술적 사상의 범위가 하기 실시 예에 한정되는 것은 아니다. 오히려, 이들 실시 예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 발명의 기술적 사상을 완전하게 전달하기 위하여 제공되는 것이다. 본 개시에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 권리범위를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 개시에서, "가진다," "가질 수 있다," "포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다. 본 개시에서, "A 또는 B," "A 또는/및 B 중 적어도 하나," 또는 "A 또는/및 B 중 하나 또는 그 이상"등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B," "A 및 B 중 적어도 하나," 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는 (3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다. 본 개시에서 사용된 "제1," "제2," "첫째," 또는 "둘째,"등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 어떤 구성요소가 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 어떤 구성요소와 다른 구성요소 사이에 다른 구성요소(예: 제3 구성요소)가 존재하지 않는 것으로 이해될 수 있다. 본 개시에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to)," 또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성된(또는 설정된)"은 하드웨어적으로 "특별히 설계된(specifically designed to)" 것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다. 실시 예에 있어서 '모듈' 혹은 '부'는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '모듈' 혹은 복수의 '부'는 특정한 하드웨어로 구현될 필요가 있는 '모듈' 혹은 '부'를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다. 한편, 도면에서의 다양한 요소와 영역은 개략적으로 그려진 것이다. 따라서, 본 발명의 기술적 사상은 첨부한 도면에 그려진 상대적인 크기나 간격에 의해 제한되지 않는다. 모델이란, 기 정의된 형태의 데이터를 입력으로 연산을 수행하여 적어도 하나의 결과값을 출력할 때, 입력부터 출력까지의 과정을 정의하는 알고리즘과, 해당 알고리즘의 수정 또는 실행을 위한 규칙을 포함하는 집합을 의미한다. 모델이 인공 신경망(Artificial neural network, ANN) 모델일 경우, 모델은 생물학적 뉴런의 작동 원리를 모방하여 설계된 그래프 형태의 수학적 모델로, 입력층(또는 입력 레이어)과 출력층(또는 출력 레이어)을 포함하며, 그 외에도 뉴런 또는 노드를 포함하는 하나 이상의 은닉층(또는 히든 레이어, Hidden layer)을 더 포함한다. 은닉층 내 뉴런은 모델 내 다른 뉴런으로부터 적어도 하나의 입력을 받아 적어도 하나의 출력값을 생성하는데, 이 때 뉴런 내에서 입력값으로부터 출력값을 생성하는 함수를 활성화 함수(Activation function)이라 한다. 활성화 함수는 시그모이드 함수(Sigmoid function), 렐루 함수(Rectified Linear Unit function, ReLU), 소프트맥스 함수(Softmax function)를 포함할 수 있으나, 이에 한정되지 않으며, 하나의 모델 또는 하나의 층을 구성하는 뉴런 간에 사용되는 활성화 함수가 다를 수 있다. 학습이란, 상기 모델의 성능을 향상시키기 위해 수행하는 것으로, 좁게는 모델 내 뉴런의 활성화 함수에 입력되는 각 입력값에 곱해지는 가중치(Weight)와 각 뉴런마다 하나가 설정되어 뉴런의 활성화 정도를 결정하는 편향(Bias)의 값을 정하는 것을 의미하며, 넓게는 가중치와 편향의 값을 정하는 것 외에 모델의 입력값이 될 데이터셋의 생성 또는 수집, 생성 또는 수집한 데이터의 전처리, 사용할 모델에 대한 선택 또는 설계, 정해진 가중치 및 편향에 기반한 모델의 평가, 개선, 및 최적화를 모두 포함하는 일련의 과정을 의미한다. 학습 과정 중 일부는 모델의 성능을 향상시키기 위해 반복적으로 수행될 수 있다. 생성형 인공지능 기술은 주어진 데이터를 기반으로 새로운 콘텐츠를