KR-20260060882-A - An method to translate exceptional document, based on the characteristics of GenAI
Abstract
본 발명의 일 실시예에 따라 장치의 프로세서가 특수 문서를 번역하기 위해 생성형 인공지능 모델을 프롬프팅하는 방법은, 제1 언어로 작성된 특수 문서를 획득하는 단계; 제1 언어의 용어와 제2 언어의 용어 간 대응관계를 포함하는 번역 사전을 획득하는 단계; 상기 제1 언어로 작성된 특수 문서 및 상기 번역 사전의 적어도 일부를 포함하는 입력 데이터를 생성하는 단계; 및 상기 입력 데이터를 생성형 인공지능 모델에 입력하는 단계;를 포함하여 생성형 인공지능 모델이 특정한 환경에 부합하는 양질의 번역문을 출력할 수 있도록 하는 방법을 제공할 수 있다. 결과적으로, 본 발명의 일 실시예에 따르면 사용 용어와 말투가 문서의 사용 목적에 부합하며, 특수 환경의 맥락에 부합하는 번역문을 획득하여, 사람이 수행하는 별도의 검토 또는 수정 단계가 없더라도 기존 기술을 통해 생성된 자동 번역문보다 양질의 결과를 얻을 수 있다.
Inventors
- 남진우
- 이민재
- 조근식
Assignees
- 주식회사 튜링
Dates
- Publication Date
- 20260506
- Application Date
- 20241025
Claims (20)
- 장치의 프로세서가 특수 문서를 번역하기 위해 생성형 인공지능 모델을 프롬프팅하는 방법으로서, 제1 언어로 작성된 특수 문서를 획득하는 단계; 제1 언어의 용어와 제2 언어의 용어 간 대응관계를 포함하는 번역 사전을 획득하는 단계; 상기 제1 언어로 작성된 특수 문서 및 상기 번역 사전의 적어도 일부를 포함하는 입력 데이터를 생성하는 단계; 및 상기 입력 데이터를 생성형 인공지능 모델에 입력하는 단계;를 포함하는, 방법.
- 제1항에 있어서, 상기 번역 사전은 제1 언어의 용어와 제2 언어의 용어를 일대일 또는 다대일 매핑(mapping)시키는 것인, 방법.
- 제1항에 있어서, 상기 특수 문서는 카테고리를 포함하며, 상기 번역 사전은 상기 카테고리별로 상이한, 방법.
- 제1항에 있어서, 상기 특수 문서는 카테고리를 포함하는 것을 특징으로 하며, 상기 카테고리를 기반으로 상기 번역 사전을 수정하는 단계;를 더 포함하는, 방법.
- 제1항에 있어서, 상기 입력 데이터는 제1 입력 데이터 및 상기 제1 입력 데이터보다 뒤에 위치하는 제2 입력 데이터를 포함하고, 상기 제1 입력 데이터는 상기 번역 사전의 적어도 일부를 포함하고, 상기 제2 입력 데이터는 상기 제1 언어로 작성된 특수 문서를 포함하는, 방법.
- 제5항에 있어서, 번역 규칙을 획득하는 단계;를 더 포함하며, 상기 입력 데이터는 상기 번역 규칙을 더 포함하는, 방법.
- 제6항에 있어서, 상기 입력 데이터는 제1 입력 데이터와 제2 입력 데이터 사이에 위치하는 제3 입력 데이터를 더 포함하고, 상기 제3 입력 데이터는 상기 번역 규칙을 포함하는, 방법.
- 제6항에 있어서, 상기 번역 규칙은 사용 금지 문자(character) 관련 정보를 포함하는, 방법.
- 제6항에 있어서, 상기 번역 규칙은 제2 언어의 종결어미 관련 정보를 포함하는, 방법.
- 제1항에 있어서, 제1 언어의 표현을 제2 언어의 표현으로 번역한 예시 목록을 획득하는 단계;를 더 포함하고, 상기 입력 데이터는 상기 예시 목록의 적어도 일부를 더 포함하는, 방법.
- 제10항에 있어서, 상기 입력 데이터는 제1 입력 데이터 및 상기 제1 입력 데이터보다 뒤에 위치하는 제2 입력 데이터를 포함하고, 상기 제1 입력 데이터는 상기 번역 사전의 적어도 일부 및 상기 예시 목록의 적어도 일부를 포함하고, 상기 제2 입력 데이터는 상기 제1 언어로 작성된 특수 문서를 포함하는, 방법.
- 제11항에 있어서, 상기 입력 데이터를 생성하는 단계는, 상기 특수 문서를 임베딩(embedding)하여 특수 문서 벡터를 획득하는 단계; 상기 예시 목록에 포함된 예시 각각을 임베딩하여 예시 벡터를 획득하는 단계; 상기 예시 벡터 각각에 대하여 상기 특수 문서 벡터와의 유사도를 산출하는 단계; 및 상기 산출한 유사도를 기반으로 상기 예시 목록에 포함된 예시 중 입력 데이터에 포함할 예시를 선정하는 단계;를 포함하는, 방법.
- 제1항에 있어서, 제2 언어로 작성된 관련 문서를 획득하는 단계;를 더 포함하고, 상기 입력 데이터는 상기 관련 문서를 더 포함하는, 방법.
- 제13항에 있어서, 상기 입력 데이터는 제1 입력 데이터 및 상기 제1 입력 데이터보다 뒤에 위치하는 제2 입력 데이터를 포함하고, 상기 제1 입력 데이터는 상기 번역 사전의 적어도 일부를 포함하고, 상기 제2 입력 데이터는 상기 제1 언어로 작성된 특수 문서 및 상기 특수 문서보다 앞에 위치하는 상기 관련 문서를 포함하는, 방법.
- 제1항에 있어서, 상기 입력 데이터를 생성하는 단계는, 상기 특수 문서를 임베딩(embedding)하여 특수 문서 벡터를 획득하는 단계; 상기 번역 사전에 포함된 대응관계 각각을 임베딩하여 대응관계 벡터를 획득하는 단계; 상기 대응관계 벡터 각각에 대하여 상기 특수 문서 벡터와의 유사도를 산출하는 단계; 및 상기 산출한 유사도를 기반으로 상기 번역 사전에 포함된 대응관계 중 입력 데이터에 포함할 대응관계를 선정하는 단계;를 포함하는, 방법.
- 제15항에 있어서, 상기 유사도는 코사인 유사도(cosine similarity)인, 방법.
- 제1항에 있어서, 사용자의 모바일 기기에 설치 가능한 어플리케이션을 배포하는 단계; 상기 생성형 인공지능 모델로부터 출력 데이터를 획득하는 단계; 및 상기 출력 데이터를 상기 어플리케이션에 전송하여 상기 모바일 기기의 디스플레이에 시각적으로 표시하도록 하는 단계;를 더 포함하는, 방법.
- 제17항에 있어서, 상기 특수 문서를 획득하는 단계는, 상기 어플리케이션을 통해 상기 모바일 기기로부터 획득한 요청에 기반하여 수행되는, 방법.
- 특수 문서를 번역하기 위해 생성형 인공지능 모델을 프롬프팅하는 장치로서, 생성형 인공지능 모델에 입력할 데이터의 생성에 필요한 정보를 저장하는 메모리; 및 프로세서;를 포함하고, 상기 프로세서는, 제1 언어로 작성된 특수 문서를 획득하고, 제1 언어의 용어와 제2 언어의 용어 간 대응관계를 포함하는 번역 사전을 획득하고, 상기 제1 언어로 작성된 특수 문서 및 상기 번역 사전의 적어도 일부를 포함하는 입력 데이터를 생성하고, 상기 입력 데이터를 생성형 인공지능 모델에 입력하는, 장치.
- 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 장치의 프로세서에서 실행되는 경우, 특수 문서를 번역하기 위해 생성형 인공지능 모델을 프롬프팅하는 단계들을 수행하며, 상기 단계들은, 제1 언어로 작성된 특수 문서를 획득하는 단계; 제1 언어의 용어와 제2 언어의 용어 간 대응관계를 포함하는 번역 사전을 획득하는 단계; 상기 제1 언어로 작성된 특수 문서 및 상기 번역 사전의 적어도 일부를 포함하는 입력 데이터를 생성하는 단계; 및 상기 입력 데이터를 생성형 인공지능 모델에 입력하는 단계;를 포함하는, 프로그램.
Description
생성형 인공지능의 특징에 기반한 특수 문서 번역 방법{An method to translate exceptional document, based on the characteristics of GenAI} 본 발명은 인공지능 기반 특수 문서 번역 방법에 관한 것으로, 더 상세하게는 생성형 인공지능의 특징을 반영하여 특정한 환경에 부합하는 번역문을 획득하는 방법, 장치, 및 프로그램에 관한 것이다. 최근 기업체들은 업무 또는 인력의 일부를 생성형 인공지능 모델로 대체하고자 하며, 특히 번역과 같이 매일 반복되는 루틴을 자동화하거나 효율성을 높이기 위하여 생성형 인공지능 모델을 적극적으로 사용하는 경향이 있다. 그러나 생성형 인공지능 모델은 입력 데이터의 미세한 차이에도 크게 다른 출력을 생성하는 특성을 가지고 있어 특정한 환경에서, 예를 들어 특정 용어를 많이 사용해야 하거나, 특정 용어를 사용해선 안 되거나, 또는 특정한 말투로 작성해야 하는 특수 문서에 생성형 인공지능 모델을 사용하기에는 제한이 있다. 이러한 특성으로 인해 사용자는 생성형 인공지능을 통하여 번역 작업을 수행한 후 직접 사람을 통한 검토 또는 수정 과정을 거치는 등 추가적인 노력과 시간 투자가 요구된다. 따라서 특수 문서에 대해서도 생성형 인공지능 모델의 잠재력을 최대한 활용하기 위해서는 이러한 도전 과제를 효과적으로 해결할 수 있는 방법론과 도구의 개발이 시급하다. 도 1은 본 발명의 일 실시예에 따라 특수 문서의 번역본을 획득하기 위해 사용되는 구성요소 간 상호작용을 나타내는 블록도이다. 도 2는 본 발명의 일 실시예에 따른 특수 문서 번역에 사용되는 장치의 구성 요소를 나타내는 블록도이다. 도 3은 본 발명의 일 실시예에 따라 힌트를 생성하는 과정을 나타낸 순서도이다. 도 4는 본 발명의 일 실시예에 따라 인공지능 모델을 활용하여 특수 문서를 번역하는 방법을 설명하기 위한 순서도이다. 도 5는 본 발명의 일 실시예에 따라 입력 데이터에 포함되는 각종 데이터를 선정하는 방법을 설명하기 위한 도면이다. 도 6은 본 발명의 일 실시예에 따라 번역 규칙을 획득하는 방법을 설명하기 위한 도면이다. 도 7은 본 발명의 일 실시예와 관련된 생성형 인공지능 모델의 동작 원리를 설명하기 위한 도면이다. 도 8은 본 발명의 일 실시예와 관련된 생성형 인공지능 모델에 데이터가 입력되는 방식을 설명하기 위한 도면이다. 본 실시예들은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 특정한 실시 형태에 대해 범위를 한정하려는 것이 아니며, 본 발명의 실시 예의 다양한 변경(modifications), 균등물(equivalents), 및/또는 대체물(alternatives)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 본 개시를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다. 덧붙여, 하기 실시 예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 기술적 사상의 범위가 하기 실시 예에 한정되는 것은 아니다. 오히려, 이들 실시 예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 발명의 기술적 사상을 완전하게 전달하기 위하여 제공되는 것이다. 본 개시에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 권리범위를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 개시에서, "가진다," "가질 수 있다," "포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다. 본 개시에서, "A 또는 B," "A 또는/및 B 중 적어도 하나," 또는 "A 또는/및 B 중 하나 또는 그 이상"등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B," "A 및 B 중 적어도 하나," 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는 (3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다. 본 개시에서 사용된 "제1," "제2," "첫째," 또는 "둘째,"등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 어떤 구성요소가 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 어떤 구성요소와 다른 구성요소 사이에 다른 구성요소(예: 제3 구성요소)가 존재하지 않는 것으로 이해될 수 있다. 본 개시에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to)," 또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성된(또는 설정된)"은 하드웨어적으로 "특별히 설계된(specifically designed to)" 것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다. 실시 예에 있어서 '모듈' 혹은 '부'는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '모듈' 혹은 복수의 '부'는 특정한 하드웨어로 구현될 필요가 있는 '모듈' 혹은 '부'를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다. 한편, 도면에서의 다양한 요소와 영역은 개략적으로 그려진 것이다. 따라서, 본 발명의 기술적 사상은 첨부한 도면에 그려진 상대적인 크기나 간격에 의해 제한되지 않는다. 모델이란, 기 정의된 형태의 데이터를 입력으로 연산을 수행하여 적어도 하나의 결과값을 출력할 때, 입력부터 출력까지의 과정을 정의하는 알고리즘과, 해당 알고리즘의 수정 또는 실행을 위한 규칙을 포함하는 집합을 의미한다. 모델이 인공 신경망(Artificial neural network, ANN) 모델일 경우, 모델은 생물학적 뉴런의 작동 원리를 모방하여 설계된 그래프 형태의 수학적 모델로, 입력층(또는 입력 레이어)과 출력층(또는 출력 레이어)을 포함하며, 그 외에도 뉴런 또는 노드를 포함하는 하나 이상의 은닉층(또는 히든 레이어, Hidden layer)을 더 포함한다. 은닉층 내 뉴런은 모델 내 다른 뉴런으로부터 적어도 하나의 입력을 받아 적어도 하나의 출력값을 생성하는데, 이 때 뉴런 내에서 입력값으로부터 출력값을 생성하는 함수를 활성화 함수(Activation function)이라 한다. 활성화 함수는 시그모이드 함수(Sigmoid function), 렐루 함수(Rectified Linear Unit function, ReLU), 소프트맥스 함수(Softmax function)를 포함할 수 있으나, 이에 한정되지 않으며, 하나의 모델 또는 하나의 층을 구성하는 뉴런 간에 사용되는 활성화 함수가 다를 수 있다. 학습이란, 상기 모델의 성능을 향상시키기 위해 수행하는 것으로, 좁게는 모델 내 뉴런의 활성화 함수에 입력되는 각 입력값에 곱해지는 가중치(Weight)와 각 뉴런마다 하나가 설정되어 뉴런의 활성화 정도를 결정하는 편향(Bias)의 값을 정하는 것을 의미하며, 넓게는 가중치와 편향의 값을 정하는 것 외에 모델의 입력값이 될 데이터셋의 생성 또는 수집, 생성 또는 수집한 데이터의 전처리, 사용할 모델에 대한 선택 또는 설계, 정해진 가중치 및 편향에 기반한 모델의 평가, 개선, 및 최적화를 모두 포함하는 일련의 과정을 의미한다. 학습 과정 중 일부는 모델의 성능을 향상시키기 위해 반복적으로 수행될 수 있다. 생성형 인공지능 기술은 주어진 데이터를 기반으로 새로운 콘텐츠를 생성하는 인공지능의 한 분야로, 기존 인공지능 기술이 데이터를 분석하거나 분류하는 것에 비해, 텍스트, 이미지, 음성 등 다양한 형태의 데이터를 새롭게 만들어 낼 수 있다는 차이점을 가진다. 생성형 인공지능 기술은 주로 딥러닝과 생성 모델을 활용하며, 생성형 인공지능 기술에 사용되는 대표적인 알고리즘으로는 생성적 적대 신경망(Generative Adversarial Networks; GAN), 변형 오토인코더(Variational AutoEncoder; VAE), 트랜스포머(Transformer) 기반 모델 등이 있다. 이하에서는 첨부한 도면을 참고하여 본 개시에 따른 실시 예에 대하여 본 개시가 속하