KR-20260061602-A - ELECTRONIC DEVICE FOR CLASSIFICATION OF ANATOMICAL THERAPEUTIC CHEMICAL(ATC) CODE BASED ON PREDICTIVE MODEL AND METHOD OPERATION THEREOF
Abstract
다양한 실시예에 따르면, 예측 모델 기반 ATC(anatomical therapeutic chemical) 코드의 분류를 위한 전자 장치에 있어서, 통신 인터페이스; 및 프로세서; 를 포함하고, 상기 프로세서는, 상기 통신 인터페이스로부터, 화학식 구조로 구성된 적어도 하나의 화학 이미지 데이터 및 화학 수식으로 구성된 적어도 하나의 화학 텍스트 데이터를 획득하고, 상기 적어도 하나의 화학 이미지 데이터를 제1 서브 딥러닝 모델에 입력하여 적어도 하나의 화학 구조 결합 데이터를 출력하고, 상기 적어도 하나의 화학 텍스트 데이터를 제2 서브 딥러닝 모델에 입력하여 적어도 하나의 화학 선형 결합 데이터를 출력하고, 상기 적어도 하나의 화학 구조 결합 데이터 및 상기 적어도 하나의 화학 선형 데이터를 상기 예측 모델에 입력하여 적어도 하나의 화학 결과 데이터를 출력하고, 및 상기 적어도 하나의 결과 데이터가 기 설정된 제1 임계 값을 초과하면, 상기 적어도 하나의 결과 데이터에 포함된 화학물이 약물에 적합한 기능을 갖춘 화학 제품으로 판단하도록 설정되고, 상기 예측 모델은, 복수의 화학 구조 결합 데이터 및 복수의 화학 선형 데이터와, 복수의 화학 결과 데이터 및 복수의 전문의에 판별된 복수의 화학 제품에 기반하여 학습된다.
Inventors
- 신종호
- 김춘성
- 이숙영
- 우태경
- 소민섭
- 키벳 던칸
Assignees
- 조선대학교산학협력단
Dates
- Publication Date
- 20260506
- Application Date
- 20241028
Claims (10)
- 예측 모델 기반 ATC(anatomical therapeutic chemical) 코드의 분류를 위한 전자 장치에 있어서, 통신 인터페이스; 및 프로세서; 를 포함하고, 상기 프로세서는, 상기 통신 인터페이스로부터, 화학식 구조로 구성된 적어도 하나의 화학 이미지 데이터 및 화학 수식으로 구성된 적어도 하나의 화학 텍스트 데이터를 획득하고, 상기 적어도 하나의 화학 이미지 데이터를 제1 서브 딥러닝 모델에 입력하여 적어도 하나의 화학 구조 결합 데이터를 출력하고, 상기 적어도 하나의 화학 텍스트 데이터를 제2 서브 딥러닝 모델에 입력하여 적어도 하나의 화학 선형 결합 데이터를 출력하고, 상기 적어도 하나의 화학 구조 결합 데이터 및 상기 적어도 하나의 화학 선형 데이터를 상기 예측 모델에 입력하여 적어도 하나의 화학 결과 데이터를 출력하고, 및 상기 적어도 하나의 결과 데이터가 기 설정된 제1 임계 값을 초과하면, 상기 적어도 하나의 결과 데이터에 포함된 화학물이 약물에 적합한 기능을 갖춘 화학 제품으로 판단하도록 설정되고, 상기 예측 모델은, 복수의 화학 구조 결합 데이터 및 복수의 화학 선형 데이터와, 복수의 화학 결과 데이터 및 복수의 전문의에 판별된 복수의 화학 제품에 기반하여 학습되는, 전자 장치.
- 제1 항에 있어서, 상기 적어도 하나의 화학 이미지 데이터는, 적어도 하나의 원자 이미지 데이터와, 상기 적어도 하나의 원자 이미지 데이터 간을 각각 연결하는 적어도 하나의 원자 공유 결합 이미지 데이터를 포함하고, 상기 적어도 하나의 화학 텍스트 데이터는, 상기 적어도 하나의 원자 이미지 데이터와 매칭되는 적어도 하나의 원자 기호 데이터, 상기 적어도 하나의 화학 이미지 데이터에 복수개의 원자 및 결합 구조에 따른 원자 개수 데이터, 및 상기 적어도 하나의 화학 이미지 데이터의 결합구조와 매칭되는 적어도 하나의 괄호 데이터를 포함하도록 설정되는, 전자 장치.
- 제2 항에 있어서, 상기 프로세서는, 상기 적어도 하나의 원자 이미지 데이터를 각각 적어도 하나의 제1 노드로 변경하면서, 상기 적어도 하나의 제1 노드를 제1 행렬에 결합하고, 상기 적어도 하나의 원자 공유 결합 이미지 데이터를 각각 적어도 하나의 제1 엣지로 변경하면서, 상기 적어도 하나의 제1 엣지를 제2 행렬에 결합하고, 및 상기 제1 행렬 및 상기 제2 행렬을 상기 제1 딥러닝 모델에 입력하여 상기 적어도 하나의 화학 구조 결합 데이터를 출력하도록 설정하고, 상기 제1 딥러닝 모델은, 복수의 제1 노드, 복수의 제1 엣지, 복수의 제1 행렬, 및 복수의 제2 행렬과, 복수의 화학 구조 결합 데이터에 기반하여 학습되는, 전자 장치.
- 제3 항에 있어서, 상기 프로세서는, 상기 적어도 하나의 원자 기호 데이터에 결합 요소에 따라 각각 기호를 변경하고, 변경된 상기 적어도 하나의 원자 기호 데이터를 각각 적어도 하나의 제2 노드로 변경하고, 복수개의 원자 기호 데이터가 있는 상기 적어도 하나의 제2 노드에 상기 적어도 하나의 원자 개수 데이터를 적용하여 적어도 하나의 제3 노드를 적용하고, 상기 적어도 하나의 괄호 데이터를 각각 적어도 하나의 제2 엣지로 변경하고, 및 상기 제2 노드, 상기 제3 노드, 및 상기 제2 엣지를 상기 제2 딥러닝 모델에 입력하여 상기 적어도 하나의 화학 선형 결합 데이터를 출력하도록 설정되고, 상기 제2 서브 딥러닝 모델은, 복수의 제2 노드, 복수의 제3 노드, 및 복수의 제2 엣지와, 복수의 화학 선형 결합 데이터, 복수의 스마일식 코드, 및 ACS|| 인코딩 방식 코드에 기반하여 학습되는, 전자 장치.
- 제4 항에 있어서, 상기 프로세서는, 상기 적어도 하나의 원자 기호 데이터에서 기 설정된 제2 임계 값을 초과하지 않으면, 상기 적어도 하나의 원자 기호 데이터에서 이성질체가 아닌 것으로 판단하고, ATC(anatomical therapeutic chemical) 레벨 명칭을 기반으로 상기 적어도 하나의 원자 기호 데이터를 상기 제2 노드로 변경하고, 상기 적어도 하나의 원자 기호 데이터에서 상기 제2 임계 값을 초과하면, 상기 적어도 하나의 원자 기호 데이터에서 이성질체인 것으로 판단하고, 상기 이성질체인 것으로 판단된 상기 적어도 하나의 원자 기호 데이터를 기 설정된 제3 임계 값을 초과하지 않으면, 상기 적어도 하나의 원자 기호 데이터에서 화학 구조식이 별도인 것으로 판단하여, 상기 적어도 하나의 원자 기호 데이터를 상기 괄호 형태에 따라 변경된 상태로 상기 제2 노드로 변경하고, 및 상기 이성질체인 것으로 판단된 상기 적어도 하나의 원자 기호 데이터를 상기 제3 임계 값을 초과하면, 상기 적어도 하나의 원자 기호 데이터에서 화학 구조식이 별도인 것으로 판단하여 상기 적어도 하나의 원자 기호 데이터를 상기 제2 노드로 변경하지 않도록 설정되는, 전자 장치.
- 예측 모델 기반 ATC(anatomical therapeutic chemical) 코드의 분류를 위한 전자 장치의 구동 방법에 있어서, 상기 방법은, 통신 인터페이스로부터, 화학식 구조로 구성된 적어도 하나의 화학 이미지 데이터 및 화학 수식으로 구성된 적어도 하나의 화학 텍스트 데이터를 획득하고, 프로세서를 통하여, 상기 적어도 하나의 화학 이미지 데이터를 제1 서브 딥러닝 모델에 입력하여 적어도 하나의 화학 구조 결합 데이터를 출력하고, 상기 적어도 하나의 화학 텍스트 데이터를 제2 서브 딥러닝 모델에 입력하여 적어도 하나의 화학 선형 결합 데이터를 출력하고, 상기 프로세서를 통하여, 상기 적어도 하나의 화학 구조 결합 데이터 및 상기 적어도 하나의 화학 선형 데이터를 상기 예측 모델에 입력하여 적어도 하나의 화학 결과 데이터를 출력하고, 및 상기 프로세서를 통하여, 상기 적어도 하나의 결과 데이터가 기 설정된 제1 임계 값을 초과하면, 상기 적어도 하나의 결과 데이터에 포함된 화학물이 약물에 적합한 기능을 갖춘 화학 제품으로 판단하도록 설정되고, 상기 예측 모델은, 복수의 화학 구조 결합 데이터 및 복수의 화학 선형 데이터와, 복수의 화학 결과 데이터 및 복수의 전문의에 판별된 복수의 화학 제품에 기반하여 학습되는, 방법.
- 제6 항에 있어서, 상기 적어도 하나의 화학 이미지 데이터는, 적어도 하나의 원자 이미지 데이터와, 상기 적어도 하나의 원자 이미지 데이터 간을 각각 연결하는 적어도 하나의 원자 공유 결합 이미지 데이터를 포함하고, 상기 적어도 하나의 화학 텍스트 데이터는, 상기 적어도 하나의 원자 이미지 데이터와 매칭되는 적어도 하나의 원자 기호 데이터, 상기 적어도 하나의 화학 이미지 데이터에 복수개의 원자 및 결합 구조에 따른 원자 개수 데이터, 및 상기 적어도 하나의 화학 이미지 데이터의 결합구조와 매칭되는 적어도 하나의 괄호 데이터를 포함하도록 설정되는, 방법.
- 제7 항에 있어서, 상기 방법은, 상기 적어도 하나의 원자 이미지 데이터를 각각 적어도 하나의 제1 노드로 변경하면서, 상기 적어도 하나의 제1 노드를 제1 행렬에 결합하고, 상기 적어도 하나의 원자 공유 결합 이미지 데이터를 각각 적어도 하나의 제1 엣지로 변경하면서, 상기 적어도 하나의 제1 엣지를 제2 행렬에 결합하고, 및 상기 제1 행렬 및 상기 제2 행렬을 상기 제1 딥러닝 모델에 입력하여 상기 적어도 하나의 화학 구조 결합 데이터를 출력하도록 설정하고, 상기 제1 딥러닝 모델은, 복수의 제1 노드, 복수의 제1 엣지, 복수의 제1 행렬, 및 복수의 제2 행렬과, 복수의 화학 구조 결합 데이터에 기반하여 학습되는, 방법.
- 제8 항에 있어서, 상기 방법은, 상기 적어도 하나의 원자 기호 데이터에 결합 요소에 따라 각각 기호를 변경하고, 변경된 상기 적어도 하나의 원자 기호 데이터를 각각 적어도 하나의 제2 노드로 변경하고, 복수개의 원자 기호 데이터가 있는 상기 적어도 하나의 제2 노드에 상기 적어도 하나의 원자 개수 데이터를 적용하여 적어도 하나의 제3 노드를 적용하고, 상기 적어도 하나의 괄호 데이터를 각각 적어도 하나의 제2 엣지로 변경하고, 및 상기 제2 노드, 상기 제3 노드, 및 상기 제2 엣지를 상기 제2 딥러닝 모델에 입력하여 상기 적어도 하나의 화학 선형 결합 데이터를 출력하도록 설정되고, 상기 제2 서브 딥러닝 모델은, 복수의 제2 노드, 복수의 제3 노드, 및 복수의 제2 엣지와, 복수의 화학 선형 결합 데이터, 복수의 스마일식 코드, 및 ACS|| 인코딩 방식 코드에 기반하여 학습되는, 방법.
- 제9 항에 있어서, 상기 방법은, 상기 적어도 하나의 원자 기호 데이터에서 기 설정된 제2 임계 값을 초과하지 않으면, 상기 적어도 하나의 원자 기호 데이터에서 이성질체가 아닌 것으로 판단하고, ATC(anatomical therapeutic chemical) 레벨 명칭을 기반으로 상기 적어도 하나의 원자 기호 데이터를 상기 제2 노드로 변경하고, 상기 적어도 하나의 원자 기호 데이터에서 상기 제2 임계 값을 초과하면, 상기 적어도 하나의 원자 기호 데이터에서 이성질체인 것으로 판단하고, 상기 이성질체인 것으로 판단된 상기 적어도 하나의 원자 기호 데이터를 기 설정된 제3 임계 값을 초과하지 않으면, 상기 적어도 하나의 원자 기호 데이터에서 화학 구조식이 별도인 것으로 판단하여, 상기 적어도 하나의 원자 기호 데이터를 상기 괄호 형태에 따라 변경된 상태로 상기 제2 노드로 변경하고, 및 상기 이성질체인 것으로 판단된 상기 적어도 하나의 원자 기호 데이터를 상기 제3 임계 값을 초과하면, 상기 적어도 하나의 원자 기호 데이터에서 화학 구조식이 별도인 것으로 판단하여 상기 적어도 하나의 원자 기호 데이터를 상기 제2 노드로 변경하지 않도록 설정되는, 방법.
Description
예측 모델 기반 ATC(anatomical therapeutic chemical) 코드의 분류를 위한 전자 장치 및 그 구동 방법{ELECTRONIC DEVICE FOR CLASSIFICATION OF ANATOMICAL THERAPEUTIC CHEMICAL(ATC) CODE BASED ON PREDICTIVE MODEL AND METHOD OPERATION THEREOF} 본 발명의 다양한 실시예는, 예측 모델 기반 ATC(anatomical therapeutic chemical) 코드의 분류를 위한 전자 장치 및 그 구동 방법에 관한 것이다. 다양한 화학품 및 약품을 개발하기 위해서는 다양한 신약 및 개발 프로세서가 진행되고 있었다. 이러한, 신약 개발 프로세스가 정확하게 검증된 데이터인지를 확인하기 위해서 다양한 사람을 통해 실제 사람 및/또는 동물에 대해 약물을 투여하여 신약을 개발한 것에 대해 검증해왔다. 그러나 종래의 경우 상기와 같이 반복적인 실험을 통해 목표하는 효능을 도출할 때까지 반복적으로 수행하여 시간, 노력, 자원이 많이 소모되는 문제점이 있었다. 또한, 이러한 종래의 경우는 전문가마다 다른 판단을 수행하여 정확성 및 일관성에 차이가 있고, 실험에 대한 외부적인 요인으로 인해 실험 결과의 차이가 발생될 우려와 신뢰성이 저하되는 문제점이 있었다. 따라서, 이러한 문제를 극복하기 위하여, 인공지능 모델을 통해 별도의 사고실험을 직접적으로 수행하지 않으면서도 좋은 결과 값을 얻을 수 있는 발명이 필요한 실정이다. 도 1은 본 발명의 다양한 실시예에 따른 전자 장치 및 네트워크의 블록도를 도시한다. 도 2는 다양한 실시예들에 따른, 전자 장치가 동작하는 방법을 설명하기 위한 흐름도이다. 도 3은 다양한 실시예들에 따른, 전자 장치가 화학식을 기초로 예측 모델에 입력하는 방법을 설명하기 위한 예시도이다. 도 4는 다양한 실시예들에 따른, 각 서브 딥러닝 모델을 기반으로 학습되는 예시도이다. 도 5는 다양한 실시예들에 따른, 예측 모델에 입력 데이터, 학습 데이터, 및 출력 데이터를 설명하기 위한 예시도이다. 도 6은 다양한 실시예들에 따른, 화학식을 기초로 학습 데이터를 최소화 및 구별하는 것을 설명하기 위한 예시도이다. 이하, 본 문서의 다양한 실시예들이 첨부된 도면을 참조하여 기재된다. 실시예 및 이에 사용된 용어들은 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 및/또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 본 문서에서, "A 또는 B" 또는 "A 및/또는 B 중 적어도 하나" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1," "제 2," "첫째," 또는 "둘째,"등의 표현들은 해당 구성요소들을, 순서 또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에 "(기능적으로 또는 통신적으로) 연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제 3 구성요소)를 통하여 연결될 수 있다. 본 문서에서, "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, 하드웨어적 또는 소프트웨어적으로 "~에 적합한," "~하는 능력을 가지는," "~하도록 변경된," "~하도록 만들어진," "~를 할 수 있는," 또는 "~하도록 설계된"과 상호 호환적으로(interchangeably) 사용될 수 있다. 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(예: CPU 또는 application processor)를 의미할 수 있다. 본 문서의 다양한 실시예들에 따른 전자 장치는, 예를 들면, 스마트폰, 태블릿 PC, 데스크탑 PC, 랩탑 PC, 넷북 컴퓨터, 워크스테이션, 서버 중 적어도 하나를 포함할 수 있다. 도 1을 참조하여, 다양한 실시예에서의, 네트워크 환경(100) 내의 전자 장치(101)가 기재된다. 전자 장치(101)는 버스(110), 프로세서(120), 메모리(130), 입출력 인터페이스(140), 디스플레이(150), 및 통신 인터페이스(160)를 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)는, 구성요소들 중 적어도 하나를 생략하거나 다른 구성요소를 추가적으로 구비할 수 있다. 버스(110)는 구성요소들(110-160)을 서로 연결하고, 구성요소들 간의 통신(예: 제어 메시지 또는 데이터)을 전달하는 회로를 포함할 수 있다. 프로세서(120)는, 중앙처리장치, 어플리케이션 프로세서, 또는 커뮤니케이션 프로세서(communication processor(CP)) 중 하나 또는 그 이상을 포함할 수 있다. 프로세서(120)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 실행할 수 있다. 메모리(130)는, 휘발성 및/또는 비휘발성 메모리를 포함할 수 있다. 메모리(130)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 저장할 수 있다. 한 실시예에 따르면, 메모리(130)는 소프트웨어 및/또는 프로그램(140)을 저장할 수 있다. 입출력 인터페이스(140)는, 예를 들면, 환자 또는 다른 외부 기기로부터 입력된 명령 또는 데이터를 전자 장치(101)의 다른 구성요소(들)에 전달하거나, 또는 전자 장치(101)의 다른 구성요소(들)로부터 수신된 명령 또는 데이터를 환자 또는 다른 외부 기기로 출력할 수 있다. 디스플레이(150)는, 예를 들면, 액정 디스플레이(LCD), 발광 다이오드(LED) 디스플레이, 유기 발광 다이오드(OLED) 디스플레이, 또는 마이크로 전자기계 시스템 (MEMS) 디스플레이, 또는 전자종이(electronic paper) 디스플레이를 포함할 수 있다. 디스플레이(150)는, 예를 들면, 환자에게 각종 콘텐츠(예: 텍스트, 이미지, 비디오, 아이콘, 및/또는 심볼 등)을 표시할 수 있다. 디스플레이(150)는, 터치 스크린을 포함할 수 있으며, 예를 들면, 전자 펜 또는 환자의 신체의 일부를 이용한 터치, 제스쳐, 근접, 또는 호버링 입력을 수신할 수 있다. 통신 인터페이스(160)는, 예를 들면, 전자 장치(101)와 외부 장치(예: 제 1 외부 전자 장치(102), 제 2 외부 전자 장치(104), 또는 서버(108)) 간의 통신을 설정할 수 있다. 예를 들면, 통신 인터페이스(160)는 무선 통신 또는 유선 통신을 통해서 네트워크(162)에 연결되어 외부 장치(예: 제 2 외부 전자 장치(104) 또는 서버(108))와 통신할 수 있다. 무선 통신은, 예를 들면, LTE, LTE-A(LTE Advance), CDMA(code division multiple access), WCDMA(wideband CDMA), UMTS(universal mobile telecommunications system), WiBro(Wireless Broadband), 또는 GSM(Global System for Mobile Communications) 등 중 적어도 하나를 사용하는 셀룰러 통신을 포함할 수 있다. 한 실시예에 따르면, 무선 통신은, 예를 들면, WiFi(wireless fidelity), 블루투스, 블루투스 저전력(BLE), 지그비(Zigbee), NFC(near field communication), 자력 시큐어 트랜스미션(Magnetic Secure Transmission), 라디오 프리퀀시(RF), 또는 보디 에어리어 네트워크(BAN) 중 적어도 하나를 포함할 수 있다. 한실시예에 따르면, 무선 통신은 GNSS를 포함할 수 있다. GNSS는, 예를 들면, GPS(Global Positioning System), Glonass(Global Navigation Satellite System), Beidou Navigation Satellite System(이하 "Beidou") 또는 Galileo, the European global satellite-based navigation system일 수 있다. 이하, 본 문서에서는, "GPS"는 "GNSS"와 상호 호환적으로 사용될 수 있다. 유선 통신은, 예를 들면, USB(universal serial bus), HDMI(high definition multimedia interface), RS-232(recommended standard232), 전력선 통신, 또는 POTS(plain old telephone service) 등 중 적어도 하나를 포함할 수 있다. 네트워크(162)는 텔레커뮤니케이션 네트워크, 예를 들면, 컴퓨터 네트워크(예: LAN 또는 WAN), 인터넷, 또는 텔레폰 네트워크 중 적어도 하나를 포함할 수 있다. 제 1 및 제 2 외부 전자 장치(102, 104, 106) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 다양한 실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 다른 하나 또는 복수의 전자 장치(예: 전자 장치(102, 104, 106), 또는 서버(108)에서 실행될 수 있다. 한 실시예에 따르면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로 또는 요청에 의하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 그와 연관된