KR-20260060970-A - METHOD AND SYSTEM FOR SIMULATION BASED MACHINE LEARNING MODEL

KR20260060970AKR 20260060970 AKR20260060970 AKR 20260060970AKR-20260060970-A

Abstract

저항성 메모리 소자의 공정 시뮬레이션을 수행하는 방법은, 산화층 두께 데이터 및 입력 전압 데이터를 획득하는 단계, 기계 학습 모델에 기초하여 입력 전압에 대응하는 전류 및 전류에 대한 분산을 예측함으로써, 예측된 전류 데이터 및 전류에 대한 예측된 분산 데이터를 생성하는 단계 및 기계 학습 모델에 기초하여 실제 전류와 예측된 전류 사이의 차이에 대한 모델 분산 데이터를 생성하는 단계를 포함할 수 있다.

Inventors

유주형
정창욱
최재명
홍기용
김영구

Assignees

삼성전자주식회사
울산과학기술원

Dates

Publication Date: 20260506
Application Date: 20250214
Priority Date: 20241025

Claims (20)

저항성 메모리 소자의 소자 시뮬레이션을 수행하는 방법에 있어서, 상기 저항성 메모리 소자의 산화층 두께 데이터 및 입력 전압 데이터를 획득하는 단계; 기계 학습 모델에 기초하여 상기 입력 전압에 대응하는 전류 및 전류에 대한 분산을 예측함으로써, 예측된 전류 데이터 및 전류에 대한 예측된 분산 데이터를 생성하는 단계; 및 상기 기계 학습 모델에 기초하여 실제 전류와 예측된 전류 사이의 차이에 대한 모델 분산 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는, 방법.
제1 항에 있어서, 상기 기계 학습 모델은 복수의 서브 기계 모델들 및 출력 레이어를 포함하고, 상기 예측된 전류 데이터 및 상기 전류에 대한 예측된 분산 데이터를 생성하는 단계는, 상기 복수의 서브 기계 학습 모델들 각각은 상기 산화층 두께 데이터 및 상기 입력 전압 데이터를 획득하는 단계; 및 상기 출력 레이어가 상기 복수의 서브 기계 학습 모델들로부터 예측된 전류 데이터 및 전류에 대한 예측된 분산 데이터를 획득하고, 평균 전류 데이터 및 평균 분산 데이터를 출력하는 단계를 포함하는 것을 특징으로 하는, 방법.
제1 항에 있어서, 상기 기계 학습 모델은 전압 예측 모듈, 상태 결정 모듈 및 전류 예측 모듈을 포함하고, 상기 전압 예측 모듈은, 산화층 두께 데이터에 대응하는 상기 저항성 메모리 소자의 셋(Set) 전압 및 리셋(Reset) 전압을 예측함으로써, 예측된 셋 전압 데이터 및 예측된 리셋 전압 데이터를 생성하는 단계; 상기 상태 결정 모듈은, 상기 입력 전압 데이터, 상기 셋 전압 데이터, 상기 리셋 전압 데이터 및 이전 상태 데이터에 기초하여, 입력 전압에 따른 상태 데이터를 생성하는 단계; 및 상기 전류 예측 모듈은, 상기 산화층 두께 데이터, 상기 입력 전압 데이터 및 상기 입력 전압에 따른 상태 데이터에 기초하여 상기 저항성 메모리 소자의 전류를 예측함으로써, 상기 예측된 전류 데이터 및 상기 전류에 대한 예측된 분산 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는, 방법.
제3 항에 있어서, 상기 상태 결정 모듈이 입력 전압에 따른 상태 데이터를 생성하는 단계는, 상기 상태 결정 모듈이, 입력 전압을 셋 전압 및 리셋 전압과 비교함으로써, 특정 조건의 만족 여부에 기초하여, 이전 상태를 입력 전압에 따른 상태로서 결정하거나, 이전 상태와 상이한 상태를 입력 전압에 따른 상태로서 결정하는 단계를 포함하는 것을 특징으로 하는, 방법.
제3 항에 있어서, 상기 상태 결정 모듈이 입력 전압에 따른 상태 데이터를 생성하는 단계는, 상기 상태 결정 모듈은, 이전 상태가 고저항 상태이고 입력 전압 레벨이 셋 전압 레벨 미만인 경우, 상기 이전 상태를 상기 입력 전압에 따른 상태로서 결정하는 단계를 포함하는 것을 특징으로 하는 방법.
제3 항에 있어서, 상기 상태 결정 모듈이 입력 전압에 따른 상태 데이터를 생성하는 단계는, 상기 상태 결정 모듈은, 이전 상태가 고저항 상태이고 입력 전압 레벨이 셋 전압 레벨 이상인 경우, 상기 이전 상태와 상이한 상태를 상기 입력 전압에 따른 상태로서 결정하는 단계를 포함하는 것을 특징으로 하는 방법.
제3 항에 있어서, 상기 상태 결정 모듈이 입력 전압에 따른 상태 데이터를 생성하는 단계는, 상기 상태 결정 모듈은, 이전 상태가 저저항 상태이고 입력 전압 레벨이 리셋 전압 레벨 이상인 경우, 상기 이전 상태를 상기 입력 전압에 따른 상태로서 결정하는 단계를 포함하는 것을 특징으로 하는 방법.
제3 항에 있어서, 상기 상태 결정 모듈이 입력 전압에 따른 상태 데이터를 생성하는 단계는, 상기 상태 결정 모듈은, 이전 상태가 저저항 상태이고 입력 전압 레벨이 리셋 전압 레벨 미만인 경우, 상기 이전 상태와 상이한 상태를 상기 입력 전압에 따른 상태로서 결정하는 단계를 포함하는 것을 특징으로 하는 방법.
제1 항에 있어서, 상기 기계 학습 모델의 출력 데이터에 기초하여 상기 기계 학습 모델과 상이한 기계 학습 모델을 학습시킴으로써, 압축된 기계 학습 모델을 생성하는 단계를 더 포함하는 것을 특징으로 하는, 방법.
제9 항에 있어서, 상기 압축된 기계 학습 모델을 생성하는 단계는, 상기 압축된 기계 학습 모델의 파라미터 수를 줄이는 프루닝 기법을 적용하는 단계; 및 프루닝 기법이 적용된 압축된 전류 예측 모듈을 상기 기계 학습 모델의 출력 데이터에 기초하여 재학습시키는 단계를 더 포함하는 것을 특징으로 하는, 방법.
명령어들을 포함하는 비일시적 컴퓨터 판독가능 저장 매체로서, 상기 명령어들은, 적어도 하나의 프로세서에 의해서 실행시 상기 적어도 하나의 프로세서로 하여금 청구항 1의 반도체 소자의 소자 시뮬레이션을 수행하는 방법을 수행하도록 하는 것을 특징으로 하는 비일시적 컴퓨터 판독가능 저장 매체.
저항성 메모리 소자의 산화층 두께 데이터 및 입력 전압 데이터를 획득하고, 기계 학습 모델에 기초하여 상기 입력 전압에 대응하는 전류 및 전류에 대한 분산을 예측함으로써, 예측된 전류 데이터 및 전류에 대한 예측된 분산 데이터를 생성하고, 상기 기계 학습 모델에 기초하여 실제 전류와 예측된 전류 사이의 차이에 대한 모델 분산 데이터를 생성하도록 구성된 프로세싱 모듈을 포함하는 것을 특징으로 하는, 컴퓨팅 시스템.
제12 항에 있어서, 상기 기계 학습 모델은 복수의 서브 기계 모델들 및 출력 레이어를 포함하고, 상기 복수의 서브 기계 학습 모델들 각각은 상기 산화층 두께 데이터 및 상기 입력 전압 데이터를 획득하도록 구성되고, 상기 출력 레이어는 상기 복수의 서브 기계 학습 모델들로부터 예측된 전류 데이터 및 전류에 대한 예측된 분산 데이터를 획득하고, 평균 전류 데이터 및 평균 분산 데이터를 출력하도록 구성된 것을 특징으로 하는, 컴퓨팅 시스템.
제12 항에 있어서, 상기 기계 학습 모델은 전압 예측 모듈, 상태 결정 모듈 및 전류 예측 모듈을 포함하고, 상기 전압 예측 모듈은, 산화층 두께 데이터에 대응하는 상기 저항성 메모리 소자의 셋(Set) 전압 및 리셋(Reset) 전압을 예측함으로써, 예측된 셋 전압 데이터 및 예측된 리셋 전압 데이터를 생성하도록 구성되고, 상기 상태 결정 모듈은, 상기 입력 전압 데이터, 상기 셋 전압 데이터, 상기 리셋 전압 데이터 및 이전 상태 데이터에 기초하여, 입력 전압에 따른 상태 데이터를 생성하도록 구성되고, 상기 전류 예측 모듈은, 상기 산화층 두께 데이터, 상기 입력 전압 데이터 및 상기 입력 전압에 따른 상태 데이터에 기초하여 상기 저항성 메모리 소자의 전류를 예측함으로써, 상기 예측된 전류 데이터 및 상기 전류에 대한 예측된 분산 데이터를 생성하도록 구성된 것을 특징으로 하는, 컴퓨팅 시스템.
제14 항에 있어서, 상기 상태 결정 모듈은, 입력 전압을 셋 전압 및 리셋 전압과 비교함으로써, 특정 조건의 만족 여부에 기초하여, 이전 상태를 입력 전압에 따른 상태로서 결정하거나, 이전 상태와 상이한 상태를 입력 전압에 따른 상태로서 결정하도록 구성된 것을 특징으로 하는, 컴퓨팅 시스템.
제14 항에 있어서, 상기 상태 결정 모듈은, 이전 상태가 고저항 상태이고 입력 전압 레벨이 셋 전압 레벨 미만인 경우, 상기 이전 상태를 상기 입력 전압에 따른 상태로서 결정하도록 구성된 것을 특징으로 하는, 컴퓨팅 시스템.
제14 항에 있어서, 상기 상태 결정 모듈은, 이전 상태가 고저항 상태이고 입력 전압 레벨이 셋 전압 레벨 이상인 경우, 상기 이전 상태와 상이한 상태를 상기 입력 전압에 따른 상태로서 결정하도록 구성된 것을 특징으로 하는, 컴퓨팅 시스템.
제14 항에 있어서, 상기 상태 결정 모듈은, 이전 상태가 저저항 상태이고 입력 전압 레벨이 리셋 전압 레벨 이상인 경우, 상기 이전 상태를 상기 입력 전압에 따른 상태로서 결정하도록 구성된 것을 특징으로 하는, 컴퓨팅 시스템.
제14 항에 있어서, 상기 상태 결정 모듈은, 이전 상태가 저저항 상태이고 입력 전압 레벨이 리셋 전압 레벨 미만인 경우, 상기 이전 상태와 상이한 상태를 상기 입력 전압에 따른 상태로서 결정하도록 구성된 것을 특징으로 하는, 컴퓨팅 시스템.
제12 항에 있어서, 상기 프로세싱 모듈은, 상기 기계 학습 모델의 출력 데이터에 기초하여 상기 기계 학습 모델과 상이한 기계 학습 모델을 학습시킴으로써, 압축된 기계 학습 모델을 생성하는 것을 특징으로 하는, 컴퓨팅 시스템.

Description

기계 학습 모델에 기초한 시뮬레이션 방법 및 시스템{METHOD AND SYSTEM FOR SIMULATION BASED MACHINE LEARNING MODEL} 본 개시의 기술적 사상은 기계 학습 모델에 기초한 시뮬레이션 방법 및 시스템에 관한 것으로서, 보다 상세하게는, 기계 학습 기반 컴팩트 모델을 사용하는 시뮬레이션 방법 및 시스템에 관한 것이다. 최근 수년간 기계 학습(Machine Learning) 기술은 데이터 분석, 예측, 최적화 및 시뮬레이션과 같은 다양한 응용 분야에서 빠르게 발전해 왔다. 특히, 기계 학습 기반 모델은 대규모 데이터 세트로부터 특정 시스템이나 현상의 복잡한 행동을 학습하고, 이를 기반으로 효율적이고 정밀한 예측을 수행할 수 있어 주목받고 있다. 이러한 기술은 전통적인 물리 기반 모델이나 경험적 모델에 비해 계산 효율성이 높고, 복잡한 비선형 시스템을 효과적으로 모델링할 수 있다는 장점을 제공한다. 기계 학습 기반의 컴팩트 모델(compact model)은 이러한 기술의 대표적인 응용으로, 높은 예측 정확도를 유지하면서도 모델의 복잡성을 줄이고 계산 속도를 향상시키는 데 초점을 맞추고 있다. 특히, 컴팩트 모델은 반도체, 전자기학, 열역학 등 다양한 기술 분야에서 복잡한 시뮬레이션 작업의 부담을 줄이고, 신속한 의사결정을 지원하기 위한 핵심 도구로 자리잡아 가고 있다. 도 1은 본 개시의 예시적 실시예에 따른 컴퓨팅 시스템의 블록도이다. 도 2는 도 1의 기계 학습 모델의 예측 대상인 저항성 메모리 소자의 일 예를 나타낸 도면이다. 도 3의 (a), (b), (c)는 ReRam의 전도성 필라멘트의 형성 과정을 나타낸 도면이다. 도 4의 (a)는 이상적인 ReRam의 전압에 대한 전류를 도시한 그래프이고, 도 4의 (b)는 실제 ReRam의 전압에 대한 전류를 도시한 그래프이다. 도 5는 본 개시의 예시적 실시예에 따른 서브 기계 학습 모델을 나타내는 도면이다. 도 6은 본 개시의 일 구현예에 따른 서브 기계 학습 모델의 데이터의 흐름을 나타내는 도면이다. 도 7은 본 개시의 예시적 실시예에 따른 도 1의 기계 학습 모델의 일 구현예이다. 도 8은 본 개시의 예시적 실시예에 따른 컴퓨팅 시스템의 블록도이다. 도 9는 도 8의 컴퓨팅 시스템의 지식 증류 기법의 일 예를 설명하기 위한 도면이다. 도 10는 본 개시의 예시적 실시예에 따른 컴퓨팅 시스템의 동작의 예를 보여주는 순서도이다. 도 11의 (a) 및 (b)는 비교예에 따른 기계 학습 모델의 입력 전압에 대응하여 예측된 전류를 나타낸 그래프이고, 도 11의 (c) 및 (d)는 본 개시의 예시적 실시예에 따른 기계 학습 모델의 입력 전압에 대응하여 예측된 전류를 나타낸 그래프이다. 도 12는 본 개시의 예시적 실시예에 따른 컴퓨터 시스템을 나타내는 블록도이다. 도 13는 본 개시의 예시적 실시예에 따른 시스템을 나타내는 블록도이다. 먼저, 본 명세서에 설명되는 "모듈들 각각은" 컴퓨팅 시스템에 포함된 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합에 대응할 수 있다. 하드웨어는, CPU(central processing unit), DSP(digital signal processor), GPU(graphics processing unit)와 같은 프로그램가능(programmable) 컴포넌트, FPGA(field programmable gate array)와 같은 재구성가능(reconfigurable) 컴포넌트 및 IP(intellectual property) 블록과 같은 고정된 기능을 제공하는 컴포넌트 중 적어도 하나를 포함할 수 있다. 소프트웨어는, 프로그램가능 컴포넌트에 의해서 실행가능한 일련의 명령어들 및 컴파일러 등에 의해서 일련의 명령어들로 변환가능한 코드 중 적어도 하나를 포함할 수 있고, 비일시적(non-transitory) 저장 매체에 저장될 수 있다. 본 명세서에서, "기계 학습 모델"은 학습(Training) 가능한 임의의 구조를 가질 수 있다. 예를 들면, 기계 학습 모델은, 인공 신경망(artificial neural network), 결정 트리(decision tree), 서포트 벡터 머신(support vector machine), 베이즈 네트워크(Bayesian network) 및/또는 유전 알고리즘(genetic algorithm) 등을 포함할 수 있다. 이하에서, 기계 학습 모델은 인공 신경망을 주로 참조하여 설명될 것이나, 본 개시의 예시적 실시예들이 이에 제한되지 아니하는 점이 유의된다. 인공 신경망은, 비제한적인 예시로서, CNN(Convolution Neural Network), R-CNN(Region with Convolution Neural Network), RPN(Region Proposal Network), RNN(Recurrent Neural Network), S-DNN(Stacking-based Deep Neural Network), S-SDNN(State-Space Dynamic Neural Network), Deconvolution Network, DBN(Deep Belief Network), RBM(Restricted Boltzmann Machine), Fully Convolutional Network, LSTM(Long Short-Term Memory) Network, Classification Network, Transformer based Network 등을 포함할 수 있다. 본 명세서에서, 기계 학습 모델은 단순하게 모델로도 지칭될 수 있다. 또한, 기계 학습 모델은 프로세싱 모듈이라 지칭될 수도 있다. 프로세싱 모듈은 본 명세서에서 기계 학습 모델을 포함하거나 이를 기반으로 동작하는 데이터 처리 단위를 지칭한다. 예를 들어, 프로세싱 모듈은 주어진 입력 데이터를 분석, 학습, 또는 예측을 통해 처리하며, 이 과정에서 상술한 기계 학습 모델이 사용될 수 있다. 이하, 본 개시의 다양한 실시예가 첨부된 도면을 참조하여 기재된다. 도 1은 본 개시의 예시적 실시예에 따른 컴퓨팅 시스템의 블록도이다. 도 1을 참조하여, 기계 학습 모델(10)을 이용하여 소자 시뮬레이션을 수행하는 방법이 설명된다. 다만, 본 명세서에서, 반도체 공정을 통해서 형성되는 반도체 소자의 속성이 예시들로서 설명될 것이나, 본 개시의 예시적 실시예들이 이에 제한되지 아니하는 점이 유의된다. 또한, 소자 시뮬레이션에 제한되지 않고 본 개시의 실시예는 공정 시뮬레이션에도 적용될 수도 있다. 도 1의 컴퓨팅 시스템(1000)은 기계 학습 모델(10)을 포함할 수 있다. 일부 실시예들에서, 기계 학습 모델(10)을 이용하여 소자 시뮬레이션을 수행하는 방법은, 도 1의 컴퓨팅 시스템(1000)에 의해서 수행될 수 있다. 예를 들면, 도 1의 컴퓨팅 시스템(1000)은 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현되는 적어도 하나의 모듈을 포함할 수 있고, 컴퓨팅 시스템(1000)은 적어도 하나의 모듈을 이용하여 기계 학습 모델(10)을 구현함으로써 소자 시뮬레이션을 수행할 수 있다. 기계 학습 모델(10)은 산화층 두께(tox) 데이터 및 입력 전압(Vt) 데이터를 획득할 수 있다. 기계 학습 모델(10)은 산화층 두께(tox)에 기초하여 입력 전압(Vt)에 대응하는 전류(It)를 예측함으로써, 기계 학습 모델(10)은 예측된 전류(It) 데이터를 생성할 수 있다. 여기서, 산화층 두께(tox) 데이터는 도 2 내지 도 4에서 설명될 저항성 메모리 소자(Resistive Memory Element)의 산화층 두께(tox)를 나타낼 수 있다. 입력 전압(Vt) 데이터는 도 2 내지 도 4에서 설명될 저항성 메모리 소자에 인가되는 전압 레벨을 나타낼 수 있다. 전류(It) 데이터는 산화층 두께(tox) 및 입력 전압(Vt)에 대응하여 도 2 내지 도 4에서 설명될 저항성 메모리 소자에 흐르는 전류(It) 값를 나타낼 수 있다. 또한, 기계 학습 모델(10)은 산화층 두께(tox)에 기초하여 입력 전압(Vt)에 대응하는 전류(It) 및 전류에 대한 분산(σ2_It)을 예측함으로써, 기계 학습 모델(10)은 예측된 전류(It) 데이터 및 전류에 대한 예측된 분산(σ2_It) 데이터를 생성할 수 있다. 여기서, 전류에 대한 예측된 분산(σ2_It) 데이터는 도 2 내지 도 4에서 설명될 저항성 메모리 소자 자체에 존재하는 전류 특성, 즉, 데이터에 대한 랜덤성 산포를 나타내며, 알레토릭 불확실성(Aleatoric Uncertainty) 값이라고 지칭될 수 있다. 즉, 알레토릭 불확실성은 데이터 자체에 내재된 랜덤성에 의해 발생하며, 데이터 자체의 본질적인 불확실성일 수 있다. 또한, 기계 학습 모델(10)은 실제 전류(It_real) 데이터를 추가적으로 획득할 수 있다. 기계 학습 모델(10)은, 실제 전류(It_real) 데이터 및 예측된 전류(It) 데이터에 기초하여, 실제 전류(It_real)와 예측된 전류(It) 사이의 차이에 대한 모델 분산(V(It_real-It)) 데이터를 생성할 수 있다. 여기서, 실제 전류(It_real) 데이터는 입력 전압에 대해 도 2 내지 도 4에서 설명될 저항성 메모리 소자에서 실험적으로 측정된 실제 전류(It_real) 값을 나타낼 수 있다. 또한, 실제 전류(It_real)와 예측된 전류(It) 사이의 차이에 대한 모델 분산(V(It_real-It)) 데이터는, 기계 학습 모델(10) 자체의 신뢰성을 수치화한 것으로서, 인식적 불확실성(Epistemic Uncertainty) 값이라고 지칭될 수 있다. 즉, 인식적 불확실성은 학습 데이터의 부족, 모델 구조의 한계 등에 의해 나타나는 불확실성일 수 있다. 본 개시에 따르면, 기계 학습 모델(10)이 알레토릭 불확실성(Aleatoric Uncertainty) 및 인식적 불확실성(Epistemic Uncertainty)을 분절화하여 모두 예측함으로써, 소자 시뮬레이션의 정확성과 효율성이 향상될 수 있다. 구체적으로, 알레토릭 불확실성(Aleatoric Uncertainty)은 데이터 자체의 내재된 변동성(예: 측정 오차, 환경 변화 등)에서 비롯될 수 있다. 본 개시