KR-20260061836-A - ELECTRONIC APPARATUS AND METHOD FOR PERFORMING JOB SUITABILITY ASSESSMENT BASED DATA TABLE BY PHRASE UNIT
Abstract
본 개시에 따른 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치는 구문 단위의 직무적합도 평가 동작 수행을 위한 적어도 하나의 프로세스가 저장된 메모리; 및 상기 프로세스에 따라 상기 직무적합도 평가 동작을 수행하는 적어도 하나의 프로세서;를 포함하고, 상기 적어도 하나의 프로세서는, 직군 또는 직무 별 역량 요소 기반으로 표준 데이터셋을 구성하고, 상기 표준 데이터셋에서 각 직군 또는 직무에 대해 구성된 복수의 클러스터를 기반으로 클러스터링 키워드를 추출하고, 상기 표준 데이터셋에서 각 텍스트를 기설정된 의미역에 따라 구분하여 라벨링하고, 상기 클러스터링 키워드 및 상기 라벨링된 텍스트를 이용하여 키워드 풀을 구축하고, 입력 데이터에 대해 상기 키워드 풀과의 구문 단위 매칭도에 따라 직무 적합도를 평가하도록 구성될 수 있다.
Inventors
- 이준협
- 김다애
Assignees
- 주식회사 무하유
Dates
- Publication Date
- 20260506
- Application Date
- 20241028
Claims (10)
- 구문 단위의 직무적합도 평가 동작 수행을 위한 적어도 하나의 프로세스가 저장된 메모리; 및 상기 프로세스에 따라 상기 직무적합도 평가 동작을 수행하는 적어도 하나의 프로세서;를 포함하고, 상기 적어도 하나의 프로세서는, 직군 또는 직무 별 역량 요소 기반으로 표준 데이터셋을 구성하고, 상기 표준 데이터셋에서 각 직군 또는 직무에 대해 구성된 복수의 클러스터를 기반으로 클러스터링 키워드를 추출하고, 상기 표준 데이터셋에서 각 텍스트를 기설정된 의미역에 따라 구분하여 라벨링하고, 상기 클러스터링 키워드 및 상기 라벨링된 텍스트를 이용하여 키워드 풀을 구축하고, 입력 데이터에 대해 상기 키워드 풀과의 구문 단위 매칭도에 따라 직무 적합도를 평가하도록 구성된 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치.
- 제1 항에 있어서, 상기 적어도 하나의 프로세서는, 상기 표준 데이터셋에서 각 직무에 대응하는 문서 내 단어에 품사를 라벨링하여 전처리하고, 각 직무에 대응하는 문서 내 단어 빈도 분석을 기반으로 상기 단어를 복수의 클러스터로 클러스터링하도록 구성된 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치.
- 제2 항에 있어서, 상기 적어도 하나의 프로세서는, 상기 복수의 클러스터 내 각 단어의 TF-IDF(Term Frequency-Inverse Document Frequency) 및 IDF(Inverse Document Frequency)를 계산하고, 기설정된 희소 단어의 기준값보다 낮은 IDF를 가진 단어를 상기 복수의 클러스터 내에서 제거하고, 기설정된 직무 별 단어 기준값보다 낮은 TF/IDF를 가진 단어를 많이 포함하는 상위 m개의 클러스터를 제거한 후 클러스터링 키워드를 추출하도록 구성되며, m은 양의 정수인, 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치.
- 제2 항에 있어서, 상기 적어도 하나의 프로세서는, 직무 별 적어도 하나의 힌트 키워드를 획득하고, 상기 힌트 키워드의 임베딩 벡터와 기설정된 직무 기준값 이상 차이나는 임베딩 벡터를 가진 단어를 많이 포함하는 상위 n개의 클러스터를 제거한 후 클러스터링 키워드를 추출하도록 구성되며, n은 양의 정수인, 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치.
- 제1 항에 있어서, 상기 적어도 하나의 프로세서는, 상기 표준 데이터셋에서 각 텍스트를 기설정된 의미역에 따라 구분하여 라벨링하기 전에, 머신러닝모델을 이용하여 각 텍스트를 의미론적 기준에 따라 구문 별로 분할하도록 구성된 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치.
- 제5 항에 있어서, 상기 적어도 하나의 프로세서는, 단어 시퀀스와 상기 단어 시퀀스의 의미역을 라벨링한 학습 데이터를 통해 학습된 인공지능 모델을 이용하여 직무 별 텍스트에서 분할된 구문에 대해 대응하는 의미역을 라벨링하도록 구성된 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치.
- 제6 항에 있어서, 상기 적어도 하나의 프로세서는, 복수의 분할된 구문에 대해 동일한 의미역이 라벨링될 경우, 상기 복수의 분할된 구문을 형태소 단위로 변환하여 병렬로 배치 및 출력하도록 구성된 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치.
- 제1 항에 있어서, 상기 적어도 하나의 프로세서는, 텍스트가 포함된 문서의 종류, 직무, 상기 직무의 평가 요소, 직무 별 상기 클러스터링 키워드, 상기 클러스터링 키워드가 포함된 구문 및 상기 구문에 라벨링된 의미역을 이용하여 데이터 테이블 형태의 키워드 풀을 구축하고, 입력 데이터를 상기 데이터 테이블 형태로 분석하여 상기 키워드 풀과의 구문 단위 매칭도에 따라 직무 적합도를 평가하도록 구성된 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치.
- 제8 항에 있어서, 상기 적어도 하나의 프로세서는, 상기 입력 데이터와 상기 키워드 풀의 데이터 데이터 테이블을 비교하여 라벨링된 의미역이 동일한 구문에 대해 형태소 단위로 유사도 점수를 계산하고, 상기 유사도 점수에 라벨링된 의미역에 대응하는 직무 별 가중치를 적용하여 임의의 직군에 대한 직무 적합도를 산출하도록 구성된 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치.
- 장치의 프로세서에 의해 수행되는 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 방법에 있어서, 직군 또는 직무 별 역량 요소 기반으로 표준 데이터셋을 구성하는 단계; 상기 표준 데이터셋에서 각 직군 또는 직무에 대해 구성된 복수의 클러스터를 기반으로 클러스터링 키워드를 추출하는 단계; 상기 표준 데이터셋에서 각 텍스트를 기설정된 의미역에 따라 구분하여 라벨링하는 단계; 상기 클러스터링 키워드 및 상기 라벨링된 텍스트를 이용하여 키워드 풀을 구축하는 단계; 및 입력 데이터에 대해 상기 키워드 풀과의 구문 단위 매칭도에 따라 직무 적합도를 평가하는 단계; 를 포함하는 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 방법.
Description
데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치 및 방법{ELECTRONIC APPARATUS AND METHOD FOR PERFORMING JOB SUITABILITY ASSESSMENT BASED DATA TABLE BY PHRASE UNIT} 본 개시는 자연어 처리 장치에 관한 것으로, 보다 구체적으로는 데이터 테이블 기반 구문 단위 직무적합도 평가를 수행하는 전자 장치 및 방법에 관한 것이다. 종래 채용 시스템에서는 지원자들의 채용 서류를 인사 담당자가 직접 읽고 필요한 정보를 추출 및 정리하여야 해서 많은 시간 및 비용이 소요되는 문제점이 있었다. 특히 만 명 이상의 지원자가 몰리는 대기업 공개 채용의 경우 이를 처리하기 위한 인적 비용 및 로드가 상당하고 인사 담당자의 숙련도에 따라 추출 정보의 일관성이 유지되기 어려웠다. 따라서, 상기 채용 서류 내에서 답변 항목을 자연어 처리하여 추출하고 일정한 형태의 서류로 전처리를 하여 인사 담당자가 유의미한 답변 항목만을 확인하도록 하여야 한다. 나아가, 지원자가 작성한 채용 서류를 통해 지원자가 지원한 직군 또는 직무에 적합한지 판단하여야 하며, 일정한 형태의 서류로 전처리된다고 하더라도 단순히 단어 단위의 매칭만으로는 문맥 상의 의미를 반영할 수 없어 실제 직군 또는 직무 적합도를 판단하기 어려운 문제점이 있었다. 종래 특허문헌에서는 면접자가 면접관이 원하는 수준의 답변을 만족하는 지를 판단하여 답변 레벨을 피드백할 수 있으나, 답변 레벨로부터 직군 또는 직무 적합도를 판단할 수는 없었다. 도 1은 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치의 구성을 간략하게 도시한 블록도이다. 도 2는 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치의 직무적합도 평가 과정을 도시한 프로세스도이다. 도 3은 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치의 키워드 사전 생성 과정을 도시한 블록도다. 도 4는 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치의 평가 요소를 도시한 예시도이다. 도 5는 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치의 표준 데이터셋을 도시한 예시도이다. 도 6은 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치의 문서 내 단어 빈도 분석에 따라 생성한 키워드 빈도 테이블이다. 도 7은 도 6의 키워드 빈도 테이블로부터 생성된 클러스터의 필터링 과정을 도시한 도면이다. 도 8은 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치가 텍스트를 구문 분할한 결과물을 도시한 도면이다. 도 9는 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치가 분할된 구문에 대해 대응하는 의미역을 라벨링한 테이블이다. 도 10은 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치가 생성한 키워드 풀의 데이터 테이블이다. 도 11은 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치가 생성한 분석 대상 서류의 데이터 테이블이다. 도 12는 본 개시에 따른 데이터 테이블 기반 구문 단위 직무 적합도 평가를 수행하는 전자 장치가 직무 적합도 계산시 동일한 직군 내 직무 별 가중치를 도시한 테이블이다. 본 개시 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 개시가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 개시가 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 ‘부, 모듈, 부재, 블록’이라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시예들에 따라 복수의 '부, 모듈, 부재, 블록'이 하나의 구성요소로 구현되거나, 하나의 '부, 모듈, 부재, 블록'이 복수의 구성요소들을 포함하는 것도 가능하다. 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 명세서 전체에서, 어떤 부재가 다른 부재 "상에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다. 제 1, 제 2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 전술된 용어들에 의해 제한되는 것은 아니다. 단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다. 각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다. 이하 첨부된 도면들을 참고하여 본 개시의 작용 원리 및 실시예들에 대해 설명한다. 본 명세서에서 '본 개시에 따른 장치'는 연산처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함된다. 예를 들어, 본 개시에 따른 장치는, 컴퓨터, 서버 장치 및 휴대용 단말기를 모두 포함하거나, 또는 어느 하나의 형태가 될 수 있다. 여기에서, 상기 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), 태블릿 PC, 슬레이트 PC 등을 포함할 수 있다. 상기 서버 장치는 외부 장치와 통신을 수행하여 정보를 처리하는 서버로써, 애플리케이션 서버, 컴퓨팅 서버, 데이터베이스 서버, 파일 서버, 게임 서버, 메일 서버, 프록시 서버 및 웹 서버 등을 포함할 수 있다. 상기 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), WiBro(Wireless Broadband Internet) 단말, 스마트 폰(Smart Phone) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치와 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD) 등과 같은 웨어러블 장치를 포함할 수 있다. 본 개시에 따른 인공지능과 관련된 기능은 프로세서와 메모리를 통해 동작된다. 프로세서는 하나 또는 복수의 프로세서로 구성될 수 있다. 이때, 하나 또는 복수의 프로세서는 CPU, AP, DSP(Digital Signal Processor) 등과 같은 범용 프로세서, GPU, VPU(Vision Processing Unit)와 같은 그래픽 전용 프로세서 또는 NPU와 같은 인공지능 전용 프로세서일 수 있다. 하나 또는 복수의 프로세서는, 메모리에 저장된 기 정의된 동작 규칙 또는 인공지능 모델에 따라, 입력 데이터를 처리하도록 제어한다. 또는, 하나 또는 복수의 프로세서가 인공지능 전용 프로세서인 경우, 인공지능 전용 프로세서는, 특정 인공지능 모델의 처리에 특화된 하드웨어 구조로 설계될 수 있다. 기 정의된 동작 규칙 또는 인공지능 모델은 학습을 통해 만들어진 것을 특징으로 한다. 여기서, 학습을 통해 만들어진다는 것은, 기본 인공지능 모델이 학습 알고리즘에 의하여 다수의 학습 데이터들을 이용하여 학습됨으로써, 원하는 특성(또는, 목적)을 수행하도록 설정된 기 정의된 동작 규칙 또는 인공지능 모델이 만들어짐을 의미한다. 이러한 학습은 본 개시에 따른 인공지능이 수행되는 기기 자체에서 이루어질 수도 있고, 별도의 서버 및/또는 시스템을 통해 이루어 질 수도 있다. 학습 알고리즘의 예로는, 지도형 학습(supervised learning), 비지도 형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)이 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 신경망 레이어들로 구성될 수 있다. 복수의 신경망 레이어들 각각은 복수의 가중치들 (weight values)을 갖고 있으며, 이전(previous) 레이어의 연산 결과와 복수의 가중치들 간의 연산을 통해 신경 망 연산을 수행한다. 복수의 신경망 레이어들이 갖고 있는 복수의 가중치들은 인공지능 모델의 학습 결과에 의해 최적화될 수 있다. 예를 들어, 학습 과정 동안 인공지능 모델에서 획득한 로스(loss) 값 또는 코스트(cost) 값이 감소 또는 최소화되도록 복수의 가중치들이 갱신될 수 있다. 인공 신경망은 심층 신경망(DNN:Deep Neural Network)를 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등이 있으나, 전술한 예에 한정되지 않는다. 본 개