KR-20260060613-A - Method and system for predicting pepper seedling growth using machine learning
Abstract
본 발명은 머신러닝을 활용한 고추 유묘의 생육 예측 방법 및 시스템에 관한 것으로, 본 발명의 일실시예에 따른 고추 유묘의 생육 예측 시스템을 이용한 고추 유묘의 생육 예측 방법은, 고추의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집하는 제1 단계; 상기 환경 데이터를 전처리하여 환경변수들을 생성하는 제2 단계; 상기 환경변수들 중에서 복수개의 환경변수를 선택하는 제3 단계; 상기 생육 데이터 중에서 어느 하나의 생육 데이터를 선택하는 제4 단계; 선택된 복수개의 상기 환경변수들에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 제5 단계; 상기 입력 변수를 이용하여 데이터 학습 및 데이터를 생성하는 제6 단계; 및 상기 데이터를 사용하여 다중선형회귀 모델, 랜덤포레스트(RandomForest) 모델 및 캣부스트(Catboost) 모델 중에서 어느 하나를 선택하여 고추 유묘의 생육을 예측하는 제7 단계;를 포함하여 구성된다.
Inventors
- 조연진
- 정수호
- 윤가윤
- 이형석
- 김주혜
- 장서우
- 김희곤
- 조윤섭
Assignees
- 전라남도
Dates
- Publication Date
- 20260506
- Application Date
- 20241025
Claims (12)
- 고추 유묘의 생육예측 시스템을 이용한 고추 유묘의 생육예측 방법에 있어서, 고추의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집하는 제1 단계; 상기 환경 데이터를 전처리하여 환경변수들을 생성하는 제2 단계; 상기 환경변수들 중에서 복수개의 환경변수를 선택하는 제3 단계; 상기 생육 데이터 중에서 어느 하나의 생육 데이터를 선택하는 제4 단계; 선택된 복수개의 상기 환경변수들에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 제5 단계; 상기 입력 변수를 이용하여 데이터 학습 및 데이터를 생성하는 제6 단계; 및 상기 데이터를 사용하여 다중선형회귀 모델, 랜덤포레스트(RandomForest) 모델 및 캣부스트(Catboost) 모델 중에서 어느 하나를 선택하여 고추 유묘의 생육을 예측하는 제7 단계; 를 포함하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 방법.
- 청구항 1에 있어서, 상기 제1 단계는, 고추의 생육 예측을 위한 내부온도(℃), 내부습도(%), 일최대일사량(J/㎠), 외부온도(℃), 포화수분 및 외부일사량(W/㎡)을 포함하는 환경 데이터와, 초장(Plant height), 줄기굵기, 엽장, 엽폭 및 엽수을 포함하는 생육 데이터를 수집하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 방법.
- 청구항 2에 있어서, 상기 제2 단계는, 상기 환경 데이터를 전처리하여 일평균온도, 일최고-최저온도차, 일평균습도, 일최고-최저습도차, 일최대일사량, 적산온도, 적산일사량 및 파종이후일수를 포함하는 환경변수를 생성하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 방법.
- 청구항 3에 있어서, 상기 제3 단계는, RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 상기 환경변수 중에서 적산온도, 적산일사량 및 파종이후일수을 선택하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 방법.
- 청구항 4에 있어서, 상기 제4 단계는, 상기 생육 데이터 중에서 초장(Plant height)의 데이터를 선택하고, 상기 제5 단계는, 선택된 상기 적산온도, 상기 적산일사량 및 상기 파종이후일수에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 방법.
- 청구항 5에 있어서, 상기 제7 단계는, 상기 데이터를 사용하여 다중선형회귀 모델, 랜덤포레스트(RandomForest) 모델 및 캣부스트(Catboost) 모델 중에서 산출된 설명계수와 예측 정확도가 높은 랜덤포레스트(RandomForest) 모델을 선택하여 고추 유묘의 생육을 예측하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 방법.
- 고추의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집하는 데이터 수집부; 상기 환경 데이터를 전처리하여 환경변수들을 생성하는 환경변수 생성부; 상기 환경변수들 중에서 복수개의 환경변수를 선택하는 환경변수 선택부; 상기 생육 데이터 중에서 어느 하나의 생육 데이터를 선택하는 생육 학습 및 데이터 생성부; 선택된 복수개의 상기 환경변수들에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 입력변수 생성부; 상기 입력 변수를 이용하여 데이터 학습 및 데이터를 생성하는 학습 및 데이터 생성부; 및 상기 데이터를 사용하여 다중선형회귀 모델, 랜덤포레스트(RandomForest) 모델 및 캣부스트(Catboost) 모델 중에서 어느 하나를 선택하여 고추 유묘의 생육을 예측하는 모델 선택 및 예측부; 를 포함하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 시스템.
- 청구항 7에 있어서, 상기 데이터 수집부는, 고추의 생육 예측을 위한 내부온도(℃), 내부습도(%), 일최대일사량(J/㎠), 외부온도(℃), 포화수분 및 외부일사량(W/㎡)을 포함하는 환경 데이터와, 초장(Plant height), 줄기굵기, 엽장, 엽폭 및 엽수을 포함하는 생육 데이터를 수집하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 시스템.
- 청구항 8에 있어서, 상기 환경변수 생성부는, 상기 환경 데이터를 전처리하여 일평균온도, 일최고-최저온도차, 일평균습도, 일최고-최저습도차, 일최대일사량, 적산온도, 적산일사량 및 파종이후일수를 포함하는 환경변수를 생성하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 시스템.
- 청구항 9에 있어서, 상기 환경변수 선택부는, RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 상기 환경변수 중에서 적산온도, 적산일사량 및 파종이후일수을 선택하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 시스템.
- 청구항 10에 있어서, 상기 생육 학습 및 데이터 생성부는, 상기 생육 데이터 중에서 초장(Plant height)의 데이터를 선택하고, 상기 입력변수 생성부는, 선택된 상기 적산온도, 상기 적산일사량 및 상기 파종이후일수에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 시스템.
- 청구항 11에 있어서, 상기 모델 선택 및 예측부는, 상기 데이터를 사용하여 다중선형회귀 모델, 랜덤포레스트(RandomForest) 모델 및 캣부스트(Catboost) 모델 중에서 산출된 설명계수와 예측 정확도가 높은 랜덤포레스트(RandomForest) 모델을 선택하여 고추 유묘의 생육을 예측하는 것을 특징으로 하는 머신러닝을 활용한 고추 유묘의 생육예측 시스템.
Description
머신러닝을 활용한 고추 유묘의 생육 예측 방법 및 시스템{Method and system for predicting pepper seedling growth using machine learning} 본 발명은 생육 예측 방법 및 시스템에 관한 것으로, 보다 상세하게는 머신러닝을 활용한 고추 유묘의 생육 예측 방법 및 시스템에 관한 것이다. 육묘의 환경 변화에 따른 작물의 생육 조절의 최적화를 통한 안정적 생산을 위하여, 작물의 생육 정보를 정량화하고 예측하기 위한 기술이 도입되고 있다. 생육예측모델은 환경과 작물의 생리적 과정 간 상호작용을 수학적으로 모델링하여 생육과 수량을 예측할 수 있게 한다. 환경조건과 작물의 생리적 반응간의 관계를 파악해 멜론, 딸기, 토마토 등의 생육 최적화를 위한 환경관리 의사결정 도구로 활용되고 있다. 정식 이후 시설재배 작물에 대한 생육예측모델은 개발되어 활용되고 있으나, 육묘 단계에서의 생육예측모델은 거의 활용되고 있지 않다. 최적 환경관리를 통한 우량묘 생산은 정식 이후 영양생장 및 생식생장에 긍정적인 영향을 주어 수량 증대의 요인이 될 수 있기 때문에 육묘 단계에서의 최적 환경관리 및 생육 예측은 중요하다. 시설원예 증가에 따른 육묘와 재배의 분업으로 육묘장의 규모는 커지고 있으나 유묘 생육 및 품질관리는 사람에 의해서 이루어지고 기록되지 않기 때문에 공정육묘 산업 발전의 한계로 여겨지고 있으며 우량묘를 원하는 농가의 니즈를 만족시키지 못하고 있다. 환경 정보를 토대로 한 육묘의 생육 예측으로 적정한 환경 요인을 제공하는 등과 같은 의사 결정에 사용될 수 있으며, 생육 진단 및 출하시기 판정을 통해 육묘 시스템 자동화 및 효율성 증대에 기여할 수 있다. 이와 같이, 공정육묘 산업 발전을 위해 우량묘 판단과 계측 자동화를 위한 기술적 수요가 증가하고 있으며, 작물의 유묘의 계측 정확도 향상과 자동계측 적용을 위한 알고리즘의 개발이 필요하다. 도 1은 본 발명의 일실시예에 따른 머신러닝을 활용한 고추 유묘의 생육 예측 시스템의 구성도이다. 도 2는 본 발명의 일실시예에 따른 머신러닝을 활용한 고추 유묘의 생육 예측 방법을 설명하기 위한 흐름도이다. 도 3은 본 발명의 일실시예에 따른 RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 환경변수를 선택하는 방법을 설명하기 위한 도면이다. 도 4는 고추의 주요 생육 지표를 선정하기 위해서 히트맵과 변수간 상관 그래프를 통해 가장 시계열적 증가 특성을 띄는 '초장'을 선택하는 도면이다. 도 5는 본 발명의 일실시예에 따른 모델 시각화를 통한 시계열 데이터 기반 예측과 측 초장 데이터 비교를 통한 결과의 해석 방법을 설명하기 위한 도면이다. 본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 다만, 실시형태를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다. 또한, 도면에서의 각 구성요소들의 크기는 설명을 위하여 과장될 수 있으며, 실제로 적용되는 크기를 의미하는 것은 아니다. 또한, 명세서 전체에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다. 또한, 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 도 1은 본 발명의 일실시예에 따른 머신러닝을 활용한 고추 유묘의 생육 예측 시스템의 구성도이다. 이후부터는 도 1을 참조하여 본 발명의 일실시예에 따른 머신러닝을 활용한 고추 유묘의 생육 예측 시스템의 구성을 설명하기로 한다. 본 발명의 일실시예에 따른 머신러닝을 활용한 고추 유묘의 생육 예측 시스템(100)은 컴퓨터 단말, 서버 또는 전용 장치로 구성되거나, 각 기능을 제공하는 구성요소가 각각 하드웨어 또는 소프트웨어로 구성되는 모듈로 구성되거나, 컴퓨터 단말, 서버, 전용 장치로 구성될 수 있다. 보다 구체적으로, 본 발명의 일실시예에 따른 머신러닝을 활용한 고추 유묘의 생육 예측 시스템(100)은 데이터 수집부(110), 환경변수 생성부(120), 환경변수 선택부(130), 생육 학습 및 데이터 생성부(140), 입력변수 생성부(150), 학습 및 데이터 생성부(160) 및 모델 선택 및 예측부(170)를 포함하여 구성될 수 있다. 상기 데이터 수집부(110)는 고추의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집한다. 보다 상세하게 설명하면, 상기 데이터 수집부(110)는 고추의 생육 예측을 위한 내부온도(℃), 내부습도(%), 일최대일사량(J/㎠), 외부온도(℃), 포화수분 및 외부일사량(W/㎡)을 포함하는 환경 데이터와, 초장, 줄기굵기, 엽장, 엽폭 및 엽수을 포함하는 생육 데이터를 수집할 수 있다. 또한, 상기 환경변수 생성부(120)는 상기 환경 데이터를 일일 단위로 전처리하여 의미가 높은 환경변수들을 생성한다. 이때, 상기 환경변수 생성부(120)는 상기 환경 데이터를 전처리하여 일평균온도, 일최고-최저온도차, 일평균습도, 일최고-최저습도차, 일최고일사량, 적산온도, 적산일사량 및 파종이후일수를 포함하는 환경변수를 생성할 수 있다. 상기 환경변수 선택부(130)는 상기 환경변수들 중에서 중요도가 높은 복수개의 환경변수를 선택한다. 보다 구체적으로, 상기 환경변수 선택부(130)는 RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 상기 환경변수 중에서 3개의 변수인 적산온도, 적산일사량 및 파종이후일수를 선택할 수 있다. 이러한 변수 선택법을 통해 머신러닝 모델 활용 시 변수의 증가로 인한 다중공선성을 감소하고 각 변수에 대한 설명력을 높일 수 있다. 상기 생육 학습 및 데이터 생성부(140)는 상기 생육 데이터 중에서 어느 하나의 생육 데이터를 선택하고, 상기 입력변수 생성부(150)는 선택된 복수개의 상기 환경변수들에 시계열 변화의 반영을 위해 월별 더미계수를 포함시켜 입력 변수를 생성한다. 이때, 상기 생육 학습 및 데이터 생성부(140)는 상기 생육 데이터 중에서 '초장(Plant height)'의 데이터를 선택하고, 상기 입력변수 생성부(150)는 선택된 3개의 변수인 상기 적산온도, 상기 적산일사량 및 상기 파종이후일수에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성할 수 있다. 월별 더미계수는 수집 환경데이터의 '월'을 추출해 더미변수화한 것으로, 데이터가 해당 '월'일 때 1의 값을 가지며 그렇지 않을 때 '0'의 값을 가져 월별 정보를 반영하게 한다. 이와 같은 ‘초장(Plant height)'은 영양생장과 생식생장을 판단하는 중요한 기준으로 이는 기존 연구들에서 증명된 바 있다(D.Arthur et al). '초장'은 다른 생육기관(줄기굵기, 엽장, 엽수)와의 상관관계가 가장 높으며, 이는 초장의 생육에 따라 다른 생육기관도 영향을 받는다는 것을 의미하며, 이와 같은 '초장'은 시계열에 따라 지속적인 성장을 이루기 때문에 시간 변화에 따른 예측하기 가장 우수한 지표이다. 한편, 상기 학습 및 데이터 생성부(160)는 상기 입력 변수를 이용하여 데이터 학습 및 테스트 데이터를 생성한다. 즉, 머신러닝 모델에 필수적인 학습 및 테스트 데이터(train-test data)를 생성할 수 있다. 학습 및 테스트 데이터 생성으로 모델의 과적합을 방지하고 성능을 평가할 수 있다. 그에 따라, 상기 모델 선택 및 예측부(170)는 상기 데이터를 사용하여 복수개의 분석 회귀 모델 중에서 어느 하나의 모델을 선택한다. 이때, 상기 모델 선택 및 예측부(170)는 상기 데이터를 사용하여 다중선형회귀 모델, 랜덤포레스트(RandomForest) 모델 및 캣부스트(Catboost) 모델 중에서 예측 정확도가 높은 모델을 선택하여 고추 유묘의 생육을 예측할 수 있다. 즉, 상기 모델 선택 및 예측부(170)는 검증을 통한 모델 선택 시에, 설명력(R2) 높으며 오차가 적은(MAPE) 모델로서 랜덤포레스트(RandomForest) 모델을 선택하고 이를 이용해 고추 유묘의 생육을 예측할 수 있다. 또한, 본 발명의 일실시예에 따르면 시계열 데이터 기반 예측과 예측 초장 데이터 비교를 통한 결과의 해석을 위한 시각화 정보를 제공하는 모델 시각화부를 더 포함하여 구성될 수 있다. 이를 통해 예측 정확도가 높은 모델을 선택하고 고추 유묘의 생육을 예측할 수 있다. 도 2는 본 발명의 일실시예에 따른 머신러닝을 활용한 고추 유묘의 생육 예측 방법을 설명하기 위한 흐름도이다. 또한, 도 3은 본 발명의 일실시예에 따른 RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 환경변수를 선택하는 방법을 설명하기 위한 도면이고, 도 4는 수집 생육 데이터 중 고추 주요 생육 지표를 선택하기 위한 데이터간 상관분석 및 시각화를 한 그래프이고, 도 5는 본 발명의 일실시예에 따른 모델 시각화를 통한 시계열 데이터 기반 예측과 실제 초장 데이터 비교를 통한 결과의 검증증 방법을 설명하기 위한 도면이다. 이후부터는 도 2 내지 도 5를 참조하여 본 발명의 일실시예에 따른 머신러닝을 활용한 고추 유묘의 생육 예측 방법을 설명하기로 한다. 본 발명의 일실시예에 따른 머신러닝을 활용한 고추 유묘의 생육 예측 방법은 고추 유묘의 생육 예측 시스템에 의해 수행된다. 먼저, 상기 고추 유묘의 생육 예측 시스템은 고추의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집한다(S110). 보다 상세하게 설명하면,