KR-20260060612-A - Method and system for predicting tomato seedling growth using machine learning
Abstract
본 발명은 머신러닝을 활용한 토마토 유묘의 생육 예측 방법 및 시스템에 관한 것으로, 본 발명의 일실시예에 따른 토마토 유묘의 생육 예측 시스템을 이용한 토마토 유묘의 생육 예측 방법은, 토마토의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집하는 제1 단계; 상기 환경 데이터를 전처리하여 환경변수들을 생성하는 제2 단계; 상기 환경변수들 중에서 복수개의 환경변수를 선택하는 제3 단계; 상기 생육 데이터 중에서 어느 하나의 생육 데이터를 선택하는 제4 단계; 선택된 복수개의 상기 환경변수들에 시계열 변화를 반영하기 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 제5 단계; 상기 입력 변수를 이용하여 데이터 학습 및 데이터를 생성하는 제6 단계; 및 상기 데이터를 사용하여 복수개의 분석 회귀 모델 중에서 어느 하나의 모델을 선택하여 토마토 유묘의 생육을 예측하는 제7 단계;를 포함하여 구성된다.
Inventors
- 조연진
- 정수호
- 윤가윤
- 이형석
- 김주혜
- 장서우
- 김희곤
- 조윤섭
Assignees
- 전라남도
Dates
- Publication Date
- 20260506
- Application Date
- 20241025
Claims (12)
- 토마토 유묘의 생육 예측 시스템을 이용한 토마토 유묘의 생육 예측 방법에 있어서, 토마토의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집하는 제1 단계; 상기 환경 데이터를 전처리하여 환경변수들을 생성하는 제2 단계; 상기 환경변수들 중에서 복수개의 환경변수를 선택하는 제3 단계; 상기 생육 데이터 중에서 어느 하나의 생육 데이터를 선택하는 제4 단계; 선택된 복수개의 상기 환경변수들에 시계열 변화를 반영하기 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 제5 단계; 상기 입력 변수를 이용하여 데이터 학습 및 데이터를 생성하는 제6 단계; 및 상기 데이터를 사용하여 복수개의 분석 회귀 모델 중에서 어느 하나의 모델을 선택하여 토마토 유묘의 생육을 예측하는 제7 단계; 를 포함하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 방법.
- 청구항 1에 있어서, 상기 제1 단계는, 토마토의 생육 예측을 위한 내부온도(℃), 내부습도(%), 일최대일사량(J/㎠), 외부온도(℃), 포화수분 및 외부일사량(W/㎡)을 포함하는 환경 데이터와, 초장(Plant height), 줄기굵기, 엽장, 엽폭 및 엽수을 포함하는 생육 데이터를 수집하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 방법.
- 청구항 2에 있어서, 상기 제2 단계는, 상기 환경 데이터를 일단위로 전처리하여 일평균온도, 일최고-최저온도차, 일평균습도, 일최고-최저습도차, 일최고일사량, 적산온도, 적산일사량 및 파종이후일수를 포함하는 환경변수를 생성하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 방법.
- 청구항 3에 있어서, 상기 제3 단계는, RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 상기 환경변수 중에서 적산온도, 적산일사량 및 파종이후일수을 선택하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 방법.
- 청구항 4에 있어서, 상기 제4 단계는, 상기 생육 데이터 중에서 초장(Plant height)의 데이터를 선택하고, 상기 제5 단계는, 선택된 상기 적산온도, 상기 적산일사량 및 상기 파종이후일수에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 방법.
- 청구항 5에 있어서, 상기 제7 단계는, 상기 데이터를 사용하여 다중선형회귀모델, 랜덤포레스트모델 및 캣부스트(Catboost) 모델 중에서 산출된 설명계수와 예측 정확도가 높은 모델을 선택하여 토마토 유묘의 생육을 예측하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 방법.
- 토마토의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집하는 데이터 수집부; 상기 환경 데이터를 전처리하여 환경변수들을 생성하는 환경변수 생성부; 상기 환경변수들 중에서 복수개의 환경변수를 선택하는 환경변수 선택부; 상기 생육 데이터 중에서 어느 하나의 생육 데이터를 선택하는 생육 학습 및 데이터 생성부; 선택된 복수개의 상기 환경변수들에 시계열 변화를 반영하기 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 입력변수 생성부; 상기 입력 변수를 이용하여 데이터 학습 및 데이터를 생성하는 학습 및 데이터 생성부; 및 상기 데이터를 사용하여 복수개의 분석 회귀 모델 중에서 어느 하나의 모델을 선택하여 토마토 유묘의 생육을 예측하는 모델 선택 및 예측부; 를 포함하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템.
- 청구항 7에 있어서, 상기 데이터 수집부는, 토마토의 생육 예측을 위한 내부온도(℃), 내부습도(%), 일최대일사량(J/㎠), 외부온도(℃), 포화수분 및 외부일사량(W/㎡)을 포함하는 환경 데이터와, 초장(Plant height), 줄기굵기, 엽장, 엽폭 및 엽수을 포함하는 생육 데이터를 수집하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템.
- 청구항 8에 있어서, 상기 환경변수 생성부는, 상기 환경 데이터를 전처리하여 일평균온도, 일최고-최저온도차, 일평균습도, 일최고-최저습도차, 일최대일사량, 적산온도, 적산일사량 및 파종이후일수를 포함하는 환경변수를 생성하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템.
- 청구항 9에 있어서, 상기 환경변수 선택부는, RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 상기 환경변수 중에서 적산온도, 적산일사량 및 파종이후일수을 선택하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템.
- 청구항 10에 있어서, 상기 생육 학습 및 데이터 생성부는, 상기 생육 데이터 중에서 초장(Plant height)의 데이터를 선택하고, 상기 입력변수 생성부는, 선택된 상기 적산온도, 상기 적산일사량 및 상기 파종이후일수에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템.
- 청구항 11에 있어서, 상기 모델 선택 및 예측부는, 상기 데이터를 사용하여 다중선형회귀모델, 랜덤포레스트모델 및 캣부스트(Catboost) 모델 중에서 산출된 설명계수와 예측 정확도가 높은 모델을 선택하여 토마토 유묘의 생육을 예측하는 것을 특징으로 하는 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템.
Description
머신러닝을 활용한 토마토 유묘의 생육 예측 방법 및 시스템{Method and system for predicting tomato seedling growth using machine learning} 본 발명은 생육 예측 방법 및 시스템에 관한 것으로, 보다 상세하게는 머신러닝을 활용한 토마토 유묘의 생육 예측 방법 및 시스템에 관한 것이다. 시설원예 스마트팜 산업이 발전하면서 작물의 최적 관리를 위한 환경관리를 할 수 있게 되었으며, 이와 함께 환경에 따른 생육을 정량화하고 예측하기 위한 기술이 개발되고 있다. 생육 모델은 스마트팜에서 수집된 빅데이터를 활용해 작물의 생육 및 수량을 예측하는 모델로서 방대한 데이터를 분석하여 재배의사 결정 도구로 적용할 수 있는 기술이다. 즉, 생육 모델은 스마트팜에서의 작물의 생육 정보를 토대로 현재 작물의 상태를 진단하고 미래의 생육을 예측하여 적정한 환경 요인을 제공하는 등과 같은 의사 결정에 사용될 수 있으며, 생육 진단 및 출하시기 판정에 기여할 수 있다. 이러한 생육 모델은 정식 이후의 토마토, 딸기 등 시설원예 작물에서는 많이 개발되어 있으나, 육묘 단계에서의 생육모델은 아직 개발 및 활용이 적어 기술 개발이 필요하다. 최근 육묘장에서 유묘를 주문하여 정식하는 농가가 증가하고 있으며 '공정육묘'라는 말이 등장해 규격묘 생산의 중요성이 커지고 있지만 생육 및 품질 관리는 인력에 의해 이루어지고 있어 환경에 따른 생육을 예측할 수 있는 모델의 개발이 필요하다. 육묘 생육예측 모델의 개발을 통해 육묘 시스템 자동화 및 유묘 생육관리 효율성 증대에 기여할 수 있다. 이와 같이, 공정육묘 확대로 우량묘 판단과 계측 자동화를 위한 기술적 수요가 증가하고 있으며, 작물의 유묘의 계측 정확도 향상과 자동계측 적용을 위한 알고리즘의 개발이 필요하다. 도 1은 본 발명의 일실시예에 따른 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템의 구성도이다. 도 2는 본 발명의 일실시예에 따른 머신러닝을 활용한 토마토 유묘의 생육 예측 방법을 설명하기 위한 흐름도이다. 도 3은 본 발명의 일실시예에 따른 RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 환경변수를 선택하는 방법을 설명하기 위한 도면이다. 도 4는 토마토의 주요 생육 지표를 선정하기 위해서 히트맵과 변수간 상관 그래프를 통해 가장 시계열적 증가 특성을 띄는 '초장'을 선택하는 도면이다. 도 5는 본 발명의 일실시예에 따른 모델 시각화를 통한 시계열 데이터 기반 예측과 측 초장 데이터 비교를 통한 결과의 해석 방법을 설명하기 위한 도면이다. 본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 다만, 실시형태를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다. 또한, 도면에서의 각 구성요소들의 크기는 설명을 위하여 과장될 수 있으며, 실제로 적용되는 크기를 의미하는 것은 아니다. 또한, 명세서 전체에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다. 또한, 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 도 1은 본 발명의 일실시예에 따른 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템의 구성도이다. 이후부터는 도 1을 참조하여 본 발명의 일실시예에 따른 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템의 구성을 설명하기로 한다. 본 발명의 일실시예에 따른 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템(100)은 컴퓨터 단말, 서버 또는 전용 장치로 구성되거나, 각 기능을 제공하는 구성요소가 각각 하드웨어 또는 소프트웨어로 구성되는 모듈로 구성되거나, 컴퓨터 단말, 서버, 전용 장치로 구성될 수 있다. 보다 구체적으로, 본 발명의 일실시예에 따른 머신러닝을 활용한 토마토 유묘의 생육 예측 시스템(100)은 데이터 수집부(110), 환경변수 생성부(120), 환경변수 선택부(130), 생육 학습 및 데이터 생성부(140), 입력변수 생성부(150), 학습 및 데이터 생성부(160) 및 모델 선택 및 예측부(170)를 포함하여 구성될 수 있다. 상기 데이터 수집부(110)는 토마토의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집한다. 보다 상세하게 설명하면, 상기 데이터 수집부(110)는 토마토의 생육 예측을 위한 내부온도(℃), 내부습도(%), 일최대일사량(J/㎠), 외부온도(℃), 포화수분 및 외부일사량(W/㎡)을 포함하는 환경 데이터와, 초장, 줄기굵기, 엽장, 엽폭 및 엽수을 포함하는 생육 데이터를 수집할 수 있다. 또한, 상기 환경변수 생성부(120)는 상기 환경 데이터를 일일 단위로 전처리하여 의미가 높은 환경변수들을 생성한다. 이때, 상기 환경변수 생성부(120)는 상기 환경 데이터를 전처리하여 일평균온도, 일최고-최저온도차, 일평균습도, 일최고-최저습도차, 일최고일사량, 적산온도, 적산일사량 및 파종이후일수를 포함하는 환경변수를 생성할 수 있다. 상기 환경변수 선택부(130)는 상기 환경변수들 중에서 복수개의 환경변수를 선택한다. 보다 구체적으로, 상기 환경변수 선택부(130)는 RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 상기 환경변수 중에서 3개의 변수인 적산온도, 적산일사량 및 파종이후일수를 선택할 수 있다. 이러한 변수 선택법을 통해 머신러닝 모델 활용 시 변수의 증가로 인한 다중공선성을 감소하고 각 변수에 대한 설명력을 높일 수 있다. 상기 생육 학습 및 데이터 생성부(140)는 상기 생육 데이터 중에서 어느 하나의 생육 데이터를 선택하고, 상기 입력변수 생성부(150)는 선택된 복수개의 상기 환경변수들에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성한다. 이때, 상기 생육 학습 및 데이터 생성부(140)는 상기 생육 데이터 중에서 '초장(Plant height)'의 데이터를 선택하고, 상기 입력변수 생성부(150)는 선택된 3개의 변수인 상기 적산온도, 상기 적산일사량 및 상기 파종이후일수에 시계열 변화를 위한 월별 더미계수를 포함시켜 입력 변수를 생성할 수 있다. 보다 상세하게 설명하면, 월별 더미변수의 생성 시에 해당 월일 때에는 '1', 해당 월이 아닐 때에는 '0'이 적용되는 변수를 생성할 수 있다. 이를 통해 환경 데이터에 '월별 정보'를 반영하게 해 준다. 이와 같은 ‘초장(Plant height)'은 영양생장과 생식생장을 판단하는 중요한 기준으로 이는 기존 연구들에서 증명된 바 있다(D.Arthur et al). '초장'은 다른 생육기관(줄기굵기, 엽장, 엽수)와의 상관관계가 가장 높으며, 이는 초장의 생육에 따라 다른 생육기관도 영향을 받는다는 것을 의미하며, 이와 같은 '초장'은 시계열에 따라 지속적인 성장을 이루기 때문에 시간 변화에 따른 예측하기 가장 우수한 지표이다. 한편, 상기 학습 및 데이터 생성부(160)는 상기 입력 변수를 이용하여 데이터 학습 및 데이터를 생성한다. 즉, 머신러닝 모델에 필수적인 학습 및 테스트 데이터(train-test data)를 생성할 수 있다. 학습 및 테스트 데이터 생성으로 모델의 과적합을 방지하고 성능을 평가할 수 있다. 그에 따라, 상기 모델 선택 및 예측부(170)는 상기 데이터를 사용하여 복수개의 분석 회귀 모델 중에서 어느 하나의 모델을 선택한다. 이때, 상기 모델 선택 및 예측부(170)는 상기 데이터를 사용하여 다중선형회귀모델, 랜덤포레스트모델 및 캣부스트(Catboost) 모델 중에서 산출된 설명계수와 예측 정확도가 높은 모델을 선택하여 토마토 유묘의 생육을 예측할 수 있다. 즉, 상기 모델 선택 및 예측부(170)는 검증을 통한 모델 선택 시에, 설명력(R2) 높으며 오차가 적은(MAPE) 모델로서 캣부스트(Catboost) 모델을 선택하고 이를 이용해 토마토 유묘의 생육을 예측할 수 있다. 또한, 본 발명의 일실시예에 따르면 시계열 데이터 기반 예측과 측 초장 데이터 비교를 통한 결과의 해석을 위한 시각화 정보를 제공하는 모델 시각화부를 더 포함하여 구성될 수 있다. 이를 통해 예측 정확도가 높은 모델을 선택하고 토마토 유묘의 생육을 예측할 수 있다. 도 2는 본 발명의 일실시예에 따른 머신러닝을 활용한 토마토 유묘의 생육 예측 방법을 설명하기 위한 흐름도이다. 또한, 도 3은 본 발명의 일실시예에 따른 RFE(Recursive Feature Elimination) 변수 선택법을 사용하여 환경변수를 선택하는 방법을 설명하기 위한 도면이고, 도 4는 수집 생육 데이터 중 고추 주요 생육 지표를 선택하기 위한 데이터간 상관분석 및 시각화를 한 그래프이고, 도 5는 본 발명의 일실시예에 따른 모델 시각화를 통한 시계열 데이터 기반 예측과 실제 초장 데이터 비교를 통한 결과의 검증증 방법을 설명하기 위한 도면이다. 이후부터는 도 2 내지 도 5를 참조하여 본 발명의 일실시예에 따른 머신러닝을 활용한 토마토 유묘의 생육 예측 방법을 설명하기로 한다. 본 발명의 일실시예에 따른 머신러닝을 활용한 토마토 유묘의 생육 예측 방법은 토마토 유묘의 생육 예측 시스템에 의해 수행된다. 먼저, 상기 토마토 유묘의 생육 예측 시스템은 토마토의 생육 예측을 위한 환경 데이터와 생육 데이터를 수집한다(S110). 보다 상세하게 설명하면, 상기 토마토 유묘의 생육 예측 시스템은 토마토의 생육 예측을 위한 내부온도(℃), 내부습