JP-2026077580-A - イメージベースで建築物の三次元構造を推論する装置および方法
Abstract
【課題】イメージベースで建築物の三次元構造を推論する装置および方法が開示される。 【解決手段】本発明の実施例によるイメージベースで建築物の三次元構造を推論する装置は、少なくとも1つのプログラムが記録されたメモリと、プログラムを実行するプロセッサとを含み、プログラムは、建築物に対する少なくとも1つのイメージを受信して、イメージの種類を分類するステップと、イメージそれぞれの三次元座標体系を生成するステップと、イメージそれぞれに含まれている少なくとも1つの構成要素を検出するステップと、イメージ間のスケールを調整するステップと、イメージそれぞれの三次元座標体系に基づいてスケーリングされたイメージでの各構成要素の三次元座標を推定するステップと、推定された各構成要素の三次元座標情報に基づいて建築物を三次元モデリングするステップとを行うことができる。 【選択図】図1
Inventors
- チョン、ダ-ウン
- イ、ソン-ジェ
- コ、ジョン-グク
- イ、ス-ウン
- イ、ヨン-シク
- イ、ジュ-ウォン
Assignees
- 韓國電子通信研究院
Dates
- Publication Date
- 20260513
- Application Date
- 20250924
- Priority Date
- 20241025
Claims (12)
- 少なくとも1つのプログラムが記録されたメモリと、 プログラムを実行するプロセッサとを含み、 プログラムは、 建築物に対する少なくとも1つのイメージを受信して、イメージの種類を分類するステップと、 イメージそれぞれの三次元座標体系を生成するステップと、 イメージそれぞれに含まれている少なくとも1つの構成要素を検出するステップと、 イメージ間のスケールを調整するステップと、 イメージそれぞれの三次元座標体系に基づいてスケーリングされたイメージでの各構成要素の三次元座標を推定するステップと、 推定された各構成要素の三次元座標情報に基づいて建築物を三次元モデリングするステップとを行う、イメージベースで建築物の三次元構造を推論する装置。
- プログラムは、 イメージを分類するステップにおいて、予め学習された図面分類モデルに基づいて、イメージを平面図、仰視図、正面図、背面図、左側面図、右側面図、縦断面図および横断面図を含む図面種類のうちの1つに分類する、請求項1に記載のイメージベースで建築物の三次元構造を推論する装置。
- プログラムは、 構成要素を検出するステップにおいて、予め学習された分類モデルに基づいて、イメージからきだん、そせき、ばしら、斗供、はりおよびけたを含む構成要素のうちの1つの位置および種類を検出する、請求項1に記載のイメージベースで建築物の三次元構造を推論する装置。
- プログラムは、 三次元座標体系を生成するステップにおいて、イメージのうち平面図の三次元座標体系を設定するステップと、 平面図の三次元座標体系を基準として、他の種類のイメージの二次元座標体系を三次元座標体系に変換するステップとを行う、請求項1に記載のイメージベースで建築物の三次元構造を推論する装置。
- プログラムは、 スケールを調整するステップにおいて、構成要素を検出するステップで検出された平面図および正面図を基準として、ばしらの間隔に基づいて決定する、請求項4に記載のイメージベースで建築物の三次元構造を推論する装置。
- プログラムは、 三次元モデリングするステップにおいて、三次元座標から推論された各構成要素の位置および個数情報に基づいて、構成要素間の連結関係により建築物の構造を推論するが、 推論する順序は、きだん、そせき、ばしら、斗供およびはりの順に推論する、請求項9に記載のイメージベースで建築物の三次元構造を推論する装置。
- 建築物に対する少なくとも1つのイメージを受信して、イメージの種類を分類するステップと、 イメージそれぞれの三次元座標体系を生成するステップと、 イメージそれぞれに含まれている少なくとも1つの構成要素を検出するステップと、 イメージ間のスケールを調整するステップと、 イメージそれぞれの三次元座標体系に基づいてスケーリングされたイメージでの各構成要素の三次元座標を推定するステップと、 推定された各構成要素の三次元座標情報に基づいて建築物を三次元モデリングするステップとを含む、イメージベースで建築物の三次元構造を推論する方法。
- イメージを分類するステップは、 予め学習された図面分類モデルに基づいて、イメージを平面図、仰視図、正面図、背面図、左側面図、右側面図、縦断面図および横断面図を含む図面種類のうちの1つに分類する、請求項11に記載のイメージベースで建築物の三次元構造を推論する方法。
- 構成要素を検出するステップは、 予め学習された分類モデルに基づいて、イメージからきだん、そせき、ばしら、斗供、はりおよびけたを含む構成要素のうちの1つの位置および種類を検出する、請求項11に記載のイメージベースで建築物の三次元構造を推論する方法。
- 座標体系を生成するステップは、 イメージのうち平面図の三次元座標体系を設定するステップと、 平面図の三次元座標体系を基準として、他の種類のイメージの二次元座標体系を三次元座標体系に変換するステップとを含む、請求項11に記載のイメージベースで建築物の三次元構造を推論する方法。
- スケールを調整するステップは、 構成要素を検出するステップで検出された平面図および正面図を基準として、ばしらの間隔に基づいて決定する、請求項14に記載のイメージベースで建築物の三次元構造を推論する方法。
- 三次元モデリングするステップは、 三次元座標から推論された各構成要素の位置および個数情報に基づいて、構成要素間の連結関係により建築物の構造を推論するが、 推論する順序は、きだん、そせき、ばしら、斗供およびはりの順に推論する、請求項19に記載のイメージベースで建築物の三次元構造を推論する方法。
Description
特許法第30条第2項適用申請有り 1.公開日 令和6年10月23日 2.集会名、開催場所 韓国建築学会2024年秋季大会、The-Kホテル慶州 3.公開者 チョン、ダ-ウン,イ、ソン-ジェ,コ、ジョン-グク,イ、ス-ウン,イ、ヨン-シク及びイ、ジュ-ウォン 記載された実施例は、伝統建築物の図面および建築物イメージを活用して構成要素の位置および構造を推論する技術に関する。 伝統建築物の三次元モデリングは、文化遺産の保存と復元に重要な役割を果たす。伝統建築物を三次元モデリングするためには、建築物の正確な構造的情報が必要であるが、修理解体せずには内部構造の把握が困難である。したがって、伝統建築物の図面イメージに基づいて構成要素を把握してモデリングしなければならない。 建築物の三次元構造を推論する研究は、ポイントクラウド(Point Cloud)を主に利用してきており、それに必要な大容量データベースを構築した。 特に、建築物の構造と様々な構成要素の推論に関連する代表的なデータセットにはBuildingNetがある。これは、既存のポイントクラウドデータセットであるShapeNetとPartNetが単一オブジェクトとオブジェクトの構成要素をラベリングすることに加えて、構成要素間の空間的関係および配置を明示化した。 建物モデルはより精密なラベリングを提供するために多量のデータで構成されなければならず、各構成要素はその細部情報と幾何学的データを追加的に含まなければならなかった。 しかし、様々な構成要素を考慮して空間的関係を連結することが複雑であり、各要素間の連結および配置が非常に正確でこそ構造を推論できるという問題点がある。しかも、伝統建築物は、解体修理および復元過程でなければ、スキャナなどを用いたポイントクラウドの生成が現実的に不可能なため、データセットの構築が困難である。 また、現代の建築物は設計過程で三次元設計図およびモデリングを実現することが必須で要求されるが、伝統建築物や文化遺産は分解組立が不可能なため、モデリング技術が非常に重要である。 実施例によるイメージベースで建築物の三次元構造を推論する方法を説明するためのフローチャートである。実施例により、分類モデルに基づいて、横断面図から構成要素の位置と種類を検出した例示図である。実施例により、分類モデルに基づいて、縦断面図から構成要素の位置と種類を検出した例示図である。平面図を基準として、三次元座標体系における図面分類されたイメージの配置例示図である。平面図を基準として、三次元座標体系における図面分類されたイメージの配置例示図である。平面図を基準として、三次元座標体系における図面分類されたイメージの配置例示図である。平面図を基準として、三次元座標体系における図面分類されたイメージの配置例示図である。平面図を基準として、三次元座標体系における図面分類されたイメージの配置例示図である。平面図を基準として、三次元座標体系における図面分類されたイメージの配置例示図である。平面図を基準として、三次元座標体系における図面分類されたイメージの配置例示図である。平面図を基準として、三次元座標体系における図面分類されたイメージの配置例示図である。オブジェクトのBBoxに対する平面図と仰視図の三次元座標値と公式を示す例示図である。オブジェクトのBBoxに対する正面図と横断面図の三次元座標値と公式を示す例示図である。オブジェクトのBBoxに対する背面図の三次元座標値と公式を示す図である。オブジェクトのBBoxに対する左側面図の三次元座標値と公式を示す図である。オブジェクトのBBoxに対する右側面図の三次元座標値と公式を示す図である。実施例による平面図と仰視図の検出されたばしらと横および縦の長さの例示図である。実施例による平面図、横断面図、正面図、背面図のばしらのBBoxおよび横、縦の長さの例示図である。実施例による縦断面図、左側面図および右側面図のばしらのBBoxおよび横、縦の長さの例示図である。きだん構造の推論を説明するための例示図である。きだん構造の推論を説明するための例示図である。そせき構造の推論を説明するための例示図である。そせき構造の推論を説明するための例示図である。ばしら構造の推論を説明するための例示図である。ばしら構造の推論を説明するための例示図である。斗供構造の推論を説明するための例示図である。側面図の最外ばしらの位置によるはり構造の推論の例示図である。側面図の最外ばしらの位置によるはり構造の推論の例示図である。横断面図のばしらの中心によるはり構造の推論の例示図である。横断面図のばしらの中心によるはり構造の推論の例示図である。実施例により、三次元モデリングされた1高柱5梁架け構造の例示図である。実施例によるコンピュータシステムの構成を示す図である。 本発明の利点および特徴、そしてそれらを達成する方法は、添付した図面とともに詳細に後述する実施例を参照すれば明確になる。しかし、本発明は以下に開示される実施例に限定されるものではなく、互いに異なる多様な形態で実現され、単に本実施例は本発明の開示が完全となるようにし、本発明の属する技術分野における通常の知識を有する者に発明の範疇を完全に知らせるために提供されるものであり、本発明は請求項の範疇によってのみ定義される。明細書全体にわたって同一の参照符号は同一の構成要素を指す。 たとえ、「第1」または「第2」などが多様な構成要素を述べるために使用されるが、このような構成要素は前記のような用語によって制限されない。前記のような用語は単に1つの構成要素を他の構成要素と区別するために使用できる。したがって、以下に言及される第1構成要素は、本発明の技術的思想内で第2構成要素であってもよい。 本明細書で使用された用語は実施例を説明するためのものであり、本発明を制限しようとするものではない。本明細書において、単数形は、文言で特に言及しない限り、複数形も含む。明細書で使用される「含む(comprises)」または「含む(comprising)」は、言及された構成要素または段階が1つ以上の他の構成要素または段階の存在または追加を排除しないという意味を含む。 他に断りがなければ、本明細書で使用されるすべての用語は、本発明の属する技術分野における通常の知識を有する者に共通して理解できる意味で解釈できる。また、一般的に使用される辞書に定義されている用語は、明らかに特に定義されていない限り、理想的または過度に解釈されない。 図1は、実施例によるイメージベースで建築物の三次元構造を推論する方法を説明するためのフローチャートである。 図1を参照すれば、イメージベースで建築物の三次元構造を推論する方法は、建築物に対する少なくとも1つのイメージを受信して、イメージそれぞれの種類を分類するステップS110と、イメージそれぞれの座標体系を生成するステップS120と、イメージそれぞれに含まれている少なくとも1つの構成要素を検出するステップS130と、イメージ間のスケールを調整するステップS140と、イメージそれぞれの座標体系に基づいてスケーリングされたイメージでの各構成要素の座標を推定するステップS150と、推定された各構成要素の座標情報に基づいて建築物を三次元モデリングするステップS160とを含むことができる。 実施例によるイメージそれぞれの種類を分類するステップS110において、収集されたイメージの種類を区分するように予め学習された図面分類(classification)モデルを用いることができる。 ここで、イメージは、建築物を撮影した写真および建築物の設計図面を含む二次元イメージを含むことができる。 この時、イメージの種類は、平面図、仰視図、正面図、背面図、左側面図、右側面図、縦断面図および横断面図の少なくとも1つを含むことができる。 実施例による構成要素を検出するステップS130において、イメージから構成要素を検出するように予め学習された分類モデルを用いて、構成要素の位置と種類を検出する。 このような分類モデルを学習するためには、検出する構成要素を選定し、収集されたイメージに検出する構成要素がラベリングされた学習データが構成されなければならない。 図2は、実施例により、分類モデルに基づいて、横断面図から構成要素の位置と種類を検出した例示図であり、図3は、実施例により、分類モデルに基づいて、縦断面図から構成要素の位置と種類を検出した例示図である。 図2および図3に示されるように、分類モデルは、建築物の図面が入力されることにより、建築物の構成要素を検出してバウンディングボックス(Bounding Box、BBox)で表示して出力することができる。 実施例による座標体系を生成するステップS120において、1つの建築物に対して入力された図面およびイメージ間の三次元座標体系を設定し、二次元イメージの座標を三次元座標に変換する。 これは、後述するS150における構成要素の三次元座標を推論するための事前準備ステップで、図面および建築イメージ間の三次元情報を事前に定義するステップであり得る。 この時、二次元図面の三次元座標体系は、平面図を基準として分類された図面イメージが配置される。 図4~図11は、平面図を基準として、三次元座標体系における図面分類されたイメージの配置例示図である。 実施例により、三次元座標体系に配置されたイメージの二次元座標系を三次元座標系に変換する公式による。 以下、図12~16に示された横(W)および縦(H)は、二次元図面における横の長さおよび縦の長さを示す符号または変数を意味するだけで、固定された定数値を意味しないことを明らかにする。 例えば、図12に示された平面図における縦(H)と、図13に示された正面図における縦(H)とは、三次元座標系においてその長さの対象が異なっていてもよく、図12に示された平面図における横(W)の長さと、図15の左側面図における横(W)の長さとは、三次元座標系においてその長さの対象が異なっていてもよい。 図12は、オブジェクトのBBoxに対する平面図と仰視図の三次元座標値と公式を示す例示図である。 図13は、オブジェクトのBBoxに対する正面図と横断面図の三次元座標値と公式を示す例示図である。 図14は、オブジェクトのBBoxに対する背面図の三次元座標値と公式を示す図である。 図15は、オブジェクトのBBoxに対する左側面図の三次元座標値と公式を示す図である。 図16は、オブジェクトのBBoxに対する右側面図の三次元座標値と公式を示す図である。 最後に、縦断面図は、収集された図面イメージおよびイメージが左側または右側に区分可能で、区分される側面に沿って座標体系を生成する。 この時、縦断面図が左側の場合には、左側面図の座標体系と同一であり、右側の場合には、右側面図の座標体系と同一であってもよい。 実施例によるイメージ間のスケールを調整するステップS140は、平面図と正面図を基準として、構成要素検出ステップで検出されたばしらの間隔を用いる。 この時、前述のような横Wと縦Hとをばしらのイメージ間隔として決定する。 以下、図17~19に示された横(W)および縦(H)は、二次元図面における横の長さおよび縦の長さを示す符号または変数を意味するだけで、固定された定数値を意味しないことを明らかにする。 例えば、図18に示された平面図における縦(H)と、正面図における縦(H)とは、三次元座標系においてその長さの対象が異なっていてもよく、図18に示された平面図における横(W)の長さと、図19の左側面図における横(W)の長さとは、三次元座標系においてその長さの対象が異なっていてもよい。 また、図17~19に示された横(W)および縦(H)は、固定された定数値を意味するのではなく、二次元図面上で測定される横(W)および縦(H)の実際の長さ値は