Search

JP-2026076743-A - 計算機システム及びファイルストレージ

JP2026076743AJP 2026076743 AJP2026076743 AJP 2026076743AJP-2026076743-A

Abstract

【課題】複数のファイルストレージの中から容易且つ適切にファイルを検索できるようにする。 【解決手段】検索サーバ20と、複数のファイルストレージ10と、を有する計算機システム1において、検索サーバ20は、検索要求を受け付け、検索要求に対応するファイルストレージ用検索要求をファイルストレージ10に送信し、ファイルストレージ10からファイルストレージ用検索要求に対応する検索結果を受信し、検索結果を要求元に返し、ファイルストレージ10は、ファイルストレージ10が管理するファイルシステムのスナップショットにおけるファイルに関するメタデータを格納するメタデータファイルT3を格納し、検索サーバ20からファイルストレージ用検索要求を受信し、ファイルストレージ用検索要求に基づいて、メタデータファイルT3からファイルを検索し、検索により得られた検索結果を検索サーバ20に返すように構成する。 【選択図】図1

Inventors

  • 鴨生 悠冬
  • 早坂 光雄

Assignees

  • 日立ヴァンタラ株式会社

Dates

Publication Date
20260512
Application Date
20241024

Claims (7)

  1. 検索サーバと、ファイルシステムを管理する複数のファイルストレージと、を有する計算機システムであって、 前記検索サーバは、 検索するファイルについての検索要求を受け付け、 前記検索要求に対応するファイルストレージ用検索要求を前記ファイルストレージに送信し、 前記ファイルストレージから前記ファイルストレージ用検索要求に対応する検索結果を受信し、 前記検索結果を前記検索要求の要求元に返し、 前記ファイルストレージは、 前記ファイルストレージが管理するファイルシステムのスナップショットにおけるファイルに関するメタデータを格納する第1のメタデータファイルを格納し、 前記検索サーバから前記ファイルストレージ用検索要求を受信し、 前記ファイルストレージ用検索要求に基づいて、前記第1のメタデータファイルからファイルを検索し、 検索により得られた検索結果を前記検索サーバに返す 計算機システム。
  2. 前記ファイルストレージは、前記第1のメタデータファイルを、直前のスナップショットの第1のメタデータファイルとの差分として作成する 請求項1に記載の計算機システム。
  3. 前記ファイルストレージは、 前記ファイルシステムにおける直前のスナップショットの取得後のファイルの操作に関わるメタデータを格納する第2のメタデータファイルを作成し、 前記ファイルストレージ用検索要求を受け付けた場合に、前記第1のメタデータファイル及び前記第2のメタデータファイルからファイルを検索する 請求項1に記載の計算機システム。
  4. 前記ファイルストレージは、 前記ファイルシステムに対するファイルI/O操作についてのログを格納し、前記ログに基づいて前記第2のメタデータファイルを作成する 請求項3に記載の計算機システム。
  5. 前記検索サーバは、 前記検索要求を、1以上の、前記ファイルストレージにおける単一のメタデータファイルに対する単一ファイル検索要求に変換し、 前記ファイルストレージ用検索要求として、前記単一ファイル検索要求を対応するメタデータファイルを有するファイルストレージに送信し、 前記ファイルストレージは、 前記単一ファイル検索要求を受信し、前記単一ファイル検索要求に従って対応するメタデータファイルからファイルを検索する 請求項1に記載の計算機システム。
  6. ファイルシステムを管理するファイルストレージであって、 記憶デバイスと、プロセッサとを備え、 前記記憶デバイスは、前記ファイルストレージが管理するファイルシステムのスナップショットにおけるファイルに関するメタデータを格納する第1のメタデータファイルを格納し、 前記プロセッサは、 検索サーバからファイルストレージ用検索要求を受信し、 前記ファイルストレージ用検索要求に基づいて、前記第1のメタデータファイルからファイルを検索し、 検索により得られた検索結果を前記検索サーバに返す ファイルストレージ。
  7. 検索サーバと、ファイルシステムを管理する複数のファイルストレージと、を有する計算機システムであって、 前記ファイルストレージは、 前記ファイルストレージが管理するファイルシステムにおいて操作されたファイルに関するメタデータを前記検索サーバに逐次送信し、 前記検索サーバは、 前記ファイルストレージから前記メタデータを受信してメタデータデータベースに反映し、 検索するファイルについての検索要求を受け付け、 前記メタデータデータベースを用いて、前記検索要求に対応するファイルを検索し、 検索により得られた検索結果を前記検索要求の要求元に返す、 計算機システム。

Description

本発明は、データ検索技術に関する。 近年、生成AI(Artificial Intelligence)の活用が注目を集めている。生成AIでは、ファイル/データベースで追加学習が行われる。学習データは複数拠点に存在することがあり、複数拠点に分散した学習データを発見する技術が求められている。 特許文献1には、複数拠点や複数ファイルストレージのスナップショット内のファイルのメタデータを1つのデータベースに集約し、グローバルデータ検索を可能にする技術が開示されている。 米国特許出願公開第2021/0103555号明細書 図1は、実施例1の概要を説明する図である。図2は、実施例1に係る計算機システムの全体構成図である。図3は、実施例1に係るファイルストレージの一例の構成図である。図4は、実施例1に係る検索サーバの一例の構成図である。図5は、実施例1に係るメタデータファイルリストの一例の構成図である。図6は、実施例1に係るメタデータファイルの一例の構成図である。図7は、実施例1に係る操作ログリストの一例の構成図である。図8は、実施例1に係るファイルストレージリストの一例の構成図である。図9は、実施例1に係るデータ検索結果の一例の構成図である。図10は、実施例1に係る検索処理の一例のフローチャートである。図11は、実施例1に係るファイルI/O処理の一例のフローチャートである。図12は、実施例1に係るメタデータファイル更新処理の一例のフローチャートである。図13は、実施例1に係るスナップショット取得処理の一例を示すフローチャートである。図14は、実施例1に係るスナップショット削除処理の一例を示すフローチャートである。図15は、実施例2の概要を説明する図である。図16は、実施例2に係るファイルストレージの一例の構成図である。図17は、実施例2に係る検索処理の一例のフローチャートである。図18は、実施例2に係るローカル検索処理一例のフローチャートである。図19は、実施例3に係るファイルストレージの一例の構成図である。図20は、実施例3に係る検索サーバの一例の構成図である。図21は、実施例3に係る検索処理の一例のフローチャートである。図22は、実施例3に係るメタデータ送付処理の一例のフローチャートである。 いくつかの実施例について、図面を参照して説明する。なお、以下に説明する実施例は特許請求の範囲に係る発明を限定するものではなく、また実施例の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。 以下の説明では、情報のデータ構造を表として説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。 また、以下の説明では、「プログラム」を動作主体として処理を説明する場合があるが、プログラムは、プロセッサによって実行されることで、定められた処理を、適宜に記憶部及びインターフェース部のうちの少なくとも1つを用いながら行うため、処理の主体が、プロセッサ(或いは、プロセッサを有する計算機又は計算機システム)とされてもよい。プログラムは、プログラムソースから計算機にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又は計算機が読み取り可能な記録メディアであってもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。また、プログラムが実行されることによって実現される処理のうちの少なくとも一部が、ハードウェア回路(例えばASIC(Application Specific Integrated Circuit)又はFPGA(Field-Programmable Gate Array))によって実現されてもよい。