Search

JP-2026077661-A - 情報処理装置、情報処理方法、および情報処理プログラム

JP2026077661AJP 2026077661 AJP2026077661 AJP 2026077661AJP-2026077661-A

Abstract

【課題】ユーザが選択したヘアスタイルにするために必要な施術内容を推定することができる情報処理装置、情報処理方法、および情報処理プログラムを提供すること。 【解決手段】本願に係る情報処理装置は、画像処理部と、推定部とを備える。画像処理部は、ユーザの顔画像であるユーザ顔画像と合成対象となるヘア画像とを合成した合成画像を生成する。推定部は、施術前後のヘア画像と施術内容との関係を学習した学習モデルを用いて、ユーザの施術前の画像と合成画像とから施術内容を推定する。 【選択図】図8

Inventors

  • 西 紗記子

Assignees

  • LINEヤフー株式会社

Dates

Publication Date
20260513
Application Date
20260205

Claims (10)

  1. ユーザの顔画像であるユーザ顔画像と合成対象となるヘア画像とを合成した合成画像を生成する画像処理部と、 施術前後のヘア画像と施術内容との関係を学習した学習モデルを用いて、前記ユーザの施術前の画像と前記合成画像とから施術内容を推定する推定部と、を備える ことを特徴とする情報処理装置。
  2. 前記学習モデルは、 施術後のヘア画像と施術内容を示す情報との組み合わせを複数含む学習用データを用いた機械学習によって生成される ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記推定部によって推定された前記施術内容を示す情報を含む施術内容情報を出力する出力部を備える ことを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記推定部によって推定された前記施術内容に対する前記ユーザの許諾を受け付ける受付部と、 前記受付部によって前記許諾が受け付けられた場合に、前記推定部によって推定された前記施術内容を示す情報を含む予約要求をヘア施術者宛に出力する出力部と、を備える ことを特徴とする請求項1または2に記載の情報処理装置。
  5. 前記出力部は、 前記合成画像または前記合成対象となる前記ヘア画像を含む前記予約要求を前記ヘア施術者宛に出力する ことを特徴とする請求項4に記載の情報処理装置。
  6. 前記推定部によって推定された前記施術内容を示す情報をヘア施術者宛に出力する出力部と、 前記推定部によって推定された前記施術内容に対する前記ヘア施術者による修正案を受け付ける修正案受付部と、を備え、 前記出力部は、 前記修正案受付部によって受け付けられた修正後の前記施術内容を示す情報を出力する ことを特徴とする請求項1または2に記載の情報処理装置。
  7. 前記推定部によって推定された前記施術内容に基づいて、施術費用を判定する判定部を備える ことを特徴とする請求項1または2に記載の情報処理装置。
  8. 前記ユーザによる施術内容の指定を受け付ける受付部と、 前記受付部によって前記指定が受け付けられた前記施術内容と前記推定部によって推定された前記施術内容とを比較する比較部と、 前記比較部による比較結果を出力する出力部と、を備える ことを特徴とする請求項1または2に記載の情報処理装置。
  9. コンピュータが実行する情報処理方法であって、 ユーザの顔画像であるユーザ顔画像と合成対象となるヘア画像とを合成した合成画像を生成する画像処理工程と、 施術前後のヘア画像と施術内容との関係を学習した学習モデルを用いて、前記ユーザの施術前の画像と前記合成画像とから施術内容を推定する推定工程と、を含む ことを特徴とする情報処理方法。
  10. ユーザの顔画像であるユーザ顔画像と合成対象となるヘア画像とを合成した合成画像を生成する画像処理手順と、 施術前後のヘア画像と施術内容との関係を学習した学習モデルを用いて、前記ユーザの施術前の画像と前記合成画像とから施術内容を推定する推定手順と、をコンピュータに実行させる ことを特徴とする情報処理プログラム。

Description

本発明は、情報処理装置、情報処理方法、および情報処理プログラムに関する。 従来、ユーザの顔画像とヘア画像とを合成してユーザに提示する技術が知られている。例えば、特許文献1には、ヘアスタイルやヘアの色を変更するヘアシミュレーションによる画像処理を行い、かかる画像処理の結果を表示する技術が提案されている。 特開2013-178789号公報 図1は、実施形態に係る情報処理の一例を示す図である。図2は、実施形態に係る情報処理システムの構成の一例を示す図である。図3は、実施形態に係る情報提供装置の構成例を示す図である。図4は、実施形態に係る情報提供装置のユーザ情報記憶部に記憶されるユーザ情報テーブルの一例を示す図である。図5は、実施形態に係る情報提供装置の投稿情報記憶部に記憶される投稿情報テーブルの一例を示す図である。図6は、実施形態に係る情報提供装置のモデル情報記憶部に記憶されるモデル情報テーブルの一例を示す図である。図7は、実施形態に係る情報提供装置のコンテンツ記憶部に記憶されるコンテンツテーブルの一例を示す図である。図8は、実施形態に係る端末装置の構成の一例を示す図である。図9は、実施形態に係る端末装置の受付部の構成の一例を示す図である。図10は、実施形態に係る端末装置の画像処理部の構成の一例を示す図である。図11は、実施形態に係る情報提供装置の出力部によって表示部に表示される予約設定画面の一例を示す図である。図12は、実施形態に係る情報提供装置の出力部によって表示部に表示されるキーワード指定画面の一例を示す図である。図13は、実施形態に係る情報提供装置の処理部によって指定キーワードから類似ヘア画像を取得する処理を説明するための図である。図14は、実施形態に係る情報提供装置の出力部によって表示部に表示される予約設定画面の他の例を示す図である。図15は、実施形態に係る情報提供装置の出力部によって表示部に表示される予約設定画面のさらに他の例を示す図である。図16は、実施形態に係る情報提供装置の出力部によって表示部に表示される合成画像変更画面の一例を示す図である。図17は、実施形態に係る情報提供装置の推定部によってユーザ画像と合成画像とから施術内容を推定する処理を説明するための図である。図18は、実施形態に係る情報提供装置の出力部によって表示部に表示される顔型選択画面の一例を示す図である。図19は、実施形態に係る端末装置の処理部による情報処理の一例を示すフローチャートである。図20は、実施形態に係る端末装置の処理部による予約処理の一例を示すフローチャートである。図21は、実施形態に係る情報提供装置および端末装置の各々の機能を実現するコンピュータの一例を示すハードウェア構成図である。 以下に、本願に係る情報処理装置、情報処理方法、および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、および情報処理プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 〔1.情報処理の一例〕 まず、図1を用いて、実施形態に係る情報処理の一例について説明する。図1は、実施形態に係る情報処理の一例を示す図である。なお、以下では、実施形態に係る情報処理装置が、図1に示す端末装置4である場合について説明するが、かかる情報処理装置は、図1に示す情報提供装置1であってもよく、端末装置4と情報提供装置1とを組み合わせた構成であってもよい。 図1に示す実施形態に係る情報提供装置1は、例えば、SNS(Social Networking Service)などのサービスを提供する情報処理装置である。例えば、情報提供装置1は、投稿者によって投稿された投稿情報を受け付ける。情報提供装置1は、投稿者から受け付けた投稿情報を閲覧者となるユーザUの端末装置4に対して配信する。 投稿者は、例えば、ヘアサロン、ヘア施術者、施術対象者などであり、ユーザUを含んでいてもよい。ヘアサロンは、美容室(美容院)や理容室(理容院)などである。ヘア施術者は、ヘアサロンにおいてヘア(髪)を整える施術者であり、ヘアスタイリストとも呼ばれる。施術対象者は、ヘア施術者によってヘアの施術を受けたユーザである。 投稿者によって投稿される投稿情報は、例えば、投稿者を撮像して得られる投稿者撮像画像である投稿画像や投稿者が投稿したテキストである投稿テキストを示す情報などを含む。投稿画像は、例えば、投稿者のヘアや顔を含む投稿者の頭部の撮像画像を含む。 また、投稿テキストは、例えば、投稿画像に対する投稿者のコメントなどを含む。投稿画像に対する投稿者のコメントは、例えば、投稿画像に対する投稿者の評価を示す評価情報を含む。以下において、投稿画像に対する投稿者のコメントを投稿者コメントと記載する場合がある。 また、情報提供装置1は、投稿情報に含まれる投稿画像に対する他のユーザ(閲覧者の一例)の評価を示す評価情報や投稿情報に対する他のユーザのコメントを受け付ける。そして、情報提供装置1は、受け付けた他のユーザの評価情報や他のユーザのコメントを含む上述した投稿情報を閲覧者の装置に対して配信する。閲覧者の装置は、例えば、ユーザUの端末装置4またはその他のユーザの装置である。以下において、他のユーザのコメントを閲覧者コメントと記載する場合がある。 投稿情報に対する評価は、例えば、肯定的な評価(例えば、「グッド」)や否定的な評価(例えば、「バッド」)などであるが、中間的な評価(例えば、「普通」)などを含んでいてもよい。また、情報提供装置1は、投稿情報が他のユーザによってタイムラインに追加された数などの情報を投稿情報に対する評価として閲覧者となるユーザUの端末装置4に対して配信することもできる。 情報提供装置1は、複数種類の学習モデルの情報を端末装置4に送信する(ステップS1)。複数種類の学習モデルは、第1の学習モデル、第2の学習モデル、第3の学習モデル、および第4の学習モデルを含む。 まず、第1の学習モデルについて説明する。第1の学習モデルは、キーワードとヘア画像との関係性を学習したモデルであり、1以上のキーワードを入力としヘア画像を出力とする学習モデルである。第1の学習モデルは、キーワードとヘア画像との組み合わせを複数含む学習用データを用いて、機械学習によって生成される。 なお、第1の学習モデルは、1以上のキーワードを入力としヘア画像特定情報を出力とする学習モデルであってもよい。ヘア画像特定情報は、ヘア画像を特定する情報である。 情報提供装置1は、例えば、投稿者コメントや投稿者テキストなどに含まれる1以上のキーワードを抽出し、かかる1以上のキーワードとコメントの対象となった投稿画像との組み合わせを複数含むデータを上述した学習用データとして生成する。 また、情報提供装置1は、投稿者コメントや投稿者テキストからキーワードを抽出できない場合、閲覧者コメントに含まれる1以上のキーワードを抽出し、かかる1以上のキーワードとコメントの対象となった投稿画像との組み合わせを複数含むデータを上述した学習用データとして生成する。 また、情報提供装置1は、投稿者コメントまたは投稿者テキストと、閲覧者コメントとに共に含まれる1以上のキーワードを抽出し、かかる1以上のキーワードとコメントの対象となった投稿画像との組み合わせを複数含むデータを上述した学習用データとして生成することもできる。 なお、学習用データは、投稿画像毎に作業者が割り当てたキーワードと投稿画像との組み合わせを複数含むデータであってもよい。また、学習用データは、投稿情報などのコンテンツに代えて、ウェブページなどのコンテンツなどに含まれる画像であってもよく、第三者が提供する画像であってもよい。投稿情報は、投稿コンテンツの一例である。 例えば、情報提供装置1は、人の顔とヘアとが含まれる画像と文章とが含まれるコンテンツをネットワーク経由で取得し、かかるコンテンツに含まれる文章からキーワードを抽出することもできる。この場合、情報提供装置1は、コンテンツに含まれる文章から抽出したキーワードとコンテンツに含まれる画像との組み合わせを複数含むデータを学習用データとして生成する。 次に、第2の学習モデルについて説明する。第2の学習モデルは、顔画像と顔の特徴を示す情報との関係を学習した学習モデルであり、顔画像を含む画像を入力とし、顔の特徴を示す情報を出力とする学習モデルである。 第2の学習モデルは、顔画像を含む画像と顔の特徴を示す情報との組み合わせを複数含む学習用データを用いて、機械学習によって生成される。顔の特徴を示す情報は、例えば、顔型の種類を示す情報であるが、顔における眉、目、鼻、口、および耳のうちの1以上の大きさ、形、位置などの各パーツの特徴を示す情報であってもよい。 また、顔の特徴を示す情報は、顔における眉、目、鼻、口、および耳の各々の位置を示す情報であってもよく、顔における眉、目、鼻、口、および耳の各々の位置および大きさを示す情報などであってもよい。 次に、第3の学習モデルについて説明する。第3の学習モデルは、顔の特徴を示す情報と当該顔に似合うと評価されたヘアスタイルとの関係性を学習したモデルであり、顔の特徴を示す情報を入力とし当該顔に似合うと推定されるヘアスタイルを示す情報を出力とする学習モデルである。 第3の学習モデルは、顔の特徴を示す情報と、ヘア画像と、顔の特徴を示す情報とヘア画像との組み合わせに対する評価を示す情報との組み合わせを複数含む学習用データを用いて、機械学習によって生成される。 情報提供装置1は、投稿画像、閲覧者コメント、および評価情報などを各々含む複数の投稿情報を収集する。顔画像は、顔画像およびヘア画像を含み、評価情報は、閲覧者である他のユーザの投稿画像に対する評価を示す情報であるが、投稿者コメントに含まれる評価を示す情報が含まれていてもよい。 情報提供装置1は、収集した各投稿情報に含まれる顔画像で示される顔の特徴を抽出する。そして、情報提供装置1は、投稿情報の投稿画像に含まれるヘア画像と、抽出した顔の特徴を示す情報と、評価情報とを含むデータを上述した学習用データとして生成する。 第3の学習モデルにおいて、顔の特徴を示す情報は、例えば、顔型の種類を示す情報であるが、顔における眉、目、鼻、口、および耳のうちの1以上の大きさ、形、位置などの各パーツの特徴を示す情報であってもよい。また、顔の特徴を示す情報は、顔における眉、目、鼻、口、および耳の各々の位置を示す情報であってもよく、顔における眉、目、鼻、口、および耳の各々の位置および大きさを示す情報などであってもよい。 次に、第4の学習モデルについて説明する。第4の学習モデルは、施術前後のヘア画像と施術内容との関係を学習した学習モデルであり、施術前後のヘア画像を入力とし、推定される施術内容を示す情報を出力とする学習モデルである。施術前後のヘア画像は、ヘア施術前のヘア画像とヘア施術後のヘア画像とを含む。 施術内容は、例えば、カットの有無、カットの量、ブリーチの有無、ブリーチの数、カラーの有無、カラーの種類、パーマの有無、パーマの種類、縮毛矯正の有無などを含む。施術内容を示す情報は、カットの有無、カットの量、ブリーチの有無、ブリーチの数、カラーの有無、カラーの種類、パーマの有無、パーマの種類、縮毛矯正の有無の各々のスコアの情報を含む。 また、施術内容を示す情報は、カットの有無、カットの量、ブリーチの有無、ブリーチの数、カラーの有無、カラーの種類、パーマの有無、パーマの種類、縮毛矯正の有無の組み合わせ毎のスコアの情報を含んでいてもよい。 第4の学習モデルは、施