JP-2026077661-A - 情報処理装置、情報処理方法、および情報処理プログラム

JP2026077661AJP 2026077661 AJP2026077661 AJP 2026077661AJP-2026077661-A

Abstract

【課題】ユーザが選択したヘアスタイルにするために必要な施術内容を推定することができる情報処理装置、情報処理方法、および情報処理プログラムを提供すること。【解決手段】本願に係る情報処理装置は、画像処理部と、推定部とを備える。画像処理部は、ユーザの顔画像であるユーザ顔画像と合成対象となるヘア画像とを合成した合成画像を生成する。推定部は、施術前後のヘア画像と施術内容との関係を学習した学習モデルを用いて、ユーザの施術前の画像と合成画像とから施術内容を推定する。【選択図】図８

Inventors

西紗記子

Assignees

ＬＩＮＥヤフー株式会社

Dates

Publication Date: 20260513
Application Date: 20260205

Claims (10)

ユーザの顔画像であるユーザ顔画像と合成対象となるヘア画像とを合成した合成画像を生成する画像処理部と、施術前後のヘア画像と施術内容との関係を学習した学習モデルを用いて、前記ユーザの施術前の画像と前記合成画像とから施術内容を推定する推定部と、を備えることを特徴とする情報処理装置。
前記学習モデルは、施術後のヘア画像と施術内容を示す情報との組み合わせを複数含む学習用データを用いた機械学習によって生成されることを特徴とする請求項１に記載の情報処理装置。
前記推定部によって推定された前記施術内容を示す情報を含む施術内容情報を出力する出力部を備えることを特徴とする請求項１または２に記載の情報処理装置。
前記推定部によって推定された前記施術内容に対する前記ユーザの許諾を受け付ける受付部と、前記受付部によって前記許諾が受け付けられた場合に、前記推定部によって推定された前記施術内容を示す情報を含む予約要求をヘア施術者宛に出力する出力部と、を備えることを特徴とする請求項１または２に記載の情報処理装置。
前記出力部は、前記合成画像または前記合成対象となる前記ヘア画像を含む前記予約要求を前記ヘア施術者宛に出力することを特徴とする請求項４に記載の情報処理装置。
前記推定部によって推定された前記施術内容を示す情報をヘア施術者宛に出力する出力部と、前記推定部によって推定された前記施術内容に対する前記ヘア施術者による修正案を受け付ける修正案受付部と、を備え、前記出力部は、前記修正案受付部によって受け付けられた修正後の前記施術内容を示す情報を出力することを特徴とする請求項１または２に記載の情報処理装置。
前記推定部によって推定された前記施術内容に基づいて、施術費用を判定する判定部を備えることを特徴とする請求項１または２に記載の情報処理装置。
前記ユーザによる施術内容の指定を受け付ける受付部と、前記受付部によって前記指定が受け付けられた前記施術内容と前記推定部によって推定された前記施術内容とを比較する比較部と、前記比較部による比較結果を出力する出力部と、を備えることを特徴とする請求項１または２に記載の情報処理装置。
コンピュータが実行する情報処理方法であって、ユーザの顔画像であるユーザ顔画像と合成対象となるヘア画像とを合成した合成画像を生成する画像処理工程と、施術前後のヘア画像と施術内容との関係を学習した学習モデルを用いて、前記ユーザの施術前の画像と前記合成画像とから施術内容を推定する推定工程と、を含むことを特徴とする情報処理方法。
ユーザの顔画像であるユーザ顔画像と合成対象となるヘア画像とを合成した合成画像を生成する画像処理手順と、施術前後のヘア画像と施術内容との関係を学習した学習モデルを用いて、前記ユーザの施術前の画像と前記合成画像とから施術内容を推定する推定手順と、をコンピュータに実行させることを特徴とする情報処理プログラム。

Description

本発明は、情報処理装置、情報処理方法、および情報処理プログラムに関する。従来、ユーザの顔画像とヘア画像とを合成してユーザに提示する技術が知られている。例えば、特許文献１には、ヘアスタイルやヘアの色を変更するヘアシミュレーションによる画像処理を行い、かかる画像処理の結果を表示する技術が提案されている。特開２０１３－１７８７８９号公報図１は、実施形態に係る情報処理の一例を示す図である。図２は、実施形態に係る情報処理システムの構成の一例を示す図である。図３は、実施形態に係る情報提供装置の構成例を示す図である。図４は、実施形態に係る情報提供装置のユーザ情報記憶部に記憶されるユーザ情報テーブルの一例を示す図である。図５は、実施形態に係る情報提供装置の投稿情報記憶部に記憶される投稿情報テーブルの一例を示す図である。図６は、実施形態に係る情報提供装置のモデル情報記憶部に記憶されるモデル情報テーブルの一例を示す図である。図７は、実施形態に係る情報提供装置のコンテンツ記憶部に記憶されるコンテンツテーブルの一例を示す図である。図８は、実施形態に係る端末装置の構成の一例を示す図である。図９は、実施形態に係る端末装置の受付部の構成の一例を示す図である。図１０は、実施形態に係る端末装置の画像処理部の構成の一例を示す図である。図１１は、実施形態に係る情報提供装置の出力部によって表示部に表示される予約設定画面の一例を示す図である。図１２は、実施形態に係る情報提供装置の出力部によって表示部に表示されるキーワード指定画面の一例を示す図である。図１３は、実施形態に係る情報提供装置の処理部によって指定キーワードから類似ヘア画像を取得する処理を説明するための図である。図１４は、実施形態に係る情報提供装置の出力部によって表示部に表示される予約設定画面の他の例を示す図である。図１５は、実施形態に係る情報提供装置の出力部によって表示部に表示される予約設定画面のさらに他の例を示す図である。図１６は、実施形態に係る情報提供装置の出力部によって表示部に表示される合成画像変更画面の一例を示す図である。図１７は、実施形態に係る情報提供装置の推定部によってユーザ画像と合成画像とから施術内容を推定する処理を説明するための図である。図１８は、実施形態に係る情報提供装置の出力部によって表示部に表示される顔型選択画面の一例を示す図である。図１９は、実施形態に係る端末装置の処理部による情報処理の一例を示すフローチャートである。図２０は、実施形態に係る端末装置の処理部による予約処理の一例を示すフローチャートである。図２１は、実施形態に係る情報提供装置および端末装置の各々の機能を実現するコンピュータの一例を示すハードウェア構成図である。以下に、本願に係る情報処理装置、情報処理方法、および情報処理プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、および情報処理プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。〔１．情報処理の一例〕まず、図１を用いて、実施形態に係る情報処理の一例について説明する。図１は、実施形態に係る情報処理の一例を示す図である。なお、以下では、実施形態に係る情報処理装置が、図１に示す端末装置４である場合について説明するが、かかる情報処理装置は、図１に示す情報提供装置１であってもよく、端末装置４と情報提供装置１とを組み合わせた構成であってもよい。図１に示す実施形態に係る情報提供装置１は、例えば、ＳＮＳ（Social Networking Service）などのサービスを提供する情報処理装置である。例えば、情報提供装置１は、投稿者によって投稿された投稿情報を受け付ける。情報提供装置１は、投稿者から受け付けた投稿情報を閲覧者となるユーザＵの端末装置４に対して配信する。投稿者は、例えば、ヘアサロン、ヘア施術者、施術対象者などであり、ユーザＵを含んでいてもよい。ヘアサロンは、美容室（美容院）や理容室（理容院）などである。ヘア施術者は、ヘアサロンにおいてヘア（髪）を整える施術者であり、ヘアスタイリストとも呼ばれる。施術対象者は、ヘア施術者によってヘアの施術を受けたユーザである。投稿者によって投稿される投稿情報は、例えば、投稿者を撮像して得られる投稿者撮像画像である投稿画像や投稿者が投稿したテキストである投稿テキストを示す情報などを含む。投稿画像は、例えば、投稿者のヘアや顔を含む投稿者の頭部の撮像画像を含む。また、投稿テキストは、例えば、投稿画像に対する投稿者のコメントなどを含む。投稿画像に対する投稿者のコメントは、例えば、投稿画像に対する投稿者の評価を示す評価情報を含む。以下において、投稿画像に対する投稿者のコメントを投稿者コメントと記載する場合がある。また、情報提供装置１は、投稿情報に含まれる投稿画像に対する他のユーザ（閲覧者の一例）の評価を示す評価情報や投稿情報に対する他のユーザのコメントを受け付ける。そして、情報提供装置１は、受け付けた他のユーザの評価情報や他のユーザのコメントを含む上述した投稿情報を閲覧者の装置に対して配信する。閲覧者の装置は、例えば、ユーザＵの端末装置４またはその他のユーザの装置である。以下において、他のユーザのコメントを閲覧者コメントと記載する場合がある。投稿情報に対する評価は、例えば、肯定的な評価（例えば、「グッド」）や否定的な評価（例えば、「バッド」）などであるが、中間的な評価（例えば、「普通」）などを含んでいてもよい。また、情報提供装置１は、投稿情報が他のユーザによってタイムラインに追加された数などの情報を投稿情報に対する評価として閲覧者となるユーザＵの端末装置４に対して配信することもできる。情報提供装置１は、複数種類の学習モデルの情報を端末装置４に送信する（ステップＳ１）。複数種類の学習モデルは、第１の学習モデル、第２の学習モデル、第３の学習モデル、および第４の学習モデルを含む。まず、第１の学習モデルについて説明する。第１の学習モデルは、キーワードとヘア画像との関係性を学習したモデルであり、１以上のキーワードを入力としヘア画像を出力とする学習モデルである。第１の学習モデルは、キーワードとヘア画像との組み合わせを複数含む学習用データを用いて、機械学習によって生成される。なお、第１の学習モデルは、１以上のキーワードを入力としヘア画像特定情報を出力とする学習モデルであってもよい。ヘア画像特定情報は、ヘア画像を特定する情報である。情報提供装置１は、例えば、投稿者コメントや投稿者テキストなどに含まれる１以上のキーワードを抽出し、かかる１以上のキーワードとコメントの対象となった投稿画像との組み合わせを複数含むデータを上述した学習用データとして生成する。また、情報提供装置１は、投稿者コメントや投稿者テキストからキーワードを抽出できない場合、閲覧者コメントに含まれる１以上のキーワードを抽出し、かかる１以上のキーワードとコメントの対象となった投稿画像との組み合わせを複数含むデータを上述した学習用データとして生成する。また、情報提供装置１は、投稿者コメントまたは投稿者テキストと、閲覧者コメントとに共に含まれる１以上のキーワードを抽出し、かかる１以上のキーワードとコメントの対象となった投稿画像との組み合わせを複数含むデータを上述した学習用データとして生成することもできる。なお、学習用データは、投稿画像毎に作業者が割り当てたキーワードと投稿画像との組み合わせを複数含むデータであってもよい。また、学習用データは、投稿情報などのコンテンツに代えて、ウェブページなどのコンテンツなどに含まれる画像であってもよく、第三者が提供する画像であってもよい。投稿情報は、投稿コンテンツの一例である。例えば、情報提供装置１は、人の顔とヘアとが含まれる画像と文章とが含まれるコンテンツをネットワーク経由で取得し、かかるコンテンツに含まれる文章からキーワードを抽出することもできる。この場合、情報提供装置１は、コンテンツに含まれる文章から抽出したキーワードとコンテンツに含まれる画像との組み合わせを複数含むデータを学習用データとして生成する。次に、第２の学習モデルについて説明する。第２の学習モデルは、顔画像と顔の特徴を示す情報との関係を学習した学習モデルであり、顔画像を含む画像を入力とし、顔の特徴を示す情報を出力とする学習モデルである。第２の学習モデルは、顔画像を含む画像と顔の特徴を示す情報との組み合わせを複数含む学習用データを用いて、機械学習によって生成される。顔の特徴を示す情報は、例えば、顔型の種類を示す情報であるが、顔における眉、目、鼻、口、および耳のうちの１以上の大きさ、形、位置などの各パーツの特徴を示す情報であってもよい。また、顔の特徴を示す情報は、顔における眉、目、鼻、口、および耳の各々の位置を示す情報であってもよく、顔における眉、目、鼻、口、および耳の各々の位置および大きさを示す情報などであってもよい。次に、第３の学習モデルについて説明する。第３の学習モデルは、顔の特徴を示す情報と当該顔に似合うと評価されたヘアスタイルとの関係性を学習したモデルであり、顔の特徴を示す情報を入力とし当該顔に似合うと推定されるヘアスタイルを示す情報を出力とする学習モデルである。第３の学習モデルは、顔の特徴を示す情報と、ヘア画像と、顔の特徴を示す情報とヘア画像との組み合わせに対する評価を示す情報との組み合わせを複数含む学習用データを用いて、機械学習によって生成される。情報提供装置１は、投稿画像、閲覧者コメント、および評価情報などを各々含む複数の投稿情報を収集する。顔画像は、顔画像およびヘア画像を含み、評価情報は、閲覧者である他のユーザの投稿画像に対する評価を示す情報であるが、投稿者コメントに含まれる評価を示す情報が含まれていてもよい。情報提供装置１は、収集した各投稿情報に含まれる顔画像で示される顔の特徴を抽出する。そして、情報提供装置１は、投稿情報の投稿画像に含まれるヘア画像と、抽出した顔の特徴を示す情報と、評価情報とを含むデータを上述した学習用データとして生成する。第３の学習モデルにおいて、顔の特徴を示す情報は、例えば、顔型の種類を示す情報であるが、顔における眉、目、鼻、口、および耳のうちの１以上の大きさ、形、位置などの各パーツの特徴を示す情報であってもよい。また、顔の特徴を示す情報は、顔における眉、目、鼻、口、および耳の各々の位置を示す情報であってもよく、顔における眉、目、鼻、口、および耳の各々の位置および大きさを示す情報などであってもよい。次に、第４の学習モデルについて説明する。第４の学習モデルは、施術前後のヘア画像と施術内容との関係を学習した学習モデルであり、施術前後のヘア画像を入力とし、推定される施術内容を示す情報を出力とする学習モデルである。施術前後のヘア画像は、ヘア施術前のヘア画像とヘア施術後のヘア画像とを含む。施術内容は、例えば、カットの有無、カットの量、ブリーチの有無、ブリーチの数、カラーの有無、カラーの種類、パーマの有無、パーマの種類、縮毛矯正の有無などを含む。施術内容を示す情報は、カットの有無、カットの量、ブリーチの有無、ブリーチの数、カラーの有無、カラーの種類、パーマの有無、パーマの種類、縮毛矯正の有無の各々のスコアの情報を含む。また、施術内容を示す情報は、カットの有無、カットの量、ブリーチの有無、ブリーチの数、カラーの有無、カラーの種類、パーマの有無、パーマの種類、縮毛矯正の有無の組み合わせ毎のスコアの情報を含んでいてもよい。第４の学習モデルは、施