お久しぶりです。
ブログの更新が1年に一回ほどになっておりますが、その数少ないブログ更新をします。
なかなか学習したことや、作ったものを作っているときはそれに集中してしまって、こちらに投稿することを忘れてしまうんですよね・・・。
今日はSeria(セリア)Projectについてまとめようと思います。
セリアプロジェクトとは、感情表現豊かなAIメイドアシスタントを作るプロジェクトです。
セリアプロジェクトではAIに感情表現を持たせて、より親しみやすいAIアシスタントを作ろうという発想から開発が始まりました。
テーマはいかに感情移入や、愛着を持ってもらえるAIアシスタントとすることができるかです。
そこで、いくつか事前検証を行いました。
①応答速度
【確認したこと】
会話をする場合、応答がすぐに買ってくる場合と、少し間があってから回答がある場合の感じ方の差の確認。
確認の結果、音声による会話の場合は応答が1,2秒以内にないとテンポの良い会話ができず、快適な会話が難しい。
会話を続けたいという気持ちになれないことが分かった、
②応答時の口調
【確認したこと】
AIからの応答の口調を女性らしい口調や、男友達のようなフランクな口調とした場合と、無難な「です」、「ます」口調とした場合とでの感じ方を比較
その結果、口調は女性的な口調やフランクな口調のほうが気楽に話せる雰囲気があり、話しやすいさ、愛着の持ちやすさで両行だった。
「です」「ます」口調の場合、無難で会話相手を不快にさせる恐れは少ないと感じたが、機械的な雰囲気があり、愛着を持つ、親しみやすさを持つという観点では最善ではないと感じた、
③アイコンの表情による感情表現
【確認したこと】
AIからの応答にキャラクターのアイコン画像の表情を連動させ、アイコン(静止画)によって感情表現させ、愛着を持てるか検証した。
その結果、アイコンがあったほうが多少キャラクタに親しみやすさを感じるものの、アイコンでの感情表現は表情間の差を感じにくく、大きな効果はないと感じた。
原因はアイコンの画像が小さかったため、表情が分かりにくいことと、表情パターンが少なく文脈に対して大げさすぎる表情になったり、逆に文脈に対s知恵感情表現が乏しい表情になり違和感があったためだと思われる。
④読み上げ音声による感情表現
【確認したこと】
事前のテストでは感情表現のないいわあゆる棒読みな音声で会話を行うことでどれほど音声による感情表現が重要性を確認、
結果棒読みの場合、口調や感情表現との音声の乖離が激しく、かなりの違和感を生む結果となった。
音声による感情表現はかなり重要だと感じた。
上記の事前確認を踏まえ、セリアでは次のような感情表現を実装しました
・Live2Dによるキャラクターの表情表現
表情表現は固定の表情ではなく、ランダム性を持たせることで表情パターンの少なさからくる違和感の軽減を目指しています。
・音声による感情表現
文脈に沿った感情表現を応答音声読み上げ時に加えて読み上げる機能を実装。
悲しい文章の場合、悲しそうな声質、イントネーションで読み上げ、楽しい話題の場合は明るく、弾むような声質、口調で読み上げます。
現状のセリアの課題
セリアは応答の読み上げに時間がかかるため、音声によるリアルタイム会話には向いていません。
そのため応答速度は割り切り、Youtubeでの生放送コメントでの会話や、チャットでの会話を前提としたAIアシスタントの位置づけとしています。
セリアの活動
せっかく開発したセリアなので、動画やYoutubeでの中放送を考えています。
現状は動画を中心にYoutube活動をしていく予定です。
もしよろしければ見てみてください!
Xではセリアが自動つぶやきをしております。
暇なときにでも見てみてくださいね!
(XのAPIの利用料金の関係でセリアからのリプライへの返信はできませんのでご了承ください)
0コメント