Master’s Research
遠山昌宏
TOHYAMA Masahiro
対話システムを用いたコミュニティスペース型ライブ配信形式の模索
A study of community space type live streaming using dialogue system
人間にとって雑談は重要である。国立国語研究所の小磯らが2014年に実施した調査によれば、雑談は一日の会話行動のうち6割強を占めている。雑談は我々の生活と切っても切り離せない存在である。雑談を主目的とする対話システム、雑談対話システムの例を見ると、マイクロソフト社が開発し2015年7月にLINEアカウントとして公開された女子高生AI「りんな」は、830万人ものユーザーが現在も雑談を楽しみ、毎週17時間、2000ターン以上にも及ぶやり取りを行う人が現れるほどの人気を博している。このように、雑談対話システムは現在注目を集め始めており、今後も雑談対話システムの需要は増加していくだろうと予想される。 しかし一方で、雑談対話システムにはいまだ多くの課題がある。まず、コンピュータが表面上の意味以上の意味(含意)を捉えることが難しいという問題や考える範囲を適切に設定することが難しいという問題(フレーム問題)など、解決されていない複数の問題が存在する。そのため、完全に人間と同程度の雑談を行えるような対話システムはいまだ存在していない。また、現在実社会で活用されている雑談対話システムの多くは「対話システム対人間」という一対一の対話のみを想定している。これは、三者以上が参加するマルチパーティ対話の方法論がいまだ確立されていないためである。マルチパーティ対話は重要であるにも関わらず、まだ研究段階にあるというのが現状である。マルチパーティ対話の中でも特に「人間対人間」の対話を含むマルチパーティのコミュニケーションを想定した雑談対話システムに関する研究はあまり検討されていない。 ここで自分が着目したのはコミュニティスペース型ライブ配信という形式である。本稿におけるコミュニティスペース型ライブ配信というのは、配信のコンテンツを単に受動的に楽しむようなものではなく、配信に集まった視聴者がコンテンツを通じて交流することを楽しむライブ配信と定義する。そうしたライブ配信上で対話システムが話題を提供することにより、各視聴者と対話システムの対話だけでなく、視聴者同士の対話を誘発できるかもしれない。もしこれを実現できれば、人にとって重要である雑談を促すことが可能となり、加えてまだ確立されていないマルチパーティ対話の手法を提案できるのではないかと考えた。 本研究では上記の考えに基づき、雑談対話システム「ミクマリオン」を制作した。ミクマリオンとはクリプトン?フューチャー?メディアのキャラクター「初音ミク」を題材としたデータベースおよび雑談対話システムであり、初音ミクに興味を持つ人々の中にある初音ミクのイメージを用例データとして収集、データベース化し、そのデータを元にライブ配信を行うものである。 このミクマリオンを用いて、2020年10月末から2021年1月初頭の期間にYouTubeにて全13回のライブ配信を行った。その結果から、雑談対話システムによって人同士の交流が促される可能性が示された。また、より長期間にわたって持続的に人同士の交流を発生させる上での課題として、ライブ配信上で急に会話へ参加することに対するハードルが高いという問題と、慣れてくることにより参加者が飽きてしまうという問題を確認した。本稿ではこの2点の課題に対し、適切なプラットフォーム、会話のきっかけづくり、参加者を飽きさせないための工夫の3点について考察した。
Small talk is essential to humans. According to a 2014 research by Koiso and her team from the National Institute for Japanese Language and Linguistics, small talk consists of over 60% of conversational activities a day. It is an inseparable part of our daily lives. Rinna is a prime example of a dialogue system geared mainly toward holding casual conversations. Developed by Microsoft and released in July 2015 as a LINE account, Rinna is an AI high school girl chatbot. Today, 8.3 million users enjoy chatting with Rinna, who is so popular that some people spend 17 hours a week exchanging over 2,000 back-and-forth messages with her. This shows that there is a growing interest in dialogue systems today, and experts predict the demand will continue to grow in the future. At the same time, however, dialogue systems still face many issues. To begin with, the computer has difficulty picking up on anything beyond the surface meaning of words (such as deeper implications). There is also the frame problem, which grapples with the difficulty of setting an appropriate frame in which to consider what changes and what does not change as a result of an action or event. As many such complex issues remain unresolved, there is no dialogue system that can, as of yet, hold conversations on the same level as humans. Furthermore, most of the dialogue systems being used in society today are created on the assumption that conversations are one-on-one between the system and one person. This is because a methodology for creating a multi-party dialogue system of three or more people has not yet been established. Even though multi-party dialogues are important, such systems are still in the research stages at this point. In particular, hardly any research has been devoted to a dialogue system that would also include multi-party communication between users. As such, I decided to create a community space live streaming system. For the purpose of this research, I define community space live streaming as an activity during which viewers do not just passively sit back and watch, but rather interact with each other through the content of the live stream. The dialogue system would provide topics of conversation during the live stream, which I believed would prompt viewers to talk, not only with the system, but also with each other. If this were possible, I hypothesized that the system would encourage small talk, which is vital to humans, and also provide a potential roadmap to establishing a multi-party dialogue system. Based on the above hypothesis, I created Mikumarion. This is a database and dialogue system based on Crypton Future Media’s character Hatsune Miku. The images of Hatsune Miku that exist in the minds of people interested in the character were collected as sample data and made into a database, and that data was used as a basis for live streaming. Using Mikumarion, I held 13 live streaming sessions on YouTube between the end of October 2020 and the beginning of January 2021. The results illustrated the potential of the dialogue system in encouraging viewers to interact with one another. However, two issues presented a challenge to creating continued human interactions over a longer period of time. The first was that some people were hesitant to suddenly jump into conversations during the live streams. Second, once participants started getting used to the sessions, they got bored. In the research paper, I examined these issues and considered three solutions: finding an appropriate platform, finding ways to facilitate conversations, and finding ways to prevent participants from growing bored.
?