芸術科学会論文誌 投稿用カバーシート(英語タイトルを修正) ■ 論文種類(以下のうちから一つ選択) ・原著論文 フルペーパー ■ 論文分野(1)〜3)のうちから一つ選択) 2) 科学系分野 ■ カテゴリ(1個以上選択) b-5) マルチメディアシステム c-1) 音楽コンテンツ ■ 該当特集(以下のうちから一つ選択) ・一般論文 ■ 論文題名(和文、英文)  ボーカルメロディに応じた歌詞生成  Lyrics generation from a vocal melody ■ 著者名(和文、英文)  宮野友弥(非会員)  斎藤博昭(正会員)  Tomoya Miyano  Hiroaki Saito ■ 著者所属(和文、英文)  慶應義塾大学大学院理工学研究科  Graduate School of Science and Technology, Keio University ■ 著者e-mail  miyano_tomoya380@keio.jp ■ 連絡担当者の氏名、住所、所属、電話、Fax、e-mail  宮野友弥  神奈川県横浜市保土ヶ谷区釜台町5-2-909  慶應義塾大学大学院理工学研究科  070 1576 5135  miyano_tomoya380@keio.jp ■ 論文概要(和文400字程度、英文100ワード程度) 概要 ポピュラー音楽のボーカルメロディから,聴きやすさを考慮した自動歌詞生成についての 研究を行った.歌詞については散文的意味に加え,音楽的な要素の双方を同時に考慮する 必要がある.本稿では人間の手助けを必要とするサポートシステムという形ではなく,ボ ーカルメロディを入力するだけで言語モデルが自動的に歌詞を出力するシステムを構築す る.具体的には音符列をシーケンスとみることにより,機械翻訳によく用いられるseq2seq とTransformerを適用した.評価には単語密度という簡易版の尺度を導入するとともに, 各言語モデルが出力した歌詞をソフトウェアで音声合成し,7 人の被験者による主観評価 で,聴きやすさ,意味,全体的なクオリティについての評価を行った.また,データ数に よる学習到達度の違いにも簡易的に評価して考察した.全ての手法でテスト曲の歌詞生成 時にある程度の言語的な乱れが見られたが,その中ではTransformerが最もメロディに応じ た自然な歌詞を生成した. Abstract This paper reports research on automatic lyrics generation considering listenability from a vocal melody of popular music. In lyrics generation, it is necessary to consider both the meaning and the melody at the same time. We built a system in which the language model automatically generates lyrics just from a vocal melody. By considering the notes as sequences, we applied seq2seq and Transformer, each of which is often used in machine translation. We introduce word density as a quantitative measure of evaluation. The lyrics output by each language model was voice-synthesized, and seven participants performed subjective evaluation on listenability, meaning, and overall quality. We also briefly evaluated the difference in learning achievement depending on the number of data. All the methods showed some linguistic disturbance in generating the lyrics of the test songs. Among them, Transformer generated the most melodious and natural lyrics. ■ キーワード(和文5個程度、英文5個程度) メロディ、歌詞、生成、seq2seq、Transformer melody, lyrics, generation, seq2seq,Transformer