OpenAIの音楽生成モデル、Jukeboxの衝撃

ここ数年で一番の衝撃…

OpenAIがリリースした音楽生成AIモデル、Jukebox。歌手の名前とジャンル、歌詞を入力するだけで、曲がまるっと生成されるというもの。実際にモデルを動かして、シナトラ風のOver the Rainbowを生成してみました (曲の選択はなんとなく今の世の中の気分に合っている気がして..)

結果はご覧の通り。こんな曲が時間とGPUさえあれば、歌手とジャンルを変えて、いくらでも無限に生成できます。くどいですが、元曲のデータはAIには与えてません。歌手名とジャンル、歌詞だけです。(あまりにすごくてビデオまで作ってしましたが、驚いたというよりは怖くなりました)

技術面で圧倒的に優れているのは間違いない一方で、アーティストの音楽性を借用することの可否、著作権をめぐる懸念など、AI研究者の間でも危惧する声が上がってます。音楽のDeep fakeなのではという声も。


AI美空ひばりの時にも議論になりましたが、これは全く別のレベルの問題と言っていいでしょう。美空ひばりの場合は曲と歌詞は人が書いていましたし、長時間かけて美空ひばりの歌のクセを学習した専用のボーカロイドが人が与えた楽譜にあわせて歌声を合成していたわけですが、今回の場合は私が与えたのは歌詞だけです(その歌詞もGPT-2という言語モデルを使って生成し、歌わせるという実験もやってます)
まだ頭の中で整理できてないですが、AIと創造性をめぐる議論が全く新しい次元に入ったと言っていいのではないでしょうか。


「音楽は予言的であるが故に来たるべき時代を告知する」

アタリの言葉を思い出してます。


OpenAI Jukeboxの情報はこちら:
https://openai.com/blog/jukebox/