What’s new

最新情報:

おすすめ記事:

Mailing List:

当Webサイトは現在大幅なアップデート作業中です. サイトの更新やイベント等の情報をメールで受け取りたい方は、ぜひこちらにご登録ください. (もちろん、スパムすることはありません!)


発表されました! – BRIAN ENO’S “THE SHIP” – A GENERATIVE FILM

以前このサイトでも予告したプロジェクト(The Ship Project with Brian Eno – Cannes Creative Lions 2016) がリリースされました!

BRIAN ENO’S “THE SHIP” – A GENERATIVE FILM
http://theship.ai/

Continue reading

AI DJ 技術解説 – 9/4「2045」at OKAZAKI LOOPS #2

LOOPS_P3460714

ありがとうございました!

人工知能時代のDJ, VJ表現を考えるイベント 「2045 」を、OKAZAKI LOOPSのプログラムの一つとして、京都国立近代美術館で先の9月4日に行いました。 200名を超える方にご参加いただきました。お越しいただいた皆さま、ありがとうございました! 前回のブログの記事で告知した技術解説を(事後になってしまいましたが)書きます。

photo (c) OKAZAKI LOOPS 実行委員会

LOOPS_P3290348 LOOPS_P3320568 LOOPS_P3270205

Continue reading

9/4「2045」at OKAZAKI LOOPS #1

いよいよ来る9/4 日曜日. 京都岡崎音楽祭 OKAZAKI LOOPSにて、人工知能DJイベント、「2045」が開催されます。2015年8月以来の1年ぶり、4回目の開催です。

2045_logo_v2-01

過去の開催についてはこちら.

M4A9564_1280

これだけ間があいた理由としては、3回やってみてその先の展開について悩みがあったというところでしょうか (一緒に2045を始めた真鍋大度くんが忙しすぎるという説も w). 選曲はなんとなくできた、センサーを使ってお客さんの動きやノリをとって選曲に生かすといったこともできた. その先に、おおっという驚き、ソフトウェアでDJをするからこそ生まれる驚きはどこにあるのか… 明確な答えを出せずにいました.

いろいろと考えた結果、初心に戻って、徳井個人とQosmoチームとしてはもともと妄想していたことを実現することに決めました。それは… 「 人と人工知能とでBack to BackでDJする」というものです。

A photo posted by Nao Tokui (@naotokui) on

知らない方のために簡単に説明すると、Back to Back(以下、B2B)とは、二人(以上)のDJが一曲(あるいは数曲)ずつ交互にかけあうというDJのスタイルのひとつ。ジャズミュージシャンのかけあいのようなものを想像してください。自分がかけた曲に対して相手が自分が想像もしてもなかったような曲をかける、それに対して自分がまた返答となる曲をかける… 「お、そうきたか. そしたらこっちはこの曲だ.」といった具合です. B2Bの面白さは、ジャズの掛け合い同様、自分の想像していたストライクゾーンのボール半個分外側にボールが返ってくる可能性にある、と言ってもいいでしょう。

2045に限らず、自分がこれまで取り組んできたプロジェクトの多くが、このボール半個分外側をどう実現するか、という点にあったといっても過言ではないかもしれません。こうした「AIに驚かされたい」という根本的な思いについては、以前にもこのブログで書きました(AIとの付き合い方) その投稿では、AIとはAlien Intelligenceだ(Kevin Kellyの言葉)、発想やそこに至るロジックが人間とは大きく異なることに価値がある、といったことを書いてます。2045での人工知能DJの立ち位置も(すくなくともQosmoチームにとっては)同じです。(注: この記事でも広い意味で人工知能/AIという言葉を使っています)

人間のDJを置き換えたいわけではなく、あくまで人に気づきを与える存在としてのAI. そうしたビジョンを明確に示すためにも、人のDJとAIのDJが並び立つようなB2Bのスタイルが最適だと考えました. さらに、今回B2Bを実現するにあたって、あえてパソコンではなく昔ながらのレコードをつかったDJにこだわりました. (ここで書いているのはQosmoチームのことです. 真鍋くん、ライゾマさんはまた別の考え方でアプローチしてます!)

A photo posted by Nao Tokui (@naotokui) on

ではなぜレコードなのか. 理由は、それがかっこいいと思ったから(笑). AIが自動的にテンポを調整してミックスする様子を見てみたい!という理由が一番正直なところなのですが、あえて答えるとしたら、不自由なレコードというフォーマットの中で人とAIが同じ土俵、同じ条件下でDJをするというのを見てみたかったといったあたりでしょうか.  AIのDJに物理的な存在感を与えたいという思いです.

レコードでDJするということは、すでにかかっている曲を聴いて、そのテンポに合わせて、次にかける曲の再生スピードをコントロールしてテンポを合わせる… といって人のDJがやっている作業と同じ作業が必要になります (ピッチ合わせという言い方もします).

PCのDJソフトウェアを使えば、勝手にテンポを合わせてスムーズに次の曲へとつないでくれます。でもそこには驚きはない. あえてレコードを使いつつ、テンポ合わせをどう実現するかというのが新しいチャレンジでした。上にあげた以前の投稿でも、人工知能とは賢そうにみえることをもうちょっとで実現できそうな仕組みのことだと書きました。自動運転でも碁でも完璧にできるようになったらもうそれは人工知能とは呼ばなくなるのです(例:オセロのアルゴリズム)。あえて、できるかできないかわからない、実際のレコードをつかったミックスに挑戦しようと思ったのもそうした背景があります。

一方でこう思う人もいるかもしれません。なぜレコードを使ったテンポ合わせがそんなに難しいのか、簡単にコントロールできても良いはずなのに…と。自動ミックスが難しい(少なくとも今はやってる人がいない)理由とそれにどうAI的にアプローチしたのかについては次のポストで書きたいと思います。選曲の方法に関しても、従来のプレイリストのログデータを解析する仕組みから離れて新しいやり方を導入しました. (畳み込みニューラルネットワークで音響的な物理量から人が聞いた時の印象を定量化することを試みてます) その辺についても説明したいと思います.

A photo posted by Nao Tokui (@naotokui) on

ここまで読まれて、センサーでお客さんの情報を取得しつつ、レコードを選んでターンテーブルでミックスする、というのはわかった. でもどうやってレコードをターンテーブルに乗せるんだろう、と疑問に思った方. 正解です w そこは人手でやります. AIが選んだレコードを数百枚あるレコードの中から選ぶ人. AIにフィードする人という図式がここでも垣間見れます.

国立近代美術館という普段とは違った雰囲気の場所でどんなイベントになるのか僕自身も楽しみにしています。まだチケットには余裕があるそうなので、ぜひお近くの方も、そうでない方も2045にぜひおいでやす。なおチケットはこちらのサイトから購入いただけます。

では京都でお会いしましょう!

AIと著作権

AIの生成物と著作権に関して弁護士の方との勉強会に参加してきたのでメモ。

 

まず前提として、著作権法上、著作物とは思想 / 感情を創作的に表現したものという定義なので、AIの生成物は著作物にはあたらない = 著作権法上の保護の対象にならないそうです. (同様に「人の」発明を保護する特許法の対象でもない)目に見える・耳で聞こえる等のかたちになった表現が著作権の対象であり、アイデアの段階では保護されない。したがって、アルゴリズムは著作物ではないが、それを実装したソフトウェアは著作物として保護されます。

また、人がコンピューを道具として用いて著作物を創作したと認められるには、人の創作意図と創作的寄与があったことが条件。たとえばDeepLearningなどで学習の結果得られる学習済みのモデルは、著作権の対象にはならない可能性が高いとのこと。 (そのため、学習済みモデルの権利の保護には営業秘密の保護の枠組みを使うと良い? その場合はモデルの非公知性と秘密管理に留意)。

前々から学習につかうデータの著作権が気になってたのですが (J-POPの歌詞を学習させる etc)、著作権の無断使用が許される例外規定があるそうです。
電子計算機による情報解析(比較、分類、その他の統計的な解析を行うこと)を目的とする場合には複製や翻案が許される、という著作権法第47条の7の規約にそえば、権利を保持していない著作物を学習につかうことは適法ということになるのではとのこと。 ただし、あくまで統計的な処理をする場合に限られているので、学習データの一部が、生成された著作物のなかにそのまま認められるような場合はNG(例、学習した歌詞の1フレーズが生成された歌詞のなかに出てきたような場合)。

私が直接お話しした弁護士さんは、商用利用も可能とおっしゃっていましたが、学習元と直接の利害関係があるような場合はNGとおっしゃっている方もいるようです。判例もないので、どこまでOKなのかということに関してはまだ見解が定まっていないように見えます。

もともとの著作権者の権利保護が前提であることも考慮すると、いずれにしても慎重に進める必要がありそうです。

「AIとのつきあい方」 – コンテンツ東京2016での講演

コンテンツ東京2016での講演が終わりました! 1500人のホールが予約で満席になってしまったということで(初めての経験!!)、急遽、翌週のライブ東京2016でも同じ講演を追加でやらせていただきました。

  今回の講演のテーマは、クリエイターにとっての「AIとのつきあい方」。 その中で私は、AIをArtificial Intelligenceとしてではなく、Alternative(代替の) Intelligence、あるいはAlien(異世界の?) Intelligenceとしてとらえてみようという話をしました。 Alternative/Alien Intelligence(以下、AI’と呼びます)は、もともとはKevin Kellyがなにかのインタビューで言っていた言葉です。彼の最近の著書 The Inevitablesでは、「AIではなくArtificial Aliens (AA)が正しい」とも言ってますが、ロボットにAIが組み込まれていく未来を想定しての言葉でしょう。 要するにAI、人工知能を人の知能の模倣ではなく、全く別の知能としてとらえよう、ということだと思います。賢いことをやっているように見える、ただしその「知能」のかたちは人とは異なる、したがって人とは違う答えを導き出すときもあるし、想像もしなかった間違いをすることもある、ということになります(なにが知能なのかという議論は棚上げ) 。 人がなにかアイデア(作品 etc)をアウトプットするプロセスにAIを導入しようとする場合、人のもともとのアイデアを膨らませる、あるいはその先にAIをつかって到達しようとするというのが普通ではないでしょうか。あるいはすこしでも早く、簡単に正解に到達するということが目的になる場合も多々あるでしょう。AIが人の模倣である限りはそれが普通だと思います。 しかし、AIがAI’であったなら… 人のアイデアとはまったく別の切り口で別の方向性のアウトプットをするのではないでしょうか。 人に新しい視点や気づきを与える、こうした「差異」「違い」を大事にしてはどうでしょうか。ときにそれは人の視点から見れば「間違い」なのかもしれません。しかし、間違いや失敗に発想のタネがころがっているということは、古今の発明発見の歴史を列挙するまでもなく、周知のとおりです。AI’は間違い→発見のプロセスを外部化し、人が気づきを得やすくするための仕組みという言い方もできるかもしれません。流行りの言葉でいうとイノベーションのタネがこの辺にあるように思います。 ai1 ai2 さらに言うと、AI’の間違いを人が承認し、そこに「あえて」歩み寄るプロセスからも新しい面白さが生まれる (AIカラオケプロジェクト)、というのも実証済みです。 こうした人とAI’が相互に影響を与えつつ相互に歩み寄るプロセスが、表現の幅や深みを生み出していくことでしょう(カメラ/写真と絵画の関係のように)。私自身もQosmoとしてもそうしたプロセスにすこしでも寄与できたらと考えています。 ai3 もうひとつAI、人工知能ということばの使い方についてもすこし言及しました。AIをめぐる昨今の議論に違和感を覚えることが多いのは、AIをきまったひとつのアルゴリズムのようにかたちがさだまったものとして扱っているように感じるからです。(ひどい場合には、IBM WatsonのようなAIを司るひとつのサーバが人工知能の実体として存在しているかのように話していたりします。) そこで今回のトークの中ではあえて私なりのゆるい人工知能の定義も紹介しました。 それは、

「賢そうにみえることをもうちょっとで実現できそうな仕組み」

というものです。「もうちょっとで」の裏側には、もし完璧に間違えることなくこなせるようになったらそれは人工知能とは呼ばなくなるという視点がこめられています。オセロをプレイするソフトウェアを人工知能とは呼ばないのと同じように、完璧な自動運転の仕組みが実現すれば人はそれを人工知能とは呼ばなくなることでしょう。 完璧にできることとまだ到底できそうにないことの間にある、その時点でのフロンティアの部分を人工知能と呼ぶ、そしてそのフロンティアは徐々に拡大していく… そんなイメージでしょうか。 そんなお話をさせていただきました! 学生時代から僕のことを知っているSound & Recording誌の元編集長、國崎さんに「いい意味で既視感があった」と褒められた?のもうれしかったですね。たしかに國崎さんに呼んでいただいたSONASPHEREに関する講演(2003年?)でも、技術的なトピックは変化しつつも同じようなことを話していた気がします。

Computational Creativity and Beyond – Qosmo, Inc. 2016

最近作った配布資料に書いた小文.


「孤高の天才が、だれも見たことのないものを無から作り上げる」

そんな創造性観が支配的だったのは、はるか昔のことです。

創造的と言われる行為の多くが「既存の要素」の「新しい組み合わせ」によるものであることは、すでに周知の事実でしょう。
インターネット上での時間や場所を超えたコラボレーションの成果が、そのことをより明確にしました。

この新しい創造性のキモは、組み合わせの「発見」とその結果の適切な「評価」というサイクルをいかに早く繰り返すかにあります。

コンピュータはその黎明期から一貫して新しい組み合わせパターンの生成を容易にしてきましたが、Deep Learningに代表される新世代の人工知能技術が画期的と呼ばれるのは、従来数値化できなかった人の”感覚”や”感性”の領域に踏み込んだ「評価」をできるようにしたことにあります。

新たな組み合わせの生成と評価のサイクルを無限に繰り返すことができるとしたら、創造的プロセスへの寄与は計り知れません。

2000年代から現在まで、インターネットという環境が新しい組み合わせを試し、評価するための大きな環境だったとすると、それとは別の「環境」をコンピュータの中で作ることができるようになるでしょう。

整然とした美しい数理的な世界。不完全で非合理的な(だからこそ美しく面白い)人間の判断を模倣するコンピュータ。こうした新たな環境に立脚する創造性として、弊社Qosmoは”Computational Creativity”を追求します。

Computational Creativity and Beyond
Qosmo, Inc. 2016

カメラと画家、とAI

dora-maar-05  7113871503_0085b6a7a3
左: マン・レイ「Dora Maar」 右: パブロ・ピカソ 「ドラ・マールの肖像」

人工知能とクリエイターの関係を考えるときに、カメラが発明が画家に与えた影響を考えると良いのではないか、なんてことを考えております。 カメラは乱暴に言ってしまえば、自動化の技術。よく言われるようにカメラの発明が肖像画を描いていた画家を失業においやった一方で、印象派やキュビズムの誕生に寄与したように、ある種の表現は人工知能に代替されるのかもしれないが、その分、別の表現が生まれてくる。

写真が広まり始めた大正時代には、わざとフォーカスをぼかしたり、レンズにつばをつけたりすることで、印象派の絵画に似せた写真を撮ろうとする藝術寫眞の流れがあったり… 写真をリファレンスにできることによって、手書きによる写実的な表現のレベルが格段に上がったり (例えばこういうのとか http://ailovei.com/?p=46139) 。その影響は双方向的。

あえて人工知能を使わないで〇〇するってことに価値がでたりとか。

音楽に置き換えるとどんなことが言えるんだろう…

そんなことをつらつら考えております。 意見求む!

 

なんでそんなことを考えているかというと… 7/1にこういう場で講演することになっているからです.  よろしくお願いします.

コンテンツ東京2016 先端コンテンツ技術展 特別講演