PyData.Okinawa Meetup #17 - Magentaで音楽生成

2016年09月17日（土）に開催予定のPyData.Okinawa Meetup #17 - Magentaで音楽生成の発表資料等をまとめたページです。

環境設定

Dockerのインストールと設定

Macの場合はこちらから「Get Docker for Mac (stable)」をダウンロードすると吉です。それ以外のOSを用いている方はこちらから探せます。

以下、環境としてMacを仮定しますので、Mac以外のOSを使っている方は適宜読み替えて下さい。

docker.appを立ち上げ、言われるがままに設定します。設定が終わったらターミナルに戻り、docker versionと打ってみて下さい。それっぽい感じのバージョン番号などが現れたらDockerの設定はOKです。

TensorFlowとMagentaが使えるDockerイメージの呼び出し

Dockerの設定が終わったら、以下の起動コマンドをおもむろにターミナルに打ち込んでみて下さい。

docker run -it -p 6006:6006 -v /tmp/magenta:/magenta-data tensorflow/magenta

最初にDockerを起動する際には、約2.5Gほどのデータをダウンロードしてくるので結構時間がかかります。お茶でも飲みながら気長に待ちましょう。最終的にroot@ab123c45678d:/magenta#のような感じのコンソール画面が出てきたら成功です。途中でダウンロードが止まったりしたときには、もう一度先ほどの起動コマンドを打ってみて下さい。

以後、Dockerを起動したいときには、同じコマンドを使って下さい。二回目以降の起動の際には、ファイルをダウンロードしないので、すぐにDockerが立ち上がります。

Dockerを起動すると、/magentaというディレクトリに降り立ちます。ここがメインディレクトリです。Magentaの実行ファイルはこのディレクトリ以下に置いてあります。lsと打って、それっぽいファイルが出てきたらOKです。cdと打つと他のディレクトリに行ってしまうので、そのときは慌てずにcd /magentaで戻ってこればOKです。

もう一つの重要なディレクトリは/magenta-dataです。ここに置かれたデータは、ホストOS（例えばMac）の/tmp/magentaと同期されるので、データのやり取りに便利です。また、ここに置かれたファイル以外は、Dockerを再起動すると綺麗さっぱり無くなってしまうので、取っておきたいファイルは/magenta-data以下に置いておきましょう。

exitと打つとdockerから抜けられます。

Timidity（MIDI再生用ソフト）のインストール

学習済みのモデルから生成されたMIDIファイルをMacで再生するにはなんらかのソフトが必要となります。今回はTimidityというソフトを使うことにします。TimidityはHomebrewを使って以下のようにインストールできます。

brew install timidity

使い方（ここからの内容はPyData.Okinawa Meetupの当日にカバーします）

共有フォルダにスクリプトを配置

先ずは、このGitHubのコンテンツをローカル環境に落としてきます。一時的に置くだけなので、どこに落としてきても良いです。dockerというフォルダが含まれていることを確認して下さい。

次にDockerを起動させた状態で、dockerというフォルダの中にあるscriptとmidiというフォルダの両方を、ローカルの/tmp/magentaの中にコピーして下さい。

この状態で、Dockerにアクセスできるターミナル上でcd /magenta-data/scriptと入力します。

MIDIファイルの設置

ローカルの/tmp/magenta/midi/の中に学習に用いたいMIDI形式のファイルを配置します。ディレクトリ構造をもたせても大丈夫です。

データセットの生成

./build_dataset.sh

このコマンドにより ./tmp/notesequences.tfrecord というファイルが生成されます。すべてのMIDIファイルが、TensorFlowで扱いやすい形に変換され、最終的にこの1つのファイルにまとめられます。

モデルの学習

./train_rnn.sh -r basic_rnn

このコマンドにより２つの処理が実行されます。

１つ目の処理は学習データと評価データの分割です。

./tmp/basic_rnn/sequences_exampels 以下に

training_melodies.tfrecord
eval_melodies.tfrecord

というデータがそれぞれ作成されます。

２つ目の処理はモデルの学習です。

basic_rnnのところをlookback_rnnやattention_rnnとすることで異なるモデルを訓練することもできます。

学習ログは ./tmp/basic_rnn/logdir/ 以下作られる160909-1のような名前（日付+実行回数）のディレクトリの中に記録されます。

ブラウザのアドレスバーにlocalhost:6006と入力すると、TensorBoardがログディレクトリの中に記録された情報を読み取り、学習の進捗状況をリアルタイムで確認できます。

TensorBoardが実行されるポートを変更したい場合は、以下のようにしてください。ここでは6007番を指定しているので、localhost:6007とすることでTensorBoardにアクセスできます。

./train_rnn.sh -r basic_rnn -p 6007

音楽の生成

./generate_melodies.sh -r basic_rnn -n 160909-1

basic_rnnはモデルの名前、160909-1は音楽生成に使いたいモデルが保存されているディレクトリの名前です。この２つの値は、使用したモデルやスクリプトが実行された日付に左右されるので、ご自分のシミュレーション環境に合わせて適宜変更して下さい。

このコマンドにより tmp/basic_rnn/generated/160909-1/以下ににMIDIファイルが生成されます。

Docker上ではMIDIを再生できないので、ローカルの /tmp/magenta/script/tmp/basic_rnn/generated/160909-1 以下に同期されているファイルをTimidityなどで再生してみてください。

その他のパラメータ

すべてのシミュレーションの結果は、（ローカルであれば）/tmp/magenta/script以下のtmpというフォルダの中に保存されました。これを変更するには、各コマンドに-t tmp2のような形で引数を渡せばOKです。-t output/beatlesなどのようにすることもできます。

また、ハイパーパラメータを変更するには -h "{'batch_size':32,'rnn_layer_sizes':[128,128]}" という形で各コマンドに引数を渡せばOKです。

これらの名前付き引数を使うと、全体を流れは以下のように書くことができます。

# データセットの生成
./build_dataset.sh -t output/beatles -m /magenta-data/midi/beatles

# モデルの学習
./train_rnn.sh -t output/beatles -r basic_rnn -p 6007 \
-h "{'batch_size':32,'rnn_layer_sizes':[128,128]}"

# 音楽の生成
./generate_melodies.sh -t output/beatles -r basic_rnn -n 160909-1 \
-h "{'batch_size':32,'rnn_layer_sizes':[128,128]}"

また、以下のスクリプトファイルにデータセットの生成から学習までの流れがまとめられているので、

./run_beatles

というコマンドを打って、一連の流れを確認してみましょう。

おまけ

MIDIファイルを他のファイル形式に変換する方法

timidityを使うことで、MIDIファイル（awesome.mid）をWAVファイル（awesome.wav）に変換することができます。

timidity -Ow awesome.mid

ffmpegを使うことで、生成されたWAVファイルをMP3に変更することができます。

ffmpeg -i awesome.wav awesome.mp3

生成した音楽をWebにアップしてシェアする方法

clypというサイトは簡単に音をシェアできるのでオススメです。MIDI形式は直接アップロードできないので、WAV形式に変換してからアップロードしましょう。
このような感じでシェアできます。

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
docker		docker
README.md		README.md
magenta.md		magenta.md
magenta.pdf		magenta.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

PyData.Okinawa Meetup #17 - Magentaで音楽生成

環境設定

Dockerのインストールと設定

TensorFlowとMagentaが使えるDockerイメージの呼び出し

Timidity（MIDI再生用ソフト）のインストール

使い方（ここからの内容はPyData.Okinawa Meetupの当日にカバーします）

共有フォルダにスクリプトを配置

MIDIファイルの設置

データセットの生成

モデルの学習

音楽の生成

その他のパラメータ

おまけ

MIDIファイルを他のファイル形式に変換する方法

生成した音楽をWebにアップしてシェアする方法

About

Uh oh!

Releases

Packages

Languages

PyDataOkinawa/meetup017

Folders and files

Latest commit

History

Repository files navigation

PyData.Okinawa Meetup #17 - Magentaで音楽生成

環境設定

Dockerのインストールと設定

TensorFlowとMagentaが使えるDockerイメージの呼び出し

Timidity（MIDI再生用ソフト）のインストール

使い方（ここからの内容はPyData.Okinawa Meetupの当日にカバーします）

共有フォルダにスクリプトを配置

MIDIファイルの設置

データセットの生成

モデルの学習

音楽の生成

その他のパラメータ

おまけ

MIDIファイルを他のファイル形式に変換する方法

生成した音楽をWebにアップしてシェアする方法

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages