entry-header-eye-catch.html
entry-title-container.html

entry-header-author-info.html
Article by

5年後には画像フォーマットなんて誰も気にしなくなる ─ ImageFluxで描く画像変換の世界(後編)

ピクシブのリードエンジニア道井俊介(ニックネーム:はるかさん)に、画像変換技術の未来について語っていただきます。

(※この記事は、「画像の価値は上がったのに、技術は10年前から変わっていない ─ ImageFluxで描く画像変換の世界」の後編です。)

これからの画像変換システムのありかた

── はるかさんは、これからの画像変換のあるべき姿をどのように捉えているんですか

今でこそEC2みたいなクラウドサービスがあるけど、そうじゃなかった時代のことを思い出して欲しいんです。物理サーバーの時代。やれCPUがどうだとか、SSDに何をつかうだとか、省電力モードがどうとか。Linuxを入れればとりあえず大丈夫でしょ、とか言われてたけど、実際に運用に乗せると、そうでもないですよね。

BIOSの設定がどうなってるだとか、そういう細かいところは、日々のルーチンワークとしてやっていたはずなんですよ。そこに、EC2みたいなクラウドサービスがでてきて、そういうことを考えなくてもよくなった。動かなかったら再起動したらいいじゃん、みたいな感じで運用できますよね。

画像変換も、そうあるべきだと思うんですよ。JPEGの中身がどうとか、そんなことに悩むのってレイヤーが違うと思ってて。専門のサービスに元画像を突っ込んでおけば、必要な変換処理がされた画像が、なんにも考えなくても出てくる。そんな風に、なるべきなんですよ。

── 今の時代に、そういうことに悩んでいること自体がおかしいですよね。自前で細かいパラメーターいじったり、チューニングとかやってるような時期はとっくに過ぎてますよ

そうなんです。だからもう、あと5年もしたら、誰も画像のフォーマットのことなんて気にしないですよ。

画像変換の最適化は、今以上に進んでいる。画像の処理自体はより専門化されて、専門家がそれをうまく進化させていく。多くの人はその進化した技術を使うだけ、という時代は絶対にやってくるんです。

ピクシブだからこそ、最高の画像変換技術を得たい

── はるかさんは、まさにそういうことができる専門家集団を作ったわけですよね。それっていったい、誰にそそのかされたの?

今したような話を、頻繁に話していた時があったんですよ。現CTOのedvakfと。

で、2015年の夏。edvakfから、その未来を実現しようよって話がきたんです。「来週、itokinさん(現ピクシブ代表)と話せる時間作ったから」とか、edvakfから突然言われて。で、僕が作った資料を持っていって、話しにいったんですよ。

── それが、2016年の12月にローンチされた画像変換クラウドサービス「ImageFlux」ですか。

ピクシブがこのようなサービスをなぜ始めるのか、ということについては、儲けるとかそういうことよりも先に考えていることがあって。

僕たちはgo-thumberというのを作って、これをOSS化してメンテナンスしています。しかし、ピクシブという会社のことを考えたときに、ピクシブはユーザーのためにサービスを作っているのであって、ユーザーに価値を与えることが優先されるべきなんです。

そう考えると、go-thumberのようなものは、やはり優先しにくいところがあるとおもうんです。自分たちのサービスだけのためにやるんならいいですけど、go-thumberを使っている他の人のために、バグの対応をしたりとか、改善の作業をしたりとか、そういうのにあんまり時間割けないこともあるんですね。

── 事業会社ゆえの、悩みというやつですね。

しかし、そういう作業にも、リソースを割ける状態にならないといけない。ピクシブであるからこそ、画像変換技術は最高を目指さなくてはいけないと思うんですね。では、どうなればいいのかというと、画像変換だけで今以上の価値を多くのユーザーに届けて、画像変換だけで十分な収益がでていればいいんじゃないかって。

自分たちの画像変換の技術を他のサービスにも使ってもらって、そこで画像変換を開発するためのコストがペイできれば、それで良くなって、さらにまた他のサービスにも使ってもらえる。そういうサイクルを回していけば、ピクシブの画像変換技術は今よりもっとよくなる、って思ったんですよ。

こういうのって、ひとつのサービスに閉じて進めても伸びていかないので、価値をもっとスケールさせるためには、出来る限り多くのサービスを巻き込むことが必要なんです。

最高の画像変換技術を探求できる場をつくった

── プロジェクトって、実際に動き出したのはもう少し後だったよね?

そうですね。プロジェクト化したのはいいものの、クラウドサービスとして他社へ提供するには、色んな問題がありました。

まず営業ですね。最初はedvakfが「俺が売るよ」って言ってくれて、一緒に営業活動したりして。けど、営業先が限られてしまって、苦戦してたんですよ。

そしたら、当時ピクシブの代表だった片桐さんが、awabarでさくらインターネットの田中社長に会って。「うちのエンジニアがこういうのやりたいって言ってるんだよね」ってめちゃくちゃ話してくれて。片桐さんが、田中社長と僕を繋いでくれて。

ピクシブはピクシブのサービスしか運用した経験がないので、問い合わせ窓口とか、障害発生時に一次対応できる運用部隊とか、規模によってどれだけでも大きくできるインフラとか、そういうのを持っていないんです。対してさくらさんは大規模なインフラを運用するノウハウはあっても、画像変換のような高付加価値を提供できるサービスを求めていた。両社の求めているものがうまく合致した形です。

それで、2016年年明けてすぐ、クラウド画像変換サービス「ImageFlux」は、さくらインターネットさんとの共同プロジェクトとして開始されたんです。ちょうど1年で一般向けにリリースすることができました。

(※ ピクシブ株式会社、ニュースリリースより)

── 今までpixivしかいなかった画像変換システムに、他のサービスが乗っかることで、得られたものってあったんじゃないですか?

JPEGの他に、PNG、GIF、WebPに対応しているんですが、これらはpixivのための画像変換システムだったら対応しなかったですね。社外に対してサービスとして提供していく上で、最初に乗り越えなくてはいけない壁でした。

ただ、そのお陰で、社内の別のプロダクトでも活用できるようになりまして。ここ最近だと、年末年始にテレビCMでやってた「pixivコミック」にも導入しました。他社だと、フリマアプリ「メルカリ」にも導入が進んだりしています。

── 思ったんですけど、ImageFluxってImageMagick使ってないんですよね。じゃ、セキュリティもかなり改善されたんじゃないです?

そうですね、ImageMagickを脆弱性を生まずに使うのは非常に大変です。たとえば、HTMLのレンダリングができてしまったり、PDFにも対応しているのでGhostScriptの知識も必要ですね。外部コマンドの呼び出しも多いので、コマンドラインのエスケープ処理が適当でそこが脆弱性になるとかたくさんの問題があります。

ImageMagickの画像フォーマットの判別方法は独特で、拡張子とかを信用するわけでもなく、内部で特殊なロジックを通して判別している。だから、フォーマットを偽るのを完全に防ごうとおもったら、ImageMagickと同じフォーマット判別アルゴリズムを、自前で実装しなくちゃいけないという、バリデーションが困難なツールだったりするんです。

恐らくImageMagickの全ての機能を把握して使っている人はいないんじゃないですかね。ImageFluxはImageMagickを使っていないので、そういった面でのセキュリティで悩む必要はありませんね。

ImageFluxは今後、どこへ向かうのか?

── ImageFluxのローンチ。まさにいま、専門部隊がピクシブの画像変換技術を最高にする方法を追求する、そのためのスタート地点に立ったと思うんですけど。これから先、この部隊はどういう方向に進むんでしょう

やっぱり、「動画」はやらないといけないって思ってます。

というのは、画像のフォーマットが意識されなくなる世界の中で、この画像は、静止画のフォーマットなのか、動画のフォーマットなのか、ということさえ気にされなくなってくるんですよね。

いま、ネットの広告ってまだ静止画が多いとおもうんですけど、もう数年もしたら全ての広告は動いていると思う。iPhoneでもLivePhotoとかが一般的になっているし。動画は画像ぐらいあたりまえになる。

なんかもう、ハリーポッターにでてくる絵とか写真みたいに、無駄にいろんなものが動いている時代になると思うんですよ。静止画さえも、動画のフォーマットで保存するなんてことも起こり得る。

iPhoneで取った写真が、静止画のフォーマットなのか動画のフォーマットなのかってこと、すでに誰も意識してないですし。動画はいつか来るので、やらないといけない。

── いまやってる画像のほうは、もうやることはないんでしょうかね。

画像については、「それっぽくやる」という技術が必要じゃないかと。

画像をサムネイルみたいな形に変換するとき、画像の一部を削ぎ落としたりするんですけど。画像の内容がわかるとか、キレイに見えるようないい感じの場所で切り出す、的な。あと、機械学習をつかって、顔っぽいところを切り出すとか。

画像の圧縮クオリティなんかも、わざわざパラメーターを指定するんじゃなくて、それっぽくコントロールしてくれるとか。アプリにライブラリみたいな感じで読み込ませれば、ライブラリがスクリーンのサイズなんかをみて、よしななサイズで画像を変換して引っ張ってくるみたいな。

画像に関しては、使うためのハードルを下げていくようなことをやっていかないとですね。

── なるほど。これからもまだまだ、やらなくてはいけないところがありそうですね。

そうですね、ImageFluxチームではやらないといけないことがたくさんあります。僕たちImageFluxチームでは、一緒に画像変換の未来を作ってくれるエンジニアを募集しています

単に画像変換だけではなく、大規模なHTTPサービスとしてもとても面白いプロジェクトです。大規模クラスタを支える技術や、機械学習などの最先端技術に興味のある方を求めています。

── 求められるスキルがめちゃくちゃ高いけど、見る人から見れば間違いなくやりがいがある仕事ですね。はるかさん、話をしてくれてありがとう!

(インタビュアー: furoshiki)
20191219023135
harukasan
1988年生まれ。久留米高専、九州工業大学を経て、筑波大学大学院システム情報工学研究科博士前期課程修了。2012年ピクシブ株式会社に入社。インフラチームとして画像配信、ログ解析基盤などを担当。現在はCTOを務める。