情報科学科の先輩に聞く!

現役学生OBインタビュー「先輩たちの仕事の原点」各界で活躍する先輩たちが教えてくれる“仕事の本質”

座談会トップへ戻る

海外での起業

トレジャーデータ|太田一樹さん (情報科学科30期)
インタビュー年月日
平成25年 1月 22日
太田一樹 
もともとプリファードインフラストラクチャー(PFI)を在学中に起業したメンバーの一人だったが、シリコンバレーへの憧れを持ち独立し、海外でビッグデータを扱う会社トレジャーデータを起業した。
情報科学科 3年 生田、島田
在学中に起業、そして海外で起業を行うというなかなか聞けない話に興味を持ち今回インタビューに伺わせてもらいました。
学生時代
島田、太田さん、生田
-プログラミングはいつから始められたのですか。

中学三年の頃に始めました。iアプリ(Java)を作り始めたのがきっかけです。そのアプリがなんと40万ダウンロードを達成して楽しくなって。それで、ふとしたきっかけでlinuxをさわりはじめることになって、当時は日本語が打てないとかいろいろ問題があって自分でいろいろ対処しているうちに、いつの間にKDEとかのコミッターになったりして。

-情報科学科にこようとおもったのはいつですか。

入ったときからです。一、二年生のうちは楽しくないじゃないですか。駒場の時はシステムをつくるバイトとかをしていてあまり授業は出ていませんでした。ちょうどその頃、19歳の時にPFIにジョインしました。

-石川研に入って何をしましたか?

分散・並列ファイルシステムをつくっていました。ディスクドライブがシステムの速度のボトルネックだから何とかしようかなと思って。
起業
-なぜPFIから独立したのですか。

PFIは独自資本で立ち上げた会社だったから、成長が緩やかだったんですね。もっと爆発的な成長をしてみたいと思って、独自資本でない会社を立ち上げました。

-なぜ日本でなくアメリカで起業したのですか。

ソフトウェアのいろいろな会社はだいたいシリコンバレーから出ていて、それにはいろいろな理由があるんだけど、シリコンバレーで生まれた企業が成長して投資家になるというエコシステムがあって、日本にはそういうものがない。ということでトレジャーデータをシリコンバレーで立ち上げることにしました。

-トレジャーデータでどのようなことをしているのですか。

大量のデータを処理するHadoopというソフトを分散クラウドにデプロイしています。現在はいろいろな所でデータが取れるから、それの解析処理をやって結果を返すということをやっています。

-太田さんはその中でどのような仕事を?

実はコードをあまり書いていないんですよ。CTOという地位について、人を雇ったり、営業や雑用のようなことまで色々やっています。コンピュータサイエンスのバックグラウンドのあるビジネスの人、という感じになっていますね。

-卒論でやったことをそのままやっているわけではないと。

そうだね。やったことはスーパーコンピュータがないとできないからね。

結果をそのまま使うという事はしてないけど、その過程で得た知識は役に立っています。研究でファイルシステムの論文を読んでいるうちに知識を体系化できて、世界にどのような課題があって、どういうところがボトルネックになっているかとかがわかるようになってきました。直接ではないけど、今も活きていて、未だに当時のように論文を読んでます。

-太田さんは石川研以外には考ませんでしたか。

ミドルウェアが昔から好きだったので、迷わなかったね。希望の時も三つ書けたのに一つしか書きませんでした。

-トレジャーデータでやっているプログラミングに関係ない仕事はどこで身につけたのですか。

PFIでですね。組織を束ねて行く中で、経営とか会計の本とかMBA(経営学修士)の教科書とかを読みました。自分で学んでいきましたね。

-アメリカで起業しようと思ったきっかけみたいなものってあったんですか。

なんだろうね……、これは石川先生に恩を感じている部分なんですが、海外の研究所に結構送ってくれて、それで向こうの雰囲気もいろいろ掴めたし、英語が喋れなかったけど、ちょっとうまくなったし。三年生のときにグーグルの知り合いがいて、その当時のグーグルはまだ小さな会社だったんだけど、その時にGCCとかpython、linuxカーネルの開発者が一同に会しているのを見たので、シリコンバレーへの憧れみたいなものがあったからですね。それで、海外で仕事することもあるんだけど、その時に知り合った人と会社起こせたらいいねって言っていたら、なんかつくっちゃってって感じですね。
CPU実験
-今はCPU実験をやっていて、コンパイラの原型としてmin-camlを使っているんですが、太田さんの頃にも有ったんですか。

ありました。住井先生が書いたやつですね。

-そうです。シミュレーター係だったそうですが、独自の機能をつけたりとかそういったことは?

流石に覚えていませんが、完動したのは11月12日でした。

-そのときは自由に班決めしてたんですか?

出来る人同士で集まってやるって感じでしたね。今もそうなの?

-今はくじ引きになってます。出来る人だけで組むと動かないまま終わっちゃう班が出てしまうらしいので。

自分たちの時は、だいたい出来る順で班ができて、最終的に全部動いたね。自分の班は谷田くんっていうハードウェア係がいて、100MHzで基盤を動かしてました。今は何MHzくらいで動かすの?

-今でも100MHzで動けばいいほうです。当時はどんな感じの係分けだったのですか?

自分はシミュレーターを書いて、ICPCで一緒だった潮田君って人がコンパイラ書いて、あとは山本君っていう石川研に行った人が命令とかのキャッシュを書いてましたね。CPUはキャッシュみたいなものじゃないですか。いかに当てるかという勝負なので。

-今は命令が全部基盤のROMに載せられるで、メモリから引っ張ってこなくても良くなってますね。

当時はいかに命令をキャッシュに当てるかっていう競争みたいな感じでした。

-今はメモリから2クロックくらいでデータ取ってこれるんで、キャッシュはあまり必要なくなってしまった感じですね。どちらかというとコンパイラの勝負みたいで、コンパイラ半分、コア半分のような感じです。

あ、コンパイラの勝負なの? じゃあ、今はパイプライン実装しちゃえばコンパイラ次第みたいな?

-パイプラインにしても、クロックが思うように上がらなかったりとか、分岐予測やフォワーディングしてるかどうかで結構変わってきますね。

谷田君はそのへん全部やってたんじゃないかな。最後に安達くんって人がいて、CPU実験の学期が終わったあとも一年くらい実験を続けてたんだけど、今はスパコン京のアセンブラとかを書いてるらしいね。二位を一位にする作業をやってたんじゃないかな。

-その人の書いたと思われる浮動少数点マニュアルにはいまだにお世話になってますね

あれまだあるの!?

-はい、いまだにお世話になってます。

それはすごい。結局自分たちの班はコンパイルコードで19秒くらいになったんだけど、彼はコンパイラの吐いたアセンブラコードを自分でいじって9秒くらいにしてたね。今はどのくらいなの?

-現状の最速は16秒くらいです。今はさすがにアセンブラを直接いじる人はなかなかいませんね。

CPU実験のときは春日に住んでいて、確か正門が0:30に閉まるから、それまでに滑りこむみたいな生活してて、完全に逆転してた。

-最後に東大の情報科学科に入ってくる人とかに何かメッセージがあれば。

今はどんな人が入ってくるの?プログラミング大好きなみたいな人多いの?

-いろいろなシステムのコミッターとかの人もいれば、情報的な数学がやりたい人とかいたりで様々ですね。

なるほどね。まぁ、大きなこというとコンピューターは世界を変えられると思うんで、皆さん是非情報科学科に来ましょう。コンピューターは人より得意な部分があるから、それをいかに現実世界に応用するかみたいなことが楽しい。