Disrupting VC:世界最先端のVCはどのように定量的投資手法を導入しているか?

Yuki Hayashi
11 min readNov 24, 2020

TL;DR — 金融業界全般でデータサイエンス応用が進む中、ベンチャーキャピタル業界は後塵を拝してきました。一方で、世界でも先進的なVC各社は既にデータサイエンスを応用し競争優位を築き始めています。UTECはDeep Tech領域のVCとしてデータサイエンス活用を行っています。

金融とデータサイエンス

近年、金融業界とデータサイエンスは切っても切り離せない関係になっています。投資行動においては、人間の脳が同時に処理できる以上の要素を同時に考慮して意思決定する必要がありますし、そこでは様々なバイアスが意思決定に悪影響を及ぼします。これを解決するため、データを包括的に判断し、バイアスから離れ、高速かつ判断基準に忠実に思考を遂行する、データサイエンスが活用されてきました。

有名どころでは、ヘッジファンドのBridgewater Associatesは、IBM Watson開発者を引き抜き、マクロ経済指標から投資委員会中の発言の質の相互評価まで収集し、意思決定にフィードバックするシステムを備えています。また、Goldman Sachs Asset Managementでは、2008年から、計量投資戦略グループにて、運用にビッグデータやAIを導入する取り組みがなされています。

VC投資におけるデータサイエンス導入の課題

一方で、金融業界の一角でありながら、ベンチャーキャピタル(VC)含むプライベートエクイティにおいてはデータサイエンスによるdisruptが進んできませんでした。大きな要因として、ディールソーシングは属人的なネットワークに依存し、網羅的なデータ取得が難しいという点が挙げられるでしょう。上場株取引においては公開市場にほとんど誰もが参加可能であることを前提としているため、投資判断に必要な諸情報の開示が行われますが、未上場株の取引においてはそうはいきません。

また、VC特有の話としては、少人数で爆発的な成長を志向するフェーズでは、過去のトラクションからの外挿がアテにならないということがあります。シード/アーリーの10人前後の組織においては、個々のメンバーの遂行力や、彼らのケミストリーなど、定量化しにくい要素の占めるウェイトがより大きいです。これが、VC投資の神髄のひとつとして「人を見極めるセンス」が長く挙げられてきた所以でもあります。

とはいえ、より多くの情報がデータとして構造化され、パブリックにアクセス可能になっていくにつれ、VC業界でも(他のアセットクラスからはかなり遅れて)データサイエンスが活用され始めています。

データサイエンスの活用余地

VCにおける投資のライフタイムを4フェーズに大別すると以下の通りです。

  1. ソーシング (投資先発掘)
  2. 投資検討/DD (投資判断)
  3. バリューアップ (投資先価値向上)
  4. EXIT (投下資本の回収)

次項で各社の取り組みを見ていきますが、VCにおいて今のところ進んでいるのは、このうち①ソーシング・②投資検討におけるデータサイエンス活用がメインです。中長期的には、データサイエンスによる③投資先価値向上を差別化としていくようなファンドも登場するかもしれませんが、投資効率を考えると、レイターのファンドから進んでいくのではないでしょうか。

(参考:バイアウトファンドでは、投資先のバリューアップにおいて、①EBITDA成長、②デレバレッジ、③マルチプル向上の3つのドライバーがあります。中でも、①③に寄与するため、バリューアップへのデジタル活用が進んでおり、内製用のデータサイエンティストを抱えるファンドも登場しています。)

先進的なVC各社の取り組み

Signalfire

Quantitative-methodにフォーカスした専業のVCとしては、おそらく世界で最も有名なファンドでしょう。CEOのChris Farmerは2005年から2009年までBessemer Venture Partners、また2013年までGeneral Catalystと、USのトップVCで定量的基準の作成に取り組んできて、満を持してSignalfireを設立しました。有名どころでは、UberのシリーズFや、ロボットピザのZume Pizza(その後芳しくない噂も聞きますが……)のシリーズAのリードなどを手がけました。

This Upstart Is Using A Bridgewater-Style Data Approach To Beat Traditional VCs To Key Hires-And Deals

年に$10M(10億円超!)を投資し、”Beacon”と呼ばれるスタートアップ版のBloombergを運営しています。論文・特許・OSS・App store・SNSなど、1000万のデータソースを利用し、600万を超える企業のパフォーマンスを追跡しているといいます。

また、人材ソーシングの”Beacon Talent”では、エンジニアからデザイナー、PdM、マネジメント層まで、さまざまなエコシステムの候補者をトラッキングし、ランク付けを行っています。6か月で55人の候補者の採用を行い、1/4はエグゼクティブだったという成果を発表しています。

また、SignalFireの元データ責任者であるJerry Yeは、UC BerkeleyのCS出身。Yahooで検索・レコメンドなどに取り組みデータサイエンティストとしてキャリアを積んでSignalFireにジョインしましたが、現在ではLightspeed Venture Partnersでデータプラットフォーム担当のパートナーになっています。

142. Beacon: An Engineering Systems Approach to Investing, Part 1 (Chris Farmer)

EQT Ventures

スウェーデンで€1.2Bを運用するVCです。

Motherbrainというカッコイイ名前の機械学習システムを社内で運用しています。データとしては、資金調達、Webランキング、App Storeのランキングデータ、ソーシャルネットワークアクティビティ、その他財務データをトラックしています。内部構造はCNNを用い、数百万のスタートアップを時系列的に追跡し、投資すべき企業を示しています。

Motherbrainを用いた投資は$100M以上行ってきており、そこに至るまでで、2019年3月時点で10,000社以上を評価してきました。Motherbrainによる初の投資はAnyDeskで、キャッシュフローポジティブで外部資金を必要としていなかったものの、「システムに選ばれた最初の企業だ」と口説かれて$7.6Mのラウンドを行ったというエピソードがあります。

元SpotifyのVP of AnalyticsだったHenrik Landgrenがシステムを駆動しています。

This AI helps find great startups before the world discovers them

Two Sigma Ventures

機械学習活用で有名になったトップ5のヘッジファンドですが、ベンチャー投資部門も保有しています。シード~Aの投資がメインで、合成生物学のZymergenにもシリーズAから投資をしています。

ここが特徴的なのは、投資先の価値向上についてもデータサイエンス導入をしており、バイアウトファンド的なハンズオンも行っていることでしょう。製品のプライシング・在庫管理・競合分析といった部分についてデータサイエンスを用いているということです。

有望ベンチャーをAIで発掘 ファンド大手ツーシグマ

InReach Ventures

ロンドンベースのVCで、2014年夏にBalderton(元Benchmark Europe)を飛び出したRoberto Bonanzingaにより設立されました。彼の古巣のBaldertonも現在データサイエンティストを雇い定量的取り組みを行っています。また、パートナーのBen Smithは Yammer / Microsoft UKの元エンジニアリングディレクターです。

彼らは$3.5Mを費やしてDIGなるプラットフォームを構築しました。数百万のデータポイントから、ルールベースと複雑なネットワークのアンサンブルモデルによって、毎月2,500のスタートアップを分析しています。特徴的な点として、Crunchbase, Product Hunt, AngelListなどをはじめとして、個人がプロジェクトを始めようとするとWebに残す痕跡(プロフィールの微妙な変更など)をトラックしています。これにより、正式に資金調達を開始する前に会社名を発見し、コールドコールを行うことができました。

彼らの課題意識は、欧州のVCは米国のVCと同じような戦略をとっているが、米国のVCに比べて投資先候補が地理的に分散しているため、業務が効率的にならないということです。そのことは、「テクノロジーを使用して、これまで非常に拡張性が低かったビジネス、つまりベンチャーキャピタルを拡張しようとしています」という彼の発言に如実に表れています。

This tech VC firm has software that it thinks can create hundreds of thousands of jobs

Blossom Capital

欧州のハイテクベンチャー、主に開発者向けツールやAPIの企業に投資を行うVCです。元Index VenturesのOphelia BrownやImran Ghoryによって共同設立されました。Imran GhoryはIndex Venturesにおいてもデータサイエンスを行っていました。Blossom Capitalは、1号ファンドを2019年に$85Mで立ち上げてから1年足らずで2号ファンドを$185Mに立ち上げています。

ここのデータサイエンス活用において特徴的なのは、「ロングテールのソーシング」にフォーカスしている点です。InReach Venturesの項でも述べた通り、欧州のVC投資において投資先候補は地理的に分散しており、シリコンバレーとNY/ボストンに集中している米国とは環境が異なります。その中で、チェコやルーマニアといった比較的ベンチャーが少ない都市に対するカバレッジは弱くなってしまいがちです。彼らはデータを用いた判断を用い、そういった「ロングテール」的都市の優良企業へのアラートを研ぎ澄ませています。

彼らのシステムは構築方法も面白いです。DDや投資委員会の議論中に取引を評価するために使用する方法論を書き出し、そこから投資家の考え方を再現するモデルを構築します。これらのモデルを提供できるデータソースを探します。これは、SNSや求人サイト等をより多くカバーしてデータリッチにするという趨勢のアプローチとは逆です。

Blossom — Medium

UTECでの取り組み

上記で紹介したファンドは主にIT領域を対象としている一方、私の所属するUTECでは、ライフサイエンスを中心としたディープテック領域での活用を模索しています。

UTECの投資の特徴を以下に5点示します。

  • 歴史:2004年から累計16年にわたって500億円超を運用、100社以上に投資
  • 投資セクター:金額別で1/2~2/3がディープテック領域。主な成功事例は、ペプチドリーム(ペプチド創薬)、MUJIN(ロボットのモーションコントローラ)、ACSL(自律飛行ドローン)、AI Inside(OCR SaaS)、ニューラルポケット(エッジAI) など
  • 投資基準:「グローバルな課題」「優れた科学技術」「実行力のあるチーム」
  • 投資タイミング:初回投資は共同創業~シリーズA、以後リードインベスターとして価値提供
  • 人材支援:人材紹介業免許を持ち、経営人材に特化した人材プール”UTEC SOC”を運用。2年で50人の投資先ハイクラス人材の採用をサポート

UTECが行うディープテック領域は、初期のR&D投資が重く、収益化まで時間が必要なため、初期から粘り強い支援が求められます。また、ピボットがソフトウェア領域ほど容易でなく、特に初期の技術選定が重要になることが多いです。したがって、VCファンドが適切な技術を探り、経営人材もソーシングし、共同創業を志向する、というモデルが適しています。

ここで重要になるのが、「どのような技術トレンドが存在し、中でも誰と共同創業を仕掛けるか?」という問い。そこへのアプローチとして、UTECではデータサイエンスの活用を模索しております。以下のようなことに取り組んでおります。

  • 論文誌からのトレンド可視化・次世代キーワード抽出
  • キーワード内での中心的人物の同定
  • 知財・マクロ情報等との組み合わせによる起業ポテンシャル評価

UTECではこの業務に携わるリサーチ・アシスタント(大学生・大学院生・副業可能な社会人)を募集しています。世界に先端的な技術革新を実装するために、VC業界で世界でも先端的な取り組みを共に創っていきたい方のご連絡をお待ちしております。

UTEC リサーチアシスタント (Data Science担当) 応募フォーム

More Resources on This Topic

Data-Driven VCs: How 83 Venture Capital Firms Use Data, AI & Proprietary…

--

--