Builder's Scorecardの設計動機と開発履歴

Facebookを見ていてLucyの投稿に出会った。彼女はオープンソースプロジェクト投資スコアカードを共有していた（Lucy Chenは、シンガポールのZoo Capitalの EIRで、管理資産規模が20億ドルを超えるファンド）。

Lucyが共有したフレームワークは明確だった。5つの次元、加重スコア、一票否決メカニズム。多くの開発者が長い間誇りにしてきた技術が、実際のビジネス展開にはまだ多くの落とし穴がある。

Lucyのフレームワークは実戦から生まれた――彼女はNVIDIA GTCの前にこのスコアカードを使ってLMCacheプロジェクトをマークし、7.78点の「ダークホース」評価を与えた。2週間後、NVIDIAがDynamo 1.0を発表するとLMCacheを公式統合リストに組み入れた。彼女が設計した投資スコアカードはシグナルを捉えることができる。

しかし、私には別の考えもあった。この物差しは一般大衆にも恩恵をもたらすことができるのだろうか？

視点を変える

Lucy Chenのフレームワークは、VC投資の角度から出発している。出口戦略、チームの国際化、コミュニティガバナンス、資本効率を考慮している。これらは投資家にとって重要な問題である。

しかし、AIを使って独立してツールを作る多くの個人にとって、もしそもそも投資を受けるつもりがないとしたら？もし単に楽しくやりたいだけなら？もし商業転換する予定がないなら？もしこの時代がすでにソフトウェア小ツールの販売に適していないなら？

例えば、私が作ったリアルタイム会議翻訳ツール、マルチモデル討論エンジンなどは、すべて私一人がClaudeと共にゼロから作ったものである。私は投資を受ける必要がなく、出口戦略も必要ないが、作っているものの価値と調整方向を「人」に教えてもらう必要がある。

この問題はLucy Chenのフレームワークでは他の次元に暗黙的に含まれている。私はそれを独立させたい。

3つの変更

私は3つのことを行った。

第一に、「チーム能力」次元を削除した。チームは会社の重要な構成要素である。しかし私はサービス評価を対象にしたく、将来一人で10個のプロダクトを作る可能性があり、この次元は識別力を持たないかもしれない。私はそれを点数に影響しない「Builder Profile」前置フィールドに抽出した――AIが参考にするが、総合点には影響しない。

第二に、「問題解決力」次元を新設した。あなたが解決する問題は自分が想像したものなのか、それとも本当に5人以上が独立してこの痛点を述べたことがあるのか？既存の代替方案は何か？あなたの解法は既存方案よりどれほど優れているのか――10倍なのかわずかに良いだけなのか？これらの問題は任意のbuilderが手を動かす前に最初に問われるべきである。

第三に、商業化次元を段階適応させた。まだ概念期のside projectに「月間経常収入はいくらか」と問うのは不公平だが、「どうやって稼ぐかを考えたことがあるか」「市場への推薦」を問うのは合理的である。私はユーザーにまずプロダクト段階を選択させる――概念期、リリース済み、ユーザーあり、収入あり――段階によって全く異なる評価シグナルが表示される。

改修後、5つの次元は以下になった。問題解決力（25%）、市場検証（20%）、技術の堀（20%）、商業化路径（20%）、長期持続可能性（15%）。各次元に4-6個のシグナルがあり、各シグナルを0-10点で評価し、加重して総合点を算出する。

5.01点――自分の物差しに打ちのめされる

フレームワーク設計完了後、自分のリアルタイム翻訳ツールで完全評価を一度実行した。

結果：5.01 / 10。赤信号。

点数分布は非常に典型的なエンジニアプロダクトの輪郭だった。問題解決力7.0点、技術の堀6.2点（3エンジンSTTルーティング、独自コーパス蓄積）、長期持続可能性5.5点だが、市場検証4.0点（外部ユーザーの再訪データなし）、商業化2.0点（収費計画がほぼない）。

レーダーチャートの形状は極端な偏りを示していた――問題解決力と技術の2角は突出しているが、市場と商業化の2角はほぼ地面に張り付いている。

Builder's Scorecard評価結果――アゴラ広場翻訳ツール5.01点

Builder's Scorecard 5次元レーダーチャート――問題解決力と技術面が強く、市場と商業化が低い

この結果は正しい（少し刺激的に見えるが）。点数が低いのは事実を語っているからだ。技術が良いことはプロダクトが完成したことと等しくない。私はQwen3-ASRとDeepgramのルーティングロジックに時間をかけたが、「誰がこれにお金を払うか」については特に考えていなかった。なぜなら私はこの段階で実際に収費の予定がなかったからだ。

つまり、この物差しは誠実で、幻覚がない。

先に市場を見てから手を動かす

慣例により、コードを書く前に市場調査を行う。

類似サービスをいくつか見つけた。例えばValidatorAIは一文を貼るだけで創業アイデアを検証でき、30万回以上の利用を累積している。OpenSSF Scorecardはオープンソースプロジェクトのサプライチェーンセキュリティ評価専門。Repo DoctorはGitHub APIを使って構造化データを自動抽出し健康度分析を行う。

それぞれ学ぶべき点がある。ValidatorAIの「30秒で結果」は利用門戸を下げ、これは直接クイックモードの設計にインスピレーションを与えた。OpenSSFのスコア解釈メカニズムは私に気づかせた――低得点は「悪い」を意味するのではなく、ユーザーが正しく解釈できるよう支援すべきである。Repo DoctorのGitHub構造化データ抽出により、AIは判断力が必要な部分に集中できる。

しかし、私がやりたいことを完成させる既存ツールはなかった（調査が不十分かもしれないが）。一つのフレームワークで、5つの次元から同時に一つのプロダクトを評価し、それがオープンソースツール、SaaS、内部システムのいずれにも適用できるもの。

市場ポジショニングを確認後、コードを書き始めた。

Builder's Scorecard市場比較図――6つの能力面での5つのツールのレーダーチャート対比と機能対照表

一日、5つの段階

投稿を見てから実行を思い立つまでが一日。開発全体はAI協働で完成――Chat sessionで偵察と計画、Code sessionでプログラミング、Cowork sessionでバッチ処理と状態管理を処理。

Phase 1でコアフレームワーク：5次元 × 30シグナルのフロントエンドインターフェース、SVGレーダーチャート、クイックモードと完全モード、中英双言語切り替え、MarkdownとJSON出力。純フロントエンド、APIには触れない。

Phase 2でAI接続：Claude APIで2つのことを実行――Prompt Aはユーザーが貼ったプロダクト説明に基づいて30シグナルを自動採点（temperature = 0、同一プロダクトを複数回実行しても点数が安定することを保証）、Prompt Bは評価結果に基づいて戦略提案を生成（temperature = 0.3、提案に変化を許可）。

Phase 3で入力源拡張：4種の入力をサポート――純テキスト説明、GitHub URL（stars / contributors / forks / licenseなどの構造化データを自動抽出してAI評価に送信）、READMEファイルアップロード、一般ウェブサイトURL抽出。

Phase 4で防護とソーシャル：4層防御アーキテクチャ（Rate Limit、Auth Gate、Result Cache、Daily Cost Cap）で公開後の濫用を確実に防止。保存機能、動的ウォール、共有リンクを追加し、評価結果を発見・討論可能にした。

Phase 5で仕上げ・磨き上げ：トップページに入り口カード、方法論紹介ページ、SEO強化（JSON-LD + FAQ Schema）、llms.txt更新を追加。

各Phase間でステップを飛ばさない――Phase 2のAI prompt形式はPhase 1のデータ構造と対応させ、Phase 3のGitHubデータはPhase 2のpromptに入力する。まず偵察してから手を動かし、まず計画してから実行する。

物差しの識別力

ツール公開後にテスト：完全に異なる3つのプロダクトで評価を実行。

LangChain：8.02点。13万stars、3,659 contributors、LangSmith有料プロダクトあり。5つの次元すべてが7点以上で、長期持続可能性のみ大手の脅威によりやや低い。

Lucy ChenのOSS Investment Scorecard自体：6.82点。フレームワーク設計がしっかりしており、問題が実在、テスト時233 stars、2 contributor、収入モデルゼロ。

私のリアルタイム翻訳ツール：5.01点。技術面に基盤があるが、市場面と商業化は空白。

3つのプロダクト、3種の全く異なるレーダーチャート形状。点数に区別があり、区別の方向も観察と一致している。この物差しには一定の識別力があるはずだ。

重要なのは点数ではない

2026年、一人とAIがあれば、確実に数日内に、一つのアイデアを概念から実際にオンライン化されたツールまで推進できる。しかし速度は決して重点ではない。

ポストAI社会において、ツールを作る門戸は急速に下がっている。ますます多くの人がbuilderになれるようになり、ツール創造も少数の技術者の専売特許ではなくなった。しかし真の問題は、まさにここから始まる。我々が作ったツールは、本当に人の使用に適しているのか？本当に問題を解決しているのか？

一つの考えが浮かび始めたとき、またはプロダクトを半分まで作ったとき、我々は前進しながら立ち止まって確認する能力があるだろうか。これは作る価値のあるものなのか？それは人のニーズに奉仕するのか、それとも単に「作ることができる」という我々の衝動を満たすだけなのか？

Builder’s Scorecardは「正解」を与えるためのものではない。5つの次元のデータをあなたの前に並べて、あなた自身に判断させる。

重要なのは総合点だけでなく、レーダーチャートの形状でもある。6.0点だが五角形が均一なプロダクトは、7.0点だがある次元が1点のプロダクトより健康かもしれない。しかし、それはあなたの意図的な選択かもしれない。創造の道において、すべては美しい。姿勢が醜くても構わない、前進し続ければよい。

もしあなたも何かツールやside projectを作ったなら、測定してみてください。点数のためではなく、自分の盲点を見るためです。

視点を変える

3つの変更

5.01点――自分の物差しに打ちのめされる

先に市場を見てから手を動かす

一日、5つの段階

物差しの識別力

重要なのは点数ではない

💬 コメント

関連記事

君は認知で負けているのではない、まだ始まりもしないうちから恐怖に怯えて敗北しているのだ

組織の硬直化を超越する：事業開発とはサイロの解読である

AI嵐からの突破：個人優位戦略マップの構築