創造與建構
“杭州六小龙”第一股、空间智能与AI的下一步:对话群核科技创始人黄晓煌
摘要
群核科技創始人黃曉煌在港股IPO後,闡述空間智能作為 AI 下一步的戰略意義。空間智能源於認知科學,經歷從二維視覺識別、三維重建到預測與規劃的技術演進。黃曉煌闡明空間智能、世界模型、具身智能三者的層級關係:世界模型是「大腦」負責內部模擬與預測;空間智能負責三維物理空間的感知與理解;具身智能則將二者整合到實際機器人與自動化系統。業界主要分為空間生成(重建、推斷、生成融合)與潛空間預測兩大路線。群核科技採取「工程+產業驅動」策略,與李飛飛的 World Labs 相異,專注於貼近物理世界的真實場景建模,已推出 SpatialLM 語言模型、SpatialGen 生成模型、SpatialVerse 訓練平台等產品矩陣,形成從設計工具到產業底座的完整生態。
重點
- 空間智能是理解三維物理空間的感知與推理能力,由視覺、表徵、推理、預測、行動五大模塊組成。
- 世界模型→空間智能→具身智能形成清晰進階路徑,具身智能無法跳過空間智能。
- 空間生成(重建+推斷+生成融合)相比潛空間預測更適合商業落地,提供可解釋性與人工干預空間。
- 中美空間智能發展路線分化:美國聚焦虛擬世界生成,中國因製造業優勢貼近物理世界真實建模。
- 群核科技基於 CAD/BIM 數據優勢,以 SpatialLM、SpatialGen 為核心,打造服務機器人、影視、電商的垂直產品矩陣。
章節
- [0:33] 空間智能的認知科學基礎與技術演進
從加德納多元智能理論出發,追溯空間智能從二維視覺識別、三維重建到預測規劃的技術發展軌跡。
- [4:41] 空間智能、世界模型、具身智能的層級關係
透過開門案例闡述三者關係:世界模型負責預測,空間智能負責三維理解,具身智能整合於實際系統。
- [7:45] 空間生成路線:重建、推斷、生成的融合
介紹點雲、Mesh、NeRF、高斯泼溅等表徵方法及其權衡,以及 World Labs 的融合策略。
- [12:50] 潛空間預測與商業化選擇
對比潛空間預測(JEPA、Dreamer)與空間生成,說明後者在可解釋性與產業落地的優勢。
- [14:04] World Labs 與群核科技的商業化差異
World Labs 採學術驅動構建通用基礎模型;群核則以工程+產業驅動瞄準垂直應用場景。
- [15:12] 群核科技的技術積累與產品矩陣
基於酷家樂 CAD/BIM 數據優勢,推出 SpatialLM、SpatialGen、SpatialVerse、LuxReal 等產品。
- [16:32] 中美空間智能發展路線差異
分析中國聚焦物理世界、美國聚焦虛擬世界的發展差異及其深層原因。
- [19:32] 黃曉煌的創業歷程與戰略預判
從英伟達 CUDA 研究到群核創業,再到空間智能布局,展現持續的技術預判與商業切入能力。
金句
對我來說沒有空間智能是不可能去實現 AGI 的,而我想要去解決這個問題。
世界模型就像是『大腦』,它能夠在『腦中』構建一個關於世界運行的『內部地圖』,去理解事件之間的因果關係,去預測接下來會發生什麼。
我們所有訓練的模型以及我們的工具,都緊貼著物理世界在做。我們要求我們出來的場景、內容,都是跟物理世界盡可能地接近。
我覺得美國更貼近於虛擬世界,中國更貼近於物理世界。可能中國的製造力比較強,所以中國的機器人本體公司多。
我當時就非常堅信 GPU 的 Manycore 架構是下一代計算的方向,因為我本來讀博士的時候就在研究這個。