從分類到建模:範式的根本轉變

傳統的AI血液細胞分析系統採用分類方法——將每個細胞歸入預設的類別(正常白血球、異常淋巴球、原始細胞等),然後根據各類別的比例來判斷是否存在異常。這種方法存在一個根本性的局限:血液細胞的形態變化是連續的,而非離散的。一個正在惡性轉化的細胞可能同時具有正常和異常的特徵,它不屬於任何一個預設類別,卻可能是疾病的重要早期信號。

CytoDiffusion採用了一種根本不同的方法。它不是將細胞分類到固定的類別中,而是利用擴散模型(diffusion model)學習血液細胞外觀的整個連續分布。系統學會了「正常血液細胞看起來應該是什麼樣的」,然後通過檢測偏離正常分布的樣本來識別異常。

這一方法的靈感直接來自生成式AI領域的核心技術。與Stable Diffusion生成圖像或DALL-E創造藝術作品的原理相同,CytoDiffusion通過學習數據的分布來理解「正常」的全部範圍,進而識別「異常」的任何偏離。

CytoDiffusion vs. 傳統分類方法

  • 傳統方法:細胞 → 固定類別(正常/異常/未知) → 比例統計 → 診斷
  • CytoDiffusion:細胞 → 與正常分布的偏離程度 → 連續異常評分 → 診斷
  • 核心優勢:能夠捕捉介於「正常」與「明確異常」之間的微妙變化
  • 臨床意義:可能更早發現疾病的初期跡象

超越人類專家的靈敏度

CytoDiffusion在白血病異常細胞檢測中展現出了超越現有系統和人類專家的靈敏度。靈敏度(sensitivity)是醫學診斷中的關鍵指標,衡量的是系統正確識別「有病」患者的能力——高靈敏度意味著漏診率低。

在白血病檢測中,靈敏度的提升具有直接的臨床意義。白血病的早期診斷對治療效果有決定性影響:急性白血病如果在早期被發現,五年生存率可以顯著提高。每一個被CytoDiffusion額外識別出來的異常樣本,都可能代表一個獲得更早治療機會的患者。

跨醫院、跨設備的穩健性

CytoDiffusion最令人印象深刻的能力之一是其跨環境的穩健性。在醫學AI領域,一個常見的問題是模型在訓練醫院表現優異,但在其他醫院的表現顯著下降——這是因為不同醫院使用的顯微鏡、染色試劑和製片方法各不相同,導致圖像的視覺特徵存在系統性差異。

研究團隊在多個醫院、使用不同顯微鏡和不同染色方案獲取的血液塗片上測試了CytoDiffusion,結果顯示系統的性能在不同條件下保持高度一致。這一結果表明,CytoDiffusion學到的不是特定設備或染色方法的視覺模式,而是血液細胞形態的本質特徵。

跨環境穩健性的技術意義

  • 消除設備偏差:不同品牌和型號的顯微鏡不影響分析結果
  • 適應染色差異:不同染色方案下的細胞外觀變化不導致性能下降
  • 跨機構部署:無需針對每個新醫院重新訓練或校準
  • 全球可擴展性:對資源有限的發展中國家醫療機構尤為重要

圖靈測試:血液學家的盲測挑戰

研究中最引人注目的實驗或許是對CytoDiffusion進行的「圖靈測試」。研究團隊邀請了10位經驗豐富的血液學專家(hematologist),要求他們區分CytoDiffusion生成的合成血液細胞圖像和真實的顯微鏡圖像。

結果令人驚嘆:這些擁有多年臨床經驗的專家無法可靠地分辨AI生成的圖像與真實圖像。專家們的正確識別率接近隨機猜測水平,這意味著CytoDiffusion已經能夠生成在專業醫學人員眼中幾乎無法與真實樣本區分的血液細胞圖像。

這一結果具有雙重意義。首先,它證明了CytoDiffusion對血液細胞外觀分布的學習達到了極高的精度——只有深刻理解了血液細胞的形態規律,才能生成專家無法辨識的合成圖像。其次,它開啟了利用生成式AI擴充醫學訓練數據的可能性——在某些罕見疾病的診斷中,真實樣本的稀缺是訓練AI系統的主要瓶頸。

更少的訓練數據,更好的性能

CytoDiffusion的另一項重要優勢是其數據效率。研究團隊報告稱,CytoDiffusion所需的訓練樣本數量少於現有的分類模型,卻能達到更好的性能。這一看似矛盾的結果有其深層的技術原因。

傳統的分類模型需要大量已標註的樣本來學習每個類別的特徵——而醫學圖像的專家標註是昂貴且耗時的過程。CytoDiffusion的生成式方法則主要從正常血液細胞圖像中學習「正常」的分布,正常樣本通常容易獲取且標註成本低。系統通過理解正常的全部變化範圍,來識別偏離正常的異常——這種「學正常、找異常」的策略在數據獲取上天然具有優勢。

對罕見疾病診斷的意義

數據效率的優勢對罕見血液疾病的AI診斷尤為重要。某些罕見的白血病亞型每年僅有極少數病例,傳統的分類方法根本無法獲得足夠的訓練樣本。CytoDiffusion的方法——不需要大量特定疾病的樣本,只需要充分的正常樣本——為這些罕見疾病的AI輔助診斷開闢了新路。

全球最大公開血液塗片數據集

除了算法本身,CytoDiffusion研究團隊做出了另一項重大貢獻:釋出了全球最大的公開外周血塗片圖像數據集,包含超過50萬張樣本。

在醫學AI領域,高質量數據集的匱乏一直是制約研究進展的重要瓶頸。大多數醫療數據受到隱私法規和機構政策的嚴格限制,難以公開共享。這一數據集的釋出對全球研究社區的價值不可估量。

  • 規模:超過50萬張高品質血液細胞圖像,遠超此前任何公開數據集
  • 多樣性:涵蓋多個醫院、多種設備和多種染色方法的樣本
  • 標註品質:由專業血液學家進行質量控制
  • 開放使用:遵循開放科學原則,研究者可自由使用

這一數據集將成為血液病AI研究的基準平台,使全球研究者能夠在統一的數據基礎上開發和比較不同的方法。

生成式AI在醫學影像中的更廣泛意義

CytoDiffusion的成功不僅限於血液學領域。它展示了一種可能適用於多種醫學影像分析的新範式——利用生成式AI學習正常組織的外觀分布,然後通過檢測偏離來識別病變。

生成式AI醫學影像分析的潛在應用

  • 病理學:分析組織切片,檢測癌症早期病變
  • 放射學:分析X光和CT影像中的細微異常
  • 皮膚科:評估皮膚病變的良性/惡性可能
  • 眼科:分析視網膜圖像檢測糖尿病視網膜病變
  • 細胞學:子宮頸抹片等細胞學檢查的自動篩查

在所有這些領域中,「正常」的變化範圍是寬廣的,而「異常」的表現形式是多樣的。傳統的分類方法要求預先定義所有可能的異常類別,這在實際中往往不可行。生成式方法通過學習「正常」的全貌來識別任何偏離,在理論上更適合這類開放性的異常檢測問題。

臨床部署的挑戰

儘管CytoDiffusion的研究結果令人振奮,從學術論文到實際臨床部署仍有相當距離。臨床環境對AI系統的要求遠比研究環境嚴格。

  • 監管審批:醫療AI系統需要獲得FDA、CE等監管機構的批准
  • 臨床驗證:需要在大規模、前瞻性的臨床試驗中驗證性能
  • 工作流程整合:系統必須無縫融入現有的臨床檢驗流程
  • 可解釋性:臨床醫生需要理解AI判斷的依據,而非僅接受結論
  • 責任界定:當AI輔助判斷出現錯誤時,責任如何劃分?

這些挑戰並非不可克服,但需要研究團隊與醫療機構、監管部門的密切合作。CytoDiffusion在跨醫院穩健性方面的良好表現,為其未來的臨床部署奠定了重要基礎。

對香港醫療AI發展的啟示

香港擁有世界一流的醫學院和醫療體系,在醫療AI研究和應用方面具備得天獨厚的條件。CytoDiffusion的研究為香港的醫療AI社區提供了幾點重要啟示。

首先,生成式AI在醫學影像分析中的應用前景廣闘。香港的大學和醫院可以借鑒CytoDiffusion的方法,在本地的醫學影像數據上開發類似系統。其次,數據集的公開共享是推動研究進展的關鍵。香港的醫療機構可以考慮在適當的隱私保護框架下,貢獻匿名化的醫學影像數據。

此外,香港作為粵港澳大灣區的醫療樞紐,有機會在AI輔助診斷的臨床驗證和推廣中發揮重要角色。瑪麗醫院、威爾斯親王醫院等教學醫院的專業能力,加上香港的國際化研究環境,為開展大規模臨床驗證試驗提供了理想平台。

結語:生成式AI重新定義醫學診斷

CytoDiffusion代表了生成式AI在醫學領域的一個重要里程碑。它不僅在特定的白血病檢測任務上超越了人類專家,更重要的是,它展示了一種全新的AI醫學診斷範式——從「分類已知」轉向「理解正常、發現異常」。

伴隨50萬張圖像數據集的公開釋出,CytoDiffusion團隊不僅分享了自己的研究成果,更為全球研究社區提供了推動血液病AI診斷進步的公共資源。在AI與醫學交叉的廣闘領域中,這種開放科學的精神或許比任何單一技術突破更為珍貴。

對於全球數百萬白血病患者及其家屬而言,AI更早、更準確地檢測異常血液細胞的能力,最終可能意味著更早的診斷、更及時的治療、以及更好的生存機會。這是技術進步最有意義的兌現方式。