隨著醫學影像分割模型在臨床應用中的需求日益增加,如何提升其在跨資料來源及未見病理特徵下的泛化能力,已成為深度學習研究的重要課題。本研究聚焦於全心臟肌肉分割任務,系統性評估多種模型在跨資料集與特定病理條件下的表現差異。實驗資料來源包括全心臟肌肉分割資料集與多模態全心臟分割資料集,並額外建立 20 筆全心臟肌肉標註資料,以補足公開資料的不足。研究設計涵蓋五折交叉驗證、跨資料集測試與病理泛化測試,並以戴斯相似係數、郝斯多夫距離 95%、平均對稱表面距離與表面戴斯相似係數等指標評估模型之泛化表現。結果顯示,訓練資料多樣性對模型效能具關鍵影響。本研究進一步探討資料分布差異與病理適應性,為未來開發更穩健、具臨床實用性的影像分割模型提供實證基礎與參考方向。