Synapse - FoundationMorph: A 3D vision-language foundation model for unsupervised medical image registration

FoundationMorph: A 3D vision-language foundation model for unsupervised medical image registration Conference Paper

Authors:	Pan, S.; Hu, M.; Safari, M.; Shah, K.; Zhao, F.; Wang, T.; Qiu, R.; Yang, X.
Editor:	Wu, S.
Title:	FoundationMorph: A 3D vision-language foundation model for unsupervised medical image registration
Conference Title:	Medical Imaging 2025: Imaging Informatics
Abstract:	This study introduces FoundationMorph, a 3D vision-language foundation model for unsupervised deformable 3D medical image registration. Traditional deep learning approaches struggle with generalizability and require training individual models for different image modalities and tasks, which may reduce efficiency and compromise clinical processes due to the limited data for training and the resulted performance inconsistency. FoundationMorph addresses these issues by performing multiple registration tasks with a single model. It integrates a language module for clinical text-based information using a pre-trained language model and a vision module that unifies 2D and 3D image encoders. The 2D encoder, trained on a large-scale mixed medical imaging dataset, including MRI, CT, and PET, works with a 3D network to learn multiple 3D registration tasks. A multi-dimensional attention module integrates language, 2D, and 3D features for accurate 3D registrations. The model was evaluated on the IXI dataset for brain MRI inter-patient registration and the DIRLAB dataset for lung 4DCT intra-patient registration. FoundationMorph outperformed competitive methods, achieving minimal target registration error and demonstrating superior effectiveness in handling multiple registration tasks, highlighting its potential to facilitate single- and multi-task registration for clinical practices. © 2025 SPIE
Keywords:	images registration; language model; foundation models; photointerpretation; patient registration; foundation model; unsupervised image registration; vision-language model; 3-d vision; 3d registration; 3d-registration; medical image registration
Journal Title	Progress in Biomedical Optics and Imaging - Proceedings of SPIE
Volume:	13411
Conference Dates:	2025 Feb 16-21
Conference Location:	San Deigo, CA
ISBN:	1605-7422
Publisher:	SPIE
Date Published:	2025-01-01
Start Page:	134111B
Language:	English
DOI:	10.1117/12.3047509
PROVIDER:	scopus
DOI/URL:	https://www.scopus.com/inward/record.uri?eid=2-s2.0-105004734369&doi=10.1117%2f12.3047509&partnerID=40&md5=40f1f1bd9ac2b0a6add315a428800b9d
Notes:	Conference Paper (ISBN: 9781510686007) -- Source: Scopus

Altmetric

What is Altmetric?

Citation Impact

What is Dimensions Citation Badge?

BMJ Impact Analytics

MSK Authors

56 Wang

Related MSK Work

Self Supervised 3 D Anatomy Segmentation Using Self Distilled Masked Image Transformer (Smit)

Lecture Notes in Computer Science 2022
Ttt Vnet: A 3 D Vision Test Time Training Model For Medical Image Analysis

Progress in Biomedical Optics and Imaging - Proceedings of SPIE 2025
A Clinical Benchmark Of Public Self Supervised Pathology Foundation Models

Nature Communications 2025
Quantifying Uncertainty In Lung Cancer Segmentation With Foundation Models Applied To Mixed Domain Datasets

Progress in Biomedical Optics and Imaging - Proceedings of SPIE 2025
Rm Sim: Controlled Respiratory Motion Simulation On Static Patient Scans

Physics in Medicine and Biology 2023