MLLM

Towards Better Vision-Inspired Vision-Language Models

Multi-modal large language models with hierarchical visual features and deeper vision-language interactions.

Jun 1, 2024

© 2024 Ziyuan Huang. Last updated Jul 4, 2024.

Published with Hugo Blox Builder — the free, open source website builder that empowers creators.