This paper introduces a first-of-its-kind benchmark for fine-grained document retrieval in natural scenes. It includes a dataset of 41,000 document images (where files like 39l.jpg are part of the image corpus) paired with over 200,000 queries .
Knowing if it contains a building , a document , or a product will help identify the exact research citation. 39l.jpg
The study highlights that OCR-free models perform better when queries involve visual, non-text elements, and that models pre-trained on image-text contrastive learning tasks (like CLIP ) show superior accuracy. Other Potential Matches "39l.jpg" also appears in these areas:
If the paper above does not match your specific context, "39l.jpg" also appears in these areas: 39l.jpg
Sie sehen gerade einen Platzhalterinhalt von Facebook. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Instagram. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie müssen den Inhalt von reCAPTCHA laden, um das Formular abzuschicken. Bitte beachten Sie, dass dabei Daten mit Drittanbietern ausgetauscht werden.
Mehr Informationen