Ask or search anything...

History

Events

Watch Recordings

AI for Law01/09 · Joel Niklaus · Hugging Face

Papers Benchmarks

Hot

PaddlePaddle Team

PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model

25 Nov 2025

Baidu Inc PaddlePaddle Team

PaddleOCR-VL introduces a 0.9B ultra-compact vision-language model (VLM) that achieves state-of-the-art multilingual document parsing by decoupling layout analysis from element-level recognition. The model supports 109 languages and secured an overall score of 92.86 on OmniDocBench v1.5, while also delivering 53.1% higher page throughput than leading baselines.

View blog

#computer-science #computer-vision-and-pattern-recognition #inference-optimization

Resources

1,128

There are no more papers matching your filters at the moment.

alphaXiv

Explore

State of the Art

Sign In

Labs

Feedback

Browser Extension

Dark mode

Ask or search anything...

Events