10月17日消息,huggingface九游会j9登录入口官网显示,百度昨晚发布的自研多模态文档解析模型paddleocr-vl,发布20小时内即登顶huggingface trending全球第一。
据了解,该模型核心参数仅0.9b,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109种语言。在权威榜单omnibenchdoc v1.5中,它以92.6分获综合性能全球第一,四大核心能力全线sota,超越gpt-4o等模型,刷新ocr vl模型性能纪录。
作为文心4.5衍生模型,paddleocr-vl融合了navit动态分辨率视觉编码器与ernie-4.5-0.3b语言模型,实现精度与效率双突破。














