百度智能云千帆正式开源推出全新视觉理解模型——qianfan-vl。该模型系列涵盖3b、8b和70b三种参数规模,专为面向企业级多模态应用需求而设计,并在实际产业场景中进行了深度优化。
官方表示,Qianfan-VL不仅拥有强大的通用视觉理解能力,更针对OCR识别、
教育等高频垂直应用场景进行了专项增强,显著提升其在真实业务环境中的表现。即日起至10月10日,开发者与企业用户可登录百度智能云千帆平台,免费试用8B与70B版本模型。
Qianfan-VL基于主流开源架构研发,全量训练与推理流程均在百度自研昆仑芯P800平台上完成,具备以下核心优势:
部分性能测评结果如下:
更多技术细节与使用指南请参见官方发布内容。
源码下载地址:点击获取