🚀 功能更新
- 安全性认证:SoMark 获网信部算法备案
- 功能新增:
- CLI & SDK 上线:支持通过命令行和 SDK 快速接入 SoMark
- Excel 解析上线:新增 Excel 文件解析支持
- 免费体验新增 md-raw:解析结果支持查看 Markdown 源码
- 功能优化:
- 文中图、表中图强化:优化文中图片和表中图片的识别与还原效果
- 图片理解多语言优化:中文文档中的图片默认输出中文理解,其他语言默认输出英文理解
- 跨页表格拼接优化:提升跨页表格合并稳定性与连续性
- SoMarkDown 功能优化:SoMarkDown Viewer 升级本地存储能力,并支持拖拽调整区域大小
- 官网 UI 换新:界面与交互体验全面升级
🚀 功能更新
- API 免费额度开放
- 每位用户每月可享 2,000 页 免费解析额度
- 每日免费额度消耗上限为 500 页
- API 功能拓展
- 输出格式
output_formats新增 zip 格式,支持打包下载 Markdown 及图片 - 新增元素输出格式配置参数
element_formats,支持自定义图片、公式、表格、化学式的输出格式 - 特色功能开放参数配置
feature_config,支持跨页文字拼接、跨页表格拼接、标题层级识别、图片语义理解、表中图、文中图及页眉页脚保留开关控制
- 输出格式
🚀 功能更新
- 免费体验与 API 同步上线“特色功能”
- 跨页表格拼接:跨页表格合二为一,数据呈现一览无余
- 跨页文本拼接:跨页文本合二为一,打通文本信息的跨页隔断
- 标题层级识别:智能识别标题等级,让文档结构一目了然
- 图片理解:视觉信息转化为文字描述,解释图片背后的逻辑
- 抗水印、印章干扰:穿透水印干扰,直取纯净文本
- 嵌入式图片还原:细致还原文字段落中的图片和表格单元格内的图片

