跳转到主要内容
适合把解析能力接进产品、后端服务和自动化系统。如果你还在比较接入方式,先看 入门总览;如果你只是想先在终端跑通一次,去看 SoMark CLI
1

安装 SDK

SoMark 提供 Python 和 JavaScript 两个实现。
pip install somark
2

初始化客户端

最简单的方式是在初始化时直接传入 API Key。
from somark import SoMark

client = SoMark(api_key="sk-your-api-key")
3

先完成一次同步解析

先拿一个文件跑通结果,再决定要不要补充格式、配置和后处理逻辑。
response = client.parser.parse(
    file="./document.pdf",
    formats=["md", "json"],
)
response.save("./document.md")
4

大文件改用异步任务

长文档、批量任务和后台流程更适合异步模式。
task = client.parser.parse_async(file="./large.pdf", formats=["md"])
result = task.wait()
result.save("./large.md")
需要更完整的参数和错误处理说明时,继续看 CLI & SDK 使用指南