API 文档

通过 RESTful API 接入 LingData 数据精炼管线

Base URLhttps://lingdata.io/api/v1
GET/meauth

验证身份

验证 API Key 是否有效,返回当前用户信息。

请求
curl https://lingdata.io/api/v1/me \
  -H "Authorization: Bearer $LINGDATA_API_KEY"
响应
{
  "id": "usr_xxx",
  "name": "张三",
  "email": "zhang@example.com",
  "tier": "pro"
}
POST/uploaddata

上传对话数据

上传对话数据集,自动进入精炼管线:格式解析 → PII脱敏 → 去重 → 6维评分。支持 .json / .jsonl / .csv / .txt 格式。

请求
curl -X POST https://lingdata.io/api/v1/upload \
  -H "Authorization: Bearer $LINGDATA_API_KEY" \
  -F "file=@conversations.json" \
  -F "name=我的ChatGPT对话"
响应
{
  "dataset_id": "ds_abc123",
  "status": "processing",
  "estimated_tier": "A"
}
GET/datasets/{id}/scoredata

查询评分结果

查询数据集的精炼结果和6维度评分。

请求
curl https://lingdata.io/api/v1/datasets/ds_abc123/score \
  -H "Authorization: Bearer $LINGDATA_API_KEY"
响应
{
  "overall": 92,
  "tier": "S",
  "dimensions": { "completeness": 94, "accuracy": 92, "safety": 95 }
}
GET/datasetsmarket

搜索数据集

搜索可购买的数据集,支持按等级、领域、语言筛选。

请求
curl "https://lingdata.io/api/v1/datasets?tier=S&domain=tech&page=1&limit=20" \
  -H "Authorization: Bearer $LINGDATA_API_KEY"
响应
{
  "total": 156,
  "items": [{ "id": "ds_001", "title": "中英双语技术对话合集", "tier": "S", "price": 12.0 }]
}
GET/datasets/{id}market

获取数据集详情

获取数据集完整信息,含评分、样例、合规证书。

请求
curl https://lingdata.io/api/v1/datasets/ds_001 \
  -H "Authorization: Bearer $LINGDATA_API_KEY"
响应
{
  "title": "中英双语技术对话合集",
  "tier": "S",
  "scores": { "completeness": 94 },
  "certificates": ["GDPR", "PII脱敏"]
}
POST/datasets/{id}/purchasemarket

购买数据集

购买数据集,支付成功后立即解锁下载。

请求
curl -X POST https://lingdata.io/api/v1/datasets/ds_001/purchase \
  -H "Authorization: Bearer $LINGDATA_API_KEY" \
  -d '{"quantity_k": 10}'
响应
{
  "order_id": "ord_xyz",
  "status": "paid",
  "download_url": "https://lingdata.io/api/v1/datasets/ds_001/download?token=***"
}
GET/datasets/{id}/downloadmarket

下载数据集

下载已购买的数据集,链接有效期24小时。

请求
curl -OJ "https://lingdata.io/api/v1/datasets/ds_001/download?token=***"
响应
Binary JSONL file
Content-Disposition: attachment; filename="ds_001.jsonl"
GET/healthsystem

健康检查

API 服务健康状态检查(无需认证)。

请求
curl https://lingdata.io/api/v1/health
响应
{
  "status": "ok",
  "version": "1.0.0"
}

速率限制:每个 API Key 每分钟最多 60 次请求,超出返回 429。建议实现指数退避重试。

错误码

CodeMeaning
200请求成功
400请求参数有误
401API Key 无效或已过期
402余额不足或需要购买
403权限不足
404资源不存在
429请求频率超限
500服务器内部错误