12 KiB
12 KiB
腾讯文档 API 数据格式解析说明
问题发现
在实际调用腾讯文档 V3 API 时,发现返回的数据格式与预期完全不同。
数据格式对比
❌ 我们最初预期的格式(简单格式)
{
"values": [
["单元格1", "单元格2", "单元格3"],
["数据1", "数据2", "数据3"]
]
}
✅ 实际返回的格式(gridData 格式)
{
"gridData": {
"startRow": 0,
"startColumn": 0,
"rows": [
{
"values": [
{
"cellValue": {
"text": "JY202506181808"
},
"cellFormat": {
"textFormat": {
"font": "Microsoft YaHei",
"fontSize": 11,
"bold": false,
"italic": false,
"strikethrough": false,
"underline": false,
"color": {
"red": 0,
"green": 0,
"blue": 0,
"alpha": 255
}
},
"horizontalAlignment": "HORIZONTAL_ALIGNMENT_UNSPECIFIED",
"verticalAlignment": "VERTICAL_ALIGNMENT_UNSPECIFIED"
},
"dataType": "DATA_TYPE_UNSPECIFIED"
},
{
"cellValue": {
"text": ""
},
...
}
]
}
],
"rowMetadata": [],
"columnMetadata": []
},
"version": "0"
}
格式差异分析
数据层级
简单格式:
响应
└── values (数组)
├── 行1 (数组)
│ ├── "单元格1"
│ └── "单元格2"
└── 行2 (数组)
├── "数据1"
└── "数据2"
gridData 格式:
响应
└── gridData (对象)
├── startRow (数字)
├── startColumn (数字)
├── rows (数组)
│ └── 行对象
│ └── values (数组)
│ └── 单元格对象
│ ├── cellValue (对象)
│ │ └── text (字符串) ← 实际文本内容在这里
│ ├── cellFormat (对象)
│ └── dataType (字符串)
├── rowMetadata (数组)
└── columnMetadata (数组)
关键区别
| 项目 | 简单格式 | gridData 格式 |
|---|---|---|
| 根字段 | values |
gridData |
| 行数据 | 直接数组 | 在 gridData.rows 中 |
| 单元格数据 | 直接字符串 | 在 cellValue.text 中 |
| 格式信息 | 无 | 在 cellFormat 中 |
| 元数据 | 无 | 在 rowMetadata、columnMetadata 中 |
解决方案
1. 创建数据解析器
我们创建了 TencentDocDataParser 工具类来统一处理两种格式:
位置:ruoyi-system/src/main/java/com/ruoyi/jarvis/util/TencentDocDataParser.java
核心功能:
(1) 解析为简单数组格式
JSONArray parsedValues = TencentDocDataParser.parseToSimpleArray(apiResponse);
输入(gridData 格式):
{
"gridData": {
"rows": [
{
"values": [
{"cellValue": {"text": "单元格1"}},
{"cellValue": {"text": "单元格2"}}
]
}
]
}
}
输出(简单格式):
[
["单元格1", "单元格2"]
]
(2) 获取指定行数据
JSONArray row = TencentDocDataParser.getRow(apiResponse, 0); // 获取第1行
(3) 获取指定单元格文本
String cellText = TencentDocDataParser.getCellText(apiResponse, 0, 2); // 第1行第3列
(4) 打印数据结构(调试用)
TencentDocDataParser.printDataStructure(apiResponse, 5); // 打印前5行
2. 更新 Service 层
在 TencentDocServiceImpl.java 的 readSheetData 方法中:
// API 调用
JSONObject result = TencentDocApiUtil.readSheetData(...);
// 解析数据为统一的简单格式
JSONArray parsedValues = TencentDocDataParser.parseToSimpleArray(result);
// 返回包含简化格式的响应
JSONObject response = new JSONObject();
response.put("values", parsedValues); // 统一格式
response.put("_原始数据", result); // 保留原始数据供调试
return response;
3. 向后兼容性
解析器会自动检测数据格式:
- 如果有
gridData字段 → 解析为 gridData 格式 - 如果有
values字段 → 直接返回(简单格式) - 如果都没有 → 返回空数组
public static JSONArray parseToSimpleArray(JSONObject apiResponse) {
// 方式1:检查是否有 gridData 字段(V3 API 新格式)
JSONObject gridData = apiResponse.getJSONObject("gridData");
if (gridData != null) {
return parseGridData(gridData);
}
// 方式2:检查是否有 values 字段(简单格式)
JSONArray values = apiResponse.getJSONArray("values");
if (values != null) {
return values;
}
// 如果都没有,返回空数组
return new JSONArray();
}
使用示例
示例 1:读取表头
// 读取第2行(索引为1)作为表头
String headerRange = "A2:Z2";
JSONObject headerData = tencentDocService.readSheetData(accessToken, fileId, sheetId, headerRange);
// 获取简化后的数据
JSONArray headerValues = headerData.getJSONArray("values");
if (headerValues != null && !headerValues.isEmpty()) {
JSONArray headerRow = headerValues.getJSONArray(0); // 第一行数据
// 遍历表头列
for (int i = 0; i < headerRow.size(); i++) {
String columnName = headerRow.getString(i);
System.out.println("第 " + (i+1) + " 列: " + columnName);
}
}
示例 2:查找特定列
// 读取表头行
JSONObject headerData = tencentDocService.readSheetData(accessToken, fileId, sheetId, "A2:Z2");
JSONArray headerValues = headerData.getJSONArray("values");
JSONArray headerRow = headerValues.getJSONArray(0);
// 查找"物流单号"列的索引
int logisticsColumn = -1;
for (int i = 0; i < headerRow.size(); i++) {
String columnName = headerRow.getString(i);
if ("物流单号".equals(columnName)) {
logisticsColumn = i;
break;
}
}
System.out.println("物流单号列在第 " + (logisticsColumn + 1) + " 列(索引: " + logisticsColumn + ")");
示例 3:读取数据行
// 读取数据行(第3行到第100行)
JSONObject sheetData = tencentDocService.readSheetData(accessToken, fileId, sheetId, "A3:Z100");
JSONArray dataValues = sheetData.getJSONArray("values");
// 遍历每一行
for (int i = 0; i < dataValues.size(); i++) {
JSONArray row = dataValues.getJSONArray(i);
// 获取订单号(假设在第1列,索引0)
String orderNo = row.getString(0);
// 获取物流单号(假设在第13列,索引12)
String logisticsNo = row.getString(12);
System.out.println("订单号: " + orderNo + ", 物流单号: " + logisticsNo);
}
真实数据示例
根据用户提供的截图,表格结构:
第1行:合并单元格,包含链接(这是合并的标题行)
第2行:表头
A列:日期
B列:公司
C列:草号
D列:型号
E列:数量
F列:姓名
G列:电话
H列:地址
I列:价格
J列:备注
K列:打聚戳图
L列:是否安排
M列:物流单号
N列:标记
第3行及以后:数据行
A列:3月10日
B列:(空)
C列:JY20251032904
...
M列:(物流单号,可能为空)
处理代码示例
// 1. 读取表头(第2行)
JSONObject headerData = tencentDocService.readSheetData(accessToken, fileId, sheetId, "A2:Z2");
JSONArray headerValues = headerData.getJSONArray("values");
JSONArray headerRow = headerValues.getJSONArray(0);
// 2. 查找关键列的索引
int orderNoColumn = -1; // 订单号列(草号)
int logisticsColumn = -1; // 物流单号列
for (int i = 0; i < headerRow.size(); i++) {
String columnName = headerRow.getString(i);
if (columnName != null) {
if (columnName.contains("草号")) {
orderNoColumn = i;
}
if (columnName.contains("物流单号")) {
logisticsColumn = i;
}
}
}
System.out.println("订单号列索引: " + orderNoColumn); // 预期: 2(C列)
System.out.println("物流单号列索引: " + logisticsColumn); // 预期: 12(M列)
// 3. 读取数据行(从第3行开始)
JSONObject sheetData = tencentDocService.readSheetData(accessToken, fileId, sheetId, "A3:Z100");
JSONArray dataValues = sheetData.getJSONArray("values");
// 4. 处理每一行数据
for (int i = 0; i < dataValues.size(); i++) {
JSONArray row = dataValues.getJSONArray(i);
// 获取订单号
String orderNo = orderNoColumn >= 0 && orderNoColumn < row.size()
? row.getString(orderNoColumn)
: null;
// 获取物流单号
String logisticsNo = logisticsColumn >= 0 && logisticsColumn < row.size()
? row.getString(logisticsColumn)
: null;
if (orderNo != null && !orderNo.isEmpty()) {
System.out.println("第 " + (i+3) + " 行 - 订单号: " + orderNo + ", 物流单号: " + logisticsNo);
// 如果物流单号为空,可以填充
if (logisticsNo == null || logisticsNo.isEmpty()) {
System.out.println(" → 需要填充物流单号");
}
}
}
写入数据注意事项
写入接口的数据格式
根据腾讯文档 API 规范,写入数据时仍然使用简单格式:
// 写入数据(简单格式)
Object[][] values = {
{"数据1", "数据2", "数据3"}
};
tencentDocService.writeSheetData(accessToken, fileId, sheetId, "A10", values);
不需要转换为 gridData 格式,API 会自动处理。
调试技巧
1. 启用详细日志
logging:
level:
com.ruoyi.jarvis.util.TencentDocDataParser: DEBUG
com.ruoyi.jarvis.service.impl.TencentDocServiceImpl: DEBUG
2. 查看数据结构
当调用 readSheetData 时,会自动打印前3行数据结构:
数据结构(共 98 行,显示前 3 行):
第 1 行(15列): ["日期","公司","草号",...,"物流单号","标记"]
第 2 行(15列): ["3月10日","","JY20251032904",...,"",""]
第 3 行(15列): ["3月10日","","JY20250309184",...,"6649902864",""]
3. 检查原始响应
Service 返回的数据中包含 _原始数据 字段,可以查看 API 的原始响应:
JSONObject result = tencentDocService.readSheetData(...);
JSONObject originalData = result.getJSONObject("_原始数据");
System.out.println("原始响应: " + originalData.toJSONString());
常见问题
Q1:为什么会有两种数据格式?
A:腾讯文档 V3 API 使用 gridData 格式以支持更丰富的格式信息(字体、颜色、对齐方式等)。但对于简单的数据读写,我们只需要文本内容,因此解析器会提取纯文本数据。
Q2:读取的数据是否包含格式信息?
A:gridData 格式包含完整的格式信息(字体、颜色等),但我们的解析器只提取文本内容。如果需要格式信息,可以从 _原始数据 字段中获取。
Q3:解析器会影响性能吗?
A:解析器只是简单的 JSON 遍历和文本提取,性能影响很小。对于大数据量(数千行),建议分批读取。
Q4:是否兼容旧代码?
A:完全兼容。解析后的数据格式与旧代码期望的格式一致({"values": [[]]}),无需修改现有代码。
总结
关键要点
- ✅ 腾讯文档 V3 API 使用 gridData 格式
- ✅ 创建了 TencentDocDataParser 统一处理
- ✅ Service 层自动解析为简单格式
- ✅ 完全向后兼容,无需修改上层代码
- ✅ 保留原始数据供调试使用
文件清单
- ✅
TencentDocDataParser.java- 数据解析器(新增) - ✅
TencentDocServiceImpl.java- Service 层(已更新) - ✅
腾讯文档API数据格式解析说明.md- 本文档(新增)
文档版本:1.0
创建时间:2025-11-05
适用场景:腾讯文档 V3 API 数据格式解析