AIPress.com.cn报道
3月24日消息,MiniMax宣布开源一套面向 AI Agent 的办公文档生成框架 MiniMax Office Skills。该系统旨在解决AI生成办公文档“能写但难用”的问题,使生成的 Word、Excel、PDF 和 PPT 文件能够直接用于企业交付场景。相关代码、设计文档和评测框架已在开源社区发布,并采用 MIT 许可协议。
该框架覆盖四类办公文档格式,并针对不同格式采取差异化技术方案。在 Word 文档生成(MiniMax-docx) 中,团队选择微软官方维护的 .NET OpenXML SDK 作为底层库,而非社区常见的 python-docx,以获得对 Word 文件结构更完整的控制能力,从而支持复杂表格、多级目录、页眉页脚控制及修订追踪等场景。在 Excel 处理(MiniMax-xlsx) 方面,系统直接在 XML 层操作 .xlsx 文件结构,通过解压、修改特定节点再重新打包的方式进行编辑,以避免传统库在读写过程中丢失数据透视表、迷你图或宏等高级内容,同时确保所有计算仍以 Excel 公式形式保存。
在 PDF 生成 上,MiniMax采用双引擎方案:封面使用 HTML 与 CSS 设计,并通过 Playwright 渲染为 PDF,以支持渐变、网格和字体等复杂视觉效果;正文则由 ReportLab 负责排版,以保证段落流控制和分页稳定性。两部分最终通过脚本合并为完整文档。
对于 PPT 生成,团队重点解决演示文稿的视觉一致性问题。系统预定义封面、目录、章节分割、内容页和总结页五类标准页面,并提供多套视觉参数组合,用于统一字体、间距、圆角和阴影等设计细节。生成逻辑基于 JavaScript 库 PptxGenJS,在编辑现有模板时则通过解压 .pptx 文件并直接修改 XML 的方式保持原始格式结构。

除生成能力外,MiniMax还构建了一套自动化迭代机制,使Office Skills能够在实际案例中持续优化。该机制采用 Execute → Evaluate → Fix 的循环流程:首先执行真实文档任务,然后根据规则检查输出结果是否符合结构、公式和排版要求,再将失败样例转化为可修复问题进入下一轮迭代。评测标准不仅包括文件是否能打开,还包括公式是否保持动态计算、模板结构是否完整、文档样式在读写过程中是否被破坏等指标。
MiniMax表示,这套系统已经在生产环境中经过多轮自动化测试,并可根据用户一句自然语言指令生成完整文档,例如策略报告或数据分析表格,涵盖内容组织、排版和最终输出流程。
扫码下载app 最新资讯实时掌握
