返回市场
pdf合并器-mcp

pdf合并器-mcp

作者:pdfdotco6 星标更新:2025-06-19

项目介绍

PDF.co MCP

PDF.co MCP Server 通过模型上下文协议(MCP)提供 PDF.co API 的功能,使AI助手能够轻松执行各种PDF处理任务。

🚀 主要特性

📄 PDF 转换工具

  • PDF → 各种格式:将PDF转换为JSON、CSV、文本、Excel(XLS/XLSX)、XML、HTML、图像(JPG/PNG/WebP/TIFF)
  • 各种格式 → PDF:将文档(DOC/DOCX/RTF/TXT)、电子表格(CSV/XLS/XLSX)、图像、网页、HTML、电子邮件(MSG/EML)转换为PDF
  • Excel 转换:将Excel文件转换为CSV、JSON、HTML、TXT、XML、PDF

🛠️ PDF 编辑与修改

  • PDF 合并:将多个PDF文件合并成一个
  • PDF 分割:按特定页面或页码范围分割PDF
  • 添加注释与图像:在PDF中添加文本、链接、图像、形状
  • 表单操作:读取PDF表单字段信息,填写表单,创建新的表单元素

🔍 PDF 搜索与分析

  • 文本搜索:在PDF中搜索文本(支持正则表达式)
  • 表格检测:查找PDF中的表格位置和坐标
  • AI 发票解析器:使用AI提取发票数据
  • PDF 信息:获取详细信息,包括元数据、页数、安全信息

🔒 安全与访问性

  • 密码保护:为PDF添加/移除密码保护
  • 可搜索性:通过OCR使PDF可搜索或移除文本层
  • 附件提取:从PDF中提取附件

💼 文件管理

  • 文件上传:将本地文件上传到PDF.co服务器
  • 作业状态跟踪:监控异步操作的进度和结果

⚙️ 配置

🔑 获取API密钥

  1. PDF.co 网站 注册
  2. 从仪表板获取您的API密钥

📦 安装UV

您需要安装UV(一个快速的Python打包工具)来使用此MCP服务器:

macOS 和 Linux

curl -LsSf https://astral.sh/uv/install.sh | sh

Windows

powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"

其他安装方法

  • Homebrewbrew install uv
  • PyPI with pipxpipx install uv
  • PyPI with pippip install uv

更多安装选项和详情,请参阅 UV 安装指南

MCP 服务器设置

Cursor IDE 配置

在您的 .cursor/mcp.json 文件中添加以下内容:

{
  "mcpServers": {
    "pdfco": {
      "command": "uvx",
      "args": ["pdfco-mcp"],
      "env": {
        "X_API_KEY": "YOUR_API_KEY_HERE"
      }
    }
  }
}

Claude Desktop 配置

在您的 claude_desktop_config.json 文件中添加以下内容:

{
  "mcpServers": {
    "pdfco": {
      "command": "uvx",
      "args": ["pdfco-mcp"],
      "env": {
        "X_API_KEY": "YOUR_API_KEY_HERE"
      }
    }
  }
}

🔧 可用工具

PDF 转换工具

  • pdf_to_json:将PDF和扫描图像转换为保留文本、字体、图像、矢量和格式的JSON表示形式
  • pdf_to_csv:将PDF和扫描图像转换为包含布局、列、行和表格的CSV表示形式
  • pdf_to_text:将PDF和扫描图像转换为保留布局的文本
  • pdf_to_xls:将PDF和扫描图像转换为XLS(Excel 97-2003)格式
  • pdf_to_xlsx:将PDF和扫描图像转换为XLSX(Excel 2007+)格式
  • pdf_to_xml:将PDF和扫描图像转换为XML格式
  • pdf_to_html:将PDF和扫描图像转换为HTML格式
  • pdf_to_image:将PDF和扫描图像转换为各种图像格式(JPG、PNG、WebP、TIFF)

文档到PDF 转换工具

  • document_to_pdf:将各种文档类型(DOC、DOCX、RTF、TXT、XLS、XLSX、CSV、HTML、JPG、PNG、TIFF、WEBP)转换为PDF
  • csv_to_pdf:将CSV或电子表格文件(XLS、XLSX)转换为PDF
  • image_to_pdf:将各种图像格式(JPG、PNG、TIFF)转换为PDF
  • webpage_to_pdf:将外部网页URL转换为PDF
  • html_to_pdf:将HTML转换为PDF
  • email_to_pdf:将电子邮件转换为PDF

Excel 转换工具

  • excel_to_csv:将Excel(XLS、XLSX)转换为CSV
  • excel_to_json:将Excel(XLS、XLSX)转换为JSON
  • excel_to_html:将Excel(XLS、XLSX)转换为HTML
  • excel_to_txt:将Excel(XLS、XLSX)转换为TXT
  • excel_to_xml:将Excel(XLS、XLSX)转换为XML
  • excel_to_pdf:将Excel(XLS、XLSX)转换为PDF

PDF 编辑工具

  • pdf_add_annotations_images_fields:在PDF中添加文本、图像、表单、其他PDF、填写表单、链接到外部网站和PDF文件。您可以更新或修改PDF和扫描PDF文件
  • pdf_merge:合并来自两个或更多PDF、DOC、XLS、图像甚至包含文档和图像的ZIP的新PDF
  • pdf_split:根据页面索引或页码范围将PDF分割成多个PDF文件

PDF 表单工具

  • read_pdf_forms_info:从输入的PDF文件中提取可填写PDF字段的信息
  • fill_pdf_forms:填写PDF文档中的现有表单字段
  • create_fillable_forms:在PDF文档中创建新的可填写表单元素

PDF 搜索工具

  • find_text:在PDF中查找文本并获取坐标。支持正则表达式
  • find_table:在PDF中查找表格并获取其坐标

PDF 分析工具

  • ai_invoice_parser:AI发票解析器:使用AI从发票中提取数据
  • extract_attachments:从源PDF文件中提取附件
  • pdf_info_reader:获取关于PDF文档的详细信息——页数、元数据、安全性、表单字段等

PDF 安全工具

  • pdf_add_password:为PDF文件添加密码保护
  • pdf_remove_password:从PDF文件中移除密码保护

PDF 可搜索性工具

  • pdf_make_searchable:将扫描的PDF文档或图像文件转换为可搜索的PDF。运行OCR并添加不可见的文本层,可用于文本搜索
  • pdf_make_unsearchable:通过删除文本层,使现有的PDF文档无法搜索

文件管理工具

  • upload_file:将文件上传到PDF.co API
  • get_job_check:检查作业的状态和结果。状态可以是:正在工作、成功、失败、已取消或未知
  • wait_job_completion:等待作业完成

📖 使用示例

将PDF转换为文本

将这个PDF文件转换为文本:https://example.com/document.pdf

合并多张图片为PDF

从这些图片创建PDF:image1.jpg, image2.png, image3.jpg

在PDF中搜索特定文本

在该PDF文档中查找“合同”一词

填写PDF表单字段

将此PDF表单中的姓名字段填写为“John Doe”

将网页转换为PDF

将https://example.com网页转换为PDF

提取发票数据

使用AI从该PDF中提取发票信息

添加密码保护

为这个PDF文件添加密码保护

📞 支持与联系

📄 许可证

本项目根据MIT许可证分发。


注意:使用此工具需要有效的PDF.co API密钥。请在 PDF.co 创建免费账户以获取您的API密钥。