微信扫码
添加专属顾问
我要投稿
微软AutoGen团队的最新开源项目,一键转换网页和文件为Markdown,支持AI模型。 核心内容: 1. MarkItDown-MCP:轻量级网页/文件转Markdown工具 2. 支持多种URI输入和MCP协议,无缝对接AI模型 3. 两种运行模式,快速上手安装与运行指南
还在为手动转换网页文章、本地文档到 Markdown 格式而头疼?想不想让你的 AI 助手(比如 Claude)也能轻松读取并处理各种来源的内容?微软 AutoGen 团队带来了福音——开源项目MarkItDown-MCP!这款轻量级工具能将网页链接、本地文件甚至数据 URI 直接转换为干净的 Markdown,最酷的是它原生支持MCP (模型上下文协议),能无缝对接 AI 模型!特别适合需要高效处理信息的学生、内容创作者以及玩转 AI Agent 的技术爱好者们!
简单来说,MarkItDown-MCP 是一个专注于格式转换的小工具,它提供了一个核心功能,并通过 MCP 协议将其暴露给 AI 或其他程序:
convert_to_markdown(uri)
http:
/https:
(网页链接)file:
(本地文件路径)data:
(Base64 编码等数据)MarkItDown-MCP 提供了两种运行模式,满足不同场景需求:
markitdown-mcp
。mcp-proxy
或某些本地 Agent 框架)集成。markitdown-mcp --sse --host 127.0.0.1 --port 3001
。上手非常简单:
pip install markitdown-mcp
markitdown-mcp
markitdown-mcp --sse --host 127.0.0.1 --port 3001(服务器将在
http://127.0.0.1:3001/sse
提供服务)推荐使用 Docker来运行 MarkItDown-MCP:
docker build -t markitdown-mcp:latest .
claude_desktop_config.json
mcpServers
部分添加以下条目:{
"mcpServers":{
"markitdown":{
"command":"docker",// 使用 docker 命令
"args":[
"run", // 运行容器
"--rm", // 容器退出后自动删除
"-i", // 保持 STDIN 打开,即使没有附加 (交互模式所需)
"markitdown-mcp:latest"// 使用你构建的镜像
]
}
}
}
run
命令中挂载本地目录:/home/user/data
目录挂载到容器内的/workdir
:{
"mcpServers":{
"markitdown":{
"command":"docker",
"args":[
"run","--rm","-i",
"-v","/home/user/data:/workdir",// 添加卷挂载
"markitdown-mcp:latest"
]
}
}
}
file:///workdir/your_file.txt
这样的 URI 来访问/home/user/data
目录下的文件了。为什么推荐 Docker?Docker 可以隔离运行环境,避免 Python 依赖冲突,并且方便管理服务的启停,特别适合与 Claude Desktop 这种需要稳定后台命令的应用集成。
mcpinspector
工具来检查 MCP 服务器是否正常工作。npx @modelcontextprotocol/inspector然后根据提示在浏览器中连接 STDIO 或 SSE 服务进行调试。
localhost
(即127.0.0.1
,这是默认行为),避免暴露到不安全的网络中。MarkItDown-MCP 是一个小而美的实用工具,它不仅简化了将各种内容转换为 Markdown 的过程,更重要的是通过MCP 协议打通了与 AI 模型(如 Claude)的连接,让 AI 能够更方便地利用外部信息。无论你是想提高内容处理效率,还是想为你的 AI Agent 添加新能力,MarkItDown-MCP 都值得一试!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-27
Dify工具插件开发和智能体开发全流程实战
2025-05-27
一个让工作效率翻倍的AI神器,Cherry Studio你值得拥有!
2025-05-27
Docext:无需 OCR,本地部署的文档提取神器,企业数据处理新选择
2025-05-26
太猛了,字节把GPT-4o级图像模型开源了!
2025-05-26
Qwen3硬核解析:从36万亿Token到“思考预算”
2025-05-26
蚂蚁集团开源antv的MCP服务:AI智能体与数据可视化的桥梁如何搭建?
2025-05-26
MinerU:高精度纸媒文档解析与数据提取一站式解决方案
2025-05-26
顶级开发者默默换掉了基础大模型
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-12-26
2024-08-13
2025-05-26
2025-05-25
2025-05-23
2025-05-17
2025-05-17
2025-05-17
2025-05-16
2025-05-14