微软近 5 万 star 的开源项目 —— MarkItDown 已支持 MCP
MarkItDown 是微软开源的 Python 实用工具库,支持将各种文件转换为 Markdown 格式,适用于索引、文本分析等用途。
MarkItDown 目前支持以下文件:
- PowerPoint
- Word
- Excel
- 图片(EXIF 元数据和 OCR)
- 音频(EXIF 元数据和语音转录)
- HTML
- 基于文本的格式(CSV、JSON、XML)
- ZIP 文件(遍历内容)
该项目最近发布了一项“史诗级”更新 —— 支持 MCP。MarkItDown 现已提供 MCP(模型上下文协议)服务器 (MarkItDown-MCP),以便与 LLM 应用程序如 Claude Desktop 集成。
MarkItDown-MCP 提供两种主要的服务器模式:
-
STDIO模式(默认):通过标准输入/输出进行通信,非常适合与命令行工具和脚本集成。
-
SSE模式:作为服务器发送事件(Server-Sent Events)服务器在指定主机和端口上运行,支持基于 Web 和网络的集成。
Docker 支持
为了增强可移植性和隔离性,MarkItDown-MCP 提供了 Docker 支持。这在以下情况特别有用:
-
确保在不同系统上的环境一致性
-
将转换过程与主机系统隔离
-
与 Claude Desktop 等远程服务协作
Docker 集成包括挂载本地目录的功能,允许容器访问和转换本地文件,同时维持安全边界。
更多信息查看 markitdown-mcp。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
宇树科技将举办全球首场“人形机器人格斗大赛”
2025年5月至6月,杭州的宇树科技将举办全球首场“人形机器人格斗大赛”。据悉,宇树科技的技术团队在过去数周内进行高强度的算法训练与硬件调试,为这场比赛打造了最强的参赛机器人。 此次比赛将通过中央广播电视总台的相关平台全网直播。 为了预热赛事,宇树科技发布了视频《Unitree 铁甲拳王:觉醒!》。视频中,参赛的G1人形机器人不仅展现了卓越的灵活性与迅猛的出拳能力,还能够完成左右勾拳、侧踢等高难度格斗动作。 特别引人注目的是,在被击倒后,G1能够迅速自我恢复并重新投入战斗。
- 下一篇
Databend Cloud 如何给游戏行业数据分析带来 10 倍收益提升?
游戏业务需求非常多,如运营层、玩法层、经济层等。比如四五个人组成的一个流量小组,要投放 100 万流量,这个时间段内能否赚回这 100 万?这几天如何分析数据?对于这样的数据分析需求,如果还用传统的方法做成看板展示,基本上不太现实。这种时候,团队通常会直接使用 SQL 查询,再把数据导出到 Excel 表里。一个个灵活的需求都是这样去实现分析的,需求量极大。 此外,游戏行业的数据工程师经常会面对堆积如山的需求量。很多在海外工作的朋友头衔叫"Data Engineer"(数据工程师)。最初很疑惑,他们做的是什么神奇工作?但交流后才发现,他们大部分时间都在写 SQL,做临时统计和需求导出,基本上每天要做很多个 Excel,可能有 30 多个甚至几百个的任务。 在如此庞大的需求下,游戏行业的数据治理非常复杂。数据来源方面,经常分成网页游戏、客户端游戏,而客户端游戏中又细分出不同的手机平台,比如 iPhone 和安卓,而安卓又分成不同品牌。这些不同品牌、不同渠道来的用户情况如何?用户体验怎么样?甚至具体到不同尺寸屏幕上的游戏效果如何?再比如说游戏的码率问题,通常看到的是每秒 60 帧的数据,而...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS关闭SELinux安全模块
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS6,CentOS7官方镜像安装Oracle11G
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作