所有文件转markdown文件
- 创业
- 2025-08-29 17:54:01

当前支持的文件格式如下:
PDF (.pdf)PowerPoint (.pptx)Word (.docx)Excel (.xlsx)Images (EXIF metadata, and OCR)Audio (EXIF metadata, and speech transcription)HTML (special handling of Wikipedia, etc.)其它各种文本格式 (csv, json, xml, etc.)先安装:
pip install markitdown基础使用:
from markitdown import MarkItDown md = MarkItDown(enable_plugins=False) # Set to True to enable plugins result = md.convert("test.xlsx") print(result.text_content)进阶使用: 开发人员还可以配置 MarkItDown 库,使用大型语言模型来描述图像,需要将 mlm_client 和 mlm_model 参数设置为 MarkItDown 对象,如下所示:
from markitdown import MarkItDown from openai import OpenAI client = OpenAI() md = MarkItDown(mlm_client=client, mlm_model="gpt-4o") result = md.convert("example.jpg") print(result.text_content)所有文件转markdown文件由讯客互联创业栏目发布,感谢您对讯客互联的认可,以及对我们原创作品以及文章的青睐,非常欢迎各位朋友分享到个人网站或者朋友圈,但转载请说明文章出处“所有文件转markdown文件”
上一篇
Dfs分布式文件存储
下一篇
Goutte库的使用方法详解