主页 > 创业  > 

所有文件转markdown文件

所有文件转markdown文件

当前支持的文件格式如下:

PDF (.pdf)PowerPoint (.pptx)Word (.docx)Excel (.xlsx)Images (EXIF metadata, and OCR)Audio (EXIF metadata, and speech transcription)HTML (special handling of Wikipedia, etc.)其它各种文本格式 (csv, json, xml, etc.)

先安装:

pip install markitdown

基础使用:

from markitdown import MarkItDown md = MarkItDown(enable_plugins=False) # Set to True to enable plugins result = md.convert("test.xlsx") print(result.text_content)

进阶使用: 开发人员还可以配置 MarkItDown 库,使用大型语言模型来描述图像,需要将 mlm_client 和 mlm_model 参数设置为 MarkItDown 对象,如下所示:

from markitdown import MarkItDown from openai import OpenAI client = OpenAI() md = MarkItDown(mlm_client=client, mlm_model="gpt-4o") result = md.convert("example.jpg") print(result.text_content)
标签:

所有文件转markdown文件由讯客互联创业栏目发布,感谢您对讯客互联的认可,以及对我们原创作品以及文章的青睐,非常欢迎各位朋友分享到个人网站或者朋友圈,但转载请说明文章出处“所有文件转markdown文件