你的案例里面使用 是这个东西在想要解析pdf文件的时候,我就需要把我的pdf切分成图片,然后每个图片利用你的这个模型进行ocr然后生成一个md的文档么?? 但是我自己使用的时候,进行将带公式和表格的pdf文件变成图片,进行ocr转md后的效果并不是很理想啊, 表格识别成多行的文字,而且效果很差 <img width="492" height="876" alt="Image" src="https://github.com/user-attachments/assets/c6680815-7ebd-450a-ac7a-f379d900adea" /> <img width="624" height="627" alt="Image" src="https://github.com/user-attachments/assets/4d77efa9-f3a5-4183-8e16-f5a3b4b13bc7" />
你的案例里面使用
是这个东西在想要解析pdf文件的时候,我就需要把我的pdf切分成图片,然后每个图片利用你的这个模型进行ocr然后生成一个md的文档么??
但是我自己使用的时候,进行将带公式和表格的pdf文件变成图片,进行ocr转md后的效果并不是很理想啊, 表格识别成多行的文字,而且效果很差