# CAJ_PDF_Word转换工具 **Repository Path**: wanglidong666/caj--pdf--word-conversion-tool ## Basic Information - **Project Name**: CAJ_PDF_Word转换工具 - **Description**: caj转pdf、pdf转word、pdf文件合并、pdf提取表格等功能,后续可能会有增加。 - **Primary Language**: Python - **License**: MulanPSL-2.0 - **Default Branch**: WLD - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 6 - **Forks**: 4 - **Created**: 2023-03-06 - **Last Updated**: 2025-08-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # CAJ_PDF_Word转换工具 1.0 # by:wld ## 一、简介 在写课程设计和毕业论文时,可能用得上这个软件。该软件可提供以下功能(不像某些网站又收费,还加水印): 1. caj转pdf(适用于部分知网论文)。 2. pdf转word(转成后可进行编辑,复制,摘图等)。 3. pdf文件合并(课程设计时将封面,内容,封底等合并)。 4. pdf提取文字、表格(该功能已合并到pdf转word中,但在代码源码中可单独使用)等功能,后续可能会有增加。 ![image-20230306182607086](assets/image-20230306182607086.png) 不想看代码直接用的小白直接看这里👉在Windows系统上可执行的exe文件上传在阿里云盘:https://www.aliyundrive.com/s/P5hviD3fTtF ,推荐下载使用【CAJ_PDF_Word转换工具 1.0】约77Mb),此链接中还含有caj查看器安装包。 另外PDF编辑器(2022破解版)的安装包及安装教程在:https://mvxjt9erbs.feishu.cn/drive/folder/fldcnh5k0aLXylXzGT4jJtgMyMe ,提取码:ahaj。 愿意看代码的,项目链接为:https://gitee.com/wanglidong666/caj--pdf--word-conversion-tool ,主要界面在main.pyw文件里。 本人gitee主页也可能更新一些有用的工具:https://gitee.com/wanglidong666 。 ## 二、功能 ### 2.1 CAJ功能 #### 2.1.1 CAJ转PDF 可将部分caj文件转换为pdf文件,便于打开和复制,亦可更进一步转化为word文件。底层代码库为caj2pdf参考自[GitHub - caj2pdf/caj2pdf: Convert CAJ (China Academic Journals) files to PDF. 转换中国知网 CAJ 格式文献为 PDF。佛系转换,成功与否,皆是玄学](https://github.com/caj2pdf/caj2pdf)。不得不说caj文件的水比pdf还深,如该项目大神所言,成功与否,皆是玄学。 使用方法如下: 1. ![image-20230305155204496](assets/image-20230305155204496.png) 2. ![image-20230305155228015](assets/image-20230305155228015.png) 3. ![image-20230305155315362](assets/image-20230305155315362.png) 4. ![image-20230305155338800](assets/image-20230305155338800.png) 5. ![image-20230305155422425](assets/image-20230305155422425.png) 6. ![image-20230305155624214](assets/image-20230305155624214.png) 7. ![image-20230305155716292](assets/image-20230305155716292.png) 8. ![image-20230305155744564](assets/image-20230305155744564.png) 当然这只是成功的个例!失败的可能性还是很高的。例如: ![image-20230305155905633](assets/image-20230305155905633.png) #### 2.1.2 CAJ文件信息 可查看caj(或部分pdf)文件的文件类型,作者,摘要等信息。个人认为是个可有可无的功能,作用不大,可以忽略。故此不再说明。 ![image-20230305163906801](assets/image-20230305163906801.png) ### 2.2 PDF功能 #### 2.2.1 PDF转Word 可将pdf文件转换为可编辑的word文件,主要参考[GitHub - dothinking/pdf2docx: Open source Python library converting pdf to docx.](https://github.com/dothinking/pdf2docx)。成功几率接近百分之百,但是对于较大文件转换效率较低(个人电脑性能较强,约3分钟100页),耗时较长,但个人非常推荐该功能。 使用方法如下: 1. ![image-20230305160835584](assets/image-20230305160835584.png) 2. ![image-20230305160852749](assets/image-20230305160852749.png) 3. ![image-20230305160926745](assets/image-20230305160926745.png) 4. ![image-20230305160950304](assets/image-20230305160950304.png) 5. ![image-20230305161018575](assets/image-20230305161018575.png) 6. ![image-20230305161042323](assets/image-20230305161042323.png) 7. ![image-20230305161139509](assets/image-20230305161139509.png) 8. ![image-20230305161250748](assets/image-20230305161250748.png) 9. ![image-20230305161333303](assets/image-20230305161333303.png) 10. ![image-20230305161427638](assets/image-20230305161427638.png) #### 2.2.2 PDF批量合并 可将多个pdf文件合并为一个pdf文件,主要参考[PyPDF2 (sjtu.edu.cn)](https://mirrors.sjtug.sjtu.edu.cn/gentoo/dev-python/PyPDF2/)。成功率高,效率也高,个人比较推荐使用该功能。 使用方法如下: 1. ![image-20230305161954629](assets/image-20230305161954629.png) 2. ![image-20230305162052442](assets/image-20230305162052442.png) 3. ![image-20230305162457767](assets/image-20230305162457767.png) 4. ![image-20230305162525844](assets/image-20230305162525844.png) 5. ![image-20230305162634638](assets/image-20230305162634638.png) 6. ![image-20230305162659114](assets/image-20230305162659114.png) 7. ![image-20230305162727750](assets/image-20230305162727750.png) 8. ![image-20230305162822719](assets/image-20230305162822719.png) #### 2.2.3 PDF文字提取 本功能可将pdf文件指定页码的文字提取到显示框用于复制,或提取为txt文件保存备用,主要参考[PyPDF2 (sjtu.edu.cn)](https://mirrors.sjtug.sjtu.edu.cn/gentoo/dev-python/PyPDF2/)。较为鸡肋的功能,不如直接转为word,不太推荐该功能。 使用方法如下: 1. ![image-20230305163113161](assets/image-20230305163113161.png) 2. ![image-20230305163128502](assets/image-20230305163128502.png) 3. ![image-20230305163224233](assets/image-20230305163224233.png) 4. ![image-20230305163325949](assets/image-20230305163325949.png) 5. ![image-20230305163342984](assets/image-20230305163342984.png) 6. ![image-20230305163448716](assets/image-20230305163448716.png) 7. ![image-20230305163418692](assets/image-20230305163418692.png) #### 2.2.4 PDF文件信息 可查看pdf文件的文件类型,作者,摘要等信息。个人认为也是个可有可无的功能,作用不大,可以忽略。故此不再说明。 ![image-20230305163744120](assets/image-20230305163744120.png) ### 2.3 其它功能 #### 2.3.1 提示信息 没什么好说的,提示框里的文字可以Ctrl + C进行复制。 #### 2.3.2 关于软件 点击软件教程,可以进入我的“码云”主页,找到该程序的教程和Python源码进行二次编辑。其实就是链接跳转这个reademe教程页面。 ## 三、特别感谢 1. #### 感谢以上参考的开源项目的作者们。 2. #### 感谢协助更新改进的小伙伴。