如何把 Markdown 文件批量转换为 pdf？

2018-09-11 698

img_129bcd8eabc86286c253ff7782eb04e7.jpe

需求

有个朋友提出，希望把目录中的许多 markdown 文件，批量转换为对应名称的 pdf 格式文件。我于是编写了一个 Python 脚本，并且分享给你。如果你有类似的需求，欢迎使用。

由于使用了 pandoc 作为转换工具，因此 Markdown 文件里的图片链接，不论是本地存储的（只测试了绝对路径情况），还是图床上的，都可以正确转换并且显示到 pdf 文件里。

环境

因为提出需求的朋友，使用的是 macOS 系统，因此这里我们以 macOS 系统的安装方式为准。注意下述工具实际上都是跨平台的。因此如果你使用的是 Windows 或者 Linux ，理论上也都是可以使用的。

这个脚本在 macOS 下测试通过，欢迎你把其他平台测试的结果告诉我。

python 3

建议使用 anaconda 软件包。请到这个地址下载适合自己操作系统的 Python 3 版本，并且进行安装。我曾经做了一个视频教程，完整展示和讲解了 anaconda 的安装流程，并且介绍了如何进行相关的命令行操作。欢迎点击这个链接，观看相关的介绍说明。

pandoc

请到这个链接，下载最新版本的 pandoc 并且进行安装。

tinytex

因为需要转换的 markdown 文件，大部分都是中文文档，因此转换到 pdf 的时候，需要 xelatex 的支持。

xelatex 可以用各种 latex 集成包来安装使用，例如 texlive 等。但是这里推荐谢益辉的 tinytex 包，简单小巧。

不过使用之前，建议删除掉系统里面原有的 texlive 等包。否则可能会造成冲突。

在终端窗口下，执行这个命令：

curl -sL "https://yihui.name/gh/tinytex/tools/install-unx.sh"

tinytex 就安装好了。

之后，为了能够更好地辅助我们进行转换，需要执行下列命令，安装扩展：

tlmgr install unicode-math filehook xecjk xltxtra realscripts fancyhdr lastpage ctex ms cjk ulem environ trimspaces zhnumber collection-fontsrecommended

代码

请到这个 github repo 下载运行代码。或者直接点击这个链接，下载压缩包并且解压。

压缩包里面，有两个文件。

其中的batch-markdown-to-pdf.py是运行脚本，template.tex是转换是采用的模板，这个模板并非我做的，它来自于这个 github 项目。

如果你对 latex 有研究，可以自行修改 template.tex 的内容，以控制输出 pdf 的样式。

准备

请把要转换的全部 markdown 文件（需要用".md"结尾），都放在同一个目录中。

注意我的样例目录，使用的是 macOS 的下载文件夹下面的“测试目录”，路径如下：

"~/Downloads/测试目录/"

你的目录，大概会与此不同，所以请你在使用之前，先打开 batch-markdown-to-pdf.py ，并且把其中第一行的路径，替换成自己电脑上的目录名称。

运行

运行起来，就很简单了。

进入终端，通过 cd 命令转换到解压后的代码所在目录。如果你对 cd 命令不是很清楚，请回顾刚才我提到的视频教程。

之后，执行：

python batch-markdown-to-pdf.py

如果一切正常，你会看到程序在运行，不过没有什么输出提示的。

因为转换 pdf 的工作需要一些时间。所以如果你的 Markdown 文件很多，可能需要等一会儿。

请不要着急。去喝杯茶，看看书，休息一下。

当你回来的时候，（但愿）已经转换完毕了。

你会看到，在原先的 markdown 文件所在目录下面，生成了一个新的文件夹，叫做 pdf 。

你的转换后 pdf 文件，应该已经在里面了。

img_abd7b3b984ac722a8ff8034ffd4eeda9.jpe

如果遇到问题，欢迎反馈给我。

祝使用愉快！

喜欢请点赞和打赏。还可以微信关注和置顶我的公众号“玉树芝兰”(nkwangshuyi)。

如果你对 Python 与数据科学感兴趣，不妨阅读我的系列教程索引贴《如何高效入门数据科学？》，里面还有更多的有趣问题及解法。

微信关注我们

原文链接：https://yq.aliyun.com/articles/650035

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

一统江湖的大前端（2）—— Mock.js + Node.js 如何与后端潇洒分手

《一统江湖的大前端》系列是自己的前端学习笔记，旨在介绍javascript在非网页开发领域的应用案例和发现各类好玩的js库，不定期更新。如果你对前端的理解还是写写页面绑绑事件，那你真的是有点OUT了，前端能做的事情已经太多了, 手机app开发 , 桌面应用开发 , 用于神经网络人工智能的库 , 页面游戏 , 数据可视化 , 甚至嵌入式开发，什么火就搞什么,活脱脱一个蹭热点小能手。如果你也觉得前端的日常开发有些枯燥，不妨一起来看看前端的另一番模样。为什么你总是下不了班大部分工程化的项目为方便维护，大多都会采用前后端分离的开发方式，而前端和后端的工作基本也是同时下发的，这时前端开发人员就会很尴尬，后端在干活的时候，领导几乎一定会让你先做个静态页面看看，这时候你和后端之间可能只是约定了接口（当然也可能连接口都没约定，那我只能祝你幸福了），并没有数据的传输，没法直接拿到填充网页的数据，如果一次将前端代码写到位，那么打开网页时轻则页面提示没有获取到数据，重则直接报错退出脚本。而真正的问题在于静态页面做起来是非常快的，以至于你的领导会认为当你把静态页面中加入javascript的逻辑部分...

2018-09-11

683

参考文献：https://xz.aliyun.com/t/2715https://www.jianshu.com/p/19e3ee990cb7 phar原理：一个标志，格式为xxx<?php xxx;__HALT_COMPILER();?>，前面内容不限，但必须以__HALT_COMPILER();?>来结尾，否则phar扩展将无法识别这个文件为phar文件。ps：要将php.ini中的 phar.readonly选项设置为Off。一个例子序列化 <?php class TestObject { } $phar = new Phar("phar.phar"); //后缀名必须为phar $phar->startBuffering(); $phar->setStub("<?php __HALT_COMPILER(); ?>"); //设置stub $o = new TestObject(); $o -> data='sheng'; $phar->setMetadata($o); //将自定义的meta-data存入mani...

2018-09-11

667

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。