关于博客搭建过程的一些总结和吐槽

Posted on

Contents

JekyllMathmathjax 的 js 文件的配置问题行间公式的空行问题反斜杠的转义问题CodeDomainMarkdown

前些日子看到 Github pages 的一些介绍(虽然之前就知道了),再加上想复习一下 CSS,于是便脑子一热萌发了使用 Github pages 搭建 blog 的想法,写了几天代码CSS,算是把基本功能都完成了。这里总结一些搭建过程中遇到的问题。

#Jekyll

Jekyll用于将 html 模板(使用 Liquid 模板引擎)和 markdown(使用 kramdowm 方言)解析成浏览器能够直接显示的 html 文件,是一个用 ruby 编写的博客生成工具,被 Github pages 原生地支持。在使用 gem 安装之后,使用 jekyll build 能够完成一次当前目录的构建,使用 jekyll serve 能够使 jekyll 在检测到文件更新时自动重新构建,并且在 localhost:4000 运行一个本地 HTTP 服务器,便于调试。

Jekyll 由于使用 ruby 编写,配置文件一般通过 yaml 文件提供,并且在需要当成模板渲染地文件开头书写 yaml 文件头。

Jekyll 的官方文档很友好,搜索功能也比较高效,有国人维护的一个中文翻译网站,不过遗憾的是中文翻译网站不支持搜索功能。

#Math

平时我都是用 LaTeX\LaTeX 进行数学相关的文字编辑 / 排版工作,好在目前已经有现成的轮子可以用来在 html 中渲染数学公式了。其中比较成熟的工具包括 mathjax 和 katex。这两个均以 js 库的形式导入到 html 中,具体的调用方法略有差异。

katex 的调用方法有点复杂,它暴露的主要接口是一个将给定给定字符串渲染成公式然后塞到 dom 元素里面的函数,官方提供了一个可以直接渲染整个文档的扩展,但是由于不明原因没有效果,也没有报错。日后再研究一下吧。

mathjax 的渲染速度和代码体积都要落后于 katex,但是它可以直接渲染整个文档。默认行内和行间公式的定界符分别是 \( \)\[ \],这和我平时写 LaTeX\LaTeX 的习惯不太一致,好在这个可以自行配置,具体的配置代码大致如下

<script type="text/x-mathjax-config">
        MathJax.Hub.Config({
          tex2jax: {inlineMath: [['$','$']]}
        });
</script>

使用 mathjax 的时候遇到了若干个坑:

#mathjax 的 js 文件的配置问题

我本来照看官网上的 Quick Start 引用了下述 js 文件

<script src='https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js?config=TeX-MML-AM_CHTML' async></script>

然而这个渲染出来的公式再布局上有比较严重的问题,例如行内分式的分子分母部分重叠,下标字号过大等等。经过仔细研究看隔壁的源码,发现应该引用下述文件

<script src="https://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML" async></script>

在更换之后,排版质量显著改善。

#行间公式的空行问题

LaTeX\LaTeX 中,只要使用 \[ \] 开启行间公式时,它会自动新启一行排版公式(废话)。但是在写 markdown 时这一点会出现一些问题。mathjax 会寻找块级元素,当检测到包含行间公式的开头/结尾字段时将其当作行间公式渲染。但是如果在 markdown 里面不换行的话, kramdown 将 markdown 转换为 html 文件时会把你输入的行间公式当成一个行内元素(因为 markdown 会忽略非空行的换行),所以这样无法正常渲染行间公式(似乎只限于 kramdown,用一些内置 TeX\TeX 支持的 markdown 编辑器不会出现这个问题)。要想让它正常渲染,必须在行间公式的上下空行,使得它被翻译为 html 的 <p> 标签。

#反斜杠的转义问题

这是一个奇妙的问题。在 markdown 中反斜杠会被转义,准确来说,当一个反斜杠后面接着一个标点符号时,这个反斜杠会被当作转义符号,它本身会被忽略,而它后面接的标点符号不会被当作 markdown 的特殊字符。

但是这个规则也有一些奇妙的例外,例如,在代码模式下(即被反引号包裹的东西里面)这个转义会被忽略,也就是说反斜杠不会被当作转义字符而被隐藏(顺便一提,这一点使得在行内的公式里面打出反引号并不容易)。此外,行间公式环境下这种转义也会出现。

但是最坑的是这件事情在行内公式中不会出现(也只限于 kramdown),也就是说,行内公式中的反斜杠仍被当作转义字符,这种不一致性让人非常不爽。 例如,在行内若想输出一对花括号,你需要写 ${}$,但是在行间的话你需要写的是 $$\{\}$$(不要忘了上下空行)。

#Code

Jekyll 内置了 Rouge 的语法高亮功能,可以将 markdown 中的行间代码进行语法高亮,但是值得注意的是它只负责将 markdown 转换为 html 然后把代码中不同的 token 赋予不同的 class,具体的着色方案需要额外提供 css 文件完成。

好在已经有人制作了这样的 css 供我们直接使用,例如这个 repo。但是是这里面的 css 文件里面有的不仅提供了 color 这个 css 属性,而且还提供了 background-color 这个属性,也就是说它可能会改变部分文字(比如说字符串)的背景颜色,这不一定总是我们想要的,可能需要手动删除,或者自己覆盖 background-color 属性。

#Domain

虽然 Github pages 默认给出的 sharzyl.github.io 域名还算不错,但是考虑到它还提供了自定义域名服务,所以我还是希望有一个自己的域名。在域名商处购买一个域名之后,添加两条 dns 记录

类型 名称
A @ 185.199.108.153
A @ 185.199.109.153

注:似乎只添加一条 dns 记录也可以。此外这里演示的是使用裸域名的情形,如果要使用子域名,应该配置 CNAME 类型*

然后在 Github repo 的 Settings 界面的 Custom domain 项里面填写自己的域名。完成之后,在浏览器上填写自定义的域名,应该就能跳转到 Github pages 里面了。

注意到这时候使用的是 http 协议,Github pages 良心之处在于它可以免费地自动为你的域名签发 ssl 证书,然后网站就可以使用 https 连接了。具体来说,需要在 Settings 界面勾选 Enforce HTTPS。

Github 启用 HTTPS 的选项
Github 启用 HTTPS 的选项

不过这个勾选项并不是马上就可以勾选的,需要等待 Github 签发 ssl 证书,一般需要等一两天,如果一两天之后仍然无法勾选,可以考虑把 Custom Domain 项删除然后重新填写。

#Markdown

markdown 的语法长期以来很不统一,存在各种各样的“方言”,Jekyll 所使用的 kramdown 就是其中之一,这个方言和我再用 vscode 写作时预览用的方言有一些不统一之处,这给我带来了一些麻烦。

kramdown 的一个和其它的方言不太一致的地方在于它(像 python 一样)把缩进用来划分语法层级。也就是说,缩进比较深的段落在生成的 html 里面会被当作缩进比较浅的段落的子元素。

这个设定还是很符合逻辑的,但是如果用户不了解这一点的话,可能会造成一些麻烦,这个麻烦在有序列表中体现地尤为明显。

问题主要发生在用户试图在有序列表的一项中插入一个块级元素(例如代码块,行间公式)的时候,如果不了解 kramdown 的缩进法则的话,用户可能认为只需要新启一行就可以了。例如

1. nsert some formula

$$ a + b = b + a $$

2. one more item

然而不幸的是这样无法正常显示有序列表的序号,它的输出结果如下:

  1. insert some formula

a+b=b+aa + b = b + a

  1. one more item

注意到有序列表的标号在第二项上被重置了,出现这个的原因在于 kramdown 会把缩进层级相同的元素当作同级元素看待,所以中间的行间公式会被它看作一个和有序列表同级的块级元素(类似段落),因此这个有序列表被这个块级元素中断了. 解决这个问题的方法很简单,把中间的公式缩进就可以了。(这里也顺带解释了上文中提到的数学公式空行问题