项目说明
在线浏览
https://whatot.github.io/leeao/index.html
由 github action 驱动自动构建部署 master 最新版到 github page 中
所有权说明
这个 github 帐号 whatot 并非原著者,whatot 只是将 wjm_tcy 编著的大李敖全集进行格式化,没有其它额外加工。 所有权利由 leeao 与 wjm_tcy 保持,此处仅为传播与留存。 编著者介绍见同目录“wjm_tcy.md”
建库本意
我看 wjm_tcy 花费很多时间对“大李敖全集”进行整合,但是使用的 txt 格式,并且文件内无格式,不便于阅读,于是就对成品 txt 进行格式化。 最终组成一个 gitbook 项目,可以通过 gitbook 转化成 pdf、epub 或者 mobi,便于在各种设备上阅读。
gitbook 已经转向付费,于是迁移到 mdbook 实现。
我对作者的文章内容持保留态度,仅通过此项目减少编著的合集埋没的可能。
生成 html,epub,pdf
构建参考
- https://github.com/rust-lang/mdBook
- https://rust-lang.github.io/mdBook/
- https://github.com/Michael-F-Bryan/mdbook-epub
- https://github.com/badboy/mdbook-toc
- https://github.com/badboy/mdbook-open-on-gh
- https://github.com/jontze/action-mdbook
cargo install mdbook
cargo install mdbook-linkcheck
cargo install mdbook-toc
cargo install mdbook-epub
cargo install mdbook-open-on-gh
## 在book目录生成html版本,book/index.html。在浏览器中打开后,在index页使用右上角的print可以获得pdf版本。
mdbook build
## 生成epub,但是文件过于巨大,浏览困难,不推荐使用。
mdbook-epub --standalone .
文件处理流程
- using enca to convert files to UTF-8/LF
enca -L zh_CN -x UTF-8 */*.txt
- check all the txt files's coding
find -type f -name '*.txt' | xargs file
- delete unneeded lines
find -type f -name '*.txt' | xargs sed -i '/李敖研究网/d'
- deleted trailing spaces
find -type f -name '*.txt' | xargs sed -i 's/[ \t\r ]\+$//'
- delete all spaces
find -type f -name '*.md' | xargs sed -i 's/[ ]//'
- rename all .txt to.md
for f in *.txt; do mv -- "$f" "${f%.txt}.md"; done