原 如何批量将html转换为markdown文件
简介
要批量将 HTML 文件转换为 Markdown 文件,可以使用pandoc工具或python脚本。
方法1:pandoc工具
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 | yum install -y pandoc cat > /tmp/convert_html_to_markdown.sh <<"EOF" #!/bin/bash INPUT_FOLDER="/www/wwwroot/gpdbdoc.dbaup.com/gpdb-docs-cn-main/v6" OUTPUT_FOLDER="/www/wwwroot/gpdbdoc.dbaup.com/gpdb_docs" mkdir -p "$OUTPUT_FOLDER" find "$INPUT_FOLDER" -type f -name '*.html' | while read -r file; do # 创建相应的输出文件夹结构 relative_path="${file#$INPUT_FOLDER/}" output_file="$OUTPUT_FOLDER/${relative_path%.html}.md" output_dir=$(dirname "$output_file") mkdir -p "$output_dir" # 执行转换 pandoc "$file" -t markdown -o "$output_file" done EOF chmod +x /tmp/convert_html_to_markdown.sh sh /tmp/convert_html_to_markdown.sh |