doc: more regex to cleanup html manual markup
authorRamprasad Venkataraman <ramv@illinois.edu>
Mon, 30 Jul 2012 23:56:25 +0000 (18:56 -0500)
committerRamprasad Venkataraman <ramv@illinois.edu>
Mon, 30 Jul 2012 23:56:25 +0000 (18:56 -0500)
doc/l2h_sanitize_markup.sh

index cc61e33e83ebe076a1df5fd53d635f9934e236ac..345b8b810898a5fcf5f4dde32dfd53e96d69e19d 100755 (executable)
@@ -21,19 +21,21 @@ do
        cwd=`echo $cwd | sed -e 's@/home/net@/expand/home@'`
        sed -e 's!'`pwd`'/!!g' $f > tmp || die "error running sed on $f"
        mv $f $f.bak || die "error backing up $f"
-    # Munge through the markup and... 
+  # Munge through the markup and... 
        # Relativize all paths
-    # Replace placeholder with script tag
-    # Replace div.alltt with pre tag
+       # Replace placeholder with script tag
+       # Replace div.alltt with pre tag
        # Delete tt tag that is no longer supported in html5
        # Remove matching closing tags
-    # and also remove the closing div matching the div.alltt
+       # and also remove the closing div matching the div.alltt
+       # Remove all br tags in between pre tags
        # and finally delete the line if it just has whitespace
        sed -e 's!'$cwd'/!!g' \
            -e 's|replace_with_script|script|g' \
-               -e 's|<DIV CLASS="alltt"[^>]*>|<pre>|g' \
+               -e 's|<DIV CLASS="alltt"[^>]*>|<pre><code>|g' \
                -e 's|<TT>||g' \
-               -e '/<\/TT>/{N;s|<\/TT>||g;/\n<\/DIV>/{s|<\/DIV>|</pre>|g}}' \
+               -e '/<\/TT>/{N;s|<\/TT>||g;/\n<\/DIV>/{s|<\/DIV>|</code></pre>|g}}' \
+               -e '/<pre>/,/<\/pre>/s|<BR>||g' \
                -e '/^\w*$/d' \
        tmp > $f || die "error running sed on $f"
        rm $f.bak