[SOLVED] Change pdftoppm output to 16 bits or 24 bits

file · Last edited by Cyrolancer; 01-22-2012 at 09:12 AM.

pdftoppm -aa yes -aaVector yes -freetype yes -r 300 file.pdf basename
pnmtopng -compress 9 basename-1.ppm > basename-1.png
file basename-1.png
 basename-1.png: PNG image data, 3509 x 2480, 8-bit/color RGB, non-interlaced
pdftoppm -aa yes -aaVector yes -freetype yes -png -r 300 file.pdf othername
pnmcolormap all basename-1.ppm >/dev/null
 pnmcolormap: making histogram...
 pnmcolormap: too many colors!
 pnmcolormap: scaling colors from maxval=255 to maxval=127 to improve clustering...
 pnmcolormap: making histogram...
 pnmcolormap: 21287 colors found
#!/bin/bash
START_TS=`date +%s`
xvfb-run -a -s "-screen 0 640x480x16" wkhtmltopdf -d 600 -q http://www.$1.com $1.pdf
pdftoppm -r 200 -png -H 1500 -freetype yes -aa yes -aaVector no $1.pdf > $1.png
convert -resize %50 $1.png $1.jpg
rm $1.pdf $1.png
END_TS=`date +%s`
declare -i TS_DIFF=$END_TS-$START_TS
echo "http://www.$1.com is processed in $TS_DIFF seconds"
convert site.pdf site.jpg
sudo apt-get install python-gtk2 python-webkit xvfb ttf-freefont
#!/usr/bin/env python

class WindowImage(object):
    def __init__(self, url, imagefile = "", font_size = 0,
                 font_default = "", font_serif = "",
                 font_sans_serif = "", font_monospace = ""):
        import gtk
        import webkit
        gtk.gdk.threads_init()

        window = gtk.Window(gtk.WINDOW_TOPLEVEL)
        window.move(0, 0)
        size = (gtk.gdk.screen_width(), gtk.gdk.screen_height())
        window.resize(*size)
        webview = webkit.WebView()

        self.imagefile = imagefile

        # webkit settings
        settings = webkit.WebSettings()
        if len(font_serif) > 0:
            settings.set_property("serif-font-family", font_serif)
        if len(font_sans_serif) > 0: 
            settings.set_property("sans-serif-font-family", font_sans_serif)
        if len(font_monospace) > 0:
            settings.set_property("monospace-font-family", font_monospace)
        if len(font_default) > 0:
            settings.set_property("default-font-family", font_default)
        if font_size > 0:
            settings.set_property("default-font-size", font_size)
        webview.set_settings(settings)

        window.add(webview)
        webview.connect("load-finished", self._loaded)
        webview.open(url)
        window.show_all()
        gtk.main()
        gtk.gdk.threads_leave()
        pass

    def _loaded(self, view, frame):
        import gtk
        try:
            width, height = view.window.get_size()
            pixmap = gtk.gdk.Pixmap(view.window, width, height)
            gc = pixmap.new_gc(function = gtk.gdk.COPY,
                               subwindow_mode = gtk.gdk.INCLUDE_INFERIORS)
            pixmap.draw_drawable(gc, view.window, 0, 0, 0, 0, width, height)
            pixbuf = gtk.gdk.Pixbuf(gtk.gdk.COLORSPACE_RGB, False, 8, width, height)
            pixbuf.get_from_drawable(pixmap, pixmap.get_colormap(), 0, 0, 0, 0, width, height)
            print "Saving %d x %d PNG image '%s'" % (width, height, self.imagefile)
            pixbuf.save(self.imagefile, "png")
            self.saved = True
        except:
            #import traceback
            #traceback.print_exc()
            pass
        gtk.main_quit()
        pass
    pass

def vfb(display_spec, dpi, server=2, screen=0):
    import subprocess
    import os
    while True:
        try:
            devnull = open("/dev/null", "w")
            proc = subprocess.Popen(
                ["Xvfb", ":%d" % server, "-dpi", "%d" % dpi,
                 "-screen", "%d" % screen, display_spec],
                shell=False, stdout=devnull, stderr=devnull)
            print "Opened Xvfb (%s @ %d DPI)" % (display_spec, dpi)
            os.environ["DISPLAY"] = ":%d.%d" % (server, screen)
            return (proc, screen)
        except:
            screen += 1
            pass
        pass
    pass

def vfb_image(url, display_spec, dpi, **args):
    proc, screen = vfb(display_spec, dpi)

    try:
        return WindowImage(url, **args).saved
    finally:
        proc.terminate()
        pass
    pass

def _main():
    screen_width = 1024
    screen_height = 600
    screen_depth = 24
    dpi = 96
    imagefile = "page.png"
    font_size = 14
    font_default = "FreeSerif"
    font_serif = "FreeSerif"
    font_sans_serif = "FreeSans"
    font_monospace = "FreeMono"

    from optparse import OptionParser
    parser = OptionParser()
    parser.usage += " URL"
    parser.add_option("-x", "--width", dest="width",
                      help="browser window width: %d" % screen_width,
                      default="%d" % screen_width)
    parser.add_option("-y", "--height", dest="height",
                      help="browser window height: %d" % screen_height,
                      default="%d" % screen_height)
    parser.add_option("-d", "--depth", dest="depth",
                      help="color depth: %d" % screen_depth,
                      default="%d" % screen_depth)
    parser.add_option("-o", "--output", dest="output",
                      help="output image file name: %s" % imagefile,
                      default=imagefile)
    parser.add_option("-z", "--dpi", dest="dpi",
                      help="dots per inch: %d" % dpi,
                      default=dpi)
    parser.add_option("-s", "--size", dest="font_size",
                      help="font size: %s" % font_size,
                      default=font_size)
    parser.add_option("-f", "--font", dest="font_default",
                      help="default font: %s" % font_default,
                      default="")
    parser.add_option("-m", "--mono", dest="font_monospace",
                      help="Monospace font: %s" % font_monospace,
                      default="")
    parser.add_option("-S", "--serif", dest="font_serif",
                      help="Serif font: %s" % font_serif,
                      default="")
    parser.add_option("-A", "--sans", dest="font_sans_serif",
                      help="Sans-serif font: %s" % font_sans_serif,
                      default="")

    opts, args = parser.parse_args()
    if len(args) == 0:
        parser.print_help()
        import sys
        sys.exit(-1)
        pass

    try: font_size = eval(opts.font_size)
    except: pass

    try:
        dpi = eval(opts.dpi)
        if dpi < 36:
            dpi = 36
    except: pass

    if len(opts.font_default) > 0:
        font_default = opts.font_default
        font_serif = opts.font_default
        font_sans_serif = opts.font_default
        font_monospace = opts.font_monospace

    if len(opts.font_serif) > 0:
        font_serif = opts.font_serif

    if len(opts.font_sans_serif) > 0:
        font_sans_serif = opts.font_sans_serif

    if len(opts.font_monospace) > 0:
        font_monospace = opts.font_monospace

    imagefile = opts.output

    try: screen_width = eval(opts.width)
    except: pass

    try: screen_height = eval(opts.height)
    except: pass

    try: screen_depth = eval(opts.depth)
    except: pass

    screen = "%dx%dx%d" % (screen_width, screen_height, screen_depth)

    from urlparse import urlparse
    if "://" in args[0]:
        url = urlparse(args[0]).geturl()
    elif args[0].startswith("/") or args[0].startswith("./") or args[0].startswith("../"):
        url = urlparse("file://" + args[0]).geturl()
    else:
        url = urlparse("http://" + args[0]).geturl()

    if vfb_image(url, screen, dpi,
                      imagefile = imagefile,
                      font_size = font_size,
                      font_default = font_default,
                      font_serif = font_serif,
                      font_sans_serif = font_sans_serif,
                      font_monospace = font_monospace):
        print "%s: Image saved successfully." % imagefile

if __name__ == "__main__": _main()
python script -o image.png URL
time python url2png -x 1920 -y 1080 -o lq.png http://www.linuxquestions.org/questions/
  Saving 1920 x 3081 PNG image 'lq.png'
  lq.png: Image saved successfully
  real: 0m6.821s
  user: 0m2.136s
  sys:  0m0.536s

ls -l lq.png
  -rw-r--r-- 1 user group 719220 2012-01-25 07:08 lq.png
            pixbuf.save(self.imagefile, "jpeg", {"quality": 97})
def vfb_image(url, display_spec, dpi, **args):
    proc, screen = vfb(display_spec, dpi)

    import urllib

    try:
        return WindowImage(urllib.quote_plus(url), **args).saved
    finally:
        proc.terminate()
        pass
    pass
#!/usr/bin/env python

class WindowImage(object):
    def __init__(self, url, imagefile = "", font_size = 0,
                 font_default = "", font_serif = "",
                 font_sans_serif = "", font_monospace = ""):
        import gtk
        import webkit
        gtk.gdk.threads_init()

        window = gtk.Window(gtk.WINDOW_TOPLEVEL)
        window.move(0, 0)
        size = (gtk.gdk.screen_width(), gtk.gdk.screen_height())
        window.resize(*size)
        webview = webkit.WebView()

        self.url = url
        self.imagefile = imagefile

        # webkit settings
        settings = webkit.WebSettings()
        if len(font_serif) > 0:
            settings.set_property("serif-font-family", font_serif)
        if len(font_sans_serif) > 0: 
            settings.set_property("sans-serif-font-family", font_sans_serif)
        if len(font_monospace) > 0:
            settings.set_property("monospace-font-family", font_monospace)
        if len(font_default) > 0:
            settings.set_property("default-font-family", font_default)
        if font_size > 0:
            settings.set_property("default-font-size", font_size)
        webview.set_settings(settings)

        window.add(webview)
        webview.connect("load-finished", self._loaded)
        webview.connect("load-error", self._failed)
        webview.open(url)
        window.show_all()
        gtk.main()
        gtk.gdk.threads_leave()

    def _loaded(self, view, frame):
        import gtk
        self.image = (0, 0, "Cannot create image.")
        try:
            width, height = view.window.get_size()
            pixmap = gtk.gdk.Pixmap(view.window, width, height)
            gc = pixmap.new_gc(function = gtk.gdk.COPY,
                               subwindow_mode = gtk.gdk.INCLUDE_INFERIORS)
            pixmap.draw_drawable(gc, view.window, 0, 0, 0, 0, width, height)
            pixbuf = gtk.gdk.Pixbuf(gtk.gdk.COLORSPACE_RGB, False, 8, width, height)
            pixbuf.get_from_drawable(pixmap, pixmap.get_colormap(), 0, 0, 0, 0, width, height)
            self.image = (0, 0, "Cannot save image file: %s" % self.imagefile )
            pixbuf.save(self.imagefile, "png")
            self.image = (width, height, "PNG")
        except:
            pass
        gtk.main_quit()

    def _failed(self, view, frame, uri, gerror):
        import gtk
        import ctypes
        msg = ctypes.cast(int(str(gerror)[13:-1],16)+8, ctypes.POINTER(ctypes.c_char_p))[0]
        self.image = (0, 0, "%s (%s)." % (msg, uri))
        gtk.main_quit()

    pass

def vfb(display_spec, dpi, server=2, screen=0):
    import subprocess
    import os
    while True:
        try:
            devnull = open(os.devnull, "w")
            proc = subprocess.Popen(
                ["Xvfb", ":%d" % server, "-dpi", "%d" % dpi,
                 "-screen", "%d" % screen, display_spec],
                shell=False, stdout=devnull, stderr=devnull)
            os.environ["DISPLAY"] = ":%d.%d" % (server, screen)
            return (proc, screen)
        except:
            screen += 1
        pass
    pass

def vfb_image(url, display_spec, dpi, **args):
    proc, screen = vfb(display_spec, dpi)
    try:
        return WindowImage(url, **args).image
    finally:
        proc.terminate()
    return (0, 0, "Webkit failed")

def _main():
    screen_width = 1024
    screen_height = 600
    screen_depth = 24
    dpi = 96
    imagefile = "page.png"
    font_size = 14
    font_default = "FreeSerif"
    font_serif = "FreeSerif"
    font_sans_serif = "FreeSans"
    font_monospace = "FreeMono"
    verbose = 1

    import os
    out = os.fdopen(os.dup(1), "w")
    err = os.fdopen(os.dup(2), "w")
    devnull = open(os.devnull, "w")
    if devnull.fileno() != 1: os.dup2(devnull.fileno(), 1)
    if devnull.fileno() != 2: os.dup2(devnull.fileno(), 2)
    if devnull.fileno() >  2: devnull.close()

    from optparse import OptionParser
    parser = OptionParser()
    parser.usage += " URL"
    parser.add_option("-v", "--verbose", dest="verbose",
                      help="verbose output", action="count",
                      default=verbose)
    parser.add_option("-q", "--quiet", dest="quiet",
                      help="no output", action="store_true",
                      default=False)
    parser.add_option("-x", "--width", dest="width",
                      help="browser window width: %d" % screen_width,
                      default="%d" % screen_width)
    parser.add_option("-y", "--height", dest="height",
                      help="browser window height: %d" % screen_height,
                      default="%d" % screen_height)
    parser.add_option("-d", "--depth", dest="depth",
                      help="color depth: %d" % screen_depth,
                      default="%d" % screen_depth)
    parser.add_option("-o", "--output", dest="output",
                      help="output image file name: %s" % imagefile,
                      default=imagefile)
    parser.add_option("-z", "--dpi", dest="dpi",
                      help="dots per inch: %d" % dpi,
                      default=dpi)
    parser.add_option("-s", "--size", dest="font_size",
                      help="font size: %s" % font_size,
                      default=font_size)
    parser.add_option("-f", "--font", dest="font_default",
                      help="default font: %s" % font_default,
                      default="")
    parser.add_option("-m", "--mono", dest="font_monospace",
                      help="Monospace font: %s" % font_monospace,
                      default="")
    parser.add_option("-S", "--serif", dest="font_serif",
                      help="Serif font: %s" % font_serif,
                      default="")
    parser.add_option("-A", "--sans", dest="font_sans_serif",
                      help="Sans-serif font: %s" % font_sans_serif,
                      default="")

    opts, args = parser.parse_args()
    if len(args) == 0:
        parser.print_help()
        import sys
        sys.exit(-1)
        pass

    try: font_size = eval(opts.font_size)
    except: pass

    try:
        dpi = eval(opts.dpi)
        if dpi < 36:
            dpi = 36
    except: pass

    if len(opts.font_default) > 0:
        font_default = opts.font_default
        font_serif = opts.font_default
        font_sans_serif = opts.font_default
        font_monospace = opts.font_monospace

    if len(opts.font_serif) > 0:
        font_serif = opts.font_serif

    if len(opts.font_sans_serif) > 0:
        font_sans_serif = opts.font_sans_serif

    if len(opts.font_monospace) > 0:
        font_monospace = opts.font_monospace

    imagefile = opts.output
    verbose = opts.verbose
    if opts.quiet: verbose = 0

    try: screen_width = eval(opts.width)
    except: pass

    try: screen_height = eval(opts.height)
    except: pass

    try: screen_depth = eval(opts.depth)
    except: pass

    screen = "%dx%dx%d" % (screen_width, screen_height, screen_depth)

    from urlparse import urlparse
    if "://" in args[0]:
        url = urlparse(args[0]).geturl()
    elif args[0].startswith("/") or args[0].startswith("./") or args[0].startswith("../"):
        url = urlparse("file://" + args[0]).geturl()
    else:
        url = urlparse("http://" + args[0]).geturl()

    (width, height, format) = vfb_image(url, screen, dpi,
                                        imagefile = imagefile,
                                        font_size = font_size,
                                        font_default = font_default,
                                        font_serif = font_serif,
                                        font_sans_serif = font_sans_serif,
                                        font_monospace = font_monospace)

    if (width < 1) or (height < 1):
        if verbose > 0:
            if len(format) > 0:
                err.write("%s\n" % format)
            else:
                err.write("Failed to save image: %s\n" % imagefile)
        import sys
        sys.exit(1)

    if verbose > 1:
        out.write("Saved %d x %d %s image: %s\n" % (width, height, format, imagefile))
    elif verbose > 0:
        out.write("%s\n" % imagefile)

if __name__ == "__main__": _main()
out.write("Saved %d x %d %s image: %s\n" % (width, height, format, imagefile))
out.write("Status: OK\nURL: %s\nFile: %s\nSize: %dx%d\n" % (args[0], imagefile, width, height))
python url2png.py -v -x 1024 -y 768 -o testing3.png http://www.youtube.com/watch?v=p8EY6TB1Iow&feature=autoplay&list=UUsa5WTL9c9PLUi1KvfNNPyg&lf=plcp&playnext=1
[1] 6138
[2] 6139
[3] 6140
[4] 6141

Status: OK
URL: http://www.youtube.com/watch?v=p8EY6TB1Iow
File: testing3.png
Size: 1024x2120

[1]   Done                    python url2png.py -v -x 1024 -y 768 -o testing3.png http://www.youtube.com/watch?v=p8EY6TB1Iow
[2]   Done                    feature=autoplay
[3]-  Done                    list=UUsa5WTL9c9PLUi1KvfNNPyg
[4]+  Done                    lf=plcp
    if verbose > 2:
        out.write("Status: OK\n")
        our.write("Request: %s\n" % args[0])
        out.write("URL: %s\n" % url)
        out.write("Saved: %s\n" % imagefile)
        out.write("Format: %s\n" % format)
        out.write("Width: %d\n" % width)
        out.write("height: %d\n" % height)
    elif verbose > 1:
        out.write("Saved %d x %d %s image: %s\n" % (width, height, format, imagefile))
    elif verbose > 0:
        out.write("%s\n" % imagefile)
python url2png.py -v -x 1024 -y 768 -o testing3.png 'http://www.youtube.com/watch?v=p8EY6TB1Iow&feature=autoplay&list=UUsa5WTL9c9PLUi1KvfNNPyg&lf=plcp&playnext=1'
read -p 'Input URL: ' URL
python url2png.py -vv -x 1024 -y 768 -o testing3.png "$URL"