comt: src/cm/converters/pandoc_converters.py@0f2c5744b39b (annotated)

0 40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	1	# python 2.5 compat
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	2	from __future__ import with_statement
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	3	from cm.utils.cache import memoize
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	4	######
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	5	## This module requires pandoc v > 1.0 (pandoc & markdown executables)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	6	######
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	7
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	8	from subprocess import Popen, PIPE, call
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	9	import os
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	10	from tempfile import mkstemp
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	11	import StringIO
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	12	import tidy
149 0f2c5744b39b cleanup diff files / add experimental diff raph parents: 119 diff changeset	13	from cm.utils.string_utils import to_unicode
0 40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	14
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	15	PANDOC_BIN = "pandoc"
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	16	PANDOC_OPTIONS = "--sanitize-html "
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	17
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	18	MARKDOWN2PDF_BIN = "markdown2pdf"
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	19
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	20	# make sure binaries are available
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	21	from cm.utils.system import bin_search
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	22	bin_search(PANDOC_BIN)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	23	bin_search(MARKDOWN2PDF_BIN)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	24
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	25	# pandoc capabilities
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	26	INPUT_FORMATS = ['native', 'markdown', 'rst', 'html', 'latex']
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	27	OUTPUT_FORMATS = ['native', 'html', 's5', 'docbook', 'opendocument', 'odt', 'latex', 'context', 'texinfo', 'man', 'markdown', 'rst', 'mediawiki', 'rtf']
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	28
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	29	# add pdf output using markdown2pdf
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	30	OUTPUT_FORMATS.append('pdf')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	31
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	32	# input formats
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	33	CHOICES_INPUT_FORMATS = [(f, f) for f in ['markdown', 'rst', 'html']]
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	34
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	35	DEFAULT_INPUT_FORMAT = 'markdown'
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	36
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	37	_PANDOC_ENCODING = 'utf8'
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	38
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	39	@memoize
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	40	def pandoc_convert(content, from_format, to_format, full=False):
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	41	"""
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	42	Convert markdown content to pdf
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	43
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	44	>>> res = pandoc_convert('<span>dssd', 'html', 'pdf')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	45	"""
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	46	# pandoc does not react well when html is not valid
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	47	# use tidy to clean html
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	48	if from_format == 'html':
119 5e8dda1b7631 recover when tidy trashes: try markdown anyway raph parents: 0 diff changeset	49	try:
5e8dda1b7631 recover when tidy trashes: try markdown anyway raph parents: 0 diff changeset	50	content = do_tidy(content)
5e8dda1b7631 recover when tidy trashes: try markdown anyway raph parents: 0 diff changeset	51	except:
5e8dda1b7631 recover when tidy trashes: try markdown anyway raph parents: 0 diff changeset	52	# tidy fails ... try pandoc anyway...
5e8dda1b7631 recover when tidy trashes: try markdown anyway raph parents: 0 diff changeset	53	content = to_unicode(content)
0 40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	54	# if to_format is pdf: use markdown2pdf
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	55	if to_format == 'pdf':
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	56	if from_format != 'markdown':
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	57	content = pandoc_convert(content, from_format, 'markdown', True)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	58	return pandoc_markdown2pdf(content)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	59	return pandoc_pandoc(content, from_format, to_format, full)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	60
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	61	def content_or_file_name(content, file_name):
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	62	if not content and not file_name:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	63	raise Exception('You should provide either a content or a file_name')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	64	if content and file_name:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	65	raise Exception('You should not provide a content AND a file_name')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	66
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	67	if file_name:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	68	fp = file(file_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	69	content = fp.read()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	70	fp.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	71
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	72	return content
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	73
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	74	@memoize
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	75	def do_tidy(content=None, file_name=None):
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	76	"""
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	77	Tidy (html) content
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	78
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	79	>>> res = do_tidy('<span>sdd')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	80	"""
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	81	content = content_or_file_name(content, file_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	82
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	83	tidy_options = dict(output_xhtml=1,
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	84	add_xml_decl=0,
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	85	indent=0,
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	86	tidy_mark=0,
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	87	input_encoding='utf8',
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	88	output_encoding='utf8',
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	89	)
119 5e8dda1b7631 recover when tidy trashes: try markdown anyway raph parents: 0 diff changeset	90	tidyied_content = tidy.parseString(to_unicode(content).encode('utf8'), **tidy_options)
0 40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	91	tidyied_content = str(tidyied_content)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	92	if content and not tidyied_content.strip():
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	93	raise Exception('Content could not be tidyfied')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	94	return str(tidyied_content).decode('utf8')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	95
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	96
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	97	def get_filetemp(mode="r"):
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	98	(fd, fname) = mkstemp()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	99	return (os.fdopen(fd, mode), fname)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	100
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	101	# build absolute address for latex header file
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	102	_tmp_ = __file__.split(os.path.sep)[:-1]
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	103	_tmp_.append('latex_header.txt')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	104	_tmp_.insert(0, os.path.sep)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	105
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	106	LATEX_HEADER_PATH = os.path.join(*_tmp_)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	107
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	108	if not os.path.isfile(LATEX_HEADER_PATH):
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	109	raise Exception('LATEX_HEADER_PATH is not a file!')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	110
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	111	@memoize
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	112	def pandoc_markdown2pdf(content=None, file_name=None):
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	113	"""
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	114	Convert markdown content to pdf
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	115
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	116	>>> pdf_content = pandoc_markdown2pdf('# dssd')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	117	"""
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	118	content = content_or_file_name(content, file_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	119
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	120	# write file to disk
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	121	temp_file, input_temp_name = get_filetemp('w')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	122	fp_error, error_temp_name = get_filetemp('w')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	123
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	124	temp_file.write(content.encode(_PANDOC_ENCODING))
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	125	temp_file.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	126
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	127	# custom latex header
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	128	cust_head_tex = " --custom-header=%s " %LATEX_HEADER_PATH
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	129
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	130	# use markdown2pdf
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	131	retcode = call(MARKDOWN2PDF_BIN + cust_head_tex + ' ' + input_temp_name, shell=True, stderr=fp_error)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	132	fp_error.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	133
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	134	fp_error = file(error_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	135	error = fp_error.read()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	136	fp_error.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	137
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	138	os.remove(input_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	139	os.remove(error_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	140
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	141	if retcode:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	142	raise Exception(error)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	143
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	144	output_temp_name = input_temp_name + '.pdf'
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	145	fp_output = file(output_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	146	pdf_content = fp_output.read()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	147	fp_output.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	148
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	149	os.remove(output_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	150
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	151	return pdf_content
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	152
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	153	# TODO: manage images in pandoc (?)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	154	# TODO: use tidy to cleanup html
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	155
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	156	@memoize
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	157	def pandoc_pandoc(content, from_format, to_format, full=False):
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	158	"""
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	159	Convert content (should be unicode) from from_format to to_format
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	160	(if full: includes header & co [html, latex])
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	161	Returns out (unicode), err
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	162
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	163	>>> res, err = pandoc_pandoc(u'# sdsd', 'markdown', 'html', False)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	164	>>> print err
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	165	None
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	166	>>> res.replace("\\n","")
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	167	u'<h1 id="sdsd">sdsd</h1>'
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	168	>>> res, err = pandoc_pandoc(u'# sdsd', 'markdown', 'html', True)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	169	>>> print err
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	170	None
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	171	"""
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	172	# verify formats
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	173	if from_format not in INPUT_FORMATS:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	174	raise Exception("Input format [%s] is not a supported format [%s]" % (from_format, ' '.join(INPUT_FORMATS)))
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	175	if to_format not in OUTPUT_FORMATS:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	176	raise Exception("Output format [%s] is not a supported format [%s]" % (to_format, ' '.join(OUTPUT_FORMATS)))
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	177	if type(content) != unicode:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	178	raise Exception('Content is not in unicode format!')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	179
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	180	# temp file
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	181	input_file, input_temp_name = get_filetemp('w')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	182	output_temp_fp, output_temp_name = get_filetemp()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	183	output_temp_fp.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	184
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	185	error_temp_fp, error_temp_name = get_filetemp('w')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	186	error_temp_fp.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	187
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	188	input_file.write(content.encode(_PANDOC_ENCODING))
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	189	input_file.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	190
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	191	# pandoc arguments and command line
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	192	cmd_args = ' %s -o %s ' %(PANDOC_OPTIONS,output_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	193	if full:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	194	cmd_args += ' -s '
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	195	cmd_args += ' -f %s ' % from_format
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	196	cmd_args += ' -t %s ' % to_format
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	197	cmd_args += ' %s ' % input_temp_name
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	198	cmd = PANDOC_BIN + ' ' + cmd_args
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	199
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	200	#from socommons.converters.new_conv import controlled_Popen
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	201	#controlled_Popen(cmd, stderr=file(error_temp_name,'w'))
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	202	fp_error = file(error_temp_name,'w')
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	203	retcode = call(cmd, shell=True, stderr=fp_error)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	204	fp_error.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	205
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	206	fp_error = file(error_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	207	error = fp_error.read()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	208	fp_error.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	209
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	210	fp_output = file(output_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	211	stdoutdata = fp_output.read()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	212	fp_output.close()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	213
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	214
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	215	# cleanup
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	216	os.remove(output_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	217	os.remove(input_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	218	os.remove(error_temp_name)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	219
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	220	if retcode:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	221	raise Exception(error)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	222
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	223	# try converting to unicode
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	224	try:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	225	stdoutdata = stdoutdata.decode(_PANDOC_ENCODING)
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	226	except UnicodeDecodeError:
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	227	# this will fail for binary output formats such as odt
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	228	# return result without conversion then
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	229	pass
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	230
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	231	return stdoutdata
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	232
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	233	if __name__ == "__main__":
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	234	import doctest
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	235	doctest.testmod()
40c8f766c9b8 import from internal svn r 4007 raph parents: diff changeset	236

author	raph
	Fri, 05 Feb 2010 16:01:32 +0100
changeset 149	0f2c5744b39b
parent 119	5e8dda1b7631
child 252	0f0a79f7f213
permissions	-rw-r--r--