本文共 1602 字,大约阅读时间需要 5 分钟。
版权声明:本文为博主原创文章,未经博主允许不得转载。
OFFICE 文档在线预览方案很多:
今天,我们要用的方案是转换为html来预览。
技术方案:
- office文档转换为pdf:使用libreoffice - pdf转html,使用pdf2htmlex测试环境:
操作系统:ubuntu 12.04apt-get install libreoffice-common
soffice --accept="socket,host=127.0.0.1,port=2002;urp;" --nofirststartwizard
网上一般介绍的都是使用JODConverter ,通过java来调用转换服务,其实还有一种替代方案,就是使用pyodconverter,python版本的转换脚本
下载后,进行测试:
python DocumentConverter.py Website_Information_Form.doc new.pdf
soffice 可以正常转换为pdf,但是中文显示为乱码
google一下,乱码问题大概是字体缺失的问题,于是尝试将windows下的字体拷贝过去,复制windows下的字体到/usr/share/fonts下,然后刷新字体缓存
sudo fc-cache -fv 2>&1 | grep failed | cut -f1 -d":" | xargs -i sudo touch {} && sudo fc-cache -fv
再重启转换服务,再次测试,已经OK了!
pdf转html,使用国人开源的,一开始尝试通过源码编译安装,依赖组件太多,安装非常麻烦!感兴趣的可以执行编译安装,参见()
下面介绍简单安装方式:
sudo add-apt-repository ppa:coolwanglu/pdf2htmlexsudo apt-get updatesudo apt-get install pdf2htmlex
pdf2htmlEX --zoom 1.3 xiaoshujiang.pdf
可以看到,当前目录生成了xiaoshujiang.html
写一个脚本,将两次转换放到一起,方便调用:
#convert2html.shtemp=$(date +%Y%m%d%H%m%s)python DocumentConverter.py $1 ${temp}.pdfpdf2htmlEX --zoom 1.3 $temp.pdf mv $temp.html $2 rm $temp.pdf
convert2html.sh imo云办公室-私有云用户使用手册V2.0.doc imo-doc.html
效果:
convert2html.sh xxx.xlsx xxx.html
./convert.sh xxx.pptx xxx.html
本文介绍了一种在服务端将office文档转换为html以方便预览的方法。
实际使用时,可以将生成好的html放到网站路径下,通过拦截器,设置访问权限。