poi 3.9
import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream; import org.apache.poi.xwpf.converter.core.FileImageExtractor; import org.apache.poi.xwpf.converter.core.FileURIResolver; import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter; import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.poi.xwpf.usermodel.XWPFPictureData; //import org.junit.Assert; //import org.junit.Test; public class word07toHtml { //@Test public static void canExtractImage() throws IOException { File f = new File("d:/test/test.docx"); if (!f.exists()) { System.out.println("Sorry File does not Exists!"); } else { if (f.getName().endsWith(".docx") || f.getName().endsWith(".DOCX")) { // 1) Load DOCX into XWPFDocument InputStream in = new FileInputStream(f); XWPFDocument document = new XWPFDocument(in); // 2) Prepare XHTML options (here we set the IURIResolver to // load images from a "word/media" folder) File imageFolderFile = new File("d:/test/media"); XHTMLOptions options = XHTMLOptions.create().URIResolver( new FileURIResolver(imageFolderFile)); options.setExtractor(new FileImageExtractor(imageFolderFile)); //options.setIgnoreStylesIfUnused(false); //options.setFragment(true); // 3) Convert XWPFDocument to XHTML OutputStream out = new FileOutputStream(new File( "d:/test/test.htm")); XHTMLConverter.getInstance().convert(document, out, options); } else { System.out.println("Enter only MS Office 2007+ files"); } } } public static void main(String args[]) { try { canExtractImage(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }
其中org.apache.poi.xwpf.converter需要扩展包
如果你的项目用到了maven做如下配置即可,若果没用maven,请从本文附件下载
1.0.4 对应的是 poi 3.9
1.0.0 对应的是 poi 3.8
import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter;
import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions;
所需jar包
<dependencies> <dependency> <groupId> fr.opensagres.xdocreport</groupId> <artifactId> org.apache.poi.xwpf.converter.core</artifactId> <version> 1.0.4</version> </dependency> <dependency> <groupId> fr.opensagres.xdocreport</groupId> <artifactId> org.apache.poi.xwpf.converter.xhtml</artifactId> <version> 1.0.4</version> </dependency> </dependencies>
如果报错:
java.lang.ClassNotFoundException: org.openxmlformats.schemas.wordprocessingml.x2006.main.impl.CTSectPrImpl$1HeaderReferenceList
请添加 ooxml-schemas-1.1.jar
java.lang.ClassNotFoundException: org.openxmlformats.schemas.wordprocessingml.x2006.main.impl.CTBodyImpl$1TblList
也是需要 ooxml-schemas-1.1.jar
用maven的会自动下来,没用maven的请从本文附件下载ooxml-schemas-1.1.rar,需要解压
不过,发现转换后的table没有边框,有待解决
java word转html(03,07) jacob,openoffcie,poi
http://happyqing.iteye.com/blog/2086437
相关推荐
poi完美word转html,完整操作资料的引用说明
poi将word里面的内容转换成html、包括word里面字体的大小、表格的处理、还有图片、段落等等...
poi word转html例子及jar包 poi word转html例子及jar包
使用poi将Word2003和Word2007内容(包括图片)完整转换成html。内附核心代码,成功事例,及完整Jar包。不用再东查西找拼凑Jar包了!
spring poi将word2003转换成html,包含格式、包含图片
java使用poi将word转为html
利用POI将word转换成html实现在线阅读
java POI完整示例,POI将word转HTML,数据库倒出数据到Excel等
poi操作word转html必须jar poi操作word转html必须jar poi操作word转html必须jar poi操作word转html必须jar
poi实现word转换html兼容03和07,手动整理含jar包,报错原因。
POI 替换word2007文本框的值POI,包含word表中的文本框的值,定义好word模板即可替换word中的值。
poi word,excel 转换成 html
POI解析word2007文本及图片(已测试).doc
这是一个POI读取word 2003 和 word 2007的例子 是一个Eclipse工程 下载后直接导入工程 运行 src 目录下的 Test java 类即可 这个 rar 包中包含着 POI 读取word 2003 和 word 2007 所需要的 jar 包 也有需要读取的 ...
在网上找了很久相关的资料,都是不怎么完整的,我发了些时间终于整合了doc,excel转html,分享出来,代码不支持2007,相关的jar自己去网上找
使用poi将word文档转为html文档,亲测可用,上传之前专门测试过!有完整的代码,直接下载运行即可!
java实现word转html,基于poi3.9的。里面包含了jar包