Java自学者论坛

 找回密码
 立即注册

手机号码,快捷登录

恭喜Java自学者论坛(https://www.javazxz.com)已经为数万Java学习者服务超过8年了!积累会员资料超过10000G+
成为本站VIP会员,下载本站10000G+会员资源,会员资料板块,购买链接:点击进入购买VIP会员

JAVA高级面试进阶训练营视频教程

Java架构师系统进阶VIP课程

分布式高可用全栈开发微服务教程Go语言视频零基础入门到精通Java架构师3期(课件+源码)
Java开发全终端实战租房项目视频教程SpringBoot2.X入门到高级使用教程大数据培训第六期全套视频教程深度学习(CNN RNN GAN)算法原理Java亿级流量电商系统视频教程
互联网架构师视频教程年薪50万Spark2.0从入门到精通年薪50万!人工智能学习路线教程年薪50万大数据入门到精通学习路线年薪50万机器学习入门到精通教程
仿小米商城类app和小程序视频教程深度学习数据分析基础到实战最新黑马javaEE2.1就业课程从 0到JVM实战高手教程MySQL入门到精通教程
查看: 390|回复: 0

Java读取word文档解决方案

[复制链接]
  • TA的每日心情
    奋斗
    2024-11-24 15:47
  • 签到天数: 804 天

    [LV.10]以坛为家III

    2053

    主题

    2111

    帖子

    72万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    726782
    发表于 2021-6-16 01:48:08 | 显示全部楼层 |阅读模式

          java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。

     

    ----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。

     

    ----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。

           1、采用字节的形式读取rtf模板内容

           2、将可变的内容字符串转为rtf编码

           3、替换原文中的可变部分,形成新的rtf文档

     

    主要程序如下:

    /**

     * 将制定的字符串转换为rtf编码

     */

    public String bin2hex(String bin) {
            char[] digital = "0123456789ABCDEF".toCharArray();
            StringBuffer sb = new StringBuffer("");
            byte[] bs = bin.getBytes();
            int bit;
            for (int i = 0; i < bs.length;i++) {
                bit = (bs & 0x0f0) >> 4;

                sb.append("\\'");
                sb.append(digital[bit]);
                bit = bs & 0x0f;
                sb.append(digital[bit]);
            }
            return sb.toString();
        }

     

    /**

     * 字节形式读取rtf模板内容

     */

    public String readByteRtf(InputStream ins, String path){

       String sourcecontent = "";
      try{
        ins = new FileInputStream(path);
        byte[] b = new byte[1024];
              if (ins == null) {
                   System.out.println("源模板文件不存在");
              }
              int bytesRead = 0;
              while (true) {
                  bytesRead = ins.read(b, 0, 1024); // return final read bytes counts
                  if(bytesRead == -1) {// end of InputStream
                   System.out.println("读取模板文件结束");
                   break;
                  }
                  sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes
               }
      }catch(Exception e){
       e.printStackTrace();
      }

    }

     

          以上为核心代码,剩余部分就是替换,从新组装java中的String.replace(oldstr,newstr);方法可以实现,在这就不贴了。源代码部分详见附件。运行源代码前提:

     

    c盘创建YQ目录,将附件中"模板.rtf"复制到YQ目录之下,运行OpreatorRTF.java文件即可,就会在YQ目录下生成文件名如:21时15分19秒_cheney_记录.rtf 的文件。。。。。文件名是在程序中指定的呵呵。由于是由商业软件中拆分出的demo所以只是将自己原来的写的程序分离,合并在一个java文件中,所以有的方法在示例程序中看似多余,没有必要那么麻烦。

     

         对于替换部分需要循环的特例程序,我不好拆分,里面很容易暴露商业软件的东西,所以就不贴了,有需要的话可以加我QQ或者MSN,一起讨论呵呵。附件传了半天也没有传上去,没有办法只有这样搞了呵呵。模板文件附件无法存放,需要的直接联系呵呵。其实直接看以下的java程序部分,就会明白

     

    /**

     * 以下部分是java源代码

     */

     

     

    package com;

     

    import java.io.File;

    import java.io.FileInputStream;

    import java.io.FileWriter;

    import java.io.IOException;

    import java.io.InputStream;

    import java.io.PrintWriter;

    import java.text.SimpleDateFormat;

    import java.util.Date;

     

    public class OperatorRTF {

     

    /**

     * 字符串转换为rtf编码

     * @param content

     * @return

     */

    public String strToRtf(String content){

    char[] digital = "0123456789ABCDEF".toCharArray();

            StringBuffer sb = new StringBuffer("");

            byte[] bs = content.getBytes();

            int bit;

            for (int i = 0; i < bs.length; i++) {

                bit = (bs & 0x0f0) >> 4;

             sb.append("\\'");

                sb.append(digital[bit]);

                bit = bs & 0x0f;

                sb.append(digital[bit]);

            }

            return sb.toString();

    }

     

    /**

     * 替换文档的可变部分

     * @param content

     * @param replacecontent

     * @param flag

     * @return

     */

    public String replaceRTF(String content,String replacecontent,int flag){

    String rc = strToRtf(replacecontent);

    String target = "";

    /*if(flag==0){

    target = content.replace("$time$",rc);

    }*/

    if(flag==0){

    target = content.replace("$timetop$",rc);

    }

    if(flag==1){

    target = content.replace("$info$",rc);

    }

    if(flag==2){

    target = content.replace("$idea$",rc);

    }

    if(flag==3){

    target = content.replace("$advice$",rc);

    }

    if(flag==4){

    target = content.replace("$infosend$",rc);

    }

    return target;

    }

     

    /**

     * 获取文件路径

     * @param flag

     * @return

     */

    public String getSavePath() {

     

    String path = "C:\\YQ";

     

    File fDirecotry = new File(path);

    if (!fDirecotry.exists()) {

    fDirecotry.mkdirs();

    }

    return path;

    }

     

    /**

     * 半角转为全角

     */

    public String ToSBC(String input){

        char[] c = input.toCharArray();

        for (int i = 0; i < c.length; i++){

            if (c == 32){

                c = (char) 12288;

                continue;

            }

            if (c < 127){

             c = (char) (c + 65248);

            }

        }

        return new String(c);

    }

     

    public void rgModel(String username, String content) {

    // TODO Auto-generated method stub

    /*  构建生成文件名 targetname:12时10分23秒_username_记录.rtf */

    Date current=new Date();

            SimpleDateFormat sdf=new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    String targetname = sdf.format(current).substring(11,13) + "时";

    targetname += sdf.format(current).substring(14,16) + "分";

    targetname += sdf.format(current).substring(17,19) + "秒";

    targetname += "_" + username +"_记录.rtf";

     

    /* 字节形式读取模板文件内容,将结果转为字符串 */

    String strpath = getSavePath();

    String sourname = strpath+"\\"+"模板.rtf";

    String sourcecontent = "";

    InputStream ins = null;

    try{

     ins = new FileInputStream(sourname);

     byte[] b = new byte[1024];

             if (ins == null) {

                  System.out.println("源模板文件不存在");

             }

             int bytesRead = 0;

             while (true) {

                 bytesRead = ins.read(b, 0, 1024); // return final read bytes counts

                 if(bytesRead == -1) {// end of InputStream

                  System.out.println("读取模板文件结束");

                  break;

                 }

                 sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes

              }

    }catch(Exception e){

    e.printStackTrace();

    }

    /* 修改变化部分 */

    String targetcontent = "";

    /**

     * 拆分之后的数组元素与模板中的标识符对应关系

     * array[0]:timetop    

     * array[1]:info

     * array[2]:idea

     * array[3]:advice

     * array[4]:infosend

     */

    String array[] = content.split("~");

    /**

     * 2008年11月27日:更新模板之后时间无需自动填充

     */

    /*String nowtime = sdf.format(current).substring(0,4) + "年";

    nowtime += sdf.format(current).substring(5,7) + "月";

    nowtime += sdf.format(current).substring(8,10) + "日";*/

    for(int i=0;i<array.length;i++){

    /*if(i==0){

    targetcontent = documentDoc.replaceRTF(sourcecontent,nowtime,i);

    }else{

    targetcontent = documentDoc.replaceRTF(targetcontent,array[i-1],i);

    }*/

    if(i==0){

    targetcontent = replaceRTF(sourcecontent, array, i);

    }else{

    targetcontent = replaceRTF(targetcontent, array, i);

    }

     

    }

    /* 结果输出保存到文件 */

    try {

    FileWriter fw = new FileWriter(getSavePath()+"\\" + targetname,true);

                PrintWriter out = new PrintWriter(fw);

                if(targetcontent.equals("")||targetcontent==""){

                 out.println(sourcecontent);

                }else{

                 out.println(targetcontent);

                }

                out.close();

                fw.close();

                System.out.println(getSavePath()+"  该目录下生成文件" + targetname + " 成功");

    } catch (IOException e) {

    // TODO Auto-generated catch block

    e.printStackTrace();

    }

    }

     

     

     

     

    public static void main(String[] args) {

    // TODO Auto-generated method stub

    OperatorRTF oRTF = new OperatorRTF();

    /**

     * 被替换内容以"~"符号分割,处理的时候将其拆分为数组即可

     */

    String content = "2008年10月12日9时-2008年10月12日6时~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法";

    oRTF.rgModel("cheney",content);

     

    }

     

    }

     

     

     

     
    哎...今天够累的,签到来了1...
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|小黑屋|Java自学者论坛 ( 声明:本站文章及资料整理自互联网,用于Java自学者交流学习使用,对资料版权不负任何法律责任,若有侵权请及时联系客服屏蔽删除 )

    GMT+8, 2025-2-2 04:51 , Processed in 0.057273 second(s), 28 queries .

    Powered by Discuz! X3.4

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表