Java自学者论坛

 找回密码
 立即注册

手机号码,快捷登录

恭喜Java自学者论坛(https://www.javazxz.com)已经为数万Java学习者服务超过8年了!积累会员资料超过10000G+
成为本站VIP会员,下载本站10000G+会员资源,会员资料板块,购买链接:点击进入购买VIP会员

JAVA高级面试进阶训练营视频教程

Java架构师系统进阶VIP课程

分布式高可用全栈开发微服务教程Go语言视频零基础入门到精通Java架构师3期(课件+源码)
Java开发全终端实战租房项目视频教程SpringBoot2.X入门到高级使用教程大数据培训第六期全套视频教程深度学习(CNN RNN GAN)算法原理Java亿级流量电商系统视频教程
互联网架构师视频教程年薪50万Spark2.0从入门到精通年薪50万!人工智能学习路线教程年薪50万大数据入门到精通学习路线年薪50万机器学习入门到精通教程
仿小米商城类app和小程序视频教程深度学习数据分析基础到实战最新黑马javaEE2.1就业课程从 0到JVM实战高手教程MySQL入门到精通教程
查看: 566|回复: 0

Hue整合Sqoop报空指针异常的解决方法

[复制链接]
  • TA的每日心情
    奋斗
    2024-4-6 11:05
  • 签到天数: 748 天

    [LV.9]以坛为家II

    2034

    主题

    2092

    帖子

    70万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    705612
    发表于 2021-7-12 13:47:43 | 显示全部楼层 |阅读模式

    hue是一个Apache基金会下的一个开源图形化管理工具,使用python语言开发,使用的框架是Django。而sqoop也是Apache的一个开源工具,是使用Java语言开发,主要用于进行hdfs和传统关系型数据库之间的数据传递。这两天在整合这两个工具的时候,遇到了一个问题,特此记录。

    Hue版本是3.9.0,Sqoop版本是1.99.6,也就是最新版的Sqoop2。

    把Hue和Sqoop安装好后,修改Hue配置文件,hue-3.9.0/desktop/conf/hue.ini

    找到Sqoop的配置项:把sqoop的请求路径改成正式的URL。

    # Sqoop server URL
    server_url=http://ip:12000/sqoop
    

    启动Hue、Sqoop,在Hue的管理页面中,可以新建、修改Sqoop的链接。但是在新建Sqoop的任务却报了错。

    查看Sqoop的日志:sqoop-1.99.6-bin-hadoop200/server/logs/catalina.out

    发现报了空指针异常:

    java.lang.NullPointerException
            at org.apache.sqoop.json.util.ConfigInputSerialization.restoreConfig(ConfigInputSerialization.java:160)
            at org.apache.sqoop.json.util.ConfigInputSerialization.restoreConfigList(ConfigInputSerialization.java:129)
            at org.apache.sqoop.json.JobBean.restoreJob(JobBean.java:179)
            at org.apache.sqoop.json.JobBean.restore(JobBean.java:159)
            at org.apache.sqoop.handler.JobRequestHandler.createUpdateJob(JobRequestHandler.java:169)
            at org.apache.sqoop.handler.JobRequestHandler.handleEvent(JobRequestHandler.java:106)
     org.apache.sqoop.server.v1.JobServlet.handlePostRequest(JobServlet.java:91)
            at org.apache.sqoop.server.SqoopProtocolServlet.doPost(SqoopProtocolServlet.java:63)
            at javax.servlet.http.HttpServlet.service(HttpServlet.java:643)
            at javax.servlet.http.HttpServlet.service(HttpServlet.java:723)
            at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:290)
            at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206)
            at org.apache.hadoop.security.authentication.server.Authentication
    

    找来Sqoop的源码,看到:

        for (int i = 0; i < inputs.size(); i++) {
          JSONObject input = (JSONObject) inputs.get(i);
          MInputType type = MInputType.valueOf((String) input.get(ConfigInputConstants.CONFIG_INPUT_TYPE));
          // 省略部分代码
          .......
          switch (type) {
          case STRING: {
            // 报错位置       
            long size = (Long) input.get(ConfigInputConstants.CONFIG_INPUT_SIZE);
            mInput = new MStringInput(name, sensitive.booleanValue(), editable, overrides, (short) size);
            break;
          }
        // 省略部分代码
        ........
    }
    

    ConfigInputConstants.CONFIG_INPUT_SIZE 是字符串常量“size”,看这个代码是在获取“size”的值的时候为空,null强转为Long类型的时候报错了。再根据报错信息往前看看JobBean类,这是在加载Hue传递过来的json数据,并设置到JobBean类中,下面是获取“from-config-values”的数据,也就是来源链接的相关信息了。

    .......
    static final String FROM_CONFIG_VALUES = "from-config-values";
    ......
    private MJob restoreJob(Object obj) {
    //省略部分代码
    ......
    JSONArray fromConfigJson = (JSONArray) object.get(FROM_CONFIG_VALUES);
    //省略部分代码
    ......
    // 报错点
    List<MConfig> fromConfig = restoreConfigList(fromConfigJson);
    
    //省略部分代码
    ......
    }
    

     从上面分析看来,是Hue传递过来的from链接配置项,即“from-config-values”项没有“size”字段或者获取到的数据为空造成这个错误的。

    而Sqoop关于这个接口的API:https://sqoop.apache.org/docs/1.99.3/RESTAPI.html#v1-job-post-create-job,给出的json格式是要求有“size”字段的。
    //省略部分
    ......    
    from-config-values: [
          {
            id: 2,
            inputs: [
              {
                id: 2,
                name: "fromJobConfig.inputDirectory",
                value: "hdfs%3A%2F%2Fvbsqoop-1.ent.cloudera.com%3A8020%2Fuser%2Froot%2Fjob1",
                type: "STRING",
                size: 255,
                sensitive: false
              }
            ],
            name: "fromJobConfig",
            type: "JOB"
          }
        ],
    //省略部分
    ......    
    

     来分析Hue是怎么使用这个接口的:hue-3.9.0/apps/sqoop/src/sqoop/api/job.py

     

    @never_cache
    def create_job(request):
    # 省略部分代码
    ...... d = json.loads(smart_str(request.POST['job'])) job = client.Job.from_dict(d) try: c = client.SqoopClient(conf.SERVER_URL.get(), request.user.username, request.LANGUAGE_CODE) response['job'] = c.create_job(job).to_dict() except RestException, e: response.update(handle_rest_exception(e, _('Could not create job.'))) except SqoopException, e: response['status'] = 100 response['errors'] = e.to_dict() return JsonResponse(response)

    最后看到了Hue对size进行了过滤处理:hue-3.9.0/apps/sqoop/src/sqoop/client/config.py

      def to_dict(self):
        d = {
          'id': self.id,
          'type': self.type,
          'name': self.name,
          'sensitive': self.sensitive,
        }
        if self.value:
          d['value'] = self.value
        if self.size != -1:
          d['size'] = self.size
        if self.values:
          d['values'] = ','.join(self.values)
        return d
    

    Hue把size=-1的情况全部设置成空,然后Sqoop获取不到size的值,报了一个NullPointerException。

    解决方法:修改config.py的to_dict方法,把size的过滤操作去掉就好了,如下:

      def to_dict(self):
        d = {
          'id': self.id,
          'type': self.type,
          'name': self.name,
          'sensitive': self.sensitive,
        }
        if self.value:
          d['value'] = self.value
        d['size'] = self.size
        if self.values:
          d['values'] = ','.join(self.values)
        return d
    

    如果这里把size设置成一个常量,那么可能会造成一个org.apache.sqoop.server.common.ServerError错误,其实就是Sqoop根据Hue传递过来的参数获取到的来源链接、目的链接

    或者是驱动配置跟Sqoop的不一致造成的。

     

    哎...今天够累的,签到来了1...
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|小黑屋|Java自学者论坛 ( 声明:本站文章及资料整理自互联网,用于Java自学者交流学习使用,对资料版权不负任何法律责任,若有侵权请及时联系客服屏蔽删除 )

    GMT+8, 2024-4-28 14:34 , Processed in 0.071629 second(s), 29 queries .

    Powered by Discuz! X3.4

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表