InputStream.read()读取文件截断问题-IT家园

摘要

使用InputStream.read()读取文件的时候，出现文件内容截断的问题，下面是解决该问题的方法，可以作为参考！

最近在写一个MapReduce程序的时候,出现了读取HDFS文件截断的情况,代码如下:

//fs : FileSystemInputStream in = null;
byte[] b = new byte[1024 * 1024 * 64];
int len = 0;
try {  in = fs.open(new Path(fileName));  
     len = in.read(b);   
    } catch (Exception e) {    	
      e.printStackTrace();    
    } finally {    	
     try {    		
        in.close();    	
      } catch (IOException e) {    		
         e.printStackTrace();    	
      }    
    }
    return new String(b, 0, len);

理论上,bytes数组大小已经设置为了64MB, 远远大于要读取的文件,那为什么会出现这种情况呢？

一开始怀疑 InputStream.read() 方法导致截断,果然,改成用BufferedReader读取的方式就好用了。

BufferedReader reader = null;
StringBuilder sb = new StringBuilder();
try {    
    reader = new BufferedReader(new InputStreamReader(fs.open(new Path(fileName))));    
    String line = null;    
    while((line = reader.readLine()) != null) { 
        sb.append(line);    
     }    
  } catch (Exception ioe) {       
           System.out.println(fileName + " does't exist!");   
       } finally {       
                try {            
                    reader.close();        
                   } catch (IOException e) {           
                     System.out.println("Reader close failed");        
                   }   
         }   
     return sb.toString();
   }

但真实的原因真的是这样么？