首页  ·  知识 ·  编程语言
java抓取网页内容--生成静态页面
网友  收集  Java  编辑:德仔   图片来源:网络
private static String getStaticPage(String surl) { nb
private static String getStaticPage(String surl) {

           String htmlContent = "";

           try {

              java.io.InputStream inputStream;

              java.net.URL url = new java.net.URL(surl);

              java.net.HttpURLConnection connection = (java.net.HttpURLConnection) url.openConnection();

              connection.connect();

              inputStream = connection.getInputStream();

              byte bytes[] = new byte[1024 * 2000];

              int index = 0;

              int count = inputStream.read(bytes, index, 1024 * 2000);

              while (count != -1) {

                  index += count;

                  count = inputStream.read(bytes, index, 1);

              }

              htmlContent = new String(bytes, "UTF-8");

              connection.disconnect();

           } catch (Exception ex) {

              ex.printStackTrace();

           }

           return htmlContent.trim();

       }


String src= getStaticPage(“http://www.google.com”);

       File file = new File(“d:\aa.html”);

       FileWriter resultFile = new FileWriter(file);

       PrintWriter myFile = new PrintWriter(resultFile);

       //写文件

       myFile.println(src);

       resultFile.close();

       myFile.close();

本文作者:网友 来源:网络收集
CIO之家 www.ciozj.com 微信公众号:imciow
   
免责声明:本站转载此文章旨在分享信息,不代表对其内容的完全认同。文章来源已尽可能注明,若涉及版权问题,请及时与我们联系,我们将积极配合处理。同时,我们无法对文章内容的真实性、准确性及完整性进行完全保证,对于因文章内容而产生的任何后果,本账号不承担法律责任。转载仅出于传播目的,读者应自行对内容进行核实与判断。请谨慎参考文章信息,一切责任由读者自行承担。
延伸阅读