原文网址:https://www.youyong.top/article/11596324c5436
java的高效是出了名的,作为SEO人员,如果能够从零开始实现一个搜索引擎,对以后的SEO工作肯定有很大的帮助。搜索引擎爬虫要收录一个网页,首先不就是获取网页内容来进行处理的嘛。
原文网址:https://www.youyong.top/article/11596324c5436
java的高效是出了名的,作为SEO人员,如果能够从零开始实现一个搜索引擎,对以后的SEO工作肯定有很大的帮助。搜索引擎爬虫要收录一个网页,首先不就是获取网页内容来进行处理的嘛。
原文网址:https://www.youyong.top/article/11596324c5436
代码如下:
package htmlparserTest; // 下载 htmlparser库并导入 import org.htmlparser.Parser; import org.htmlparser.visitors.HtmlPage; public class GetTitle { public static void main(String[] args) throws Exception { new GetTitle().getTitle("http://www.yangshengliang.com"); } private void getTitle(String url) throws Exception { Parser parser = new Parser(url); //编码 parser.setEncoding(parser.getEncoding()); // 获取页面 HtmlPage htmlpage = new HtmlPage(parser); parser.visitAllNodesWith(htmlpage); // 获取 title String title = htmlpage.getTitle(); // 输出title System.out.println(title); } }
程序经测试是没有问题的,使用的环境是java8,其他版本的java 下未做测试。
共 0 条留言
Java虚拟机崩溃出现大量 hs_err_pid*.log 日志
6款程序员必备的开源中文汉字拼音转换及处理工具 (PHP Java .net)
jMeter: The target server failed to respond Connection reset
iPhone X 跌破发行价,苏宁200亿入股恒大 | 财经日日评
资深黄牛现身说法:iPhone X价格秒变不停,就像炒股一样
6款程序员必备的开源中文汉字拼音转换及处理工具 (PHP Java .net)
java如何获取网页标题title? (用htmlparser)
mysql: ERROR 1292 (22007): Truncated incorrect DOUBLE value:
手机扫一扫
分享文章