java如何获取网页标题title? (用htmlparser)

赞赏 2017-07-09

java的高效是出了名的,作为SEO人员,如果能够从零开始实现一个搜索引擎,对以后的SEO工作肯定有很大的帮助。搜索引擎爬虫要收录一个网页,首先不就是获取网页内容来进行处理的嘛。


代码如下:

package htmlparserTest;
// 下载 htmlparser库并导入
import org.htmlparser.Parser;
import org.htmlparser.visitors.HtmlPage;
public class GetTitle {
    public static void main(String[] args) throws Exception {
        new GetTitle().getTitle("http://www.yangshengliang.com");
    }
private void getTitle(String url) throws Exception
{
    Parser parser = new Parser(url);
    //编码
    parser.setEncoding(parser.getEncoding());
    // 获取页面
    HtmlPage htmlpage = new HtmlPage(parser);
    parser.visitAllNodesWith(htmlpage);
    // 获取 title
    String title = htmlpage.getTitle();
    // 输出title
    System.out.println(title);
    }
}

程序经测试是没有问题的,使用的环境是java8,其他版本的java 下未做测试。

登陆后阅读全文
阅读 2499 赞赏 0 有用 2 没用 0 收藏 0 分享

   



0 条留言

相关文章

JAVA 中原生的 socket 通信机制

Java虚拟机崩溃出现大量 hs_err_pid*.log 日志

大前端开发者需要了解的基础编译原理和语言知识

最近5年133个Java面试问题列表

Java 老矣,尚能饭否?

6款程序员必备的开源中文汉字拼音转换及处理工具 (PHP Java .net)

jMeter: The target server failed to respond Connection reset

快速上手 Kotlin 的 11 招

JAVA NIO 一步步构建I/O多路复用的请求模型

Sql性能优化梳理

有料推荐

这世界欠我一个这样的老公!

高校学生模仿“世界名画”摆拍,可以说是戏精本精了

iPhone X 跌破发行价,苏宁200亿入股恒大 | 财经日日评

果然是高手!这次在日本,特朗普竹杠敲得不是一般狠

资深黄牛现身说法:iPhone X价格秒变不停,就像炒股一样

长一样的双胞胎也能识别?蚂蚁金服发布「眼纹识别」技术

苏联是怎么被阿富汗拖垮的?

美团或入局「分时租赁」共享汽车,王兴要大笔投入「泛出行」领域了? | 36氪独家

你或许被“一盘番茄炒蛋”刷屏了,但有人辛酸,有人质疑

iPhone X发售前夜,黄牛与苹果公司的不安

他的文章

JAVA NIO 一步步构建I/O多路复用的请求模型

JAVA 中原生的 socket 通信机制

6款程序员必备的开源中文汉字拼音转换及处理工具 (PHP Java .net)

java如何获取网页标题title? (用htmlparser)

Tomcat9配置HTTP2的流程

快速上手 Kotlin 的 11 招

为什么我要改用Kotlin

比特币装逼指南

printf %8s %4s %-12s 这个数字是啥?

mysql: ERROR 1292 (22007): Truncated incorrect DOUBLE value:

手机扫一扫
分享文章