java如何获取网页标题title？（用htmlparser）

抓取 java

赞赏 2017-07-09

原文网址：https://www.youyong.top/article/11596324c5436

java的高效是出了名的，作为SEO人员，如果能够从零开始实现一个搜索引擎，对以后的SEO工作肯定有很大的帮助。搜索引擎爬虫要收录一个网页，首先不就是获取网页内容来进行处理的嘛。

原文网址：https://www.youyong.top/article/11596324c5436

代码如下：

package htmlparserTest;
// 下载 htmlparser库并导入
import org.htmlparser.Parser;
import org.htmlparser.visitors.HtmlPage;
public class GetTitle {
    public static void main(String[] args) throws Exception {
        new GetTitle().getTitle("http://www.yangshengliang.com");
    }
private void getTitle(String url) throws Exception
{
    Parser parser = new Parser(url);
    //编码
    parser.setEncoding(parser.getEncoding());
    // 获取页面
    HtmlPage htmlpage = new HtmlPage(parser);
    parser.visitAllNodesWith(htmlpage);
    // 获取 title
    String title = htmlpage.getTitle();
    // 输出title
    System.out.println(title);
    }
}

程序经测试是没有问题的，使用的环境是java8，其他版本的java 下未做测试。

原文网址：https://www.youyong.top/article/11596324c5436

登陆后阅读全文

阅读 2929 赞赏 0 有用 2 没用 0 收藏 0

如果觉得文章对你有用，请随意赞赏！

java如何获取网页标题title？（用htmlparser）

相关文章

他的文章

java如何获取网页标题title？ （用htmlparser）

相关文章

他的文章

java如何获取网页标题title？（用htmlparser）