HTML 使用Html Agility Pack从HTML BODY节点中提取内部文本

要使用Html Agility Pack从HTML BODY节点中提取内部文本,首先需要安装Html Agility Pack库,在C#项目中,可以通过NuGet包管理器安装。

HTML 使用Html Agility Pack从HTML BODY节点中提取内部文本
(图片来源网络,侵删)

安装完成后,可以使用以下步骤来提取HTML BODY节点中的内部文本:

1、引入命名空间:

using HtmlAgilityPack;

2、创建一个HtmlDocument对象,加载HTML内容:

var html = "<html><body>这是一个示例文本</body></html>";
var document = new HtmlDocument();
document.LoadHtml(html);

3、获取BODY节点:

var bodyNode = document.DocumentNode.SelectSingleNode("//body");

4、提取BODY节点中的内部文本:

var innerText = bodyNode.InnerText;
Console.WriteLine(innerText); // 输出: 这是一个示例文本

以下是完整的示例代码:

using System;
using HtmlAgilityPack;
namespace HtmlAgilityPackDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            var html = "<html><body>这是一个示例文本</body></html>";
            var document = new HtmlDocument();
            document.LoadHtml(html);
            var bodyNode = document.DocumentNode.SelectSingleNode("//body");
            var innerText = bodyNode.InnerText;
            Console.WriteLine(innerText); // 输出: 这是一个示例文本
        }
    }
}

原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/476315.html

(0)
未希新媒体运营
上一篇 2024-04-15 03:19
下一篇 2024-04-15 03:20

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

云产品限时秒杀。精选云产品高防服务器,20M大带宽限量抢购  >>点击进入