要使用Html Agility Pack从HTML BODY节点中提取内部文本,首先需要安装Html Agility Pack库,在C#项目中,可以通过NuGet包管理器安装。
(图片来源网络,侵删)
安装完成后,可以使用以下步骤来提取HTML BODY节点中的内部文本:
1、引入命名空间:
using HtmlAgilityPack;
2、创建一个HtmlDocument对象,加载HTML内容:
var html = "<html><body>这是一个示例文本</body></html>"; var document = new HtmlDocument(); document.LoadHtml(html);
3、获取BODY节点:
var bodyNode = document.DocumentNode.SelectSingleNode("//body");
4、提取BODY节点中的内部文本:
var innerText = bodyNode.InnerText; Console.WriteLine(innerText); // 输出: 这是一个示例文本
以下是完整的示例代码:
using System; using HtmlAgilityPack; namespace HtmlAgilityPackDemo { class Program { static void Main(string[] args) { var html = "<html><body>这是一个示例文本</body></html>"; var document = new HtmlDocument(); document.LoadHtml(html); var bodyNode = document.DocumentNode.SelectSingleNode("//body"); var innerText = bodyNode.InnerText; Console.WriteLine(innerText); // 输出: 这是一个示例文本 } } }
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/476315.html