当前位置: 软件>C/C++软件
纯C语言实现的HTML5解析库 Gumbo
本文导语: Gumbo 是 Google 的一款用C语言实现的HTML5解析库,无需任何外部依赖。 目标及特征: 遵循 HTML5 规范 功能强大,可处理一些不规范的 HTML 标签 简单的 API 支持源位置和指针回到原始文本 轻巧、没有外部依赖 通过 html5lib-0.95...
Gumbo 是 Google 的一款用C语言实现的HTML5解析库,无需任何外部依赖。
目标及特征:
- 遵循 HTML5 规范
- 功能强大,可处理一些不规范的 HTML 标签
- 简单的 API
- 支持源位置和指针回到原始文本
- 轻巧、没有外部依赖
- 通过 html5lib-0.95 兼容测试
- 已在超过25亿个来自谷歌索引的页面中进行过测试
示例代码:
#include "gumbo.h" int main(int argc, char** argv) { GumboOutput* output = gumbo_parse(argv[1]); // Do stuff with output->root gumbo_destroy_output(&kGumboDefaultOptions, output); }