diff options
-rw-r--r-- | tests/test_parse.cpp | 357 |
1 files changed, 357 insertions, 0 deletions
diff --git a/tests/test_parse.cpp b/tests/test_parse.cpp new file mode 100644 index 0000000..81cd84f --- /dev/null +++ b/tests/test_parse.cpp @@ -0,0 +1,357 @@ +#include "common.hpp"
+
+TEST(parse_pi_skip)
+{
+ xml_document doc;
+ CHECK(doc.load("<?pi?><?pi value?>", parse_minimal));
+ CHECK(!doc.first_child());
+}
+
+TEST(parse_pi_parse)
+{
+ xml_document doc;
+ CHECK(doc.load("<?pi1?><?pi2 value?>", parse_minimal | parse_pi));
+
+ xml_node pi1 = doc.first_child();
+ xml_node pi2 = doc.last_child();
+
+ CHECK(pi1 != pi2);
+ CHECK(pi1.type() == node_pi);
+ CHECK_STRING(pi1.name(), "pi1");
+ CHECK_STRING(pi1.value(), "");
+ CHECK(pi2.type() == node_pi);
+ CHECK_STRING(pi2.name(), "pi2");
+ CHECK_STRING(pi2.value(), "value");
+}
+
+TEST(parse_pi_error)
+{
+ xml_document doc;
+
+ unsigned int flag_sets[] = {parse_minimal, parse_minimal | parse_pi};
+
+ for (unsigned int i = 0; i < sizeof(flag_sets) / sizeof(flag_sets[0]); ++i)
+ {
+ unsigned int flags = flag_sets[i];
+
+ CHECK(doc.load("<?", flags).status == status_bad_pi);
+ CHECK(doc.load("<?#?>", flags).status == status_bad_pi);
+ CHECK(doc.load("<?name", flags).status == status_bad_pi);
+ CHECK(doc.load("<?name>", flags).status == status_bad_pi);
+ CHECK(doc.load("<?name ?", flags).status == status_bad_pi);
+ }
+}
+
+TEST(parse_comments_skip)
+{
+ xml_document doc;
+ CHECK(doc.load("<!----><!--value-->", parse_minimal));
+ CHECK(!doc.first_child());
+}
+
+TEST(parse_comments_parse)
+{
+ xml_document doc;
+ CHECK(doc.load("<!----><!--value-->", parse_minimal | parse_comments));
+
+ xml_node c1 = doc.first_child();
+ xml_node c2 = doc.last_child();
+
+ CHECK(c1 != c2);
+ CHECK(c1.type() == node_comment);
+ CHECK_STRING(c1.name(), "");
+ CHECK_STRING(c1.value(), "");
+ CHECK(c2.type() == node_comment);
+ CHECK_STRING(c2.name(), "");
+ CHECK_STRING(c2.value(), "value");
+}
+
+TEST(parse_comments_parse_no_eol)
+{
+ xml_document doc;
+ CHECK(doc.load("<!--\r\rval1\rval2\r\nval3\nval4\r\r-->", parse_minimal | parse_comments));
+
+ xml_node c = doc.first_child();
+ CHECK(c.type() == node_comment);
+ CHECK_STRING(c.value(), "\r\rval1\rval2\r\nval3\nval4\r\r");
+}
+
+TEST(parse_comments_parse_eol)
+{
+ xml_document doc;
+ CHECK(doc.load("<!--\r\rval1\rval2\r\nval3\nval4\r\r-->", parse_minimal | parse_comments | parse_eol));
+
+ xml_node c = doc.first_child();
+ CHECK(c.type() == node_comment);
+ CHECK_STRING(c.value(), "\n\nval1\nval2\nval3\nval4\n\n");
+}
+
+TEST(parse_comments_error)
+{
+ xml_document doc;
+
+ unsigned int flag_sets[] = {parse_minimal, parse_minimal | parse_comments};
+
+ for (unsigned int i = 0; i < sizeof(flag_sets) / sizeof(flag_sets[0]); ++i)
+ {
+ unsigned int flags = flag_sets[i];
+
+ CHECK(doc.load("<!-", flags).status == status_bad_comment);
+ CHECK(doc.load("<!--", flags).status == status_bad_comment);
+ CHECK(doc.load("<!--v", flags).status == status_bad_comment);
+ CHECK(doc.load("<!-->", flags).status == status_bad_comment);
+ CHECK(doc.load("<!--->", flags).status == status_bad_comment);
+ CHECK(doc.load("<!-- <!-- --><!- -->", flags).status == status_bad_comment);
+ }
+}
+
+TEST(parse_cdata_skip)
+{
+ xml_document doc;
+ CHECK(doc.load("<![CDATA[]]><![CDATA[value]]>", parse_minimal));
+ CHECK(!doc.first_child());
+}
+
+TEST(parse_cdata_parse)
+{
+ xml_document doc;
+ CHECK(doc.load("<![CDATA[]]><![CDATA[value]]>", parse_minimal | parse_cdata));
+
+ xml_node c1 = doc.first_child();
+ xml_node c2 = doc.last_child();
+
+ CHECK(c1 != c2);
+ CHECK(c1.type() == node_cdata);
+ CHECK_STRING(c1.name(), "");
+ CHECK_STRING(c1.value(), "");
+ CHECK(c2.type() == node_cdata);
+ CHECK_STRING(c2.name(), "");
+ CHECK_STRING(c2.value(), "value");
+}
+
+TEST(parse_cdata_parse_no_eol)
+{
+ xml_document doc;
+ CHECK(doc.load("<![CDATA[\r\rval1\rval2\r\nval3\nval4\r\r]]>", parse_minimal | parse_cdata));
+
+ xml_node c = doc.first_child();
+ CHECK(c.type() == node_cdata);
+ CHECK_STRING(c.value(), "\r\rval1\rval2\r\nval3\nval4\r\r");
+}
+
+TEST(parse_cdata_parse_eol)
+{
+ xml_document doc;
+ CHECK(doc.load("<![CDATA[\r\rval1\rval2\r\nval3\nval4\r\r]]>", parse_minimal | parse_cdata | parse_eol));
+
+ xml_node c = doc.first_child();
+ CHECK(c.type() == node_cdata);
+ CHECK_STRING(c.value(), "\n\nval1\nval2\nval3\nval4\n\n");
+}
+
+TEST(parse_cdata_error)
+{
+ xml_document doc;
+
+ unsigned int flag_sets[] = {parse_minimal, parse_minimal | parse_cdata};
+
+ for (unsigned int i = 0; i < sizeof(flag_sets) / sizeof(flag_sets[0]); ++i)
+ {
+ unsigned int flags = flag_sets[i];
+
+ CHECK(doc.load("<![", flags).status == status_bad_cdata);
+ CHECK(doc.load("<![C", flags).status == status_bad_cdata);
+ CHECK(doc.load("<![CD", flags).status == status_bad_cdata);
+ CHECK(doc.load("<![CDA", flags).status == status_bad_cdata);
+ CHECK(doc.load("<![CDAT", flags).status == status_bad_cdata);
+ CHECK(doc.load("<![CDATA", flags).status == status_bad_cdata);
+ CHECK(doc.load("<![CDATA[", flags).status == status_bad_cdata);
+ CHECK(doc.load("<![CDATA[]", flags).status == status_bad_cdata);
+ CHECK(doc.load("<![CDATA[>", flags).status == status_bad_cdata);
+ CHECK(doc.load("<![CDATA[ <![CDATA[]]><![CDATA ]]>", flags).status == status_bad_cdata);
+ }
+}
+
+TEST(parse_ws_pcdata_skip)
+{
+ xml_document doc;
+ CHECK(doc.load(" ", parse_minimal));
+ CHECK(!doc.first_child());
+
+ CHECK(doc.load("<root> <node> </node> </root>", parse_minimal));
+
+ xml_node root = doc.child("root");
+
+ CHECK(root.first_child() == root.last_child());
+ CHECK(!root.first_child().first_child());
+}
+
+TEST(parse_ws_pcdata_parse)
+{
+ xml_document doc;
+ CHECK(doc.load("<root> <node> </node> </root>", parse_minimal | parse_ws_pcdata));
+
+ xml_node root = doc.child("root");
+
+ xml_node c1 = root.first_child();
+ xml_node c2 = c1.next_sibling();
+ xml_node c3 = c2.next_sibling();
+
+ CHECK(c3 == root.last_child());
+
+ CHECK(c1.type() == node_pcdata);
+ CHECK_STRING(c1.value(), " ");
+ CHECK(c3.type() == node_pcdata);
+ CHECK_STRING(c3.value(), " ");
+
+ CHECK(c2.first_child() == c2.last_child());
+ CHECK(c2.first_child().type() == node_pcdata);
+ CHECK_STRING(c2.first_child().value(), " ");
+}
+
+TEST(parse_pcdata_no_eol)
+{
+ xml_document doc;
+ CHECK(doc.load("<root>\r\rval1\rval2\r\nval3\nval4\r\r</root>", parse_minimal));
+
+ CHECK_STRING(doc.child_value("root"), "\r\rval1\rval2\r\nval3\nval4\r\r");
+}
+
+TEST(parse_pcdata_eol)
+{
+ xml_document doc;
+ CHECK(doc.load("<root>\r\rval1\rval2\r\nval3\nval4\r\r</root>", parse_minimal | parse_eol));
+
+ CHECK_STRING(doc.child_value("root"), "\n\nval1\nval2\nval3\nval4\n\n");
+}
+
+TEST(parse_pcdata_skip_ext)
+{
+ xml_document doc;
+ CHECK(doc.load("pre<root/>post", parse_minimal));
+ CHECK(doc.first_child() == doc.last_child());
+ CHECK(doc.first_child().type() == node_element);
+}
+
+TEST(parse_escapes_skip)
+{
+ xml_document doc;
+ CHECK(doc.load("<node id='<>&'"'><>&'"</node>", parse_minimal));
+ CHECK_STRING(doc.child("node").attribute("id").value(), "<>&'"");
+}
+
+TEST(parse_escapes_parse)
+{
+ xml_document doc;
+ CHECK(doc.load("<node id='<>&'"'><>&'"</node>", parse_minimal | parse_escapes));
+ CHECK_STRING(doc.child_value("node"), "<>&'\"");
+ CHECK_STRING(doc.child("node").attribute("id").value(), "<>&'\"");
+}
+
+TEST(parse_escapes_code)
+{
+ xml_document doc;
+ CHECK(doc.load("<node>  </node>", parse_minimal | parse_escapes));
+ CHECK_STRING(doc.child_value("node"), "\01 ");
+}
+
+TEST(parse_escapes_unicode)
+{
+ xml_document doc;
+ CHECK(doc.load("<node>γγ</node>", parse_minimal | parse_escapes));
+ CHECK_STRING(doc.child_value("node"), "\xce\xb3\xce\xb3");
+}
+
+TEST(parse_escapes_error)
+{
+ xml_document doc;
+ CHECK(doc.load("<node>g;&#ab;&#quot</node>", parse_minimal | parse_escapes));
+ CHECK_STRING(doc.child_value("node"), "g;&#ab;&#quot");
+}
+
+TEST(parse_attribute_quot)
+{
+ xml_document doc;
+ CHECK(doc.load("<node id1='v1' id2=\"v2\"/>", parse_minimal));
+ CHECK_STRING(doc.child("node").attribute("id1").value(), "v1");
+ CHECK_STRING(doc.child("node").attribute("id2").value(), "v2");
+}
+
+TEST(parse_attribute_no_eol_no_wconv)
+{
+ xml_document doc;
+ CHECK(doc.load("<node id=' \t\r\rval1 \rval2\r\nval3\nval4\r\r'/>", parse_minimal));
+ CHECK_STRING(doc.child("node").attribute("id").value(), " \t\r\rval1 \rval2\r\nval3\nval4\r\r");
+}
+
+TEST(parse_attribute_eol_no_wconv)
+{
+ xml_document doc;
+ CHECK(doc.load("<node id=' \t\r\rval1 \rval2\r\nval3\nval4\r\r'/>", parse_minimal | parse_eol));
+ CHECK_STRING(doc.child("node").attribute("id").value(), " \t\n\nval1 \nval2\nval3\nval4\n\n");
+}
+
+TEST(parse_attribute_no_eol_wconv)
+{
+ xml_document doc;
+ CHECK(doc.load("<node id=' \t\r\rval1 \rval2\r\nval3\nval4\r\r'/>", parse_minimal | parse_wconv_attribute));
+ CHECK_STRING(doc.child("node").attribute("id").value(), " val1 val2 val3 val4 ");
+}
+
+TEST(parse_attribute_eol_wconv)
+{
+ xml_document doc;
+ CHECK(doc.load("<node id=' \t\r\rval1 \rval2\r\nval3\nval4\r\r'/>", parse_minimal | parse_eol | parse_wconv_attribute));
+ CHECK_STRING(doc.child("node").attribute("id").value(), " val1 val2 val3 val4 ");
+}
+
+TEST(parse_attribute_wnorm)
+{
+ xml_document doc;
+ CHECK(doc.load("<node id=' \t\r\rval1 \rval2\r\nval3\nval4\r\r'/>", parse_minimal | parse_wnorm_attribute));
+ CHECK_STRING(doc.child("node").attribute("id").value(), "val1 val2 val3 val4");
+}
+
+TEST(parse_attribute_error)
+{
+ xml_document doc;
+ CHECK(doc.load("<node id/>", parse_minimal).status == status_bad_attribute);
+ CHECK(doc.load("<node id=/>", parse_minimal).status == status_bad_attribute);
+ CHECK(doc.load("<node id='/>", parse_minimal).status == status_bad_attribute);
+ CHECK(doc.load("<node id=\"/>", parse_minimal).status == status_bad_attribute);
+ CHECK(doc.load("<node id=\"'/>", parse_minimal).status == status_bad_attribute);
+ CHECK(doc.load("<node id='\"/>", parse_minimal).status == status_bad_attribute);
+ CHECK(doc.load("<node id='\"/>", parse_minimal).status == status_bad_attribute);
+}
+
+TEST(parse_tag_single)
+{
+ xml_document doc;
+ CHECK(doc.load("<node/><node /><node\n/>", parse_minimal));
+ CHECK_NODE(doc, "<node /><node /><node />");
+}
+
+TEST(parse_tag_hierarchy)
+{
+ xml_document doc;
+ CHECK(doc.load("<node><n1><n2/></n1><n3><n4><n5></n5></n4></n3 \r\n></node>", parse_minimal));
+ CHECK_NODE(doc, "<node><n1><n2 /></n1><n3><n4><n5 /></n4></n3></node>");
+}
+
+TEST(parse_tag_error)
+{
+ xml_document doc;
+ CHECK(doc.load("<", parse_minimal).status == status_unrecognized_tag);
+ CHECK(doc.load("<#", parse_minimal).status == status_unrecognized_tag);
+ CHECK(doc.load("<node#", parse_minimal).status == status_bad_start_element);
+ CHECK(doc.load("<node", parse_minimal).status == status_bad_start_element);
+ CHECK(doc.load("<node/", parse_minimal).status == status_bad_start_element);
+ CHECK(doc.load("<node/ >", parse_minimal).status == status_bad_start_element);
+ CHECK(doc.load("</ node>", parse_minimal).status == status_end_element_mismatch);
+ CHECK(doc.load("</node", parse_minimal).status == status_end_element_mismatch);
+ CHECK(doc.load("</node ", parse_minimal).status == status_end_element_mismatch);
+ CHECK(doc.load("<node></ node>", parse_minimal).status == status_end_element_mismatch);
+ CHECK(doc.load("<node></node", parse_minimal).status == status_bad_end_element);
+ CHECK(doc.load("<node></node ", parse_minimal).status == status_bad_end_element);
+ CHECK(doc.load("<node></nodes>", parse_minimal).status == status_end_element_mismatch);
+}
|