PHP 和 XML: 使用expat函数(二)

(编辑:jimmy 日期: 2025/1/17 浏览:2)

 PHP 和 XML: 使用expat函数(二)
  让我们看一下实际处理这个文档的PHP代码。



/*NewsBoy : News system for the web written in PHP by Justin Grant (Web: jusgrant.cjb.net or justin.host.za.net Mail: justin@glendale.net)25 March V0.0.2 Converted Newsboy to a PHP class, allowing the layout to be easily modified. Also added made the HTML that is genrated a little easier to read.24 March V0.0.1 Just completed the intial version, very rough and basic.*/
class newsboy { var $xml_parser; var $xml_file; var $html; var $open_tag ; var $close_tag ;
//Class Constructor
function newsboy() { $this->xml_parser = ""; $this->xml_file = ""; $this->html = ""; $this->open_tag = array(
//these are the default settings but they are quite easy to modify
"NEWSBOY" => "nn", "STORY" => " ", "DATE" => "", "SLUG" => " ", "TEXT" => "", "PIC" => "", "NEWLINE" => "" ); $this->close_tag = array( "NEWSBOY" => "
nnn", "STORY" => "", "DATE" => "", "SLUG" => "
", "TEXT" => "n", "PIC" => " "
" ); }
//Class Destructor (has to be invoked manually as PHP does not support destructors)

function destroy() { xml_parser_free($this->xml_parser); }
//Class Members
function concat($str) { $this->html .= $str; }
function startElement($parser, $name, $attrs) { //global $open_tag; if ($format= $this->open_tag[$name]) { $this->html .= $format; } }
function endElement($parser, $name) { global $close_tag; if ($format= $this->close_tag[$name]) { $this->html .= $format; } }
function characterData($parser, $data) { $this->html .= $data; }
/* function PIHandler($parser, $target, $data) { //switch (strtolower($target)){ // case "php": eval($data); // break; //} }*/
function parse() { $this->xml_parser = xml_parser_create(); xml_set_object($this->xml_parser, &$this); // use case-folding so we are sure to find the tag in $map_array
xml_parser_set_option($this->xml_parser, XML_OPTION_CASE_FOLDING, true); xml_set_element_handler($this->xml_parser, "startElement", "endElement"); xml_set_character_data_handler($this->xml_parser, "characterData");//xml_set_processing_instruction_handler($this->xml_parser, "PIHandler");
if (!($fp = fopen($this->xml_file, "r"))) { die("could not open XML input"); } while ($data = fread($fp, 4096)) { if (!xml_parse($this->xml_parser, $data, feof($fp))) { die(sprintf("XML error: %s at line %d", xml_error_string(xml_get_error_code($this->xml_parser)), xml_get_current_line_number($this->xml_parser))); } } }}
?>



--------------------------------------------------------------------------------

  在这个类的构造函数中,我创建了打开与关闭两个标记数组。数组的关键字与我后面将要分析的标记是
一样的,并且它们相应的值包含格式化打开与关闭标记的HTML代码。

  我定义了一个简单的类析构函数用来当我们不再需要它时释放XML 分析器。这个函数不得不手工调用,
因为PHP不支持当一个对象释放时自动调用类的析构函数。

  然后我定义了在XML文档中用来分析打开和关闭标记的主回调方法。我也定义了一个数据分析方法, 将
用于当打开和关闭标记中有数据时,对数据进行简单的格式化,后面我将向你演示如何将这些回调方法注册
到分析器中。

  在startElement和closeElement(当分析到一个打开或关闭标专时被分别调用)中使用 标记的名字
作为索引键值对相应的数组进行查询。如果那个键值存在,则返回值并且追加到类的'html' 属性的后面。
'html'属性将在以后我们真正显示文档内容的时候使用。

  characterData方法简单地将标记之间的值加到类的html属性的后面。

  被注释起来的叫PIHandler的方法是一个回调函数,我还未曾实现它。如果它存在的话,它将直接在XML
文档中处理php脚本。

  现在,让我解释一下主要的分析方法的调用,你猜一猜,parse()!!!

  第一行调用了函数xml_parser_create(),它将返回一个expat的xml分析器的实例,并且被保存在类的
属性&this->xml_parser中。

  下一步,我们需要用函数xml_set_object()来注册一个类方法的回调函数。

  我是这样使用的,xml_set_object($this->xml_parser, &$this)。我在第一个参数中指定了用
来保存xml 分析器的类属性,然后在第二个参数,我指定了PHP对象的实例地址。这个可以让分析器 知道全
部将要注册的回调函数,是在那个地址上指定类的实际的方法。这就象c或c++中的一个'引用传递',也有人
简单地叫做'引用变量'。

  在下一行,我调用了xml_parser_set_option()设置了一个xml分析器的属性,使用大小写折叠( case
folding)。大小写折叠只是告诉分析器知道,当我分析我的XML文档时我并不关心大小写敏感,但是 如果你
想使用大小写敏感来定义两个不同的标记,如或,你可以不设置它。

  通过使用xml_set_element_handler(),我指定了用于开始和结束标记的回调函数,名字是
"startElement"和"endElement"。

  接着,我使用xml_set_character_data_handler()来指定字符数据的处理句柄为名为
characterData()的回调函数。被注释的函数调用,xml_set_processing_instruction_handler(),
是一个我用于注册函数 PIHandler()的调用。PIHandler可以被包括在XML文档中处理php代码。

  其它的代码只是很简单地读XML文件并且分析它。如果一个错误发生,那么错误明细将返回,包括错误
发生的行号。