以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 XML基础 』  (http://bbs.xml.org.cn/list.asp?boardid=1)
----  如何简便地创建这样的 xml 文档  (http://bbs.xml.org.cn/dispbbs.asp?boardid=1&rootid=&id=43499)


--  作者:yoyota
--  发布时间:3/1/2007 8:58:00 AM

--  如何简便地创建这样的 xml 文档

请问有什么较直接的方法把下面的sgml格式转成要求的xml文档格式吗?
原文档格式是如下的sgml格式:
<DOC>
  <DOCID> nyt960108.0493 </DOCID>
  <STORYID cat=a pri=u> A5852 </STORYID>
  <SLUG fv=sci-z> BC-BALLOON-RACE-2ndTAKE- </SLUG>
  <DATE> 01-08 </DATE>
  <NWORDS> 0745 </NWORDS>
  <PREAMBLE>  BC-BALLOON-RACE-2ndTAKE-NYT  UNDATED: daylight hours.  </PREAMBLE>
  <TEXT>
    <p>      ......
    <p>      ......
  </TEXT>
  <TRAILER>  NYT-01-08-96 1751EST  </TRAILER>
</DOC>
<DOC>
  ......
</DOC>

现在想把这种格式转换成如下xml格式, 即给原来的元素属性加引号,另外给<TEXT>中标签<P>加</P>,使之成为完整的xml文档如下:
<DOC>
  <DOCID> nyt960108.0493 </DOCID>
  <STORYID cat="a" pri="u"> A5852 </STORYID>
  <SLUG fv="sci-z"> BC-BALLOON-RACE-2ndTAKE- </SLUG>
  <DATE> 01-08 </DATE>
  <NWORDS> 0745 </NWORDS>
  <PREAMBLE>  BC-BALLOON-RACE-2ndTAKE-NYT  UNDATED: daylight hours.  </PREAMBLE>
  <TEXT>
    <p>      ......
    <p>      ......
  </TEXT>
  <TRAILER>  NYT-01-08-96 1751EST  </TRAILER>
</DOC>

因为我对XML不熟悉,只能通过直接读取字符串再比较的方法进行,不知有什么好方法可以方便转化,最好还能够适应标签的变化,比如<TEXT>中的<P>换成了<SENTENCE>, 有没有什么工具或模版之类的可以直接修改的?
谢谢!


--  作者:fansx
--  发布时间:4/21/2007 9:56:00 AM

--  
假如能更详细点就更好了
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
62.500ms