快精灵印艺坊 您身边的文印专家
广州名片 深圳名片 会员卡 贵宾卡 印刷 设计教程
产品展示 在线订购 会员中心 产品模板 设计指南 在线编辑
 首页 名片设计   CorelDRAW   Illustrator   AuotoCAD   Painter   其他软件   Photoshop   Fireworks   Flash  

 » 彩色名片
 » PVC卡
 » 彩色磁性卡
 » 彩页/画册
 » 个性印务
 » 彩色不干胶
 » 明信片
   » 明信片
   » 彩色书签
   » 门挂
 » 其他产品与服务
   » 创业锦囊
   » 办公用品
     » 信封、信纸
     » 便签纸、斜面纸砖
     » 无碳复印纸
   » 海报
   » 大篇幅印刷
     » KT板
     » 海报
     » 横幅

HTML如何向XML迁移

  当Internet世界正快速地把注重力聚焦到XML及其相关技术上时,一个问题产生了:以前用HTML构建的网站将怎么办?对于那些刚刚开始进行信息化建设的企业来说,理所当然地可以采用XML技术来设计网页;但对于那些HTML文件已经异常丰富的传统企业来说,要重新构建网站,不仅耗资巨大,而且拖的时间会很长。那么应该如何处理遗留下来的HTML资料呢?
  目前已经出现了一种新的技术――可扩展超文本标记语言(XHTML),它被认为是传统的HTML向XML迁移的理想工具。

  ■HTML要向XML迁移

  HTML是一种简朴的标记语言。HTML包含许多专用的标记(tags),而这些标记并不被所有的浏览器所支持。一些用来得到视觉效果的元素,如〈font〉标记,仅仅使得HTML文档体积变大。对于显示屏幕很小的PDA和手机等上网新设备, HTML也不能给予很好的支持。可以说,HTML不适合继承作为标准的页面和信息载体语言。
  怎样才能让以前积累下来的HTML文档在新的环境下继承发挥作用呢?向XML的过渡是解决之道。XML文档包含了清楚的文档结构信息,可以为各种需要灵活地输出所需要的格式。XML不是一个简朴的类似HTML和WML(无线标记语言)那样的预定义标记语言,而是一个让用户根据不同的数据和文档内容而制定标记的语言标准。用户可以为自己的文档建立比HTML更加正确而适当的标记。
  可扩展的样式表语言(XSL)提供了一种从存储的XML文件中输出各种所需的格式的途径。许多基于XSL的产品都能通过选用特定的样式表来从XML文件中输出能在各种浏览器中准确显示的HTML文档,而且同一个XML文档还可以使用其它的样式表,创建出能在无线设备中使用的WML格式的文档。设计者所要做的仅仅是创建这种格式文档的样式表,而对于文档的内容不需进行任何的修改,即“身体”是一样的,但“外套”可以自由地进行选择。

  ■HTML如何改装成XHTML

  传统HTML要向XML迁移,最麻烦的就是不轻易把HTML文档的内容和表现形式进行分离。那么怎样才能对HTML文档进行改装呢?一个可选择的方案是采用XHTML。XHTML结合了HTML和XML的长处,由于它和HTML很相似,所以可以很轻易地把以前的HTML进行简化和改装,形成新的XHTML文档,实现HTML向XHTML的过渡,这要比直接重新构建XML文档简朴得多。
  首先,XHTML对大小写标记敏感。在XHTML中定义元素的属性必须使用小写,那些曾经在HTML中用来增强文档可读性的有些技巧都不能用了。例如以前在HTML中定义元素属性时使用大写的字符,而详细的数值使用小写,这样可读性强一些,但是这种技巧在XHTML中就不能使用了。
  其次,XHTML严格地要求元素必须以标记开始和标记结束。以前常常能在HTML中使用的先打开标记,然后作用于其它内容的手法,现在也必须加以修改。在XHTML中,所有非空的元素都要求被关闭。以前常常被开发者使用的一个技巧就是在两个段落中使用〈p〉这个标记,而不是严格地按照在每一段的开始使用〈p〉而在结尾使用〈/p〉。另外,所有的XHTML属性都需要使用引号来表示,即〈table border = 2〉这样的语句需要改写成〈table border = “2”〉。
  最后要指出的一点是,〈head〉 和〈body〉这样的元素在XHTML中都是必须的,而且〈title〉这个元素必须作为第一个元素放在〈head〉段中。
  通过对HTML文档进行了这些改变,原来的HTML文件不仅能在HTML的浏览器上得到准确的显示,而且能用支持XML的软件来进行处理。

  ■HTML转变工具

  假如你的站点仅仅有很少的文档需要进行转变,即使采用手工的方式也能处理;但假如有几年累计下来的HTML文档需要转变,那么就需要寻找一个工具来帮助进行。在这方面有许多商业和免费的工具软件可以使用,它们既可以帮助进行转变而且可以直接编辑形成新型的XHTML格式的文件。
  HTML Tidy 是一个很基本但很有用的工具,可以运行在多种平台上。HTML Tidy可以用来清除HTML文件的标记错误(相对XHTML标准而言),并能重新格式化HTML文件,使之有更好的可读性。HTML Tidy已成为一个能把HTML向XHTML转变的多功能工具。
  HTML-Kit是一个免费的程序,能在许多平台上运行。它不仅能帮助进行HTML的编辑、格式化输出、合法性检查、预览和发布,而且还能在图形界面上进行HTML向XHTML的转变。在其用户界面上,有一个窗口显示源文件,另一个窗口显示转变后的标记语言结果,还有一个窗口显示出现的错误以及对XHTML进行改进的建议。

  ■直接向XML标准前进

  HTML经过改装后形成新的XHTML文档将不再有浏览和显示的麻烦。但是假如希望其内容能被运用到各个领域,那么可以考虑直接建立XML文档。这就需要在现存的HTML中把内容抽取出来,使得内容和表现形式的标记得到分离。
  XspLit是由Percussion Software公司推出的新工具。XspLit让Web开发者能把HTML文档转变成相应的XSL样式表。XspLit能创建一个包含格式定义的XML的DTD(文件类型定义)文件,还能使用静态的内容来创建一个XML样本文档。


返回类别: 教程
上一教程: XML在金融行业中应用的问题分析
下一教程: 如何得到XML文档大小

您可以阅读与"HTML如何向XML迁移"相关的教程:
· 如何在HTML中引用XML数据
· XMLHTTP Get HTML页面时的中文乱码之完全客户端Script解决方案
· 用JTidy转变html为xml
· 将XML文件链接至HTML网页
· 如何迅速通过XSL转变XML文件
    微笑服务 优质保证 索取样品