新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 关于 XML 的一般性技术讨论,提供 XML入门资料 和 XML教程
    [返回] 计算机科学论坛XML.ORG.CN讨论区 - XML技术『 XML基础 』 → 怎么利用XML提取HTML中的中文 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 3714 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 怎么利用XML提取HTML中的中文 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     zoie 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:1
      积分:56
      门派:XML.ORG.CN
      注册:2007/11/10

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zoie发送一个短消息 把zoie加入好友 查看zoie的个人资料 搜索zoie在『 XML基础 』的所有贴子 引用回复这个贴子 回复这个贴子 查看zoie的博客楼主
    发贴心情 怎么利用XML提取HTML中的中文


    初学XML,想利用XMLHTTTP从诸如google的页面上提取所要的汉字,请问怎么做到呢?

    ps:可以做到全部显示google源代码,但是只要其中的如<title>...</title>之间的汉字,怎么做到呢?


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/11/10 19:07:00
     
     Qr 帅哥哟,离线,有人找我吗?
      
      
      威望:9
      等级:博士二年级(版主)
      文章:4392
      积分:29981
      门派:XML.ORG.CN
      注册:2004/5/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Qr发送一个短消息 把Qr加入好友 查看Qr的个人资料 搜索Qr在『 XML基础 』的所有贴子 访问Qr的主页 引用回复这个贴子 回复这个贴子 查看Qr的博客2
    发贴心情 
    用javascript就可以,getElementsByTagName("title")

    ----------------------------------------------
    没人帮忙,那就靠自己,自己才是最好的老师!本人拒绝回答通过站内短消息提出的问题!

    blog:http://Qr.blogger.org.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/11/10 19:55:00
     
     zoie 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:1
      积分:56
      门派:XML.ORG.CN
      注册:2007/11/10

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zoie发送一个短消息 把zoie加入好友 查看zoie的个人资料 搜索zoie在『 XML基础 』的所有贴子 引用回复这个贴子 回复这个贴子 查看zoie的博客3
    发贴心情 
    谢谢ls。

    查到一个用vbscript写成的可显示baidu源码的程序,如果用javascript来做应该怎么写?(语法学的不好,55555555):

    -------------------
    <html>

    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=gb2312">

    </head>

    <body>
    <div id="demo"> <div style="width: 677; height: 70">

    </body>

    </html>
    <script language=vbscript>
     
     
    sub b3_onclick  
      Dim objXMLHTTP, xml
      Set xml = CreateObject("Microsoft.XMLHTTP")
      
      xml.Open "GET", "http://www.baidu.com/", False
      ' Pull the data from the web page
      xml.Send
      'demo.innerhtml= xml.responseText
      'demo.innertext= xml.responseText
      demo.innertext= bytes2BSTR(xml.responsebody)
      Set xml = Nothing
    end sub

    sub d1_select

    end sub

    Function bytes2BSTR(vIn)
        Dim strReturn
        Dim I, ThisCharCode, NextCharCode
        strReturn = ""
        For I = 1 To LenB(vIn)
            ThisCharCode = AscB(MidB(vIn, I, 1))
            If ThisCharCode < &H80 Then
                strReturn = strReturn & Chr(ThisCharCode)
            Else
                NextCharCode = AscB(MidB(vIn, I + 1, 1))
                strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
                I = I + 1
            End If
        Next
        bytes2BSTR = strReturn
    End Function

    </script>
    <input type="button" value="获取html源码" name="B3">

    ---------------------------

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/11/10 20:05:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML基础 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/6/22 8:13:57

    本主题贴数3,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    60.547ms