新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 计算机科学论坛W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → 分析:利用人力让语义搜索更有效 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 5484 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 分析:利用人力让语义搜索更有效 举报  打印  推荐  IE收藏夹 
       本主题类别: Semantic Web    
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18407
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 分析:利用人力让语义搜索更有效

    2010年09月17日16:43腾讯科技Kathy


    按此在新窗口浏览图片

    腾讯科技讯(Kathy)北京时间9月17日消息,据国外媒体报道,有“互联网之父”之称的蒂姆·伯纳斯-李(Tim Berners-Lee)去年曾在TED大会上振臂高呼,希望大家将在线数据整理起来,“为多学科目的服务,比如将基因组数据和蛋白质数据结合起来,以便试图知道治疗老年痴呆症的方式。” 知名科技博客gigaom的作者利兹·加恩斯(Liz Gannes)撰文指出,现在已经有一些初创公司响应了伯纳斯-李号召,正在试图把“原始数据”变成为“关联数据”。文章摘要如下:

    在干草堆里找一根针的最好的方式,就是把干草整理组织好。如果我们不知道的信息片断是如何相互联系的,它们就没有什么用处。我最近采访的两家新公司Semantifi 和FindTheBest正在将巨大的数据集整理成为可以进行查询的网上数据库。这两家初创公司利用人工方式整理出数以千计的特定主题网络应用程序,与常规的搜索查询相比,这些应用程序可以帮助用户找到更加复杂,也更加令人满意的答案。

    你可以使用Semantifi公司的搜索应用程序来查询“百思买、亚马逊过去两年的销售额”,在几秒钟之内,你就会得到这两家公司的季度销售额数据比较表,以及一个自动格式化的条状图。

    位于康涅狄格州斯坦福德的Semantifi希望提供结构化的数据集,因此它征募人手来进行“深度解锁网络”和创建搜索应用程序的工作。Semantifi说的应用程序(app)就是用户输入的数据集(用户还需要教系统哪一组数据是什么类别,以及它们是如何互相联系的)。Semantifi自己的网站上已经有一些搜索应用程序,它们可以帮助你获得更好的政府数据和金融数据。

    Semantifi已筹得350万美元资金,目前正在努力征募用户来整理组织数据,此外它也与发布商开展合作,例如,萨克斯投资研究公司(Zacks Investment Research)就正在帮助Semantifi创建查询金融数据的应用程序。发布商可以将内容和数据结合成一个平台,并可以选择只允许付费用户访问他们的应用程序。

    那么普通用户又如何参与呢? Semantifi的首席技术官维西·达萨里(Vishy Dasari)向我展示了如何创建一个亚马逊产品数据应用程序来处理“不到400美元银色数码相机”这样的查询。如果用户在亚马逊自己的网站上寻找类似问题的答案,那需要在搜索和结果页面上点击很多次才行。

    我还电话采访了FindTheBest(FTB)的创始人兼首席执行官凯文·奥康纳(Kevin O’Connor,他也是也是广告网络DoubleClick的联合创始人)。奥康纳说说:“在互联网上,你可以找到任何方面的信息,但是如果你真的想要比较不同的事物并做出决定,那就非常困难了。” FTB位于加利福尼亚州圣巴巴拉,是一个白手起家的公司,它为用户提供详细的图表(这些图表由FTB的内部研究人员和外包工人制作),帮助他们在事物之间进行比较。

    FTB通过查看搜索数据来决定研究哪些新主题。这个步骤听起来有些类似互联网内容制造商“按需媒体”(Demand Media),但“按需媒体”提供的是文章或影片,而FTB创建的是数据库。你可以看到,在网面中间是一张大表,左侧的滑块则用来调整图表显示的内容,你可以选择深入查看详情,还可以对几个靠前的结果进行比较。

    在FTB至今创建的400多个应用程序中,有些很“正常”,比如根据降雪量和个人喜好等因素创建的滑雪胜地评估比较应用程序;有些应用程序出人意料,比如有一个应用程序可以帮你找到哪家加州药房提供的医用大麻最好。奥康纳说他们有一个寻找肾脏透析中心的应用程序,因为FTB发现每月有20万人在寻找这一问题的答案。 科技博客的读者则可能对比较400家技术公司收购案的应用程序感兴趣。

    FTB的与众不同是,它以相当人工化的方式创建应用程序。如果“语义网”的希望在于像人类一样思考,那我们就应该雇佣一些员工,而不是一切依靠软件。奥康纳说公司拥有15名全职员工、8个实习生和20个外包工人。任何用户都可以编辑一个应用程序,但必须事先获得FTB编辑的批准。

    由于新的搜索目的地几乎没有占据任何市场份额,因此有一点对Semantifi和FTB来说都很关键,即从谷歌和其他搜索引擎处获得用户。两家公司都积极地进行了搜索引擎优化。如果你在必应上搜索“过去60个月来的烂尾房”,Semantifi的页面会排在搜索结果中靠前的位置。奥康纳说FTB的重点是吸引长尾查询词条(long-tail queries)搜索者,然后让他们接触到更广泛的比较信息,可能以前他们可能根本不知道还有这样的比较信息存在。

    帮助人们建立网络数据库的并非只有这两家公司。 Needlebase是旅游公司ITA的一个副产品,刚刚被谷歌收购。谷歌还收购了Metaweb并获得了它的数据库Freebase。这一领域的其他竞争对手还包括Wolfram Alpha、 Socrata 和 Factual。


       收藏   分享  
    顶(2)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/9/21 11:30:00
     
     leopard 帅哥哟,离线,有人找我吗?
      
      
      威望:10
      等级:大四寒假(收到Stanford的Offer啦)(贵宾)
      文章:150
      积分:1153
      门派:XML.ORG.CN
      注册:2005/1/24

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给leopard发送一个短消息 把leopard加入好友 查看leopard的个人资料 搜索leopard在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看leopard的博客2
    发贴心情 
    有点意思啊,呵呵
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/9/22 18:04:00
     
     GoogleAdSense
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/7/26 11:15:30

    本主题贴数2,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    46.875ms