隐网络

Average: 3 (1 vote)

隐网络是一个2007年新的概念。 在刚刚举行的第一次defrag会议上,隐网络是讨论的主题,因此现在正是讨论这一新名词的意义的时机。

首先,隐网络的提出是提醒我们一个事实,除了显式的网络数据,服务,和链接以外,网上还充满着其它一些隐藏的信息,诸如数据的浏览记录,服务的引用频率,和链接的点击次数等等。这些信息往往过于沉闷和乏味,因而缺乏可读性。所以,不可避免的,它们在网上只是隐式的存在,而极少被显式表现出来,所以我们称它们是隐式信息。隐网络就是一个由隐式信息联结而成的网络。

信息无处不在

信息无处不在, 网络用户在网上的任何行为都属于隐式的网上信息的范畴。举例来说,信息是关于哪些网页被经常阅读,又都是哪些用户阅读了它们。 信息也涉及到哪些服务被经常引用,而它们又是常常被谁引用的。 如果我们考虑到网络用户的数量以及每个用户每天在网上有多少的活动,信息的数量非常惊人。 信息并存于每一个网页,每一个网上服务的,和每一个网页链接。 总之,在每一小片的显式信息背后,都并存着无可记数的信息 

并不代表着微不足道或者不重要。 相反,隐网络信息往往是宝贵的,在一些特定环境中甚至可以是至关重要的。 比如说,点击率可以帮助编辑决定哪些新闻是最受欢迎的,因此他们应该把这些新闻放到头版。 类似的,点击率也可以帮助销售人员决定哪些商品有最大的需求,因此他们可以知道怎样安排接下来的商品供给线。

许多公司已经开始收集隐信息,并早以享受从信息带来的好处。 Alex Iskold最近写了一个关于一些企业如何利用信息的简单介绍。其中一个著名的例子是amazon.com。亚马逊总是在它网上商品旁边加上一个建议,"Customers Who Bought This Item Also Bought(买了这个商品的顾客还买了)",相信许多读者都很熟悉这个标签。 而跟重要的是,事实上很多网络用户的确关心这个标签下面的内容,他们常常因为这些推荐就买了更多的东西。 这是一个隐网络信息应用的典型成功事例。

亚马逊并不是唯一一家从信息中获益的网络企业,亚马逊也不是少数几家信息中获益的网络企业之一 事实上,现在几乎每一个销售网站,无论它卖的是婴儿玩具还是汽车,都在分析自己网站上的信息 ,并依此调整自己的销售计划。信息的确是无处不在。

连接隐式信息

虽然信息无处不在,到处却都只是信息的碎片。缺乏有效的连接,这是目前信息使用上面的一个大问题。

目前为止,隐资料通常都是由个别公司单独储存的。举例来说,无论是gap.com和jcrew.com有自己的客户来访资料,但它们之间并没有资料分享机制,虽然我们可以设想这两个公司分别的信息是存在必然联系的,因为它们都主要销售成品服装和服饰配件。 有人可能会说,它们之间没有建立资料是因为他们是竞争对手, 那么让我们改成另外两个公司,比如说是香蕉共和国和维多利亚的秘密。 这两个公司的产品更多是互补,而不是竞争(一个是成品外衣,另一个是内衣),并且他们针对的顾客群重叠很大,照理说分享资料对双方都大有好处 但事实上,并没有这样理想化的资料连接存在。读者们自己可以找到更多这一类的例子。

如果说对于大公司而言,和小公司共享隐信息能有多少好处实在值得商榷(因为大男生总是很难相信他们可以从自己的小姐妹那里得到一些帮助的) ,共享隐信息对小网站而言则是关键性的。大多数的小型个人网站无法有效利用自己单独的隐信息,因为它们规模太小。 如果它们之间能够分享交换各自的信息,彼此都能得益。但问题是,现在并不存在这样一种分享与寻找有用的隐信息有效途径,尽管每个人都知道,在网上信息无处不在

所有这些讨论导向的一个需求:我们需要隐网络 建立隐网络目的在于收集信息的碎片并将它们用一种有效的方式连接起来 但我们如何才能确实连接这许多不同类型的信息并将它们编成一个连贯的隐网络呢? 这是一个大的挑战,我们还没有一个明确的答案。

但无论如何,解决这一问题的答案必然不可能是传统模式的网络链接。隐网络包含着复杂的语义类型,隐网络无可估量的信息量,隐网络的信息是高度动态的。 所有这些事实都使得传统模式的网络连接显得过于简单,过于肤浅,和过于静态。传统模式的网络连接不足以同时应对所有这些挑战。 我们需要非常的创造性思维来研究怎样存储和连接所有的信息

隐网络小结

最后,我简要地列出我对隐网络认识的小结。

1. 隐网络是一个将显网络(也就是万维网自身)上所有信息碎片收集在一起的网络。

2. 如果显网络上揭示的是静态的人类知识,也就是数据,服务,和它们之间的链接,那么隐网络揭示的就是动态的人类知识,也就是用户如何获取和使用这些数据,服务,和链接

3. 显网络集合人类的集体智慧,隐网络集合人类的集体行为。

4. 隐网不是语义网的一部分,但它们之间是紧密相关的。如果语义网构建了万维网的概念模型,那么隐网络就建构万维网的行为模式。

隐网络一文原文写作于英文,发表在Thinking Space。同时,它还被ZDNet的Web 2.0 Explorer所采用。作者现在同时建立有Thinking Space的中文对照博客,思维空间,欢迎有兴趣的读者访问和交流。

Average rating
(1 vote)

同意你们的评论。事

同意你们的评论。事实上,信息并不神秘,但是怎样有效整合它们,却是新问题。就如我文中提到的,这些整合对于小网站而言,其意义可能比大网站要大得多。但是如果我们注意到绝大多数的网站都是小网站的时候,我们就可以想象对于这样一个信息整合的需求有多么大。

隐私保护当然是另外一个问题。隐网络的研究刚刚开始,不过这的确是一个非常有前途的领域。

我的看法

这个有点像我们从一个人的博客及相关资料中去找他的社会网络一样。

通过理解语义上的联系,我们可以从中找到谁是谁的老师,同学,同事。

当然如果去找某种特定的关系,那并不难。比方说通过entity extraction, term extraction, 然后可以做entity relationship extraction。 比方说像yahoo中国的社会关系发现一样 http://www.yahoo.cn/s?v=person&p=%E7%AB%A0%E5%AD%90%E6%80%A1&source=OI

但是难得是,如何去发现这样的关系。

另外这个也和我上次写的各种聚合比较类似,比方说lijit得社会关系聚合等。

隐信息的处理

这些隐藏信息的价值非常大,但是也有隐私的问题。
如何让大网站分享这些信息是面临的最困难的问题。
也许通过一定的商业途径,可以产生一些专门处理加工隐信息的公司,从大公司获得原始信息,然后加工处理分析后以产品的方式卖给公司或者个人。