• 漫话Web2.0

    2006-04-25

    下文放在他山之石,因其只能算与SOA有点关系,但这篇文章绝对是本人的原创呦

    转自我的MSN Spaces:http://spaces.msn.com/seraph-zhang/,因为是五天之内连载拼接而成,所以会显得有些长而且有的地方有明显的拼接痕迹,不过没关系啦,应该还是可以看的。

        技术的发展日新月异,每天我们都面临很多新生的事物,现在最火的应用技术就是Web2.0了,从现在开始准备逐步写一些关于它的心得,保证原创,同时也对自己的思维学习过程有个整理和回顾。我也不知道多久能写一次,一共会写多久,总之我会坚持的。

    传统的Web1.0也就是我们现在使用的互联网,内容和结构全部都是由少数工程师、美工、编辑完成的,一般人只能浏览获取信息,而且浏览中也不能很自主的选择选择内容,它就像一个大杂烩,什么都有胆识什么有意义的东西都很难找到,所以搜索引擎大行其道。

    Web2.0,我认为可以这样定义:基于个性化的微内容的,注重用户体验的,并可以亲自参与的社会化网络服务平台。说的详细一点就是,第一、网络内容由每个人参与编辑;第二、改善由于传统的提交模型导致的网络服务交互的同步因子,以一种异步方式提供RIARich International Application)交互服务;第三、它的网络概念不再是孤立存在的纯技术层面的问题,越来越与人类社会组织模式趋同,MicrosoftWallopGoogleOrkut等都是组织模式趋同化的很好尝试。

    Web2.0下,网络内容已经不仅仅是掌握在少数人手中了,我们可以很方便的对微内容进行存储、表示、转移、整合、管理、维护等等,我们所有人都是它的参与者,其实Blog本身就是Web2.0最基本的表现形式之一。

    互联网产业经过2001年开始的严冬之后并没有彻底消亡下去,而是随着Web2.0的高潮重新冲入了人们的视野,这也是创业的高潮期,同时由于第一次全球性的网络风暴,无论是投资商还是创业者都会用一种更加审慎的姿态来对待这个问题,相信那种疯狂的烧钱行为是决不会再出现了,取而代之的是理性的分析决策。

    其实任何一种新的发展趋势无外乎以下几点:出现的背景、技术基础、元素构成、商业模式等等。就先聊一聊Web2.0出现的背景以及同传统的Web1.0的比较。自从1989Time Berners-Lee提出了www的概念以来,Web开始正式登上历史舞台。网络真正进入了一个发展的高峰期,从科学家们手中的玩具变成了惠及大众的工具,基于HTTP的超文本协议的出现,使得信息的共享和连接更加方便自如,浏览器的大行其道也促成了一些巨无霸公司的出现,例如微软,第一次大规模的操作系统捆绑战略使微软从中尝尽甜头,也成为微软公司发展历史上第二个重要的转折点。

    但是人们渐渐的发现,网络上的信息都被网站的经营者们垄断着,普通的受众仍然像接受传统媒体一样填鸭式的接受着各种各样的信息,无论他们是否真的需要这些信息。只要有矛盾就必然有发展,而传统Web模式的内在矛盾不可避免地成为了技术和应用潮流的触发器与推进器。解决这样的矛盾无外乎有两种方式:第一、提供海量信息的合理检索方式,让用户可以很方便的找到自己真正需要的信息;第二、让用户自己提供信息,并组织其他有价值的信息为我所用。这就好比大海捞针,方法只有两种:准确知道针在哪里或自己向大海中投入针。前者促进了搜索引擎的发展,从早期的LycosAltavistaYahoo到如今如日中天的Google,再到大梦初醒的MSN,虽然他们的信息组织方式或许不同,但都具有提供信息检索服务的初衷;而后者促进了Web2.0新经济模式的诞生,从BBS到网络论坛,从个人网站到博客站点,人们逐渐认识到了互联网的内容应该由所有人来共同编辑、交流、分享而不仅仅少数人手中的玩物。必须承认Blog不是Web2.0的全部,但它以最鲜明的特点、最快的速度促生了新经济模式的出现。Web2.0的解决方案相较搜索引擎更加倾向于解决传统Web应用中信息不对称的矛盾本质,但这两者不存在必然的对立关系,而且可以很好的相互借鉴相互利用,否则Google也就不会提供Blogger服务了。

    内容提供者的变化能改变信息不对称的矛盾,但是无法解决海量数据检索的问题,而搜索引擎正是此道中人SNSSocial Network Service,有人叫作社会网络服务、也有人称其为人脉网络)尝试从另一个角度解决如何从海量数据中检索有价值信息的问题,我想很多人应该都听说过六度隔离假说,它是在20世纪60年点由美国著名社会心理学家Stanley Milgram提出的"六度分离"Six Degrees of Seperation)理论,即认为人和任何一陌生人之间所间隔的人不会超过六个,我们暂且不论这样理论的数据来源和所能利用方法学验证的正确性,至少物以类聚、人以群分的说法我们老祖宗历来有之,你周围的人所拥有的信息是你最需要的信息的可能性,那是相当高的!~~!而通过SNS的方式将这些你与你的朋友以至于朋友的朋友所提供的信息聚集在一起,这些沧海一栗的信息虽然少确是含金量最高的,无须搜索引擎的帮助就可以获得所需的信息了,至于现在这种方法还不能广泛适用的原因在于自主信息的提供量还是太少、结构化程度太低。当然任何方法都不是完美的,只有将它们有机地结合起来才能取得更好的解决方案,试想:我们如果能够从自己的生活圈子中的人所提供的信息中利用搜索引擎检索信息的话,那将是多么高效的呀。

    同时,信息结构化的程度也直接决定着机器理解信息的能力进而决定了信息检索的效率,这就引到了语义网的问题上来了。这超出了我们讨论的范围,以后有机会的话再讨论吧。

    任何的新技术潮流不可能仅仅包括数据而不包括数据的处理方式,如何让传统的桌面信息处理应用变为纯网络化的呢,这里所谓的网络化不是指联网的数据处理,而是指在本地没有能力处理所需要的数据的情况下(例如没有安装相应的应用程序)进行数据处理,在这里我们所拥有的东西只有网络和浏览器。从“Software is Service”到今天的“Everything is Service”,应用的网络化程度越来越高,当然这股潮流的主导者还是那些软件服务提供商,Microsoft所主导的Live战略就是其中最典型的范例,MessengerMail早就已经网络化并开始试用了,而她的主打产品WindowsOffice也在走上Live之路,或许有一天我们可以通过浏览器来使用Word编辑文档,通过网络版Photoshop来处理图片了,这些现在就没有吗?其实不是的,他们的简单替代产品早就已经有了,去http://www.writely.com/http://www.thumbstacks.com/http://www.irows.com/http://www.flickr.com/http://www.zoto.com/上面去看看吧,或许有完全不一样的收获的。对于那些还是不满足的朋友们,我推荐http://www.techcrunch.com/,它对自己的介绍是这样的“TechCrunch profiles and reviews new web 2.0 products and companies. ”,我已经决定将它加入我的SpacesRSS List中了,这样每天就能看到更多更新的东西了。

    在了解了Web2.0的产生背景之后,下一步就是要了解Web2.0的基本组成元素是什么?任何事物都是由基本元素和元素之间的构成方式联合在一起的,Web2.0也决不例外。我敢打赌相当多的人都知道Web2.0的组成基础是微内容,那么究竟什么是微内容?在这里希望能通过启发引导式的方法把它阐述清楚。

    在解释什么是微内容前,先让我们再简要回顾一下网络的发展历程:首先出现的是仅仅为了能够进行数据通讯的通讯网络,它的意义和价值本身并不比电话网络高出多少,这个时期最主要的应用无外乎EmailFTP两种形式;然后在此基础上出现了以信息共享和发布为主要目的的万维网,也就是我们俗称的www,它的出现在很大程度上改变了人们信息传递和共享的方式,但所有这些都还是限制在人能理解的范围之内的。那么机器如何理解这些信息呢?要弄清楚这个问题,先要搞清楚人与机器的认知模型的不同,人是建立在经验基础之上的模糊认知模型,而计算机则是建立在逻辑关系基础之上的精确认知模型,我个人认为这两个模型之间本不存在谁更加高级的问题,只不过由于人的惰性以及机器由人造这个注定不可更改的事实,自然而然地,让计算机拥有人的认知和思维方式成了科学家们的努力方向,而不是恰恰相反的发展路线。回过头来看,万维网的最大缺点就在于它内容的非结构化不可自描述性,而这样的信息是不可能被计算机理解和处理的,于是便有了语义网(Semantic Network)的出现。

    W3C为语义网提供了很好的——The Semantic Web is a web of data. The Semantic Web is about two things. It is about common formats for interchange of data, where on the original Web we only had interchange of documents. Also it is about language for recording how the data relates to real world objects. 语义网将做什么呢?第一、以通用的各式交换数据;第二、提供可自描述的信息表达与真实世界实体的关系,这两点恰恰解决了刚才所说的万维网的两大缺点——非结构化和不可自描述性。

    那么如何达到以上的目的呢?最关键的当然是找到统一的可自描述的结构化描述方法,我们把它称为RDFResource Description Framework),RDF作为一种资源描述的架构是基于XML语法的,XML的起源就不想在这里敖述了,只需要知道SGMLXMLHTML之间的关系就可以了,可以这样来建立三者之间的集合关系——XMLSGML的子集,而HTMLSGML/XML的具体实现。

    有了以上的基本概念能不能理解什么是微内容的?其实中间还差一层"窗户纸"——元数据,即语义网通过RDF来具体组织什么东西呢?当然就是元数据了,即英文中的metadata,这个恐怕在数据库中更为常见,一个数据库的表结构、约束条件都可以称之为该数据库的元数据,这些"数据"对现实世界实体的记录并没有任何意义,不能表征现实世界中的任何具体存在的事物,但是它描述了这个数据集的特征,说得通俗一点就是——元数据描述了这个数据集的who, what, when, where, why, and how。然后让我们再来看看专业组织的定义:NISO(The National Information Standards Organization —— Metadata structured information that describes, explains, locates, or otherwise makes it easier to retrieve, use, or manage an information resourceW3C(The World Wide Web Consortium —— Metadata is machine understandable information for the web

    好了,全球最大的数据集在那里?这个答案是唯一的,那就是万维网。而何谓""呢?顾名思义,就是不可再分,即互联网通过将大量的微内容组织在一起形成了庞大的信息网,但是不幸的是它的组织方式是那样的无序和无结构,这本不是微内容的错而是组织方法的问题!这样导致的直接后果就是微内容在现在万维网环境下的难于检索、难于重用、难于组织、难于管理……总之什么都难!那么如何才能更好的利用微内容的呢?微内容的结构化(例如用XML描述)、开放性(例如公开访问接口)以及工具无关性(对于用户而言,可以使用多种工具来聚合和利用这些微内容,而不必局限于生成内容的原始站点)。这样就把原先本来就存在的微内容以更加合理、更加接近于机器理解的方式组织起来,当然微内容的普及和结构化性能增强必然导致信息的逐步无中心化,传统的门户网站必然受到很大的威胁,这也是迫使包括MSNYahoo等在内的门户网站进行转型的原因。

    呵呵,兜了个大圈子,原来微内容本身早早就已经在我们周围无处不在了,我们没有感觉到它的原因不是它不存在而是它的组织形式太过隐蔽了。有的人可能要崩溃了~~其实任何技术都是在旧有的基础之上进行创新和改善的,没有任何东西是凭空造出来的,下面将从另一个角度介绍实现Web2.0的技术层面问题。

    终于谈到作为技术人员最关心的Web2.0的技术实现问题,其实这种说法本身就是有错误的,因为Web2.0仅仅是Web发展的趋势,是针对内容组织形势和人利用Web模式而言,跟技术本身是处于两个层面的问题,也就是说Web组织与应用结构的改变并不会导致技术的必然变化,原有的技术当然还是可以在未来的环境中运用的,只不过在某些方面可能存在一定的不便,递增的逐步改善这些不便是技术发展的趋势而不是彻底的颠覆,否则我们这些技术人员岂不是很惨~~

    我们都已经知道了XMLWeb2.0信息结构化和自描述的基础,那么如何处理XML文件也就成了技术实现中最最关键的问题,从本质上来讲XML文件不过就是带有格式化信息的文本文件,对其分析并不是非常困难,而且作为统一的国际标准,它不同实现的处理过程也非常的趋同。诸如处理DOMSAX模型的运行时APIJAXP、数据绑定方法JAXB.NET平台下的System.XML类都能提供完整的支持,这里不想敖述它们的具体行为,一则本人能力不足以完成如此庞大的Survey,二则来懒惰使然,况且市面上介绍这些的东西不胜枚举,我也没必要在这里更多的废话。

    上面仅仅非常简要的说明了我们需要处理什么样的数据,这些都是机器和程序来做的事情,那么是不是也应该为用户多想想什么呢?记得曾描述的Web2.0三大特点中第二点是——注重用户体验,在读过Alan Cooper的书之后更加意识到这是多么重要呀,机器和程序是不会反抗的,它们指挥乖乖地按照你告诉它们的亦步亦趋的完成任务,但是用户可不会,稍有不甚你丢失的是可能为你带来巨大经济效益和社会效益的用户,尤其是现在这个通讯非常发达的注意力经济时代——Google的出名完全就是口口向传的——对用户的忽视会使坏名声也快速的传播出去。

    传统网络应用无外乎C/SB/S两种模式,但是他们都有自己很明显的缺点,C/S模式可以提供更加丰富的用户体验和非常复杂的逻辑,但是它的部署和更新的复杂度却是一直被人们所诟病的,B/S刚好相反它的部署非常容易几乎不会让用户收到任何的干扰,但是它能提供的用户可交互性却是非常低劣的,这直接源于传统网络的数据提交模型。正式由于这些原因,RIARich International Application)才大行其道,它也就是在结合了B/S模型与C/S模型的各自优势,在B/S模型的基础上,在客户端添加了大量用户交互逻辑的处理,目前比较热的方法包括Macromedia FlexAjax,由微软为我们带来的基于AvalonWeb表示层实现技术相信在Vista正式公布在微软的强力攻势之下也必然会有不小的发展,当然Mozilla社区的XULLaszlo公司的LaszloJavaSwing也都是不可小视的力量~~

    总体来说Web2.0的实现技术还是新瓶装旧酒的感觉,不过这里面确实有很多东西是值得我们学习的,没能在这里详细的说明所有的技术是我的遗憾,同时也是我力所不能及的,但我相信一条发展的主线远比细枝末节的介绍要重要的多,也许在未来我也会将自己所学之细枝末节拿出来共享。

    最后我们来讨论一下Web2.0的商业模式及其未来的发展,说实话这也是我最没有把握的地方,因为我不是一个敏锐的商人更不是神秘的预言家,不然我就可以自己去创业了,这些事情对于我来说确实有些困难,在这里只是谈谈自己对目前商业模式的看法和总结而已,并无甚新创意,由此,想获得这方面信息的读者现在就可拂袖而去了,不需要再耽误时间了。

    说实话,我觉得Web2.0的创业浪潮有点被夸大了,单独靠某一个关键技术是不可能创业成功的,创业是需要很多的因素促成而不仅仅是技术,说实话最新最好的技术不一定能成功地转变为占领市场的商机,Apple就是最好的例子。不过还好,这里只是讨论在Web2.0的基础上新兴的商业模式而不是应该怎样创业。商业需要客户群的支持,Web2.0能怎样为我们吸引客户群呢?首先,从信息组织方式来看,网络对于用户的最大作用就是方便地检索、组织和共享信息。如果我们能为用户很好的提供这些服务,必然会有大量用户将他们注意力集中过来。

    但是有了稳定的用户群仅仅是商业模式成功运行中的必要前提,如何利用它来取得盈利才是最关键的部分。供给与需求制衡理论是传统宏观经济学的基础,但是在以约翰凯恩斯为主要奠基人创建的宏观经济学中,供给与需求的物资是存在实际物理实体的产品,它本身是不可以被无限复制及无限传播的,它的使用和占有具有明显的相克性(增加一个人消费服务所追加的成本几乎等于重新制造一次的成本)与相斥性(排除他人享用)。网络商业运营的"产品"则是服务,它几乎是可以被无成本地无限复制的,并且具有非相克性及与非相斥性,同时用户对这种服务的需求也是无限增长的,尤其是服务的质量。21世纪初的那次网络风暴中,深陷漩涡中心的网络公司就是仅仅注意到了眼球经济而忽视了商业运营的根本目的——盈利,在虚幻的网络世界中找不到什么是真正可以运营的"网络产品",取而代之的是给用户尤其是股东们各种各样的愿景,随着时间的推移,这个泡泡越来越大最终的一生破灭了,其实稳定的客户群本身就是公司拥有的固定资产,只是那个时候没人懂得如何利用它。而现在,网络广告好像成了网络公司的主营收益之一了,包括Google也是靠各种各样的广告策略存活,为什么各大商家愿意给Google广告费呢?就是因为他有全世界最庞大的网络客户群体。前面已经谈到过,在Web2.0中信息的发布、组织是由客户自己完成的,既然这样,网络运营商当然没有理由向用户收取信息的获取费用,因为毕竟它们来自于客户本身,如果有理由也仅仅是存储介质的使用费用,而这个受益却是微乎其微的,况且各大网络公司更加倾向于免费提供存储。但是始终觉得这种广告收入更像是类似于银行因为贷款而获得贷款盈利一样,属于依附于制造业(广义上的,任何生产物理实体产品的产业)或其他网络服务提供商而获利的一种方式,它更多地取决于其他产业的兴衰,当然这也是第三产业的特点,所谓服务型行业的意义也体现在这里。

    从另一个角度讲,除了稳定的客户群体作为固定资产盈利之外,将传统的业务流程及软件功能移植到网络上也是一种盈利方式,即所谓的"All are services",用户通过使用服务的次数与强度收取费用,而不再是需要购买固定的产品——这些产品中或许存在着根本不需要的功能——浪费本不该浪费的资金,而网络应用服务部署和更新的成本相较传统的离线方式会大幅度下降,这样网络应用服务提供商在降低成本的同时获得至少不低于以往的经营业绩,当然必须承认的是,这个经营业绩的好坏直接取决于客户群的大小。

    由此我们可以看到,在新经济模式下,用户的注意力仍然是最关键的因素,在这点上和前一次网络浪潮没有什么区别,关键是如何利用这样的注意力获得盈利,在给公司带来切实利益的同时,不仅为公司未来的发展提供强大的支持,同时可以为公司的用户及股东更加坚定的信心,使公司乃至整个新经济时代步入正常的发展轨道。

    终于到了要结尾的时候了,最后想说的是Web2.0的前景,让我们再来回顾一下Web2.0的三个特点:基于微内容的、注重用户体验的、提供可参与的社会化服务平台。只有在这些基础之上有所改进才能称得上是发展,称得上是Web2.5/Web3.0。我最主要的改进可能会有以下几点:第一、微内容层次和种类的丰富化;第二、改进人机交互的方式方法,将虚拟现实技术大规模应用到日常的Web活动中来;第三、提供交互的而不仅仅是单向的信息获取方式;第四、融入信息家电和信息办公的过程中,使人们在感觉不到它存在的情况下从中获取便利……

    未来是美好的,现实是残酷的,前进的道路需要有人去披荆斩棘,眼界高一点远一点自然没有错,但还是需要扎扎实实做好眼前的工作,你我的成果或许微不足道,但是如果它能成为后人成功的基石,这份执着也将无怨无悔。

  • 上了一天的课,回来发现seraphzhang同学已经将blog搞定,赞一个先!曾几何时,计算机系是我心中梦寐以求的殿堂,而就在享受管理之妙时,命运却将我们撮合在一起,不得不承认是命运使然。

    自从上次开会回来之后一直在看,但不解之处甚多,尤其是看了seraphzhang的几篇推荐作品,更是一头雾水,几尽潸然泪下,话虽如此,但我对咱们的team充满信心,团队成员麦卡同学已经做了详细的介绍(不要再把俺的名字记错!!!),如此的人员配备和坚实的基本功,我们没理由畏惧。

    前方的道路虽然崎岖,却也鲜花密布。二人同心,其力断金;同心之言,其香如兰。让我们在思想的碰撞中成长,在项目的突破中升华!

  • 报道,报道~

    2006-04-25

            终于有团队的blog了。真的很高兴能和大家合作参加这样一个比赛^_^。

            这次比赛是一个非常好的机会,可以使我们能够真正的理解IT技术在企业环境中如何应用。在这个基础上,我们就可以更好的理解IT技术和理念,避免空洞的纸上谈兵。

             另外,比赛最重要的不是结果,而是过程。在比赛的过程中,大家互相帮助,互相提高,不断提出新的观点和理念。在整个过程中体验到团队合作的优越性以及集体的力量大于个人力量之和的道理。

             既然选择了开始,我们就不会放弃。让我们披荆斩棘,排除万难,向着远方,前进,前进,……

  • 我也来报道!

    2006-04-25

          小张同学这么快就把Blog建好了,辛苦辛苦!

          从第一眼看到竞赛题目被吸引开始,已有差不多一周的时间;期间聆听了IBM专家在南开的宣讲、认真学习竞赛主页上推荐的阅读材料、也在smth和版友做了许多交流,终于对SOA和我们的题目有一些感觉了。

          不过,这段时间最大的成果是我们的参赛队伍组建完成!

          史老师经验丰富、目光长远,他的指导经常有拨云见日的功效;对于这次参赛,史老师在给予充足资源支持的同时,更将亲自参与比赛的全过程!

          卞晓青博士拥有扎实的企业管理理论基础,同时参与过多项企业咨询和培训工作,我们的SOA大赛不仅仅是对于程序设计能力的考察,它更关注IT与企业业务如何完美结合,相信小青在企管领域的知识储备将保证我们的参赛作品更合理、更贴近实际应用、也有更多闪耀创新光芒的亮点;

          我做过的工程项目比较多,对于项目的设计架构有一些自己的经验总结,希望能利用自己的特长在设计和规划SOA项目时发挥作用;

          宫大伟的技术能力非常强,敢于钻研、喜欢迎难而上。作为一个实际的应用题目,这次比赛的开发工作同规划设计一样重要,大伟的工程能力将为作品的最终实现提供保证;

          哈哈,至于说张维同学嘛,他可是第二次参加IBM全国高校大赛了!去年他带领的团队进入了最后的总决赛并获得了第10名的好成绩。他视野开阔、思维活跃,业界的新技术、新动态没啥能逃过他的“法眼”,他可比我们其他人知道SOA、了解SOA早的多呢!

          在过去的学习和实践过程中我深深体会到:个人的力量终究有限,团队精神和团队协作是能确保项目成功的真正动力!

          作为来自南开大学的参赛队伍,我们充分发挥了南开文理综合大学的优势,集合了计算机系和企业管理系的5名老师同学,其中有计算机系副教授1名、管理系博士1名和计算机系硕士3名,队员各有所长、搭配合理;更重要的是,通过一段时间的学习和调研,我们都已对SOA的理念有了很强的认同感,相信这是我们参赛并最终成功的一个良好起点!

          IBM(中国)公司为广大高校师生提供了这样一个良好的比赛、交流平台,目的就是把SOA的福祗带给中国企业。我们要利用和把握好这个难得的机会,在比赛提高自己、也为使SOA理念深入人心作出自己的贡献!

  • 我们团队的Blog终于开通了,今天只是个起点,作为指导教师,我只希望大家能够认识到以下几点:

    1.我们不是为了荣誉和奖励走到一起的,而是为了体验和创造

    2.我们任何一个人都不可能取得成功,但是我们的团队却可以

    3.既然选择了远方,便只顾风雨兼程。我们不能轻易放弃努力

    4.校园里的一切都是短暂的,漫长的发展道路才刚刚开始

    努力吧,什么都不说了,大家赶紧现身,呵呵