首页

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 (Page 12 of 18)



January 14, 2006

一时好奇,看看这些大网站的 Web 服务器信息(操作系统/Web 服务器/应用服务器软件).

Google
哪些软件做 Web Server?
除了有两个节点操作系统看出来是 Linux 外,其他的都是未知的. Web 服务器用的都是 GWS ? 我估计是 Google Web Server 的缩写.

Yahoo!
操作系统都是 FreeBSD. 其他的都不可知.Yahoo! 的网络安全据说是一级棒!

微软
操作系统全是 Windows 2003(如果使用 Linux 会被笑死) , 看来 Windows 2000 已经退出微软自己的舞台.Web 服务器用的是Microsoft-IIS/6.0.

eBay
操作系统用:Windows Server 2003 /2000, Web服务器用 Microsoft-IIS/6.0 (5.0). 对这个检测有些怀疑.eBay 大规模使用 Windows ?

GNU.org
操作系统全是 Debian Linux(没错,Debian 是 GNU 正宗传人). Web 服务器: Apache/1.3.31 (Debian GNU/Linux) mod_python/2.7.10 Python/2.3.4 , 也有的配置是:Apache/1.3.26 (Unix) Debian GNU/Linux mod_python/2.7.8 Python/2.1.3.GNU.org 对 Python 用的比较多的.

看看国内的一些公司.

阿里巴巴
操作系统是 Linux . Web 服务器: Apache/1.3.29 (Unix) mod_alibaba/1.0 Resin/2.1.13 .
(+mod_gzip/1.3.26.1a). mod_alibaba 模块估计是专门定制的.

Sina
操作系统是 FreeBSD. Web 服务器都是 Apache/2.0.54 .

百度
操作系统是 Linux , Web 服务器: Apache/1.3.27. 整齐划一.(更新:现在已经换成了 BWS -Baidu Web Server)

搜狐
操作系统居然是 SCO UNIX ,Web 服务器信息: Apache/1.3.33 (Unix) mod_gzip/1.3.19.1a
看来业界传闻"Sohu 的技术力量最差"并不夸张.

网易
操作系统:Linux. Web 服务器信息: Apache/2.0.5x

这些数据是在Netcraft得到的.

分析一下上述数据,可以得到的基本信息如下:

1. Linux vs FreeBSD 半斤八两.很多公司用 Linux , FreeBSD 也不乏拥趸.但开源操作系统做 Web 应用是首选已经是一个既定事实.
2. 关于 Apache ,虽然 Apache 目前还是推荐使用 1.3 版本. 但是很多公司还是使用了 2.0 版.而 Apache.org 自己也全在使用 Apache 2.0 .甚至是 2.2 .
3. Mod_gzip 被一些公司有选择的使用.
4. 技术实力强的公司定制自己专用的模块.

这些判断的前提是 Netcraft 的探测是正确的并且具备代表性.

| | Comments (20) | TrackBacks (1)


January 7, 2006

第一次听说"蓝海战略"是偶然看到中央电视台的一期“对话”,没过几天,车东推荐我用 Google Analytics 的时候也提到了这"蓝海战略"。搜索了一下,这本书在欧美似乎不那么有市场,而在亚洲倒是很被人追捧。

什么是所谓的"蓝海战略"? 

要赢得明天,企业不能靠与对手竞争,而是要开创“蓝海”,即蕴含庞大需求的新市场空间,以走上增长之路。这种被称为“价值创新”的战略行动能够为企业和买方都创造价值的飞跃,使企业彻底甩脱竞争对手,并将新的需求释放出来。[From 豆瓣]

这样看来,其实大多数人都已经见证了"蓝海",上班族们对办公楼内电梯旁的液晶电视广告都不陌生吧?05 年在美国纳斯达克成功上市的的分众传媒,就是成功发现了蓝海--楼宇液晶电视的一个例子。盛大也可以算是一个例子,"游戏"这片蓝海成就了盛大--虽然现在游戏已经变成了激烈竞争的"红海"。有趣的是,盛大现在热炒的"盛大盒子",无疑是想发掘另外一片蓝海,不知道盛大在这个战略转型的时候决策者有没有看到这本书。有趣的是,这本《蓝海战略》书中的"蓝海"概念也是比较新的东西,书本身在销售过程中也算是在亚洲找到了一片"蓝海"。

Continue reading "蓝海战略与 Web 2.0" »

| | Comments (2)


January 6, 2006

虽然 2005 年已经过去,但是还是觉得有对过去一年总结的必要(有趣的是,这几天查看 Web 服务器日志,很多人居然是通过'个人总结'来到本站的)。这篇写一下过去一年中经常访问的几个个人门户。这里提到的"个人门户"是我的个人化的概念,只指具备独立域名 Blogger 的个人站点。通过该站点 Blogger 组织个人信息,并且有特定的写作风格。

车东 (http://www.chedong.com/)
车东的站点首页是采用 Lilina 的框架搭建的(当然现在只是采用了 Lilina 的形式而已,程序大部分都是 Hack 过的).首页程序动态抓取的是他关注的各个 Blog 内容,有一定的个人兴趣在里面,但也正如首页副标题说的"My Window, Your Bridge",这个站点是一个很好的桥梁。我的很多 Web 2.0 信息都是从这里首先得知的.车东的 Blog 标题为 Blog^2 ,记得在一个访谈里,他解释这个标题的含义其实是 "Blog 的平方",记载了很多他对 Web 相关技术的实践、心得、体会。有趣的是,05 年车东和我居然成为了同事。

王建硕 (http://www.wangjianshuo.com/)
王建硕用双语写 Blog 获得的成功效应不需多说了,我第一次关注他的站点倒是因为他的那篇 今天是我写blog的第999天,曾经有也是做技术的朋友问我如何写 Blog(我哪里懂阿),我给他推荐的就是这篇文章。记得当初读罢之后,逐篇的把他的 Blog 上的中文文章读了一下,很受启发。一个好的 Blog ,一定要能够"坚持",没有一份恒心,不会出现他站点上的 999 篇英文 Blog,当然现在已经不止这么多了。

冯衍 (http://yanfeng.org/)
冯衍 可能很多人有些陌生,但是一提起他的 Blog 站点 桑林志恐怕很多人都有印象的。第一次拜访他的站点,感觉很学术。看了相关介绍才知道 冯衍(桑葚) 所学的专业是物理,稍有些释然。以后每次查询 WordPress 的内容几乎都可以在他那里找到,时常还可以看到了一些我比较关心的 OpenSource 内容。他发起并维护的格志则完全是学术圈子的内容,很有看头。

Continue reading "2005 年关注的几个个人门户" »

| | Comments (4) | TrackBacks (1)


December 1, 2005

前几天看到一份 Web 2.0 Checklist . 中文 Blogger 圈子反映很快. 比如 HerockWeb2.0特征列表 就对此进行了逐条评论. Keso 认为原作者"..有点儿揶揄的味道...". 话虽然这么说,这份列表还是值得研究一下的. 下面简单说说我理解的几个特性.

商业模型面对“长尾”(Business model optimized for the long tail)
这无疑是最重要的一条."长尾理论"从某种角度上说是 Web 2.0 的经济学基础.

创新而非抄袭
这是我加的一点.我前一段时间给朋友推荐 Del.icio.us 的时候.大多数的第一反应都是不屑一顾:这不就是书签收藏么?这有什么大不了的? 的确,书签收藏是个很老的概念,但是能做到 Del.icio.us 这样让人眼前一亮的就不容易了. 相反, 国内赶这个风潮的公司的特点则为"化神奇为腐朽".比如新浪的 Blog,把 Blog 完全变成了做秀的个人主页,是一种倒退.而豆瓣之所以能吸引那么多人的青睐,一个不可或缺的因素是"创新"

Continue reading "也说 Web 2.0 Checklist" »

| | Comments (8)


November 21, 2005

更新:Google Analytics 在异步上支持也很好了。所以,以前的担忧是杞人忧天。忽略以下内容。

Google Analytics 一经推出就引起了很多 Blogger 的注意. 很多Blogger都是迫不及待的把Google 的 Agent 代码贴到了自己 Blog 的模板里(我也是).不过,短短的使用了一天之后,如我批评过的那样,因为一些我不能忍受的原因,我又把那段代码去掉了.今天看到车东发来的他的帐户分析的截图,不得不承认,Google Analytics 有其独到之处.但我还是暂时不想使用.

Google 推出这项服务,的确是一个很好的创意.但是对广大用户来说,是否选择用它,还需要慎重.之所以这样说,基于以下几个原因:

  • Google Analytics 会影响站点的可用性

    如果启用该服务,要把一段代码粘贴到页面的 </head> 之前.一个不可忽略的事实是,对于国内的用户来说,因为种种原因,Google 站点的可访问性并不是很高.这样一旦针对某个特定用户来说,如果 Google 不可访问,则使用 Analytics 服务的用户就会受到影响,甚至是不可访问.类似的问题在一些调用站外 Web Servcie 的时候都会遇到.比如一些统反向链接的服务.前一段时间我在使用Yahoo!的 Y!Q 相关搜索服务的时候也遇到过.相对 Google Analytics 服务来说,别的代码(比如Y!Q)都是可以放到页面最下面的,这样起码站点内容会首先显示出来,影响相对小一些.但是 Google Analytics 的涉及很特别,需要放到页面头部.不知道以后是否会去掉这个限制.




  • 相关软件插件的风险 

    另一个潜在的风险是一些依赖于该服务的软件插件可能会带来问题.这当然不是 Google 的错.但是在使用这些插件提供的功能之前你却不得不为自己的站点的稳定性考虑.毫无疑问的是,用户看到你的网站乱码之后会大大影响其阅读的兴趣.

  • Google获知你的站点的统计信息的潜在问题
    还有一点不得不考虑的是,Google收集到你的站点信息,会对那些依赖于Google广告获得收入的站点取得全面的分析.如果有一天 Google 认为你的广告质量并不是很高,而你发现自己的广告收入锐减,你会觉得冤枉么? 那么不要怪别人,因为"引狼入室"的人是你.虽然 Google 一再暗示自己不会做恶.但是除了 Google 谁能给你更多的保证呢?

到现在我还在期待 Google 该项服务的继续改进其灵活性与稳定性,或许有一天我将使用这个服务.你呢?

| | Comments (13)


November 14, 2005

看了车东用 MTRelatedEntries ByKeyword 这个插件实现 MT 的 Tag. 这几天我也在测试各个 MT 的 Tag 插件.最后选择了用 Tagwire.

MT 的站点上列出的关于 Tag 的 Tagging 分类中,功能最强大的应该是 Tags.App,Tags.App 需要建立额外的数据库对象,是基于MT-XSearch 框架的,设计的结构比较灵活,可以根据Tag 动态查询 Blog 内容.很容易创建"Tag 云"(Tag Cloud).不过我测试始终不成功:不能针对单篇归档产生合适的 Tag.输出的结果总是不正确的. 而且,糟糕的是,把我的原来所有文章的关键字都弄得乱糟糟一团;放弃这个插件还有另外一个重要原因:这是一款商业软件.

Tags.App 有一个简化版 Tagslite,不幸的是,我测试遇到了同样的问题.

另外有两个插件:TechnoratiTagsDelicious Tags ,因为功能单一,没有进行测试

相比之下,Tagwire 好用多了.配置简单,手册也很详细.而且,有两个独到的特性:多语言支持;灵活的 Tag 格式.以下为我在"单篇归档模板"中的配置:.

Continue reading "Tagwire:MT 的 Tag 插件" »

| | Comments (0)


October 25, 2005

在 Blog 盛行的今天,一些 Web 应用需要解析大量的 RSS Feed .如何提高效率是个非常重要的问题.在 MagpieRSS 的 Features 中列举了这样的一条: HTTP Conditional GETs Save bandwidth and speed up download times with intelligent use of Last-Modified and ETag.. 这里的 Etag 引起了我的注意.

什么是 Etag ?

通过阅读 RFC 2616 ,得到了对 Etag 的一点印象:

The ETag response-header field provides the current value of the entity tag for the requested variant......Entity tags are normally "strong validators," but the protocol provides a mechanism to tag an entity tag as "weak." One can think of a strong validator as one that changes whenever the bits of an entity changes, while a weak value changes whenever the meaning of an entity changes. Alternatively, one can think of a strong validator as part of an identifier for a specific entity, while a weak validator is part of an identifier for a set of semantically equivalent entities.

从上我们可以大致得知,Entity tags 本质上说是一种"强校验器",但是 HTTP 协议提供了一种通过给 Entity tags 打标签的"弱"的机制(类似于内容的校验码).虽然这段话后面通过两种方式进行了解释,但是还是有些晦涩.我看了这段话之后只是得出了 Etag 的 "E" 代表 "Entity" 而已.

Magpie 首页上提到了一篇文章: HTTP Conditional Get for RSS Hackers ,拜读之后清晰了许多.要先说说 HTTP Conditional GETs 的基本原理,很简单,就是说,从 Web 服务器取数据的时候,如果文件变化了,给我新的文件,如果文件没有变化,只需告诉客户端没有变化即可,不必再把文件取回来.这样就可节省大量的网络带宽和资源.

Etag 与 Last-Modified 是从 HTTP 1.0 到 HTTP 1.1 才有的概念.当我们从 Web 服务器获取文件的时候,只需要读取 HTTP 响应头的 Etag 与 Last-Modified 字段即可,这两个字段里面的具体内容是什么可以不管(可能会千奇百怪,RFC 2616 对 Etag 没有具体值的定义),把这两个值 Cache 在本地,下次检查文件是否更新的时候比对这两个值即可.如果没有变化,服务器的响应代码不是 HTTP 200 (OK) , 而是 304.

http.304.png

如上图.目前 OpenRSS 虽然订阅了40 多个 Feed,但是响应速度很不错.在使用 Gregarius 的过程中(Lilina 也应用了 ETag),发现了 FeedBurnrer 烧录的 Feed ,几乎都是用了 Etag 的(否则估计服务器要瘫痪,Hoho).我们再测试一下 HTTP header 的响应情况:

$ curl -I http://feeds.feedburner.com/dbanotes
HTTP/1.1 200 OK
Date: Tue, 25 Oct 2005 11:34:15 GMT
Server: Apache
Last-Modified: Tue, 25 Oct 2005 04:30:12 GMT
ETag: U4q478bDKLqZ8UMMC8A5afZuHug
Content-Type: text/xml;charset=utf-8

$ curl -I http://feeds.feedburner.com/dbanotes
HTTP/1.1 200 OK
Date: Tue, 25 Oct 2005 11:34:21 GMT
Server: Apache
Last-Modified: Tue, 25 Oct 2005 04:30:12 GMT 
ETag: U4q478bDKLqZ8UMMC8A5afZuHug
Content-Type: text/xml;charset=utf-8

在这个期间,我的 Blog 没有更新.所以 Last-Modified 和 ETag 返回的都是相同的值.这样 Gregarius 就不必重新解析了. 国内的 GreatNews 是支持 HTTP Conditional GETs 的,更棒的是还支持 gzip/deflate encoding.而另一个 RSS 阅读工具 POPU (周博通) 就不知道了.

以上是我的笔记,如有理解错误,请指正!

--EOF--

| | Comments (3)


October 24, 2005

因为 Gregarius 的 URL_REWRITE 做的不错.OpenRSS.net 也算上线了几天了.好奇心起,看看在各个搜索引擎的收录情况.从访问日志上看,各个搜索引擎的机器人都有光顾.尤其以 Yahoo Slurp 和 百度的 BaiDuSpider 最为频繁.这两家的爬虫居然各自有几千次.Google 的 Googlebot 光顾的次数比较少.每天大约 5/6 次而已. MSNBot 光顾的还要再少一些.

从搜索的结果上看,用 site:www.openrss.net 搜索百度,居然有 540 个站内页面可以找到. 搜索Google,只有孤零零的一个结果,而 MSN 的爬虫虽然来的次数少,但是还是有效率,可以找到 31 项. Yahoo! Search 呢? 用 domain:www.openrss.net 查询,结果为零.不过从一搜那里倒是可以找到一个.

2005/10/27Update:现在在一搜中的结果已经到了 470个.Google 还是 1. 在 Search.yahoo.com 中也出现了 9 条记录.百度1090 .不过 一搜 的窜升速度太快了.相信不久就可以超过百度.从这边爬虫的来访频度来看,也是一搜越来越频繁.

Continue reading "测试 OpenRSS.net 在几个搜索引擎的情况" »

| | Comments (0)


October 23, 2005

第一次注意到 Gregarius 是在 Lilina 的论坛里面. 看到 Gragarius 之后,就想抛掉 Lilina 以及 Ajax-ed Lilina. 因为 本身存在的一些问题没办法解决,不得不放弃.从一个普通用户的角度上看,Lilina 存在的主要问题有:

  • RSS 抓取速度太慢.尽管可以利用 Wget 工具在后台构建一个静态页面.但是 Lilina 订阅的种子数量还是不能太多.否则光解析就是灾难.
  • RSS Feed 不能分类.所有的 RSS 都放到一起.看起来有点杂乱无章.
  • 不支持数据库.
  • 开发进度缓慢,基本上已经停止开发.也就是说出现问题能够得到的支持非常的少.

另外一个功能类似的 Feedonfeeds ,结构太松散了.而对比之下, Gregarius 的功能似乎让人惊讶. 我比较关注的几点如下:

  • AJAX 能够带来更好的用户体验. 支持 AJAX 化的 Tag定制功能
  • Supports themes and plugins 带来了良好的扩展性.
  • Search in your feeds 具备查找功能 .
  • 良好的 url_rewrite 设计.
  • 支持 MySQL 和 SQLite

对 Gregarius 分析了几天之后,接着利用了几天的休息时间,把 Gregarius 在 OpenRSS.net 上搭建了起来.部署应该是个很简单的事情,但是因为是虚拟主机,遇到了很多问题.还好,大部分都已经解决.涉及到的问题大致有如下几个:

Continue reading "Gregarius , Ajaxed Online Rss Reader" »

| | Comments (8) | TrackBacks (1)


October 22, 2005

很多朋友是 FeedBurner 的忠实用户,把自己的 Blog ,图片书签等交给 FeedBurner 统一烧制成一个 Feed .其实,FeedBurner 也可以用来做 Blog 代理, BlogSpot 上的很多内容由于某种原因,国内都是不可以访问的,但是可以直接用 FeedBurner 烧制 Feed,这样间接的转一下,就可以看到大部分的 Blog 内容.

比如,Oracle 公司专家 Thomas Kyte 的 Blog ,就可以直接把 URL 交给 FeedBurner 烧制,可以自动探测出 Feed .

这样有的时候只能看到 Blog 的一部分.所以如果作者的 Blog "量给的足",不是只有摘要(Excerpt)或者链接.这个在 OpenRSS.net 上当我抓取 Official Google Blog 的 Blog 的时候很有体会.一次给足是个不错的习惯.期待 FeedBurner 以后能够推出可以抓取 Blog 全文的服务.毕竟这不是难事.

Continue reading "把 Feedburner 作为 Blog Proxy 来用" »

| | Comments (2) | TrackBacks (2)


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 (Page 12 of 18)