首页

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 (Page 10 of 18)



July 31, 2006

很久没有更新的 Lilina 升级了(看到首页有点变化。还以为是被黑掉了)。 新版本直接从 0.7 跳到了 0.9 rc1。改进特点如下:

  * Changed <? to <?php and <?= to <?php echo  
  * Changed physical styles to logical styles
  * Added browser sniffing and content type generating
  * Added RSS output
  * Fixed several bugs 
  * Added <GUID> support
  * Upgraded Magpie code (inc/ and extlib/)
  * Added more social bookmarking links 

实质的变动似乎不多。升级很简单。不过发现 "Fancy" 模式 CSS 文件似乎有一点问题。

如果发现速度慢,可以简单的做一个静态页面提高访问首页速度:

*/10 * * * * (/usr/bin/wget -t 60 -O /$Your_Path$/lilina/index.html  \
http://www.dbanotes.net/lilina/index.php ) 

Lilina 和 Gregarius 相比,软件结构清晰是最大的优点。

访问我的 Lilina 测试页面

| | Comments (3)


July 29, 2006

前几天把 DBA notes WikiTWiki 升级到了 4.04 版本。升级后遇到了一点文件权限上的问题。摸索了几天算是全部修复了。现在开始试运行 Oracle Database Wiki 。

DBA 朋友们,一起来玩 Wiki 吧。知识共享最有力量。可惜的是,现在几乎是我一个人的 Wiki。之前已经有几个朋友注册,但是几乎没有尝试使用的人。倒是有不少 Spamer 折腾的挺欢。发现有的用户 Comment 被用来作 SEO ,防止 Spam 任重道远。

如果在局域网内使用 TWiki ,速度不会是很大的问题,可 Web 上用 TWiki 搭建 Wiki ,的确有点慢。

也有好消息,以前比较头疼的 WikiWord 问题现在也缓解了许多,创建新条目的时候已经可以选择不用骆驼词(CamelWord)了:

WikiWord.png


求助:

那位朋友帮助做一个用于 Wiki 的图片吧?! 可以参考:

Powered by Oracle Database Wiki

把左边的 那个大 T 用 Oracle 字样替代就可以。

| | Comments (11)


July 25, 2006

本站后台的统计上看,OutfoxBot 这个爬虫最近非常频繁,辛勤的程度都超过了 GoogleBot, 快赶上 Yahoo Slurp了。

Awstats 给出的信息只有一个联系方式: outfox.agent@gmail.com . 网络上搜索了一下,没有很清晰的结果,从这个分析来看,这个机器人似乎和搜狐有关(名字也有点像),莫非是搜狗的么? 但是搜狗站点上并没有提供更多关于爬虫的信息。

| | Comments (5)


July 23, 2006

有点恼火。Dreamhost 最近频繁的出问题。今天又是几个小时的 Severe Power Outage。去 DreamHost Status 看一看,最近一两个月来三天两头的有问题。难道真的是用户数量太多了,管理上带来了问题?

| | Comments (3)


July 19, 2006

把 Blog 升级到了 3.31. 因为模版还是使用的旧模版. 所以 MT 3.31 的 Tag 功能没体现出来. 修改了一下,现在单篇归档的 Tag 已经可以看到了. 记录如下:

1) 修改 CSS 模版 加入:

.entry-tags {
margin: 0 0 5px 5px;
}
.entry-tags-header,
.entry-tags-list,
.entry-tag { display: inline; }
.entry-tags-list {
list-style:none;
padding: 0px;
}

2) URL_rewrite, 美化 URL
编辑根目录下的 .htaccess 文件, 添加:

RewriteEngine on
RewriteRule tag/(.+) /mt/mt-search.cgi?tag=$1&blog_id=1

第一个 mt 是你的 mt 安装的相对目库. 最后的 blog_id 值填入你的具体值即可. 我的是 1.

3) 修改 Individual Entry Archive 的模版
在 < $MTEntryMore > 后面加入:

<MTEntryIfTagged>
<div class="entry-tags">
<h2 class="entry-tags-header">本则 Blog 所属的Tag:</h2>
<ul class="entry-tags-list">
<MTEntryTags>
<li class="entry-tag"><a href="/tag/<$MTTagName encode_url="1"$>"<$MTTagName$></a></li>
</MTEntryTags>
</ul>
</div>
</MTEntryIfTagged>

4) rebuild 所有的单篇归档.

如果不允许做 URL_rewrite ,则 模版中的 Link 修改为:

<a href="<$MTTagSearchLink$>"><$MTTagName$></a></MTEntryTags>

最后效果请参考本则 Blog 全文.

| | Comments (4)


June 29, 2006

Technorati (现在被阻尼了, 可能你访问不了)的 Dorion Carroll2006 MySQL 用户会议上介绍了一些关于 Technorati 后台数据库架构的情况.

基本情况
目前处理着大约 10Tb 核心数据, 分布在大约 20 台机器上.通过复制, 多增加了 100Tb 数据, 分布在 200 台机器上. 每天增长的数据 1TB. 通过 SOA 的运用, 物理与逻辑的访问相隔离, 似乎消除了数据库的瓶颈. 值得一提的是, 该扩展过程始终是利用普通的硬件与开源软件来完成的. 毕竟 , Web 2.0 站点都不是烧钱的主. 从数据量来看,这绝对是一个相对比较大的 Web 2.0 应用.

Tag 是 Technorati 最为重要的数据元素. 爆炸性的 Tag 增长给 Technorati 带来了不小的挑战.
2005 年 1 月的时候, 只有两台数据库服务器, 一主一从. 到了 06 年一月份, 已经是一主一从, 6 台 MyISAM 从数据库用来对付查询, 3 台 MyISAM 用作异步计算.

一些核心的处理方法:

1) 根据实体(tags/posttags))进行分区
衡量数据访问方法,读和写的平衡.然后通过不同的维度进行分区.( Technorati 数据更新不会很多, 否则会成为数据库灾难)

2) 合理利用 InnoDB 与 MyISAM
InnoDB 用于数据完整性/写性能要求比较高的应用. MyISAM 适合进行 OLAP 运算. 物尽其用.

3) MySQL 复制
复制数据到从主数据库到辅数据库上,平衡分布查询与异步计算, 另外一个功能是提供冗余. 如图:

InnoDB MyISAM 拓扑

后记
拜读了一个藏袍的两篇大做(mixi.jp:使用开源软件搭建的可扩展SNS网站 / FeedBurner:基于MySQL和JAVA的可扩展Web应用) 心痒难当, 顺藤摸瓜, 发现也有文档提及 Technorati , 赶紧照样学习一下. 几篇文档读罢, MySQL 的 可扩展性让我刮目相看.

或许,应该把注意力留一点给 MySQL 了 .

--End.

| | Comments (14)


May 25, 2006

开源 RSS 聚合工具 Gregarius 一直在持续的改进. 最新的 0.5.5 版本相对于以前的老版本有了许多新功能. 升级安装已经变得非常容易. 可以选用安装界面的方式, 管理密码也可以在安装后直接创建.新的主题 UI 已经足够好(参见 OpenRSS.net). 可以配置选择中文界面(简体/繁体).

现在插件也远比以前丰富多了.插件也有针对与 del.icio.us 等站点的交互的.这次新选用了 Google Adsense 插件

依然存在的问题: 

1) Tag 仍然不支持中文;
2) 中文子目录的 URL 重写还是有 Bug;
3) 不支持多用户;
4) Bug , 大量的 Bug !

相对于 Bloglines 等联机 Blog 阅读工具, Gregarius 的速度仍然是最大的优势.

--End.

| | Comments (5)


May 23, 2006

Cal Henderson 是大名鼎鼎的 Flickr 网站的开发者之一.在一篇名为 Serving JavaScript Fast 的文章中,他介绍了用于 Flickr 站点应用优化的技巧,读罢感觉获益良多."嚼一下别人的馍",概括一下该文的主要内容.

Flickr 是 Web 2.0 的代表站点。面对的网络问题除了一般 Web 站点都会有的内容优化之外, 还有必须要灵活处理 JavaScript 与 CSS 的频繁变化后部署分发带来的复杂性。

设定文件大小的策略 首先面临的一个问题是把所有的 JavaScript 与 CSS 放到一个文件中好呢,还是分割成多个文件 ? 从减少网络请求的角度上考虑, 前者更好,后者差。但是从并行的角度考虑, IE 与 Firefox 默认情况下都只能同时从一个域请求两个资源. 这会在很多情况下给用户带来不良的使用体验--必须所有的文件都下载完毕才可以看到像样的页面. Flickr 采用了折衷的办法--在保持文件数量尽可能少的情况下,把 JavaScript 与 CSS 分成多个子文件. 这在开发上带来了复杂性,但是对性能的收益是巨大的。

压缩的优化问题 毫无疑问,对站点内容进行压缩是一个比较常用的 Web 优化手段.但是并不一定都能达到理想的效果.原因在于 mod-gzip 模块不但消耗服务器端 CPU 资源,也消耗客户端 CPU 资源. 而且, mod_gzip 压缩文件后创建的临时文件是放到磁盘上的,这也会给磁盘 IO 带来严重的问题. Flickr 采用的是 Httpd 2.x 以后支持的 mod_deflate 模块.压缩操作都在内存中进行.mod_deflate 在 Httpd 1.x 是不可用的, 不过可以通过创建 RAM 盘的方式来间接提高性能.

当然, mod_gzip 到也不是一无是处, 对于预压缩的文件, 还是有好处的. 而且, 采用压缩的时候,也要注意策略. 图片文件压缩就没什么必要了(Flickr 上图像多, 而且压缩得不到什么好处). Flickr 只对 JavaScript 和 CSS 进行压缩. mod_gzip 新一点的版本能够自动通过配置 mod_gzip_update_static 选项自动处理 预压缩的文件. Cal 也指出这个特性在一些旧版本的浏览器上会出问题.

压缩的另一个主要手段是内容的压缩. 针对 JavaScript 可以进行通过减少注释、合并空格、使用紧凑的语法等小技巧(Google 的所有脚本都非常难读,而且非常紧凑,思想类似).当然,经过这样处理的 JavaScript 可能带了很多括号不容易解析,Flickr 使用了 Dojo Compressor 来构建解析树。Dojo Compressor 开销很低,而且对于最终用户是透明的. JavaScript 的处理方法介绍过,CSS 处理则相对简单.通过简单的正则表达式替换(比如把多个空格替换为一个空格符), 最高可以获得 50% 的压缩比。

Caching 的优化 Flickr 的开发者充分利用了 Http 1.1 规范定义的 Etag 与 Last-Modified 机制 来提高 Caching 的效率. 值得注意的是,Cal 介绍了一个在负载均衡条件下的 e-Tag 小技巧. 即可以设定 Apache 通过文件调整时间与文件大小获得 E-Tag ,而默认情况下, Apache 是通过文件节点获取 e-Tag 的。当然,这也不是很完美,因为会影响 if-modified-since 。

灵活运用 mod_rewrite 据说 Flickr 网站应用是进行每日构建的(Daily Build)。 如果没有一个灵活的机制恐怕这是不可想象的。而且,在 Flickr 这样的站点, 内容的修改同步的处理都是很让人头疼的难题. 他们的利器是 mod_rewrite 的灵活运用。通过配置 URL 重写规则,很容易切换到不同的环境下。听起来很简单, 但是没有一定的 Web 技术功力谈何容易做到 ?!

通过这几个主要方法的运用,我们看到了如梦幻一般高性能的 Flickr .


BTW: 因为在 Flickr 在国内没有服务器, 大陆用户访问的速度就别提了 :(

--End.

| | Comments (11) | TrackBacks (1)


April 3, 2006

前几天收到 Neso 的邀请测试一下新推出的 Souyo . 一直比较忙,到现在一共上去两次.

1) 第一次发现的一个问题是 Souyo 的官方 Blog 的验证字搞得模糊无比(现在已经修正了吧), 连着几次输入都不正确.也就不想留言了.刚才又上去一看, Blog 还是有问题, 右边栏都跑到底下去了.

2) 测试了几个搜索, 以我的 Blog 为例, 居然一个链接都没有. "链接:0,来自0个博客 - 链出:0". 而搜索结果右边的"您也许会感兴趣"的推荐,居然没有一个感兴趣的. 反复几次, 似乎结果不是刷新的. 像这样不会有作用的功能不如等达到真的 Beta 版再让用户看到更好一些.

3) 名为 Yoooo 的图片搜索结果都显示在一页, 相信绝大多数浏览者都没有耐心等待页面都下载完毕. 而且,搜索到的图片质量...有点惨

Continue reading "小评 Souyo" »

| | Comments (2)


March 23, 2006

前几天, 雅虎移动产业策略师 Russell Beattie 批评 Web 2.0 没有自己的盈利模式. 从现在来看, 99% 的号称自己是 Web 2.0 的公司都找不到自己的盈利模式. 虽然国内有人爱拿"百万格子"说事儿, 其实"百万格子"是否是 Web 2.0? 我个人认为"百万格子"充其量是一场网络行为主义,完全是网络环境下催生的特定传播行为. 其实和"芙蓉姐姐","后舍男孩"们的行为如出一辙, 赋予这样行为价值的看客们绝大多数是"从动"参予者.

那么说回来, Web 2.0 是否有赢利模式 ? 国外的不好说, 就说国内吧. 盈利模式应该还是存在的. 在我看,至少就有如下生财模式:

圈投资人的钱. 三五个人, 靠着一个概念圈了一笔不菲的投资, 某种程度上已经算盈利了,难道非给投资者盈利才算? 让 Web 2.0 的运作者先富起来吧!

赚"擦边球"的钱 现在的一些号称 2.0 的网站, 登录一看满屏的色情信息, 还以为进了一个黄色网站呢. 这样丰富的"内容"想不赚钱都难--有色情内容就有人看,有人看就有流量,有流量就有广告费,有广告费.....赚钱喽. 人家这都是"用户创造的微内容".我就奇怪,为什么 del.icio.us 也是书签收藏的站点,人家那里色情连接怎么就那么少呢?

Continue reading "歪批 Web 2.0 盈利模式" »

| | Comments (3)


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 (Page 10 of 18)