Entries tagged with “egosurf” from DBA notes
标题里的 egc 代表:ego-Generated Content,是我模仿 UGC(User-generated content)造出来的一个词。用以表示个人生成内容,尤其是在一些 UGC 网站产生的内容。
记得 CSDN 的曾登高问过我:
如果 CSDN 开发一个 Google Group的功能,你会创建自己的小组,建立一个兴趣小圈子吗?
我的直接回答是"不用",尤其是国内的很多明显是克隆国外服务的站点,比如饭否这样的。最近一段时间里,一觉醒来,似乎遍地都是 SNS ,对于一些明显是浑水摸鱼的服务,我一般会敬而远之,即使注册了,也基本不会真的花费心思去参与。原因只有一个:自己生成的内容是有价值的,有价值的东西不要随便扔到不靠谱的地方,当然,这么说肯定会引起一部分人的误解(我现在也在用个别的 SNS 服务,主要的目的还是为了研究用户体验和产品设计。作为一个技术人员,至少到到现在为止,还没从 SNS 服务里面发现比较有价值的技术内容)。
自我生成内容成本其实很高。考虑到每个人的一生也就那么长的时间,如果你的时间有价值,那么产生的哪怕每个字符都有必要保存,一旦内容丢失,对个人来说,就是最大的浪费。我个人不认为 SNS 之类的服务能产生更有价值的信息,倒是有可能产生更有价值的"关系",而且,SNS 的服务很少让人静下新来作一些"沉淀",每天被新信息充斥着。
至于 LifeSteam:之所以会产生 Lifestream 功能的服务,其终极目的还是要把一个人产生的内容融合起来,但这里面最大的一个问题是,不能做信息的归档保存(类似数据库-> 数据仓库的机制),只是即时更新的信息流而已。从这一上来说,也不利于 egc 的整理。
所以,有必要谨慎对待自我产生的内容,尽管你还没发现这些内容的价值。也不要趋之若鹜的去到处尝试一些新服务,做小白鼠其实没什么大价值。
个人建议:
- 同类服务只用一个,最多用两个,如果用了三个,那么你是一个义务测试员。
--EOF--
看到这篇 2007 抓虾最热 50 篇文章分析,甚感惭愧。没一篇是自己写的。翻了一下抓虾上被推荐的文章列表,看看这一年抓虾用户给了 DBAnotes.net 多大的关注程度。
重新安装系统后的几件事情 >> 推荐数:70
本想写给自己备忘的一篇文章反而收到了最多的关注程度(不过即使最多也没超过 100 个推荐)。始料未及。或许是越简单的东西反而越普适.
网站架构分析篇
WikiPedia 技术架构学习分享 >> 推荐数:51
架构类文章被推荐最多的一篇,之所以受到了更多关注怕还是沾了 WikiPedia 名头的光。
YouTube 的架构扩展 >> 推荐数:43
Google 收购 YouTube 后,迫不及待的把 YouTube 纳入自己体系架构中。YouTube 也是大树底下好乘凉。
财帮子(caibangzi.com)网站架构 >> 推荐数:27
采访了财帮子的 Meng Yan 后整理的资料。07 年财经类站点很火。08 年相信他们会更有机会。这也是唯一一篇爆料国内网站架构的文章。
WordPress 对 Gravatar 进行的优化 >> 推荐数:22
WordPress 收购 Gravatar 后,干了啥好事?
Yahoo!社区架构 >> 推荐数:30
关于雅虎技术背景的爆料。
Twitter 架构扩展:100 倍性能提升 >> 推荐数:30
Twitter 是 2007 年我用的比较多的服务了。这个站点现在还需要不停的扩展
Internet Archive 的海量存储浅析 >> 推荐数: 13
从写这篇分析开始,我有了写更多系统架构分析文章的念头。
技术备忘篇
Unix 速成小法 >> 推荐数:35
这篇和另一篇 GNU 核心工具 遥相呼应。算是我对 Unix 使用中的一点感悟。
Bash Shell 快捷键的学习使用 >> 推荐数:33
Shell 学习笔记,备忘。俗语说,好记性不如烂笔头,诚然。
GNU 核心工具 >> 推荐数:18
关于GNU Core Utilities 的小小介绍。
从 MySQL 迁移到 Oracle (傻瓜篇) >> 推荐数:16
从 Oracle 迁移到 MySQL 的文章很多,从 MySQL 迁移到 Oracle 的文章则很少。本文算是抛砖引玉。
探讨篇
Web 2.0 站点扩展性问题随感 >> 推荐数:27
Web 2.0 站点扩展性问题越来越突出,已经成为制约 Web 2.0 发展的一个障碍. 一点想法以及探讨。
Windows 上最好用的 GTD 工具是哪一个? >> 推荐数:21
GTD 工具林林总总,可最好用的是哪一个?怕是没有最好,只有哪个合适而已。
扯淡篇
G FW 三定律 >> 推荐数:22
这篇文章被关注绝对不是因为写的好,而是因为痛恨 GF W 的人太多了。
诡异篇
推荐本站在 del.icio.us 收藏最多的文章 >> 推荐数:28
一点题外话:
1)抓虾数据仍有潜力可挖掘。像我的最被关注的帖子,如果能给自动做个分析该有多好?
2) del.icio.us 和 抓虾用户兴趣点多有重合之处。但普及类的文章在抓虾上怕是更受关注。
3) 被推荐多或者被收藏多的文章不一定得到比较多的评论
不早了,改天想起来再写
--EOF
我的 del.icio.us 账户下有个 egosurf 标签,专门是收集我写的文章以及关于 egosurf 的一些信息。稍加整理了一下。目前被收藏最多的文章列表如下:
Flickr 的开发者的 Web 应用优化技巧
目前共有 121 人收藏
Flickr 绝对是 Web 2.0 站点中的当红明星。所以 Flickr 开发者的技巧也容易引起人关注。这是除了我的 Blog 首页之外被收藏最多的一篇文章。
YouTube 的架构扩展
目前共有 55 人收藏
这是我一直想写的一个题材。可直到最近才找到一些蛛丝马迹,顺藤摸瓜写了一点介绍。YouTube 因为 Google 的关系也是很吸引眼球的。
Craigslist 的数据库架构
目前共有 48 人收藏
介绍了著名分类广告网站 Craigslist 的数据库架构以及一些相关数据。
了解一下 Technorati 的后台数据库架构
目前共有 45 人收藏
对著名 Blog 搜索引擎 Technorati 的数据库架构的分析介绍。Technorati 被绿色长城挡住了好久不能访问,因为这个原因,现在国内 Blog 圈子对他的注意力小多了。
Yapache--Yahoo! Apache 的秘密
目前共有 20 人收藏
Yahoo! Apache 的一些介绍。
eBay 的应用服务器规模
目前共有 16 人收藏
eBay 的后台架构介绍。另外还有一篇 eBay 的数据库分布扩展架构也推荐一下
Web 2.0 站点扩展性问题随感
目前共有 16 人收藏
关于站点扩展性问题有感而发之作。关心人数也算可以
Geek ? 什么是 Geek ? 谁是 Geek ?
目前共有 16 人收藏
Nerd 会在 Slashdot 流连忘返,而 Geek 或许每天都看 Engadget。Hacker 呢? IRC 里去找找看, 运气好你能碰到一个,但那些自称是 Hacker 的,其实都不是。最后说一下,我用这篇文章作了一下 SEO 实践。
关于世界上的超大数据库
目前共有 13 人收藏
关于世界上排名前几位的 VLDB 的信息。VLDB,超大数据库,其实叫做"狂大数据库"倒是也很贴切。这类题材一向容易有不少读者,可没啥实际参考价值。
回答的智慧
目前共有 13 人收藏
相信很多人都看过那篇提问的智慧,回答也需要智慧。
观察到的一些东西:
1) 可能是 del.icio.us 用户群都是偏 IT 人士,所以 egosurf 到的收藏最多的文章题材大多是关于 Web 2.0 站点的后台架构的。
2) 收藏归收藏,但是添加注释的少之又少。可能这就是 1/100 规律吧
3) 自己用心写的很多文章其实读者未必会关心的。大多数读者还是更关心热点信息
这篇 Blog 发表后订阅数或许就会有变化了
--EOF--
AnySQL 最近在改进 Movable Type 的性能。又有新成果:写了一个 NewSearch.pm 来代替 Search.pm , 并有说明《通过Cache提升MT基于Tag搜索的速度》 , 极力向我推荐,我做小白鼠,测试后发现对于 MT Tag的查看速度的确有很大提升,而且使用简单,无毒无公害. 在此向他的辛勤编码工作表示敬意!
对右边栏的"友情链接"作了一些调整,如果链接 Blog半个月才更新一次,将会放到"更多链接"页。从现在起,尽量做到不做无意义的交换链接(昨天有个朋友联系我,交换链接,点开一看居然是"超女"内容,这和我的 Blog 内容根本不相关). 通过一段时间的观察,发现还是 Blogger 间的引用最有效果。
对于主动链接到我的,通过 egoSurf 脚本, 会自动发现的。 对于关心 PageRank 的 Blogger ,这样也公平一些.
本来的链接途径发现是:Here-->BlogSearch-->BloggersLink2Me
通过这个脚本简化一步:Here-->BloggersLink2Me
Blog 改进,其乐无穷.
--EOF--
我在 Google Blogsearch 的时效性以及其他 说过:
因为 Technorati 访问困难,很长一段时间里,Google Blogsearch 就成了我进行 Blog eogsurf 最常用的工具
那天又和车东聊了一下,都认为把这个东西在本地展现会好很多。今天作了一个页面,把 Google Blogsearch 关于 www.dbanotes.net 的相关内容动态展示在本地页面上。效果参见 http://www.dbanotes.net/egosurf.php,这个页面的内容对应 http://blogsearch.google.com/blogsearch?hl=en&q=www.dbanotes.net 搜索出来的结果。
其实如果 MT 3.31 的 Feed Widget 好用的话,根本不用额外的脚本来做,可是这个东西在我的页面上解析任何 RSS 地址都会把展示内容之外的东西全变成乱码。
这个 PHP 脚本调用 MagpieRSS 库,没有乱码了,但还有些 Bug 。接下来准备把 del.icio.us 备份到本地展现出来。
--EOF--
其实这个现象观察到好久了,那就是 Google Blogsearch 的实效性非常好,一般情况下 4-10 分钟就可以通过 搜索结果RSS 观察到我刚发表的 Blog 。因为 Technorati 访问困难,很长一段时间里,Google Blogsearch 就成了我进行 Blog eogsurf 最常用的工具。
国内的 Blogger 中,Keso 应该是 Google Blogsearch 的最忠实用户:
“我还是很关心别人怎么说我和我写的东西,所以看到有人谈论我,我就会很感兴趣地去读那些博客。提到我的人,多半是我博客的读者,他们关注我,我也会关注他们。很多次,都是因为有人提到了我的名字,我才发现了新的博客。”博客搜索为博客群体彼此间进一步的交流提供了可能。”--Keso 接受《互联网周刊》的采访。
可能是所有 Blogger 的天性,有的时候我也这样,看到别人链接或引用了我写的东西,总要跑上去看看有没有引发出来什么更新鲜的内容。
发现,有的时候也是一种乐趣。
Blogsearch 中的 inurl 语法虽然有效,但是搜索结果有很大问题。应该用 Blogurl 语法(如 blogurl:dbanotes.net 所以车东以前做的测试似乎不太能够说明问题。我的测试结果:
| BSP 名字 | 结果数量 |
| spaces.msn.com | 105,881,316 |
| myspace.com | 73,014,029 |
| Blogspot.com | 66,813,563 |
| Spaces.live.com | 10,980,686 |
| Livejournal.com | 62,989,323 |
| Typepad.com | 4,405,857 |
MSN Space 是当之无愧的第一大 BSP。
国内的 BSP 除了 CSDN 结果有三万多,其他的 BSP 都少的可怜--有的还没有我个人 Blog 的多。推测原因可能第一个是网站页面结构普遍设计的不好,对 Blog 的一些内置的技术特性理会的不好,也难怪,人家都是用作新闻的手法搞 Blog 的。再一个或许是 Google 对中文用户还没有投入那么大的兵力( Blog 的及时性可能只是针对少数更新频繁的 Feed 抓取 )。 如果你知道原因,请告诉我。
--EOF--
最近好多人尝试了 egosurf.org 这个站点提供的服务:egosurf . 什么是 egosurf ? 这个词拆开来是 ego(自我.本我.心理学术语)+ surf(网络冲浪). 根据 Eric S. Raymond 的《黑客大辞典》中的定义
To search the net for your name or links to your web pages(在网络上搜索自己的名字或者自己Web页面的链接). Perhaps connected to long-established SF-fan slang egoscan,
to search for one's name in a fanzine.
最早了解这个词是从车东[怎么又是这个家伙:)]的 Ego Surfing = Ego + Surfing . Blogger 进行 egosurf 的应该不少(虽然很多人可能没意识到), 其实如果把一个站点看作一个互联网实体,也是应该进行 egosurf 的. 因为通过这个行为能够做到以下几点:
- 1. 更好的了解自己的站点信息,以便吸引更多的有针对性的读者
- 2. 知识发现. 了解哪些用户通过自己的站点内容引发出更多的内容,这些内容有哪些与自己提供的信息能够互补.
- 3. 满足自己的虚荣心 ;) 或者了解自己/站点的影响力
