关于 Nutch 的一个问题: 中文乱码


作者:Fenng
出处:http://www.dbanotes.net
日期:September 17, 2005

« Install Oracle 10g on SuSE 10 | Blog首页 | 免费杀毒软件与防火墙 »


很多朋友都遇到 Nutch 0.6 输入中文会出现乱码的问题。这个问题其实和 Nutch 关系不大,主要原因是使用 Tomcat 5.0 的问题。解决办法是修改 Tomcat 的 server.xml 文件的 connnector:

<Connector port="8080"
    maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
    enableLookups="false" redirectPort="8443" acceptCount="100"
    connectionTimeout="20000" disableUploadTimeout="true" 
    URIEncoding="UTF-8" useBodyEncodingForURI="true" /> 

其中 URIEncoding="UTF-8" useBodyEncodingForURI="true" 是需要新增的。否则搜索栏输入的字符默认编码将不能正确解析。

注:这个小 Hint 本来是写在站点的首页页面的,今天把他整理一下放到这里.

Technorati Tags:

Posted by Fenng at September 17, 2005 10:47 PM
Last updated at 11:05 PM on September 17, 2005


相关文章

Trackback Pings

TrackBack URL for this entry:
http://www.dbanotes.net/mt/mt-tb.cgi/286

Comments


I also oneself something would want to find out on this theme. Very attentively I will read every post.
Notebooki

Posted by: Aparaty cyfrowe at January 29, 2006 11:20 PM

Nutch 是 什么?

Posted by: 速泡 at February 27, 2006 03:38 PM

Post a comment



Hint: 为避免您收到垃圾邮件,请尽量不用使用真实的邮件地址.


Remember Me?