Posts Tagged ‘Web’

apache2 和 tomcat5.5 集成及虚拟主机配置

星期四, 11月 26th, 2009

想起以前 tomcat 还没配过虚拟主机,便想试试,就随手集成了 apache2。把配置过程记录在这里。

安装 apache2、JDK、tomcat 就不写了,查看文档吧。

apache2 要整合 tomcat 需要用到 mod_jk。Ubuntu 下安装 mod_jk 很简单:

$ sudo apt-get install libapache2-mod-jk

可以查看一下这个包安装后产生的配置文件:

$ dpkg -L libapache2-mod-jk
1
2
3
4
5
6
7
8
......
/etc
/etc/libapache2-mod-jk
/etc/libapache2-mod-jk/workers.properties
/etc/apache2
/etc/apache2/mods-available
/etc/apache2/mods-available/jk.load
......

(更多...)

HTTP 输出 Gzip 的注意事项

星期二, 8月 25th, 2009

昨天上 Jobsdigg.com 发现 Firebug 里飘红,于是做了一些测试,在这里做个笔记。

如今海量存储已经不是问题,反而是带宽资源有限,成了 Web 应用中主要瓶颈的所在。因此减少响应的传输量也就成了优化的关键。

Yahoo 的 34 条前端优化规则 中提到了 Gzip 压缩,Google 的前端性能最佳实践 中也提到了 Gzip 压缩。把服务器响应中的文本内容用 Gzip 压缩后可以减少大约 70% 的大小。这着实对前端性能和用户体验的提升有明显的帮助。

从 HTTP/1.1 开始,客户端就可以在请求头中添加

 Accept-Encoding: gzip,deflate

来向请求的服务器表明自己支持 Gzip 压缩的响应。Web 服务器则在响应头中添加

 Content-Encoding: gzip

来向客户端表明响应体是经过 gzip 压缩的。

(更多...)

源代码的字符集不同带来的问题

星期日, 3月 29th, 2009

这两天在研究 Jobs Digg 的中文 URL 编码乱码的问题,我发现原来是由源代码字符集和数据输入输出字符集不同造成的。

这个乱码问题是这样的。在 Jobs Digg 的网站上,中文分类的链接里 URL 编码出错,无法还原成原来的中文名称。比如,UTF-8 的“招聘”这两个中文的 URL 编码应该是 %E6%8B%9B%E8%81%98,而出错的串变成 ae%8B%9Be%81%98。

产生这个问题的原因是在添加/更新分类的时候,Pligg 会把这个分类名称另外保存成一个 category_safe_name,代码中是先用 str_replace 函数把分类名称中可能包含的特殊字符转换成安全字符,再进行 URLEncode。

(更多...)

ThinkPHP 框架的 PATHINFO 模式对站点性能的影响

星期二, 12月 30th, 2008

最近在做的是一个基于 ThinkPHP 框架的webgame项目。在做性能优化的时候,发现 ThinkPHP 框架中 URL 的 PATHINFO 模式对性能有些不好的影响。

首先看看 ThinkPHP 的默认配置注1

URL_MODEL=1
URL模式: 0 普通模式 1 PATHINFO 2 REWRITE
默认为PATHINFO 模式,提供最好的用户体验和SEO支持
PATH_MODEL=2
// PATHINFO 模式
// 普通模式1 参数没有顺序/m/module/a/action/id/1
// 智能模式2 自动识别模块和操作/module/action/id/1/ 或者 /module,action,id,1/...
默认采用智能模式

把URL参数以斜杠分隔,这样 URL 看起来就比较友好,不管是对人(用户)还是对蜘蛛(机器人)都是。但在处理这种模式下的 URL 参数时,ThinkPHP 却做了影响性能的行为。在这种模式下,如果浏览器的 GET 参数是以常规的方式来传递(即参数以&分隔),ThinkPHP 在处理 URL 是时候,会把这样的参数重新拼成以斜杠分隔的“规范”的形式,然后向浏览器发一个重定向的响应头,让浏览器重新用“规范”的URL形式来请求。而重定向在高性能网站设计中是比较忌讳的,因为增加了浏览器向服务器提交请求的次数,也就增加了前端加载的时间,同时还会增加服务器的负载。这对于设计高性能的站点来说,是个不利的因素。注2

(更多...)

2008年终总结

星期三, 12月 24th, 2008

根据《程序员修炼之道》的建议,今年收获很多,嗯。

一直坚持使用 Ubuntu Linux 作为操作系统,坚持使用 Vim 作为主要开发的编辑器。经过一年的实践,对 Linux 的认识又有所提高,对 Vim 编辑器已经比较熟练。在 Linux 平台上作开发,效率比在 Win 平台上高出很多,主要是因为强大的开源工具集。

年初,读了《Learning Perl》,对 Perl 语言进行了初步的学习,之后写了几个小脚本,主要用于自动化方面,例如解析 CSV 文件、Excel 文档,自动处理电子邮件,以及系统管理等,并在实践中有所提高。对 Perl 的学习,是我走向 LAMP 的导火线。

由于目前国内 Java 和企业级开发环境的恶劣1,以及自身兴趣所在,决定转向 LAMP 方向。

利用出差那段时间的空闲,读了《PHP5 权威编程》,并接触了 WordPress。因为我的 Linux 和编程基础较好,所以转向 LAMP 的路很通畅。目前在一家互联网公司做 WebGame 的开发。

今年还读了不少好书,包括《精通正则表达式》、《JavaScript 权威指南》、《构建可扩展的Web站点》、《高性能网站建设指南》、《时间管理——给系统管理员》等等。

由于结合了 Web 方面的开发实践,效果很好。对 Web 站点的建设,有个最佳实践作为指导,对前端优化,也有个最佳实践作为指南,在实际开发中项目受益和个人收获都很大。尤其是对 Javascript 的深入学习和实践,理解并掌握了最核心的闭包、函数作用域链和函数调用对象的概念2。同时,掌握了命名空间,模块化开发等较高级的 Javascript 技巧。在 LAMP 开发过程中,也逐步认识到了开发符合标准 HTML/XHTML,CSS 的好处。

在项目开发中,对时间管理的概念有了初步的认识,并结合项目管理,体会到了注重时效3的重要性。

(更多...)

CSS+DIV不是标准布局

星期日, 12月 21st, 2008

CSS+DIV不是标准布局。

标准倡导的是用有意义的标签,而不是div这种无意义的标签的滥用。

其实tabel和div都是标准HTML的标签,按照标准的建议,应该将table用在数据表格展现的地方,也只有用table才能最好地展现表格数据。如果用div来表现表格数据,那将和用table来做页面布局一样,使web页面设计陷入标签和内容不统一的局面。这不是标准所建议的。

国内最近一两年一直高呼div+css,其实会对大家造成一种误导,让大家对标准产生误解。

再强调一下,css+div并不是web的一切,就像table一样。我们应该使用有意义的标签,和内容统一的标签,这才是符合标准的精神。

用有意义的标签加CSS的布局才是最佳的布局。