当前位置: 编程技术>移动开发
本页文章导读:
▪成也Titanium败也Titanium-之cons 成也Titanium败也Titanium-----之cons
接上篇,我们来说说Titanium另外一面,看看他到底有什么样的不足。 1)收费的Titanium 天下没有免费的午餐,免费的另一面就是收费!Titanium的营收模式分.........
▪ 从当地sdcard中读取图片显示 从本地sdcard中读取图片显示
http://hi.baidu.com/fgfd0/blog/item/0dd055ee92730debb2fb9512.htmlBitmap bm = BitmapFactory.decodeFile("/sdcard/images/20120315100145150.jpg");
......
▪ HttpClient 课程 (二) HttpClient 教程 (二)
HttpClient 教程 (二)第二章 连接管理HttpClient有一个对连接初始化和终止,还有在活动连接上I/O操作的完整控制。而连接操作的很多方面可以使用一些参数来控制。2.1 连接.........
[1]成也Titanium败也Titanium-之cons
来源: 互联网 发布时间: 2014-02-18
成也Titanium败也Titanium-----之cons
接上篇,我们来说说Titanium另外一面,看看他到底有什么样的不足。
1)收费的Titanium
天下没有免费的午餐,免费的另一面就是收费!Titanium的营收模式分两种:增值收费和平台。基本部件免费,高级部件、Titanium Studio的附加功能和官方专业指导服务都需要付费。而且要想获得他们专业的1对1服务,更是相当的昂贵!
2)贫乏的开发文档
API文档不完整,要么书写的过于简单,要么干脆就没有提到,要么就是版本已经升级没来得及更新,偶尔还有写错的。
查看API是很多时候解决问题的最好方式,应该在最大程度上重视API的提供。
提供的Guides内容也很有限,很多东西都没有提到,也就是能够得到一些基本的信息而已。
Guides虽然是以WIKI的形式提供的,但也只能是他们自己的职员才能够编辑。
--->(2012/03/26)Titanium 提供可编辑的Community Wiki了
同样在Github上的project里理应开发的wiki也没有开放。
他们提供了很多的入门视频,出发点是好的,但是一些由于版本升级后已经过期的视频没有被拿下,无法分辨是否还能观看使用。
3)Q&A论坛不完善
首先他们使用的Q&A论坛程序本身在技术和设计上就存在很多问题,比如你想查找个问题是很费劲的,它所给你显示的结果的排序非常混乱,不知道是否结合了回答数,点击数,发布时间等,但就是跟你想象的结果差的太远,你就得挨个看看每个问题是否跟自己的问题类似,当你将你的Q&A Profile的Notifications设置成Enabled的时候,你也很多时候收不到来自论坛的邮件。这样你就无法知道是否有人回答了你的问题,不得不每次都把问题挨个查看一遍。
很多人希望得到他们开发人员的回答,但是他们很少在Q&A论坛中回答问题,偶尔一次就是很难得的了。你会发现很长时间都没有人理会问题,很多时候还是一些热心的开发者来提供回答。
4)构建问题太多
这是大家普遍反应的问题,在环境构筑,应用构建时候会出现很多问题,比如找不到SDK,build时出错,不能启动模拟器等等
应用构建花费时间太长,很多时候当你点击启动emulator后,很长时间才能把模拟器启动起来,而模拟器启动起来后,你又会发现,Titanium总是提示找不到模拟器,让你重新启动。你不得不一遍一遍的重复这启动这个操作,直到它好用。
5)性能太差
问题最大的还是性能问题,在Android下尤为严重(1.8版后引入V8后稍有改善)。当你往页面上添加很多View的时候,页面显示就很吃力,当你的Tableview中有很多行时,滚动起来就很费劲等等。
6)无缘无故的crash
最苦恼的就是这个问题了,因为它会让你抓狂。也不知道什么原因,莫名的系统就提示你发生错误,不能响应了。一个最严重的问题是,应用程序崩溃时没有任何明显的原因,而且错误报告太简单,很难帮助开发者解决问题。很严重的时候他会影响到开发者发布应用到Appstore或AndroidMarket上去。
7)无法做内存管理
不用开发者考虑内存管理,是好事也是坏事。你将无法知道你的内存使用状况,发生内存溢出的话,你将无从下手。很多时候会让你陷入内存溢出的困境中,无法解决。
8)UI也存在问题
目前提供的UI控件也存在着Bug,比如说,不能响应事件,无法滚动,不能显示等等。
UI是应用的“门脸”,如果这里出现了问题,将直接导致用户卸载应用。有时候导航不能正常工作,造成了一些导航控制不能实现,UI的设计被打破,如果这发生在一个真正的应用程序商店的产品身上的话,对开发者来说将是一个灾难。但是苦恼的是你怎么Review你的代码都发现它没有任何毛病。
9)Bug修复太慢
成千上万的开发者在使用Titanium,每天都会发现很多问题,提交给了Appcelerator。但是你会发现很多bug很长时间都未能解决,间隔几年的都有。
10)IDE功能不全
最开始Appcelerator提供的IDE是Titanium Developer,自从收购Aptana之后,开始提供Titanium Studio。Titanium Studio是一个基于Eclipse的Aptana自定义版的IDE开发工具,它允许你创建,管理,测试你的移动应用项目工程,而且将工程自动打包发布到模拟器或者真机上去。而Titanium Studio在一遇到问题是就不在往控制台输出信息,最为严重的是会偶尔在构建的时候忽略代码的修改。你不得不每次修改完代码后clean你的工程。
没有官方的可视化开发工具,可视化开发对于应用的页面布局是很重要的,无论是Android还是iOS都提供了强大的GUI工具。Titanium却迟迟没有提供,这就意味着你必须手动书写你自己的代码来实现你的布局。
调试代码很不方便,Titanium studio还需要加强代码的调试功能。
11)错误提示不准确
对于开发者来说,调试程序相当重要的,而在程序出错的时候,查看出错的位置,异常的堆栈等信息是很必要的。但是在开发中Titanium的错误提示很难让你找到问题所在,很多时候你都会得到一个模糊的错误提示,它没有给出你具体的错误,你也很难判断错误。很多时候不得不先把一大部分代码删除了,一点点的网上添加来看看那里出了错误。
12)应用文件太大
在构建应用时会生成大量的文件,一个很简单的应用动辄就5,6M大小。而如果用原生的话,估计也就几十K大小。
当Titanium把你的代码转换成目标平台(iOS,Android)代码的时候,它产生了大量的类。比如我们查看Xcode工程的话,会发现它生成了大概450个类,而这些类中我们可能用到的也就是10来个左右。这虽然不是很大的问题,但是他堆积到你的应用中,增大了应用的大小,从而将会加大用户访问网络的流量。
在Android上,如果你查看应用源码的话,你会发现它被写的特别的臃肿。
13)功能受限
Javascript不是Objective-C也不是Java,所以相比Object-C和Java开发出来的原生应用,可实现功能的范围有所限制。正如前所述,使用JavaScript开发是简单快速的,但是也将失去了原生应用开发语言的一些特有的功能。
而且从代码上来说,Object-C和Java的结构化严格规范,使得程序很容易维护,而JavaScript灵活宽松的语法也加大了维护的难度。
14)并非完全的开源
说Appcelerator不是完全的开源,一点儿不过,他不接受众多开发者的贡献。他是能说是公开了源代码而已。
15)Appcelerator在监视你
Appcelerator在监视你,你知道吗?为了分析app,Titanium默认开启了分析功能。还有你想使用Titanium Studio创建应用的前提是:从Appcelerator申请账户,这样一来,你创建了什么应用,支持什么平台等等,都会传回给Appcelerator。Appcelerator每次发布的移动应用趋势报告就来源于此。
16)API封装不足
尽管Titanium同时支持iOS和Android,但是目前的API还是需要写很多基于iOS和Android平台的代码(尽管他已经为各个SDK简化了代码)。
对于JSON对象的正确性也需要特别的注意,自带的parser很严格,最好得先使用eval一下。
Titanium API的灵活性也带来了不足,虽然他能你用短短的几行代码实现原生代码很长代码才能实现的功能,但是另一面来说他也限制了功能。比如你想给window设置一个铺满的背景,在原生代码中是很普通很简单的功能,但是Titanium中需要很多代码才能实现。
17)代码的可维护性
Titanium在一定程度上增加了代码的复杂度。何出此言,随着app的功能的增加,代码在不断增多,开发也变得更复杂,你也将会遇到更严重的技术问题,比如:随机崩溃,奇怪的行为,恼人的错误,等等。
而代码的组织,代码的可读性,MVC层次的分割,multi-device的支持, multi-platform的支持等等,都是需要你考虑的问题。
18)其他
不断的发布新的产品而不去修复既有产品、网站的问题。而且“新”产品总是在beta或者准备阶段发布。
有开发者通过Titanium开发的应用未通过Apple的审查,原因是应用调用了Apple的私有API,但是Appcelerator不承认他们有这个问题。
http://developer.appcelerator.com/question/123785/app-has-bee-rejected-by-non-public-api
最后说一个网上最差的案例!有人花2万多美元通过Titanium开发了一个iPad应用,但是经常莫名的crash,内存溢出。应用作者开始寻找Titanium Professional support,这当然要付很昂贵的服务费。虽然应用作者很详细的说明问题,甚至把相关代码发给了他们,但在很长一段时间里都没能解决问题。应用作者就把问题反映给了Appcelerator的CTO(抄送CEO),很快就有了回复。承任Titanium存在Bug,并相应的提出ticket承诺在以后版本中修正但是不可能等那么长时间等他们版本升级,所以应用作者需要更加专业的企业级服务
得到的回复是,每小时375美元帮他排查代码的问题,而应用作者估计他们至少需要20到40个小时才能通读他的代码后给出建议,这将是一笔不小的花费啊!
http://labs.thesedays.com/blog/2010/02/04/review-of-appcelerator-titanium/
正如所有事情一样,每一个设计方法,在每一个决策,都有优点和缺点。对于简单,小的应用来说,Titanium应该是最好的选择,但如果你希望强化你的应用程序的话还是选择原生开发环境比较好。Titanium 作为开发原型来说是一个非常优秀的工具,你可以花费很少的时间,作成prototype展示给客户,进行可用性测试。但是不管是正反哪个方面,在每次项目中都应该去评估,因为它跟取决于项目自身。需要考虑的关键点是:效益,成本,预算,开发的复杂性,跨平台支持有多重要,项目的战略,性能的重要性等等。你必须权衡每个正反方面的观点,根据你的具体优先顺序,来确定它是否适合你的需求。但是从个人观点来说,当你启动一个新的项目时,应该考虑考虑Titanium,它是一个很棒的选择!
接上篇,我们来说说Titanium另外一面,看看他到底有什么样的不足。
1)收费的Titanium
天下没有免费的午餐,免费的另一面就是收费!Titanium的营收模式分两种:增值收费和平台。基本部件免费,高级部件、Titanium Studio的附加功能和官方专业指导服务都需要付费。而且要想获得他们专业的1对1服务,更是相当的昂贵!
2)贫乏的开发文档
API文档不完整,要么书写的过于简单,要么干脆就没有提到,要么就是版本已经升级没来得及更新,偶尔还有写错的。
查看API是很多时候解决问题的最好方式,应该在最大程度上重视API的提供。
提供的Guides内容也很有限,很多东西都没有提到,也就是能够得到一些基本的信息而已。
Guides虽然是以WIKI的形式提供的,但也只能是他们自己的职员才能够编辑。
--->(2012/03/26)Titanium 提供可编辑的Community Wiki了
同样在Github上的project里理应开发的wiki也没有开放。
他们提供了很多的入门视频,出发点是好的,但是一些由于版本升级后已经过期的视频没有被拿下,无法分辨是否还能观看使用。
3)Q&A论坛不完善
首先他们使用的Q&A论坛程序本身在技术和设计上就存在很多问题,比如你想查找个问题是很费劲的,它所给你显示的结果的排序非常混乱,不知道是否结合了回答数,点击数,发布时间等,但就是跟你想象的结果差的太远,你就得挨个看看每个问题是否跟自己的问题类似,当你将你的Q&A Profile的Notifications设置成Enabled的时候,你也很多时候收不到来自论坛的邮件。这样你就无法知道是否有人回答了你的问题,不得不每次都把问题挨个查看一遍。
很多人希望得到他们开发人员的回答,但是他们很少在Q&A论坛中回答问题,偶尔一次就是很难得的了。你会发现很长时间都没有人理会问题,很多时候还是一些热心的开发者来提供回答。
4)构建问题太多
这是大家普遍反应的问题,在环境构筑,应用构建时候会出现很多问题,比如找不到SDK,build时出错,不能启动模拟器等等
应用构建花费时间太长,很多时候当你点击启动emulator后,很长时间才能把模拟器启动起来,而模拟器启动起来后,你又会发现,Titanium总是提示找不到模拟器,让你重新启动。你不得不一遍一遍的重复这启动这个操作,直到它好用。
5)性能太差
问题最大的还是性能问题,在Android下尤为严重(1.8版后引入V8后稍有改善)。当你往页面上添加很多View的时候,页面显示就很吃力,当你的Tableview中有很多行时,滚动起来就很费劲等等。
6)无缘无故的crash
最苦恼的就是这个问题了,因为它会让你抓狂。也不知道什么原因,莫名的系统就提示你发生错误,不能响应了。一个最严重的问题是,应用程序崩溃时没有任何明显的原因,而且错误报告太简单,很难帮助开发者解决问题。很严重的时候他会影响到开发者发布应用到Appstore或AndroidMarket上去。
7)无法做内存管理
不用开发者考虑内存管理,是好事也是坏事。你将无法知道你的内存使用状况,发生内存溢出的话,你将无从下手。很多时候会让你陷入内存溢出的困境中,无法解决。
8)UI也存在问题
目前提供的UI控件也存在着Bug,比如说,不能响应事件,无法滚动,不能显示等等。
UI是应用的“门脸”,如果这里出现了问题,将直接导致用户卸载应用。有时候导航不能正常工作,造成了一些导航控制不能实现,UI的设计被打破,如果这发生在一个真正的应用程序商店的产品身上的话,对开发者来说将是一个灾难。但是苦恼的是你怎么Review你的代码都发现它没有任何毛病。
9)Bug修复太慢
成千上万的开发者在使用Titanium,每天都会发现很多问题,提交给了Appcelerator。但是你会发现很多bug很长时间都未能解决,间隔几年的都有。
10)IDE功能不全
最开始Appcelerator提供的IDE是Titanium Developer,自从收购Aptana之后,开始提供Titanium Studio。Titanium Studio是一个基于Eclipse的Aptana自定义版的IDE开发工具,它允许你创建,管理,测试你的移动应用项目工程,而且将工程自动打包发布到模拟器或者真机上去。而Titanium Studio在一遇到问题是就不在往控制台输出信息,最为严重的是会偶尔在构建的时候忽略代码的修改。你不得不每次修改完代码后clean你的工程。
没有官方的可视化开发工具,可视化开发对于应用的页面布局是很重要的,无论是Android还是iOS都提供了强大的GUI工具。Titanium却迟迟没有提供,这就意味着你必须手动书写你自己的代码来实现你的布局。
调试代码很不方便,Titanium studio还需要加强代码的调试功能。
11)错误提示不准确
对于开发者来说,调试程序相当重要的,而在程序出错的时候,查看出错的位置,异常的堆栈等信息是很必要的。但是在开发中Titanium的错误提示很难让你找到问题所在,很多时候你都会得到一个模糊的错误提示,它没有给出你具体的错误,你也很难判断错误。很多时候不得不先把一大部分代码删除了,一点点的网上添加来看看那里出了错误。
12)应用文件太大
在构建应用时会生成大量的文件,一个很简单的应用动辄就5,6M大小。而如果用原生的话,估计也就几十K大小。
当Titanium把你的代码转换成目标平台(iOS,Android)代码的时候,它产生了大量的类。比如我们查看Xcode工程的话,会发现它生成了大概450个类,而这些类中我们可能用到的也就是10来个左右。这虽然不是很大的问题,但是他堆积到你的应用中,增大了应用的大小,从而将会加大用户访问网络的流量。
在Android上,如果你查看应用源码的话,你会发现它被写的特别的臃肿。
13)功能受限
Javascript不是Objective-C也不是Java,所以相比Object-C和Java开发出来的原生应用,可实现功能的范围有所限制。正如前所述,使用JavaScript开发是简单快速的,但是也将失去了原生应用开发语言的一些特有的功能。
而且从代码上来说,Object-C和Java的结构化严格规范,使得程序很容易维护,而JavaScript灵活宽松的语法也加大了维护的难度。
14)并非完全的开源
说Appcelerator不是完全的开源,一点儿不过,他不接受众多开发者的贡献。他是能说是公开了源代码而已。
15)Appcelerator在监视你
Appcelerator在监视你,你知道吗?为了分析app,Titanium默认开启了分析功能。还有你想使用Titanium Studio创建应用的前提是:从Appcelerator申请账户,这样一来,你创建了什么应用,支持什么平台等等,都会传回给Appcelerator。Appcelerator每次发布的移动应用趋势报告就来源于此。
16)API封装不足
尽管Titanium同时支持iOS和Android,但是目前的API还是需要写很多基于iOS和Android平台的代码(尽管他已经为各个SDK简化了代码)。
对于JSON对象的正确性也需要特别的注意,自带的parser很严格,最好得先使用eval一下。
Titanium API的灵活性也带来了不足,虽然他能你用短短的几行代码实现原生代码很长代码才能实现的功能,但是另一面来说他也限制了功能。比如你想给window设置一个铺满的背景,在原生代码中是很普通很简单的功能,但是Titanium中需要很多代码才能实现。
17)代码的可维护性
Titanium在一定程度上增加了代码的复杂度。何出此言,随着app的功能的增加,代码在不断增多,开发也变得更复杂,你也将会遇到更严重的技术问题,比如:随机崩溃,奇怪的行为,恼人的错误,等等。
而代码的组织,代码的可读性,MVC层次的分割,multi-device的支持, multi-platform的支持等等,都是需要你考虑的问题。
18)其他
不断的发布新的产品而不去修复既有产品、网站的问题。而且“新”产品总是在beta或者准备阶段发布。
有开发者通过Titanium开发的应用未通过Apple的审查,原因是应用调用了Apple的私有API,但是Appcelerator不承认他们有这个问题。
http://developer.appcelerator.com/question/123785/app-has-bee-rejected-by-non-public-api
最后说一个网上最差的案例!有人花2万多美元通过Titanium开发了一个iPad应用,但是经常莫名的crash,内存溢出。应用作者开始寻找Titanium Professional support,这当然要付很昂贵的服务费。虽然应用作者很详细的说明问题,甚至把相关代码发给了他们,但在很长一段时间里都没能解决问题。应用作者就把问题反映给了Appcelerator的CTO(抄送CEO),很快就有了回复。承任Titanium存在Bug,并相应的提出ticket承诺在以后版本中修正但是不可能等那么长时间等他们版本升级,所以应用作者需要更加专业的企业级服务
得到的回复是,每小时375美元帮他排查代码的问题,而应用作者估计他们至少需要20到40个小时才能通读他的代码后给出建议,这将是一笔不小的花费啊!
http://labs.thesedays.com/blog/2010/02/04/review-of-appcelerator-titanium/
正如所有事情一样,每一个设计方法,在每一个决策,都有优点和缺点。对于简单,小的应用来说,Titanium应该是最好的选择,但如果你希望强化你的应用程序的话还是选择原生开发环境比较好。Titanium 作为开发原型来说是一个非常优秀的工具,你可以花费很少的时间,作成prototype展示给客户,进行可用性测试。但是不管是正反哪个方面,在每次项目中都应该去评估,因为它跟取决于项目自身。需要考虑的关键点是:效益,成本,预算,开发的复杂性,跨平台支持有多重要,项目的战略,性能的重要性等等。你必须权衡每个正反方面的观点,根据你的具体优先顺序,来确定它是否适合你的需求。但是从个人观点来说,当你启动一个新的项目时,应该考虑考虑Titanium,它是一个很棒的选择!
[2] 从当地sdcard中读取图片显示
来源: 互联网 发布时间: 2014-02-18
从本地sdcard中读取图片显示
http://hi.baidu.com/fgfd0/blog/item/0dd055ee92730debb2fb9512.html
http://hi.baidu.com/fgfd0/blog/item/0dd055ee92730debb2fb9512.html
Bitmap bm = BitmapFactory.decodeFile("/sdcard/images/20120315100145150.jpg");
[3] HttpClient 课程 (二)
来源: 互联网 发布时间: 2014-02-18
HttpClient 教程 (二)
HttpClient 教程 (二)
第二章 连接管理
HttpClient有一个对连接初始化和终止,还有在活动连接上I/O操作的完整控制。而连接操作的很多方面可以使用一些参数来控制。
2.1 连接参数
这些参数可以影响连接操作:
'http.socket.timeout':定义了套接字的毫秒级超时时间(SO_TIMEOUT),这就是等待数据,换句话说,在两个连续的数据包之间最大的闲置时间。如果超时时间是0就解释为是一个无限大的超时时间。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,那么读取操作就不会超时(无限大的超时时间)。
'http.tcp.nodelay':决定了是否使用Nagle算法。Nagle算法视图通过最小化发送的分组数量来节省带宽。当应用程序希望降低网络延迟并提高性能时,它们可以关闭Nagle算法(也就是开启TCP_NODELAY)。数据将会更早发送,增加了带宽消耗的成文。这个参数期望得到一个java.lang.Boolean类型的值。如果这个参数没有被设置,那么TCP_NODELAY就会开启(无延迟)。
'http.socket.buffer-size':决定了内部套接字缓冲使用的大小,来缓冲数据同时接收/传输HTTP报文。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,那么HttpClient将会分配8192字节的套接字缓存。
'http.socket.linger':使用指定的秒数拖延时间来设置SO_LINGER。最大的连接超时值是平台指定的。值0暗示了这个选项是关闭的。值-1暗示了使用了JRE默认的。这个设置仅仅影响套接字关闭操作。如果这个参数没有被设置,那么就假设值为-1(JRE默认)。
'http.connection.timeout':决定了直到连接建立时的毫秒级超时时间。超时时间的值为0解释为一个无限大的时间。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,连接操作将不会超时(无限大的超时时间)。
'http.connection.stalecheck':决定了是否使用旧的连接检查。当在一个连接之上执行一个请求而服务器端的连接已经关闭时,关闭旧的连接检查可能导致在获得一个I/O错误风险时显著的性能提升(对于每一个请求,检查时间可以达到30毫秒)。这个参数期望得到一个java.lang.Boolean类型的值。出于性能的关键操作,检查应该被关闭。如果这个参数没有被设置,那么旧的连接将会在每个请求执行之前执行。
'http.connection.max-line-length':决定了最大请求行长度的限制。如果设置为一个正数,任何HTTP请求行超过这个限制将会引发java.io.IOException异常。负数或零将会关闭这个检查。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,那么就不强制进行限制了。
'http.connection.max-header-count':决定了允许的最大HTTP头部信息数量。如果设置为一个正数,从数据流中获得的HTTP头部信息数量超过这个限制就会引发java.io.IOException异常。负数或零将会关闭这个检查。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,那么就不
强制进行限制了。
'http.connection.max-status-line-garbage':决定了在期望得到HTTP响应状态行之前可忽略请求行的最大数量。使用HTTP/1.1持久性连接,这个问题产生的破碎的脚本将会返回一个错误的Content-Length(有比指定的字节更多的发送)。不幸的是,在某些情况下,这个不能在错误响应后来侦测,只能在下一次之前。所以HttpClient必须以这种方式跳过那些多余的行。这个参数期望得到一个java.lang.Integer类型的值。0是不允许在状态行之前的所有垃圾/空行。使用java.lang.Integer#MAX_VALUE来设置不限制的数字。如果这个参数没有被设置那就假设是不限制的。
2.2 持久连接
从一个主机向另外一个建立连接的过程是相当复杂的,而且包含了两个终端之间的很多包的交换,它是相当费时的。连接握手的开销是很重要的,特别是对小量的HTTP报文。如果打开的连接可以被重用来执行多次请求,那么就可以达到很高的数据吞吐量。
HTTP/1.1强调HTTP连接默认情况可以被重用于多次请求。HTTP/1.0兼容的终端也可以使用相似的机制来明确地交流它们的偏好来保证连接处于活动状态,也使用它来处理多个请求。HTTP代理也可以保持空闲连接处于一段时间的活动状态,防止对相同目标主机的一个连接也许对随后的请求需要。保持连接活动的能力通常被称作持久性连接。HttpClient完全支持持久性连接。
2.3 HTTP连接路由
HttpClient能够直接或通过路由建立连接到目标主机,这会涉及多个中间连接,也被称为跳。HttpClient区分路由和普通连接,通道和分层。通道连接到目标主机的多个中间代理的使用也称作是代理链。
普通路由由连接到目标或仅第一次的代理来创建。通道路由通过代理链到目标连接到第一通道来建立。没有代理的路由不是通道的,分层路由通过已存在连接的分层协议来建立。协议仅仅可以在到目标的通道上或在没有代理的直接连接上分层。
2.3.1 路由计算
RouteInfo接口代表关于最终涉及一个或多个中间步骤或跳的目标主机路由的信息。HttpRoute是RouteInfo的具体实现,这是不能改变的(是不变的)。HttpTracker是可变的RouteInfo实现,由HttpClient在内部使用来跟踪到最大路由目标的剩余跳数。HttpTracker可以在成功执行向路由目标的下一跳之后更新。HttpRouteDirector是一个帮助类,可以用来计算路由中的下一跳。这个类由HttpClient在内部使用。
HttpRoutePlanner是一个代表计算到基于执行上下文到给定目标完整路由策略的接口。HttpClient附带两个默认的HttpRoutePlanner实现。ProxySelectorRoutePlanner是基于java.net.ProxySelector的。默认情况下,它会从系统属性中或从运行应用程序的浏览器中选取JVM的代理设置。DefaultHttpRoutePlanner实现既不使用任何Java系统属性,也不使用系统或浏览器的代理设置。它只基于HTTP如下面描述的参数计算路由。
2.3.2 安全HTTP连接
如果信息在两个不能由非认证的第三方进行读取或修改的终端之间传输,HTTP连接可以被认为是安全的。SSL/TLS协议是用来保证HTTP传输安全使用最广泛的技术。而其它加密技术也可以被使用。通常来说,HTTP传输是在SSL/TLS加密连接之上分层的。
2.4 HTTP路由参数
这些参数可以影响路由计算:
'http.route.default-proxy':定义可以被不使用JRE设置的默认路由规划者使用的代理主机。这个参数期望得到一个HttpHost类型的值。如果这个参数没有被设置,那么就会尝试直接连接到目标。
'http.route.local-address':定义一个本地地址由所有默认路由规划者来使用。有多个网络接口的机器中,这个参数可以被用于从连接源中选择网络接口。这个参数期望得到一个java.net.InetAddress类型的值。如果这个参数没有被设置,将会自动使用本地地址。
'http.route.forced-route':定义一个由所有默认路由规划者使用的强制路由。代替了计算路由,给定的强制路由将会被返回,尽管它指向一个完全不同的目标主机。这个参数期望得到一个HttpRoute类型的值。如果这个参数没有被设置,那么就使用默认的规则建立连接到目标服务器。
2.5 套接字工厂
LayeredSocketFactory是SocketFactory接口的扩展。分层的套接字工厂可HTTP连接内部使用java.net.Socket对象来处理数据在线路上的传输。它们依赖SocketFactory接口来创建,初始化和连接套接字。这会使得HttpClient的用户可以提供在运行时指定套接字初始化代码的应用程序。PlainSocketFactory是创建和初始化普通的(不加密的)套接字的默认工厂。
创建套接字的过程和连接到主机的过程是不成对的,所以套接字在连接操作封锁时可以被关闭。
PlainSocketFactory sf = PlainSocketFactory.getSocketFactory();
Socket socket = sf.createSocket();
HttpParams params = new BasicHttpParams();
params.setParameter(CoreConnectionPNames.CONNECTION_TIMEOUT, 1000L);
sf.connectSocket(socket, "locahost", 8080, null, -1, params);
2.5.1 安全套接字分层
LayeredSocketFactory是SocketFactory接口的扩展。分层的套接字工厂可以创建在已经存在的普通套接字之上的分层套接字。套接字分层主要通过代理来创建安全的套接字。HttpClient附带实现了SSL/TLS分层的SSLSocketFactory。请注意HttpClient不使用任何自定义加密功能。它完全依赖于标准的Java密码学(JCE)和安全套接字(JSEE)扩展。
2.5.2 SSL/TLS的定制
HttpClient使用SSLSocketFactory来创建SSL连接。SSLSocketFactory允许高度定制。它可以使用javax.net.ssl.SSLContext的实例作为参数,并使用它来创建定制SSL连接。
TrustManager easyTrustManager = new X509TrustManager() {
@Override
public void checkClientTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
// 哦,这很简单!
}
@Override
public void checkServerTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
//哦,这很简单!
}
@Override
public X509Certificate[] getAcceptedIssuers() {
return null;
}
};
SSLContext sslcontext = SSLContext.getInstance("TLS");
sslcontext.init(null, new TrustManager[] { easyTrustManager }, null);
SSLSocketFactory sf = new SSLSocketFactory(sslcontext);
SSLSocket socket = (SSLSocket) sf.createSocket();
socket.setEnabledCipherSuites(new String[] { "SSL_RSA_WITH_RC4_128_MD5" });
HttpParams params = new BasicHttpParams();
params.setParameter(CoreConnectionPNames.CONNECTION_TIMEOUT, 1000L);
sf.connectSocket(socket, "locahost", 443, null, -1, params);
SSLSocketFactory的定制暗示出一定程度SSL/TLS协议概念的熟悉,这个详细的解释超出了本文档的范围。请参考Java的安全套接字扩展[http://java.sun.com/j2se/1.5.0/docs/guide/
security/jsse/JSSERefGuide.html],这是javax.net.ssl.SSLContext和相关工具的详细描述。
2.5.3 主机名验证
除了信任验证和客户端认证在SSL/TLS协议级上进行,一旦连接建立之后,HttpClient能可选地验证目标主机名匹配存储在服务器的X.509认证中的名字。这个认证可以提供额外的服务器信任材料的真实保证。X509主机名验证接口代表了主机名验证的策略。HttpClient附带了3个X509主机名验证器。很重要的一点是:主机名验证不应该混淆SSL信任验证。
StrictHostnameVerifier:严格的主机名验证在Sun Java 1.4,Sun Java 5和Sun Java 6中是相同的。而且也非常接近IE6。这个实现似乎是兼容RFC 2818处理通配符的。主机名必须匹配第一个CN或任意的subject-alt。在CN和其它任意的subject-alt中可能会出现通配符。
BrowserCompatHostnameVerifier:主机名验证器和Curl和Firefox的工作方式是相同的。主机名必须匹配第一个CN或任意的subject-alt。在CN和其它任意的subject-alt中可能会出现通配符。BrowserCompatHostnameVerifier和StrictHostnameVerifier的唯一不同是使用BrowserCompatHostnameVerifier匹配所有子域的通配符(比如”*.foo.com”),包括”a.b.foo.com”。
AllowAllHostnameVerifier:这个主机名验证器基本上是关闭主机名验证的。这个实现是一个空操作,而且不会抛出javax.net.ssl.SSLException异常。
每一个默认的HttpClient使用BrowserCompatHostnameVerifier的实现。如果需要的话,它可以指定不同的主机名验证器实现。
SSLSocketFactory sf = new SSLSocketFactory(SSLContext.getInstance("TLS"));
sf.setHostnameVerifier(SSLSocketFactory.STRICT_HOSTNAME_VERIFIER);
2.6 协议模式
Scheme类代表了一个协议模式,比如“http”或“https”同时包含一些协议属性,比如默认端口,用来为给定协议创建java.net.Socket实例的套接字工厂。SchemeRegistry类用来维持一组Scheme,当去通过请求URI建立连接时,HttpClient可以从中选择:
Scheme http = new Scheme("http", PlainSocketFactory.getSocketFactory(), 80);
SSLSocketFactory sf = new SSLSocketFactory(SSLContext.getInstance("TLS"));
sf.setHostnameVerifier(SSLSocketFactory.STRICT_HOSTNAME_VERIFIER);
Scheme https = new Scheme("https", sf, 443);
SchemeRegistry sr = new SchemeRegistry();
sr.register(http);
sr.register(https);
2.7 HttpClient代理配置
尽管HttpClient了解复杂的路由模式和代理链,它仅支持简单直接的或开箱的跳式代理连接。
告诉HttpClient通过代理去连接到目标主机的最简单方式是通过设置默认的代理参数:
DefaultHttpClient httpclient = new DefaultHttpClient();
HttpHost proxy = new HttpHost("someproxy", 8080);
httpclient.getParams().setParameter(ConnRoutePNames.DEFAULT_PROXY, proxy);
也可以构建HttpClient使用标准的JRE代理选择器来获得代理信息:
DefaultHttpClient httpclient = new DefaultHttpClient();
ProxySelectorRoutePlanner routePlanner = new ProxySelectorRoutePlanner(
httpclient.getConnectionManager().getSchemeRegistry(),
ProxySelector.getDefault());
httpclient.setRoutePlanner(routePlanner);
另外一种选择,可以提供一个定制的RoutePlanner实现来获得HTTP路由计算处理上的复杂的控制:
DefaultHttpClient httpclient = new DefaultHttpClient();
httpclient.setRoutePlanner(new HttpRoutePlanner() {
public HttpRoute determineRoute(HttpHost target,
HttpRequest request,
HttpContext context) throws HttpException {
return new HttpRoute(target, null, new HttpHost("someproxy", 8080),
"https".equalsIgnoreCase(target.getSchemeName()));
}
});
2.8 HTTP连接管理器
2.8.1 连接操作器
连接操作是客户端的低层套接字或可以通过外部实体,通常称为连接操作的被操作的状态的连接。OperatedClientConnection接口扩展了HttpClientConnection接口而且定义了额外的控制连接套接字的方法。ClientConnectionOperator接口代表了创建实例和更新那些对象低层套接字的策略。实现类最有可能利用SocketFactory来创建java.net.Socket实例。ClientConnectionOperator接口可以让HttpClient的用户提供一个连接操作的定制策略和提供可选实现OperatedClientConnection接口的能力。
2.8.2 管理连接和连接管理器
HTTP连接是复杂的,有状态的,线程不安全的对象需要正确的管理以便正确地执行功能。HTTP连接在同一时间仅仅只能由一个执行线程来使用。HttpClient采用一个特殊实体来管理访问HTTP连接,这被称为HTTP连接管理器,代表了ClientConnectionManager接口。一个HTTP连接管理器的目的是作为工厂服务于新的HTTP连接,管理持久连接和同步访问持久连接来确保同一时间仅有一个线程可以访问一个连接。
内部的HTTP连接管理器和OperatedClientConnection实例一起工作,但是它们为服务消耗器ManagedClientConnection提供实例。ManagedClientConnection扮演连接之上管理状态控制所有I/O操作的OperatedClientConnection实例的包装器。它也抽象套接字操作,提供打开和更新去创建路由套接字便利的方法。ManagedClientConnection实例了解产生它们到连接管理器的链接,而且基于这个事实,当不再被使用时,它们必须返回到管理器。ManagedClientConnection类也实现了ConnectionReleaseTrigger接口,可以被用来触发释放连接返回给管理器。一旦释放连接操作被触发了,被包装的连接从ManagedClientConnection包装器中脱离,OperatedClientConnection实例被返回给管理器。尽管服务消耗器仍然持有ManagedClientConnection实例的引用,它也不再去执行任何I/O操作或有意无意地改变的OperatedClientConnection状态。
这里有一个从连接管理器中获取连接的示例:
HttpParams params = new BasicHttpParams();
Scheme http = new Scheme("http", PlainSocketFactory.getSocketFactory(), 80);
SchemeRegistry sr = new SchemeRegistry();
sr.register(http);
ClientConnectionManager connMrg = new SingleClientConnManager(params, sr);
// 请求新连接。这可能是一个很长的过程。
ClientConnectionRequest connRequest = connMrg.requestConnection(
new HttpRoute(new HttpHost("localhost", 80)), null);
// 等待连接10秒
ManagedClientConnection conn = connRequest.getConnection(10, TimeUnit.SECONDS);
try {
// 用连接在做有用的事情。当完成时释放连接。
conn.releaseConnection();
} catch (IOException ex) {
// 在I/O error之上终止连接。
conn.abortConnection();
throw ex;
}
如果需要,连接请求可以通过调用来ClientConnectionRequest#abortRequest()方法过早地中断。这会解锁在ClientConnectionRequest#getConnection()方法中被阻止的线程。
一旦响应内容被完全消耗后,BasicManagedEntity包装器类可以用来保证自动释放低层的连接。HttpClient内部使用这个机制来实现透明地对所有从HttpClient#execute()方法中获得响应释放连接:
ClientConnectionRequest connRequest = connMrg.requestConnection(
new HttpRoute(new HttpHost("localhost", 80)), null);
ManagedClientConnection conn = connRequest.getConnection(10, TimeUnit.SECONDS);
try {
BasicHttpRequest request = new BasicHttpRequest("GET", "/");
conn.sendRequestHeader(request);
HttpResponse response = conn.receiveResponseHeader();
conn.receiveResponseEntity(response);
HttpEntity entity = response.getEntity();
if (entity != null) {
BasicManagedEntity managedEntity = new BasicManagedEntity(entity, conn, true);
// 替换实体
response.setEntity(managedEntity);
}
// 使用响应对象做有用的事情。当响应内容被消耗后这个连接将会自动释放。
} catch (IOException ex) {
//在I/O error之上终止连接。
conn.abortConnection();
throw ex;
}
2.8.3 简单连接管理器
SingleClientConnManager是一个简单的连接管理器,在同一时间它仅仅维护一个连接。尽管这个类是线程安全的,但它应该被用于一个执行线程。SingleClientConnManager对于同一路由的后续请求会尽量重用连接。而如果持久连接的路由不匹配连接请求的话,它也会关闭存在的连接之后对给定路由再打开一个新的。如果连接已经被分配,将会抛出java.lang.IllegalStateException异常。
对于每个默认连接,HttpClient使用SingleClientConnManager。
2.8.4 连接池管理器
ThreadSafeClientConnManager是一个复杂的实现来管理客户端连接池,它也可以从多个执行线程中服务连接请求。对每个基本的路由,连接都是池管理的。对于路由的请求,管理器在池中有可用的持久性连接,将被从池中租赁连接服务,而不是创建一个新的连接。
ThreadSafeClientConnManager维护每个基本路由的最大连接限制。每个默认的实现对每个给定路由将会创建不超过两个的并发连接,而总共也不会超过20个连接。对于很多真实的应用程序,这个限制也证明很大的制约,特别是他们在服务中使用HTTP作为传输协议。连接限制,也可以使用HTTP参数来进行调整。
这个示例展示了连接池参数是如何来调整的:
HttpParams params = new BasicHttpParams();
// 增加最大连接到200
ConnManagerParams.setMaxTotalConnections(params, 200);
// 增加每个路由的默认最大连接到20
ConnPerRouteBean connPerRoute = new ConnPerRouteBean(20);
// 对localhost:80增加最大连接到50
HttpHost localhost = new HttpHost("locahost", 80);
connPerRoute.setMaxForRoute(new HttpRoute(localhost), 50);
ConnManagerParams.setMaxConnectionsPerRoute(params, connPerRoute);
SchemeRegistry schemeRegistry = new SchemeRegistry();
schemeRegistry.register(
new Scheme("http", PlainSocketFactory.getSocketFactory(), 80));
schemeRegistry.register(
new Scheme("https", SSLSocketFactory.getSocketFactory(), 443));
ClientConnectionManager cm = new ThreadSafeClientConnManager(params, schemeRegistry);
HttpClient httpClient = new DefaultHttpClient(cm, params);
2.8.5 连接管理器关闭
当一个HttpClient实例不再需要时,而且即将走出使用范围,那么关闭连接管理器来保证由管理器保持活动的所有连接被关闭,由连接分配的系统资源被释放是很重要的。
DefaultHttpClient httpclient = new DefaultHttpClient();
HttpGet httpget = new HttpGet("http://www.google.com/");
HttpResponse response = httpclient.execute(httpget);
HttpEntity entity = response.getEntity();
System.out.println(response.getStatusLine());
if (entity != null) {
entity.consumeContent();
}
httpclient.getConnectionManager().shutdown();
2.9 连接管理参数
这些是可以用于定制标准HTTP连接管理器实现的参数:
'http.conn-manager.timeout':定义了当从ClientConnectionManager中检索ManagedClientConnection实例时使用的毫秒级的超时时间。这个参数期望得到一个java.lang.Long类型的值。如果这个参数没有被设置,连接请求就不会超时(无限大的超时时间)。
'http.conn-manager.max-per-route':定义了每个路由连接的最大数量。这个限制由客户端连接管理器来解释,而且应用于独立的管理器实例。这个参数期望得到一个ConnPerRoute类型的值。
'http.conn-manager.max-total':定义了总共连接的最大数目。这个限制由客户端连接管理器来解释,而且应用于独立的管理器实例。这个参数期望得到一个java.lang.Integer类型的值。
2.10 多线程执行请求
当配备连接池管理器时,比如ThreadSafeClientConnManager,HttpClient可以同时被用来执行多个请求,使用多线程执行。
ThreadSafeClientConnManager将会分配基于它的配置的连接。如果对于给定路由的所有连接都被租出了,那么连接的请求将会阻塞,直到一个连接被释放回连接池。它可以通过设置'http.conn-manager.timeout'为一个正数来保证连接管理器不会在连接请求执行时无限期的被阻塞。如果连接请求不能在给定的时间周期内被响应,将会抛出ConnectionPoolTimeoutException异常。
HttpParams params = new BasicHttpParams();
SchemeRegistry schemeRegistry = new SchemeRegistry();
schemeRegistry.register(
new Scheme("http", PlainSocketFactory.getSocketFactory(), 80));
ClientConnectionManager cm = new ThreadSafeClientConnManager(params, schemeRegistry);
HttpClient httpClient = new DefaultHttpClient(cm, params);
// 执行GET方法的URI
String[] urisToGet = {
"http://www.domain1.com/",
"http://www.domain2.com/",
"http://www.domain3.com/",
"http://www.domain4.com/"
};
// 为每个URI创建一个线程
GetThread[] threads = new GetThread[urisToGet.length];
for (int i = 0; i < threads.length; i++) {
HttpGet httpget = new HttpGet(urisToGet[i]);
threads[i] = new GetThread(httpClient, httpget);
}
// 开始执行线程
for (int j = 0; j < threads.length; j++) {
threads[j].start();
}
// 合并线程
for (int j = 0; j < threads.length; j++) {
threads[j].join();
}
static class GetThread extends Thread {
private final HttpClient httpClient;
private final HttpContext context;
private final HttpGet httpget;
public GetThread(HttpClient httpClient, HttpGet httpget) {
this.httpClient = httpClient;
this.context = new BasicHttpContext();
this.httpget = httpget;
}
@Override
public void run() {
try {
HttpResponse response = this.httpClient.execute(this.httpget, this.context);
HttpEntity entity = response.getEntity();
if (entity != null) {
// 对实体做些有用的事情...
// 保证连接能释放回管理器
entity.consumeContent();
}
} catch (Exception ex) {
this.httpget.abort();
}
}
}
2.11 连接收回策略
一个经典的阻塞I/O模型的主要缺点是网络套接字仅当I/O操作阻塞时才可以响应I/O事件。当一个连接被释放返回管理器时,它可以被保持活动状态而却不能监控套接字的状态和响应任何I/O事件。如果连接在服务器端关闭,那么客户端连接也不能去侦测连接状态中的变化和关闭本端的套接字去作出适当响应。
HttpClient通过测试连接是否是过时的来尝试去减轻这个问题,这已经不再有效了,因为它已经在服务器端关闭了,之前使用执行HTTP请求的连接。过时的连接检查也并不是100%的稳定,反而对每次请求执行还要增加10到30毫秒的开销。唯一可行的而不涉及到每个对空闲连接的套接字模型线程,是使用专用的监控线程来收回因为长时间不活动而被认为是过期的连接。监控线程可以周期地调用ClientConnectionManager#closeExpiredConnections()方法来关闭所有过期的连接,从连接池中收回关闭的连接。它也可以选择性调用ClientConnectionManager#closeIdleConnections()方法来关闭所有已经空闲超过给定时间周期的连接。
public static class IdleConnectionMonitorThread extends Thread {
private final ClientConnectionManager connMgr;
private volatile boolean shutdown;
public IdleConnectionMonitorThread(ClientConnectionManager connMgr) {
super();
this.connMgr = connMgr;
}
@Override
public void run() {
try {
while (!shutdown) {
synchronized (this) {
wait(5000);
// 关闭过期连接
connMgr.closeExpiredConnections();
// 可选地,关闭空闲超过30秒的连接
connMgr.closeIdleConnections(30, TimeUnit.SECONDS);
}
}
} catch (InterruptedException ex) {
// 终止
}
}
public void shutdown() {
shutdown = true;
synchronized (this) {
notifyAll();
}
}
}
2.12 连接保持活动的策略
HTTP规范没有确定一个持久连接可能或应该保持活动多长时间。一些HTTP服务器使用非标准的头部信息Keep-Alive来告诉客户端它们想在服务器端保持连接活动的周期秒数。如果这个信息可用,HttClient就会利用这个它。如果头部信息Keep-Alive在响应中不存在,HttpClient假设连接无限期的保持活动。然而许多现实中的HTTP服务器配置了在特定不活动周期之后丢掉持久连接来保存系统资源,往往这是不通知客户端的。如果默认的策略证明是过于乐观的,那么就会有人想提供一个定制的保持活动策略。
DefaultHttpClient httpclient = new DefaultHttpClient();
httpclient.setKeepAliveStrategy(new ConnectionKeepAliveStrategy() {
public long getKeepAliveDuration(HttpResponse response, HttpContext context) {
// 兑现'keep-alive'头部信息
HeaderElementIterator it = new BasicHeaderElementIterator(
response.headerIterator(HTTP.CONN_KEEP_ALIVE));
while (it.hasNext()) {
HeaderElement he = it.nextElement();
String param = he.getName();
String value = he.getValue();
if (value != null && param.equalsIgnoreCase("timeout")) {
try {
return Long.parseLong(value) * 1000;
} catch(NumberFormatException ignore) {
}
}
}
HttpHost target = (HttpHost) context.getAttribute(
ExecutionContext.HTTP_TARGET_HOST);
if ("www.naughty-server.com".equalsIgnoreCase(target.getHostName())) {
// 只保持活动5秒
return 5 * 1000;
} else {
// 否则保持活动30秒
return 30 * 1000;
}
}
});
HttpClient 教程 (二)
第二章 连接管理
HttpClient有一个对连接初始化和终止,还有在活动连接上I/O操作的完整控制。而连接操作的很多方面可以使用一些参数来控制。
2.1 连接参数
这些参数可以影响连接操作:
'http.socket.timeout':定义了套接字的毫秒级超时时间(SO_TIMEOUT),这就是等待数据,换句话说,在两个连续的数据包之间最大的闲置时间。如果超时时间是0就解释为是一个无限大的超时时间。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,那么读取操作就不会超时(无限大的超时时间)。
'http.tcp.nodelay':决定了是否使用Nagle算法。Nagle算法视图通过最小化发送的分组数量来节省带宽。当应用程序希望降低网络延迟并提高性能时,它们可以关闭Nagle算法(也就是开启TCP_NODELAY)。数据将会更早发送,增加了带宽消耗的成文。这个参数期望得到一个java.lang.Boolean类型的值。如果这个参数没有被设置,那么TCP_NODELAY就会开启(无延迟)。
'http.socket.buffer-size':决定了内部套接字缓冲使用的大小,来缓冲数据同时接收/传输HTTP报文。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,那么HttpClient将会分配8192字节的套接字缓存。
'http.socket.linger':使用指定的秒数拖延时间来设置SO_LINGER。最大的连接超时值是平台指定的。值0暗示了这个选项是关闭的。值-1暗示了使用了JRE默认的。这个设置仅仅影响套接字关闭操作。如果这个参数没有被设置,那么就假设值为-1(JRE默认)。
'http.connection.timeout':决定了直到连接建立时的毫秒级超时时间。超时时间的值为0解释为一个无限大的时间。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,连接操作将不会超时(无限大的超时时间)。
'http.connection.stalecheck':决定了是否使用旧的连接检查。当在一个连接之上执行一个请求而服务器端的连接已经关闭时,关闭旧的连接检查可能导致在获得一个I/O错误风险时显著的性能提升(对于每一个请求,检查时间可以达到30毫秒)。这个参数期望得到一个java.lang.Boolean类型的值。出于性能的关键操作,检查应该被关闭。如果这个参数没有被设置,那么旧的连接将会在每个请求执行之前执行。
'http.connection.max-line-length':决定了最大请求行长度的限制。如果设置为一个正数,任何HTTP请求行超过这个限制将会引发java.io.IOException异常。负数或零将会关闭这个检查。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,那么就不强制进行限制了。
'http.connection.max-header-count':决定了允许的最大HTTP头部信息数量。如果设置为一个正数,从数据流中获得的HTTP头部信息数量超过这个限制就会引发java.io.IOException异常。负数或零将会关闭这个检查。这个参数期望得到一个java.lang.Integer类型的值。如果这个参数没有被设置,那么就不
强制进行限制了。
'http.connection.max-status-line-garbage':决定了在期望得到HTTP响应状态行之前可忽略请求行的最大数量。使用HTTP/1.1持久性连接,这个问题产生的破碎的脚本将会返回一个错误的Content-Length(有比指定的字节更多的发送)。不幸的是,在某些情况下,这个不能在错误响应后来侦测,只能在下一次之前。所以HttpClient必须以这种方式跳过那些多余的行。这个参数期望得到一个java.lang.Integer类型的值。0是不允许在状态行之前的所有垃圾/空行。使用java.lang.Integer#MAX_VALUE来设置不限制的数字。如果这个参数没有被设置那就假设是不限制的。
2.2 持久连接
从一个主机向另外一个建立连接的过程是相当复杂的,而且包含了两个终端之间的很多包的交换,它是相当费时的。连接握手的开销是很重要的,特别是对小量的HTTP报文。如果打开的连接可以被重用来执行多次请求,那么就可以达到很高的数据吞吐量。
HTTP/1.1强调HTTP连接默认情况可以被重用于多次请求。HTTP/1.0兼容的终端也可以使用相似的机制来明确地交流它们的偏好来保证连接处于活动状态,也使用它来处理多个请求。HTTP代理也可以保持空闲连接处于一段时间的活动状态,防止对相同目标主机的一个连接也许对随后的请求需要。保持连接活动的能力通常被称作持久性连接。HttpClient完全支持持久性连接。
2.3 HTTP连接路由
HttpClient能够直接或通过路由建立连接到目标主机,这会涉及多个中间连接,也被称为跳。HttpClient区分路由和普通连接,通道和分层。通道连接到目标主机的多个中间代理的使用也称作是代理链。
普通路由由连接到目标或仅第一次的代理来创建。通道路由通过代理链到目标连接到第一通道来建立。没有代理的路由不是通道的,分层路由通过已存在连接的分层协议来建立。协议仅仅可以在到目标的通道上或在没有代理的直接连接上分层。
2.3.1 路由计算
RouteInfo接口代表关于最终涉及一个或多个中间步骤或跳的目标主机路由的信息。HttpRoute是RouteInfo的具体实现,这是不能改变的(是不变的)。HttpTracker是可变的RouteInfo实现,由HttpClient在内部使用来跟踪到最大路由目标的剩余跳数。HttpTracker可以在成功执行向路由目标的下一跳之后更新。HttpRouteDirector是一个帮助类,可以用来计算路由中的下一跳。这个类由HttpClient在内部使用。
HttpRoutePlanner是一个代表计算到基于执行上下文到给定目标完整路由策略的接口。HttpClient附带两个默认的HttpRoutePlanner实现。ProxySelectorRoutePlanner是基于java.net.ProxySelector的。默认情况下,它会从系统属性中或从运行应用程序的浏览器中选取JVM的代理设置。DefaultHttpRoutePlanner实现既不使用任何Java系统属性,也不使用系统或浏览器的代理设置。它只基于HTTP如下面描述的参数计算路由。
2.3.2 安全HTTP连接
如果信息在两个不能由非认证的第三方进行读取或修改的终端之间传输,HTTP连接可以被认为是安全的。SSL/TLS协议是用来保证HTTP传输安全使用最广泛的技术。而其它加密技术也可以被使用。通常来说,HTTP传输是在SSL/TLS加密连接之上分层的。
2.4 HTTP路由参数
这些参数可以影响路由计算:
'http.route.default-proxy':定义可以被不使用JRE设置的默认路由规划者使用的代理主机。这个参数期望得到一个HttpHost类型的值。如果这个参数没有被设置,那么就会尝试直接连接到目标。
'http.route.local-address':定义一个本地地址由所有默认路由规划者来使用。有多个网络接口的机器中,这个参数可以被用于从连接源中选择网络接口。这个参数期望得到一个java.net.InetAddress类型的值。如果这个参数没有被设置,将会自动使用本地地址。
'http.route.forced-route':定义一个由所有默认路由规划者使用的强制路由。代替了计算路由,给定的强制路由将会被返回,尽管它指向一个完全不同的目标主机。这个参数期望得到一个HttpRoute类型的值。如果这个参数没有被设置,那么就使用默认的规则建立连接到目标服务器。
2.5 套接字工厂
LayeredSocketFactory是SocketFactory接口的扩展。分层的套接字工厂可HTTP连接内部使用java.net.Socket对象来处理数据在线路上的传输。它们依赖SocketFactory接口来创建,初始化和连接套接字。这会使得HttpClient的用户可以提供在运行时指定套接字初始化代码的应用程序。PlainSocketFactory是创建和初始化普通的(不加密的)套接字的默认工厂。
创建套接字的过程和连接到主机的过程是不成对的,所以套接字在连接操作封锁时可以被关闭。
PlainSocketFactory sf = PlainSocketFactory.getSocketFactory();
Socket socket = sf.createSocket();
HttpParams params = new BasicHttpParams();
params.setParameter(CoreConnectionPNames.CONNECTION_TIMEOUT, 1000L);
sf.connectSocket(socket, "locahost", 8080, null, -1, params);
2.5.1 安全套接字分层
LayeredSocketFactory是SocketFactory接口的扩展。分层的套接字工厂可以创建在已经存在的普通套接字之上的分层套接字。套接字分层主要通过代理来创建安全的套接字。HttpClient附带实现了SSL/TLS分层的SSLSocketFactory。请注意HttpClient不使用任何自定义加密功能。它完全依赖于标准的Java密码学(JCE)和安全套接字(JSEE)扩展。
2.5.2 SSL/TLS的定制
HttpClient使用SSLSocketFactory来创建SSL连接。SSLSocketFactory允许高度定制。它可以使用javax.net.ssl.SSLContext的实例作为参数,并使用它来创建定制SSL连接。
TrustManager easyTrustManager = new X509TrustManager() {
@Override
public void checkClientTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
// 哦,这很简单!
}
@Override
public void checkServerTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
//哦,这很简单!
}
@Override
public X509Certificate[] getAcceptedIssuers() {
return null;
}
};
SSLContext sslcontext = SSLContext.getInstance("TLS");
sslcontext.init(null, new TrustManager[] { easyTrustManager }, null);
SSLSocketFactory sf = new SSLSocketFactory(sslcontext);
SSLSocket socket = (SSLSocket) sf.createSocket();
socket.setEnabledCipherSuites(new String[] { "SSL_RSA_WITH_RC4_128_MD5" });
HttpParams params = new BasicHttpParams();
params.setParameter(CoreConnectionPNames.CONNECTION_TIMEOUT, 1000L);
sf.connectSocket(socket, "locahost", 443, null, -1, params);
SSLSocketFactory的定制暗示出一定程度SSL/TLS协议概念的熟悉,这个详细的解释超出了本文档的范围。请参考Java的安全套接字扩展[http://java.sun.com/j2se/1.5.0/docs/guide/
security/jsse/JSSERefGuide.html],这是javax.net.ssl.SSLContext和相关工具的详细描述。
2.5.3 主机名验证
除了信任验证和客户端认证在SSL/TLS协议级上进行,一旦连接建立之后,HttpClient能可选地验证目标主机名匹配存储在服务器的X.509认证中的名字。这个认证可以提供额外的服务器信任材料的真实保证。X509主机名验证接口代表了主机名验证的策略。HttpClient附带了3个X509主机名验证器。很重要的一点是:主机名验证不应该混淆SSL信任验证。
StrictHostnameVerifier:严格的主机名验证在Sun Java 1.4,Sun Java 5和Sun Java 6中是相同的。而且也非常接近IE6。这个实现似乎是兼容RFC 2818处理通配符的。主机名必须匹配第一个CN或任意的subject-alt。在CN和其它任意的subject-alt中可能会出现通配符。
BrowserCompatHostnameVerifier:主机名验证器和Curl和Firefox的工作方式是相同的。主机名必须匹配第一个CN或任意的subject-alt。在CN和其它任意的subject-alt中可能会出现通配符。BrowserCompatHostnameVerifier和StrictHostnameVerifier的唯一不同是使用BrowserCompatHostnameVerifier匹配所有子域的通配符(比如”*.foo.com”),包括”a.b.foo.com”。
AllowAllHostnameVerifier:这个主机名验证器基本上是关闭主机名验证的。这个实现是一个空操作,而且不会抛出javax.net.ssl.SSLException异常。
每一个默认的HttpClient使用BrowserCompatHostnameVerifier的实现。如果需要的话,它可以指定不同的主机名验证器实现。
SSLSocketFactory sf = new SSLSocketFactory(SSLContext.getInstance("TLS"));
sf.setHostnameVerifier(SSLSocketFactory.STRICT_HOSTNAME_VERIFIER);
2.6 协议模式
Scheme类代表了一个协议模式,比如“http”或“https”同时包含一些协议属性,比如默认端口,用来为给定协议创建java.net.Socket实例的套接字工厂。SchemeRegistry类用来维持一组Scheme,当去通过请求URI建立连接时,HttpClient可以从中选择:
Scheme http = new Scheme("http", PlainSocketFactory.getSocketFactory(), 80);
SSLSocketFactory sf = new SSLSocketFactory(SSLContext.getInstance("TLS"));
sf.setHostnameVerifier(SSLSocketFactory.STRICT_HOSTNAME_VERIFIER);
Scheme https = new Scheme("https", sf, 443);
SchemeRegistry sr = new SchemeRegistry();
sr.register(http);
sr.register(https);
2.7 HttpClient代理配置
尽管HttpClient了解复杂的路由模式和代理链,它仅支持简单直接的或开箱的跳式代理连接。
告诉HttpClient通过代理去连接到目标主机的最简单方式是通过设置默认的代理参数:
DefaultHttpClient httpclient = new DefaultHttpClient();
HttpHost proxy = new HttpHost("someproxy", 8080);
httpclient.getParams().setParameter(ConnRoutePNames.DEFAULT_PROXY, proxy);
也可以构建HttpClient使用标准的JRE代理选择器来获得代理信息:
DefaultHttpClient httpclient = new DefaultHttpClient();
ProxySelectorRoutePlanner routePlanner = new ProxySelectorRoutePlanner(
httpclient.getConnectionManager().getSchemeRegistry(),
ProxySelector.getDefault());
httpclient.setRoutePlanner(routePlanner);
另外一种选择,可以提供一个定制的RoutePlanner实现来获得HTTP路由计算处理上的复杂的控制:
DefaultHttpClient httpclient = new DefaultHttpClient();
httpclient.setRoutePlanner(new HttpRoutePlanner() {
public HttpRoute determineRoute(HttpHost target,
HttpRequest request,
HttpContext context) throws HttpException {
return new HttpRoute(target, null, new HttpHost("someproxy", 8080),
"https".equalsIgnoreCase(target.getSchemeName()));
}
});
2.8 HTTP连接管理器
2.8.1 连接操作器
连接操作是客户端的低层套接字或可以通过外部实体,通常称为连接操作的被操作的状态的连接。OperatedClientConnection接口扩展了HttpClientConnection接口而且定义了额外的控制连接套接字的方法。ClientConnectionOperator接口代表了创建实例和更新那些对象低层套接字的策略。实现类最有可能利用SocketFactory来创建java.net.Socket实例。ClientConnectionOperator接口可以让HttpClient的用户提供一个连接操作的定制策略和提供可选实现OperatedClientConnection接口的能力。
2.8.2 管理连接和连接管理器
HTTP连接是复杂的,有状态的,线程不安全的对象需要正确的管理以便正确地执行功能。HTTP连接在同一时间仅仅只能由一个执行线程来使用。HttpClient采用一个特殊实体来管理访问HTTP连接,这被称为HTTP连接管理器,代表了ClientConnectionManager接口。一个HTTP连接管理器的目的是作为工厂服务于新的HTTP连接,管理持久连接和同步访问持久连接来确保同一时间仅有一个线程可以访问一个连接。
内部的HTTP连接管理器和OperatedClientConnection实例一起工作,但是它们为服务消耗器ManagedClientConnection提供实例。ManagedClientConnection扮演连接之上管理状态控制所有I/O操作的OperatedClientConnection实例的包装器。它也抽象套接字操作,提供打开和更新去创建路由套接字便利的方法。ManagedClientConnection实例了解产生它们到连接管理器的链接,而且基于这个事实,当不再被使用时,它们必须返回到管理器。ManagedClientConnection类也实现了ConnectionReleaseTrigger接口,可以被用来触发释放连接返回给管理器。一旦释放连接操作被触发了,被包装的连接从ManagedClientConnection包装器中脱离,OperatedClientConnection实例被返回给管理器。尽管服务消耗器仍然持有ManagedClientConnection实例的引用,它也不再去执行任何I/O操作或有意无意地改变的OperatedClientConnection状态。
这里有一个从连接管理器中获取连接的示例:
HttpParams params = new BasicHttpParams();
Scheme http = new Scheme("http", PlainSocketFactory.getSocketFactory(), 80);
SchemeRegistry sr = new SchemeRegistry();
sr.register(http);
ClientConnectionManager connMrg = new SingleClientConnManager(params, sr);
// 请求新连接。这可能是一个很长的过程。
ClientConnectionRequest connRequest = connMrg.requestConnection(
new HttpRoute(new HttpHost("localhost", 80)), null);
// 等待连接10秒
ManagedClientConnection conn = connRequest.getConnection(10, TimeUnit.SECONDS);
try {
// 用连接在做有用的事情。当完成时释放连接。
conn.releaseConnection();
} catch (IOException ex) {
// 在I/O error之上终止连接。
conn.abortConnection();
throw ex;
}
如果需要,连接请求可以通过调用来ClientConnectionRequest#abortRequest()方法过早地中断。这会解锁在ClientConnectionRequest#getConnection()方法中被阻止的线程。
一旦响应内容被完全消耗后,BasicManagedEntity包装器类可以用来保证自动释放低层的连接。HttpClient内部使用这个机制来实现透明地对所有从HttpClient#execute()方法中获得响应释放连接:
ClientConnectionRequest connRequest = connMrg.requestConnection(
new HttpRoute(new HttpHost("localhost", 80)), null);
ManagedClientConnection conn = connRequest.getConnection(10, TimeUnit.SECONDS);
try {
BasicHttpRequest request = new BasicHttpRequest("GET", "/");
conn.sendRequestHeader(request);
HttpResponse response = conn.receiveResponseHeader();
conn.receiveResponseEntity(response);
HttpEntity entity = response.getEntity();
if (entity != null) {
BasicManagedEntity managedEntity = new BasicManagedEntity(entity, conn, true);
// 替换实体
response.setEntity(managedEntity);
}
// 使用响应对象做有用的事情。当响应内容被消耗后这个连接将会自动释放。
} catch (IOException ex) {
//在I/O error之上终止连接。
conn.abortConnection();
throw ex;
}
2.8.3 简单连接管理器
SingleClientConnManager是一个简单的连接管理器,在同一时间它仅仅维护一个连接。尽管这个类是线程安全的,但它应该被用于一个执行线程。SingleClientConnManager对于同一路由的后续请求会尽量重用连接。而如果持久连接的路由不匹配连接请求的话,它也会关闭存在的连接之后对给定路由再打开一个新的。如果连接已经被分配,将会抛出java.lang.IllegalStateException异常。
对于每个默认连接,HttpClient使用SingleClientConnManager。
2.8.4 连接池管理器
ThreadSafeClientConnManager是一个复杂的实现来管理客户端连接池,它也可以从多个执行线程中服务连接请求。对每个基本的路由,连接都是池管理的。对于路由的请求,管理器在池中有可用的持久性连接,将被从池中租赁连接服务,而不是创建一个新的连接。
ThreadSafeClientConnManager维护每个基本路由的最大连接限制。每个默认的实现对每个给定路由将会创建不超过两个的并发连接,而总共也不会超过20个连接。对于很多真实的应用程序,这个限制也证明很大的制约,特别是他们在服务中使用HTTP作为传输协议。连接限制,也可以使用HTTP参数来进行调整。
这个示例展示了连接池参数是如何来调整的:
HttpParams params = new BasicHttpParams();
// 增加最大连接到200
ConnManagerParams.setMaxTotalConnections(params, 200);
// 增加每个路由的默认最大连接到20
ConnPerRouteBean connPerRoute = new ConnPerRouteBean(20);
// 对localhost:80增加最大连接到50
HttpHost localhost = new HttpHost("locahost", 80);
connPerRoute.setMaxForRoute(new HttpRoute(localhost), 50);
ConnManagerParams.setMaxConnectionsPerRoute(params, connPerRoute);
SchemeRegistry schemeRegistry = new SchemeRegistry();
schemeRegistry.register(
new Scheme("http", PlainSocketFactory.getSocketFactory(), 80));
schemeRegistry.register(
new Scheme("https", SSLSocketFactory.getSocketFactory(), 443));
ClientConnectionManager cm = new ThreadSafeClientConnManager(params, schemeRegistry);
HttpClient httpClient = new DefaultHttpClient(cm, params);
2.8.5 连接管理器关闭
当一个HttpClient实例不再需要时,而且即将走出使用范围,那么关闭连接管理器来保证由管理器保持活动的所有连接被关闭,由连接分配的系统资源被释放是很重要的。
DefaultHttpClient httpclient = new DefaultHttpClient();
HttpGet httpget = new HttpGet("http://www.google.com/");
HttpResponse response = httpclient.execute(httpget);
HttpEntity entity = response.getEntity();
System.out.println(response.getStatusLine());
if (entity != null) {
entity.consumeContent();
}
httpclient.getConnectionManager().shutdown();
2.9 连接管理参数
这些是可以用于定制标准HTTP连接管理器实现的参数:
'http.conn-manager.timeout':定义了当从ClientConnectionManager中检索ManagedClientConnection实例时使用的毫秒级的超时时间。这个参数期望得到一个java.lang.Long类型的值。如果这个参数没有被设置,连接请求就不会超时(无限大的超时时间)。
'http.conn-manager.max-per-route':定义了每个路由连接的最大数量。这个限制由客户端连接管理器来解释,而且应用于独立的管理器实例。这个参数期望得到一个ConnPerRoute类型的值。
'http.conn-manager.max-total':定义了总共连接的最大数目。这个限制由客户端连接管理器来解释,而且应用于独立的管理器实例。这个参数期望得到一个java.lang.Integer类型的值。
2.10 多线程执行请求
当配备连接池管理器时,比如ThreadSafeClientConnManager,HttpClient可以同时被用来执行多个请求,使用多线程执行。
ThreadSafeClientConnManager将会分配基于它的配置的连接。如果对于给定路由的所有连接都被租出了,那么连接的请求将会阻塞,直到一个连接被释放回连接池。它可以通过设置'http.conn-manager.timeout'为一个正数来保证连接管理器不会在连接请求执行时无限期的被阻塞。如果连接请求不能在给定的时间周期内被响应,将会抛出ConnectionPoolTimeoutException异常。
HttpParams params = new BasicHttpParams();
SchemeRegistry schemeRegistry = new SchemeRegistry();
schemeRegistry.register(
new Scheme("http", PlainSocketFactory.getSocketFactory(), 80));
ClientConnectionManager cm = new ThreadSafeClientConnManager(params, schemeRegistry);
HttpClient httpClient = new DefaultHttpClient(cm, params);
// 执行GET方法的URI
String[] urisToGet = {
"http://www.domain1.com/",
"http://www.domain2.com/",
"http://www.domain3.com/",
"http://www.domain4.com/"
};
// 为每个URI创建一个线程
GetThread[] threads = new GetThread[urisToGet.length];
for (int i = 0; i < threads.length; i++) {
HttpGet httpget = new HttpGet(urisToGet[i]);
threads[i] = new GetThread(httpClient, httpget);
}
// 开始执行线程
for (int j = 0; j < threads.length; j++) {
threads[j].start();
}
// 合并线程
for (int j = 0; j < threads.length; j++) {
threads[j].join();
}
static class GetThread extends Thread {
private final HttpClient httpClient;
private final HttpContext context;
private final HttpGet httpget;
public GetThread(HttpClient httpClient, HttpGet httpget) {
this.httpClient = httpClient;
this.context = new BasicHttpContext();
this.httpget = httpget;
}
@Override
public void run() {
try {
HttpResponse response = this.httpClient.execute(this.httpget, this.context);
HttpEntity entity = response.getEntity();
if (entity != null) {
// 对实体做些有用的事情...
// 保证连接能释放回管理器
entity.consumeContent();
}
} catch (Exception ex) {
this.httpget.abort();
}
}
}
2.11 连接收回策略
一个经典的阻塞I/O模型的主要缺点是网络套接字仅当I/O操作阻塞时才可以响应I/O事件。当一个连接被释放返回管理器时,它可以被保持活动状态而却不能监控套接字的状态和响应任何I/O事件。如果连接在服务器端关闭,那么客户端连接也不能去侦测连接状态中的变化和关闭本端的套接字去作出适当响应。
HttpClient通过测试连接是否是过时的来尝试去减轻这个问题,这已经不再有效了,因为它已经在服务器端关闭了,之前使用执行HTTP请求的连接。过时的连接检查也并不是100%的稳定,反而对每次请求执行还要增加10到30毫秒的开销。唯一可行的而不涉及到每个对空闲连接的套接字模型线程,是使用专用的监控线程来收回因为长时间不活动而被认为是过期的连接。监控线程可以周期地调用ClientConnectionManager#closeExpiredConnections()方法来关闭所有过期的连接,从连接池中收回关闭的连接。它也可以选择性调用ClientConnectionManager#closeIdleConnections()方法来关闭所有已经空闲超过给定时间周期的连接。
public static class IdleConnectionMonitorThread extends Thread {
private final ClientConnectionManager connMgr;
private volatile boolean shutdown;
public IdleConnectionMonitorThread(ClientConnectionManager connMgr) {
super();
this.connMgr = connMgr;
}
@Override
public void run() {
try {
while (!shutdown) {
synchronized (this) {
wait(5000);
// 关闭过期连接
connMgr.closeExpiredConnections();
// 可选地,关闭空闲超过30秒的连接
connMgr.closeIdleConnections(30, TimeUnit.SECONDS);
}
}
} catch (InterruptedException ex) {
// 终止
}
}
public void shutdown() {
shutdown = true;
synchronized (this) {
notifyAll();
}
}
}
2.12 连接保持活动的策略
HTTP规范没有确定一个持久连接可能或应该保持活动多长时间。一些HTTP服务器使用非标准的头部信息Keep-Alive来告诉客户端它们想在服务器端保持连接活动的周期秒数。如果这个信息可用,HttClient就会利用这个它。如果头部信息Keep-Alive在响应中不存在,HttpClient假设连接无限期的保持活动。然而许多现实中的HTTP服务器配置了在特定不活动周期之后丢掉持久连接来保存系统资源,往往这是不通知客户端的。如果默认的策略证明是过于乐观的,那么就会有人想提供一个定制的保持活动策略。
DefaultHttpClient httpclient = new DefaultHttpClient();
httpclient.setKeepAliveStrategy(new ConnectionKeepAliveStrategy() {
public long getKeepAliveDuration(HttpResponse response, HttpContext context) {
// 兑现'keep-alive'头部信息
HeaderElementIterator it = new BasicHeaderElementIterator(
response.headerIterator(HTTP.CONN_KEEP_ALIVE));
while (it.hasNext()) {
HeaderElement he = it.nextElement();
String param = he.getName();
String value = he.getValue();
if (value != null && param.equalsIgnoreCase("timeout")) {
try {
return Long.parseLong(value) * 1000;
} catch(NumberFormatException ignore) {
}
}
}
HttpHost target = (HttpHost) context.getAttribute(
ExecutionContext.HTTP_TARGET_HOST);
if ("www.naughty-server.com".equalsIgnoreCase(target.getHostName())) {
// 只保持活动5秒
return 5 * 1000;
} else {
// 否则保持活动30秒
return 30 * 1000;
}
}
});
最新技术文章: