2010农历年前的牢骚

又是一年春来到,转眼又要过年了,还好我一直在武汉,没有春运的困扰,不过前不久出差浙江也体验了一把春运。中国人注重过年可是我一直对年没什么感觉,每年过年都是不停的走亲访友或者被亲友走访,一个年过下来还真是不轻松。希望明年的春节能够去旅游吧。

阿凡达到现在还没看,不知道大年三十的时候会不会不这么紧俏,我的希望就在那一天了。

从技术转换到管理岗位,需要学习的好多啊,突然有想回到学校的想法,不过不太现实。希望什么时候能再回到学校吧。

明年的重点是公司,要让公司运作进入轨道。

更改域名

前几天域名到期,续费一看,cn涨到60了,比COM都还贵了,没办法,谁叫现在严打呢,只能续费了,为了不被cnnic继续控制,上godaddy买了这个com域名,以后改用这个com域名。

换了域名以后顺便设置了一下301重定向,把之前的CN米定向到com上来了,看什么时候能重新收录吧,虽然也没收录多少就是了。

btw:godaddy买com米用优惠码以后只要7.69美刀。最好附送godaddy $7.69购买com域名的优惠码CJC695T1

2044_1

Dropbox免费网盘高级使用技巧(ZT)

经常使用Dropbox同步公司和家里的文件,今天看到月光博客上面有一篇关于Dropbox的高级使用技巧,很有用处,于是转了过来,版权归月光博客所有。

转自http://www.williamlong.info/archives/2044.html

Dropbox和Live Mesh都是常用的网络存储服务,可以实现多台电脑上共享和同步文件,微软的Live Mesh提供的空间是5GB空间,而Dropbox提供的初始免费空间是2GB,可以通过邀请增大到5GB,两个网络同步软件各有千秋,但我感觉Dropbox更为好用一些,这里,我就介绍一下我在使用Dropbox的过程中总结的几个小技巧。

1、同步任意文件夹

Dropbox安装完成之后,通常会在你电脑上建立一个My Dropbox文件夹,放到这个文件夹里的文件才进行同步。这点不如Live Mesh好用,至少Mesh可以同步例如“桌面”等指定的文件夹,而Dropbox只能同步固定文件夹,为了解决同步其他文件夹的问题,需要使用junction/mklink工具来解决。

对于Windows XP用户来说,微软就提供了一个小工具junction,可以在NTFS系统中创建和删除一个junction目录,该目录和原始目录的内容一模一样,如果你对其中任意一个文件夹里面的内容做修改,另一个也会相应的改变,junction目录是NTFS文件系统的一个特性,但Windows XP没有工具对其进行操作,需要点这里下载一个exe文件才能使用。在Windows 7系统下已经内部支持,其命令为mklink,使用方法和junction相同。

例如,我们可以执行junction “E:\My Documents” “E:\My Dropbox\My Documents” ,命令的意思是创建一个名为E:\My Documents的junction目录,指向E:\My Dropbox\My Documents,该命令瞬间执行完成,而两个目录则完全相同,这样我们就可以使用E:\My Dropbox\My Documents这个目录来替代“我的文档”中的目录。

对于Dropbox来说,只能按照如上的命令建立junction目录,而不能在My Dropbox目录里创建junction目录,经过我的测试,My Dropbox目录里面的junction目录只能同步一次,之后修改加文件都不同步,无法实现同步更新。

2044_1

2、同步MSN和QQ记录

如果我们同时在家里和公司上MSN和QQ,就会遇到一个麻烦问题,就是聊天记录不同步,公司一处,家里一处,使用Dropbox可以实现两地的聊天记录同步。

首先按照上面的操作将My Documents我的文档目录设置为junction目录,实际文件放到My Dropbox目录中,接着,在QQ和MSN中设置默认保存文件和聊天记录的位置在“我的文档”中,这样,用户所有聊天记录都会自动被Dropbox同步,从而实现了家中和公司两处聊天记录的同步更新。

3、同步桌面

除了“我的文档”,很多人希望将多台电脑的桌面文件进行同步,经过我的测试,Dropbox无法直接同步桌面,不过,可以通过在桌面创建一个junction目录的方式实现同步,这样桌面上就会多一个实际为junction类型的“文件夹”,将工作文档或者其他文档复制到这个文件夹中,即可实现同步。

4、同步IE收藏夹

默认情况下IE的收藏夹路径为: C:\Documents and Settings\Administrator\Favorites ,我们可以通过修改注册表的方式来修改收藏夹的路径,打开注册表: HKEY_USERs\Software\Microsoft\Windows\CurrentVersion\Explorer\User Shell Folders ,而后把“Favorites”键值修改成My Dropbox目录下的一个文件夹路径即可。在多台电脑都进行这样的操作,就可以实现多台电脑自动同步IE收藏夹的功能。

5、网站自动备份

如果你也拥有一个类似“月光博客”的网站,你也会为数据的安全性而头疼,如何安全地自动备份网站数据呢?有了Dropbox,我们就有了一个网站自动备份的新方案。

对于使用SQL Server的网站来说,可以在SQL Server中设置一个自动执行任务,每天自动将数据库文件备份到My Dropbox目录里即可。

对于使用Access的网站来说,频繁读写的Access文件不宜直接放到Dropbox目录里,而采用定时复制的方法更好一些。具体操作是,建立一个BAT文件,内容是“xcopy “E:\website” “E:\My Dropbox\website” /s/e/y”,在“系统工具 – 任务计划”中新建一个计划任务,选择这个批处理文件,设置每天临晨自动执行,就可以定时自动把website目录下的网站文件(包括ACCESS文件)一起复制到Dropbox目录中的website文件夹。

这样,就实现了使用Dropbox可以自动将网站上的文件和数据库进行备份,无需手动操作。缺点是最多5G空间,不适合大网站的备份。

好了,以上就是我在使用Dropbox过程中总结的一些小技巧,总的来说,Dropbox是一个非常不错的网络同步工具,Live Mesh相比Dropbox来说有几个缺点,比如只支持Windows,不支持Linux、Mac,兼容性较差(例如在我公司的电脑上安装Live Mesh就报错,无法安装),另外Live Mesh的界面有待进一步优化。

Dropbox的默认空间是2G,如果你也想使用Dropbox,点这里注册Dropbox帐号可以获得2.25G的空间,如果你邀请其他用户使用的话,每邀请一个用户注册也可获得250M空间,最大到5G空间封顶。

1

reCAPTCHA

1

『 reCAPTCHA 』

反 spam 的 CAPTCHA 技术现在有了新的用途:reCAPTCHA。

根据Science的介绍,reCAPTCHA是利用CAPTCHA的原理(CAPTCHA的中文全称是全自动区分计算机和人类的图灵测试),借助于人类大脑对难以识别的字符的辨别能力,进行对古旧书籍中难以被OCR识别的字符进行辨别的技术。也就是说,reCAPTCHA不仅可以反spam,而且同时还可以帮助进行古籍的数字化工作(可以称为人工OCR,呵呵)。不知道他们的灵感是否来自于分布式计算的想法?据称 目前正施用于 4 万多个网站,并到目前为止已经帮助解决了来自扫描文本文件的约 4 亿 4 千万个字词。

reCAPTCHA使用起来并不复杂,大多数独立blogger所用的wordpress,MT都有相应的插件支持。在reCAPTCHA.net注册一个用户名后,输入你的blog域名(只支持域名和子域名),就会的到一个Public Key,把他用在你所用的reCAPTCHA插件上。reCAPTCHA也支持多个站点。

安装成功后,用户评论就有了CAPTCHA功能。每次CAPTCHA会显示两个单词让人来识别,其中一个是需要用户识别的难认词,另外一个是答案已知的真正的CAPTCHA 词。软件将能够正确识别CAPTCHA 词的用户看作是人类,当CAPTCHA 词被正确识别出来后,程序会纪录用户对无法阅读的词的回答并将其添加到它的数据库中。这样就完成了一次人工的OCR识别。

OCR软件并不能很好的识别文字:比如…

2

为了改善软件的精确性, reCAPTCHA 会将最困难的词发送给多个用户并挑选其中有相同答案的作为正确的答案。据说准确率能够达到99%。

reCAPTCHA: http://reCAPTCHA.net

或许大家在很多网站看到过下面这个,这说明这个网站支持reCAPTCHA。

3

用户每使用一次这个程序,实际上就是在帮助数字重现1908年《纽约时报》上的某一页,或者其它古书中的一页,这对考古学具有重大的意义。

★ 相关文字:2008年8月《科幻世界》跃迁层

您肯定上过论坛吧?几乎所有正规的论坛都要求注册时输入验证码,这是为了防止乱发垃圾广告的家伙用注册机来恶意注册。这个源自美国卡内基-梅隆大学的发明被称为CAPTCHA(用于区分人类与电脑的全自动图灵测试),因为注册者需要辨识图片上七歪八扭的文字,而这项工作只有真正的人类才能完成。

要知道,全世界的网络用户数以亿计,对个人来说,辨认文字所花的几秒时间微不足道,但如果将所有网民的力量利用起来,那便能完成难以想象的浩大工程,而这正是美国宾夕法尼亚州匹兹堡市的CMU研究小组正在做的事。

该小组受一家名为“互联网档案馆”的非营利组织委托,要将海量的古老书籍和手稿通过OCR(光学字符识别)软件转化为电子文本,以方便电脑储存和查询。然而,由于原稿的质量太差,可怜的电脑每扫描十个单词就会错读一个,唯一解决的办法就是人工核对,而这样的工作显然不是一个人或一个小组可以胜任的。

于是,CMU设计了一个名叫reCAPTCHA的强大系统,让他们的电脑去向人类求助。具体做法是:将OCR软件无法识别的文字扫描图传给世界各大网站,用以替换原来的验证码图片;那些网站的用户在正确识别出这些文字之后,其答案便会被传回CMU。

为了提高用户辨识文字的正确率,他们往往被要求辨认两个单词,其中一个的答案已经知晓。这样以来,正确辨认出有答案的那个单词的用户,很有可能也会正确辨认另一个单词。有时候,CMU也会将一个未经辨认的单词提交给不同的用户,如果得到的是相同的答案,那这个答案便可以肯定是正确的。

由于许多人气极高的网站,如Facebook、Twitter和StumbleUpon等,都采用了reCAPTCHA,CMU现在每天都可以处理大约一百万个单词。不过,按照现在的速度,要电子化“互联网档案馆”提供的所有文本,估计还需要400年。

★ 重点单词注释:

■ SPAM

SPAM,最初是一个罐装肉的牌子。对于这个牌子名字的来源有很多解释,官方版本说,它是“Specially Processed Assorted Meat”特殊加工过的混和肉。这种SPAM肉有段时间非常普及,到了无处不在,令人讨厌的程度。1970年Monty Python剧团有个很流行的Sketch comedy(一种短小的系列喜剧)叫Spam,剧中两位顾客试图点一份没有SPAM的早餐,但不能得逞。后来,Spam被用来称呼互联网上到处散布的垃圾邮件。

■ Captcha

CAPTCHA项目是Completely Automated Public Turing Test to Tell Computers and Humans Apart (全自动区分计算机和人类的图灵测试)的简称,已由卡内基梅隆大学注册商标。

CAPTCHA的目的是区分计算机和人类的一种程序算法,这种程序必须能生成并评价人类能很容易通过但计算机却通不过的测试。这个要求本身就是悖论,因为这意味着一个CAPTCHA必须能生成一个它自己不能通过的测试。

新的开始,最近要做的事情

到这边一个礼拜了,基本上就绪了,准备开始新的工作,马上就十一月了,做下计划有个良好的开端。

在接下来的十一月要处理的事情还是很多的,工作上和自己的研究目标

工作上

首先是人手问题,项目的开展需要解决人手问题。

其次设计用户注册流程,十一月要把用户注册审批这一块包括功能开发搞定

第三是网站调整,目前网站有很多需要调整的地方

第四网站内容页跟列表页的优化

个人需要研究的

linux服务器平台

phpcms模板深入研究

我的CSS框架的整合