Archive for November, 2009
Sunday, November 29th, 2009
上次去beta沙龙的视频,希望没有浪费大家的时间,感谢beta沙龙的组织工作。
Posted in Data Mining | 2 Comments »
Tuesday, November 17th, 2009
周末beta沙龙和大家分享的音乐智能推荐PPT,有些内容和上次的PPT差不多,这次主要和大家分享一个完整的数据挖掘流程,同样的,还是工程方面比较多,学术方面这里有很多大牛。
Posted in Data Mining | 6 Comments »
Thursday, November 12th, 2009
从2亿个0~2,000,000,000之间的数字样本中找出不重复的记录总数,首先想到的是bloom filter,转念一想既然全都是数字,bloom filter有点太重,bitarray也许更有效,于是第一个版本出来,部分代码如下:
ba = bitarray(212**4)
cnt = 0
for i in data:
if (not ba[i]):
cnt += 1
ba[i] = True
print cnt
大概需要140s左右,觉得if (not ba[i]):这个比较费,改了第二版:
for i in data:
ba[i] = True
print ba.count()
速度有所提升,到了120s左右,开始打起多核运算的主意了,山寨了一个map-reduce,首先通过maper把数据按照除4得余分成4份:
def maper(data):
...
Posted in Python | 14 Comments »
Saturday, November 7th, 2009
开发工作很久以前就基本完成了,一直没来得及整理,今天发布0.3alpha,相比较0.2alpha,比较大的修改如下:
Helper中增加了验证码模块Captcha.php、HTTP访问模块Http.php、数据校验模块Validate.php
修订DB模块中result($sql)函数,如果$sql是select语句则返回结果集,如果是insert语句则返回最后插入ID,如果是update或者delete语句,则返回受影响行数(有可能为0行),其他语句则返回query句柄
完善框架的易用性:增加了统一配置文件;可以指定models、views、controllers目录;支持默认模版名称
大量的代码重构以及bug fix
下载0.3alpha,不过建议随时跟进我们的SVN://colaphp.googlecode.com/svn/trunk/,ColaPHP一直在活跃开发。
0.4alpha版本开发代号:20 lines,目标是把所有的函数都控制在20行以内以及代码的持续重构。
继续招募PHP极客加入Cola,联系fuchaoqun#gmail.com。
Posted in PHP | No Comments »
Monday, November 2nd, 2009
最近有个项目,用到很多的表单校验,尝试了一下jQuery.validator,甚是顺手,地址:http://plugins.jquery.com/project/validate,基本的用法:
$('#formId').validate({
debug:true, // 打开debug模式,不会真实提交,适合测试
rules:{
uName:"required", // 需要录入
uNick:{
required:true
}, // ...
Posted in Javascript | 1 Comment »