KanRSS是一个很宏大的计划, 他的目标是整合当前支离破碎的互联网.

也许正是因为他很宏大,所以我使劲的写啊写啊,写了好几个月,也才做了冰山一角.

恩,一个人写好慢 … 所以欢迎大家一起来写

KanRSS 基于python开发 , 代码一直放在 Google Code ( http://zspyun.googlecode.com )

最近两天, 有两个感兴趣的开发者

张侃 http://kanrss.com/@phoenix

刘志超 http://kanrss.com/@imouren

加入到它的开发中. 在他们的帮助下, 我完善了一些开发环境配置文档.

如果你有时间, 并且懂python, 并且有兴趣 , 那么欢迎来贡献代码 .

1.到 kanrss 注册一个账号 参考 http://kanrss.com/them/join 这个流程介绍一下自己

2. 一道简单的笔试题

用python定义 find_url 函数(只允许使用python的内置库)

输入是一个页面的url 比如 http://news.baidu.com/

输出是页面上 所有的<a>元素中的链接以及链接文字 , 比如:
[(
"http://news.xinhuanet.com/world/2010-05/09/c_1282452.htm",
"阿富汗与美国军队打死10名塔利班人员"
),]

3. 到 bitbucket.org 网站注册一个账号 上面有一些文档

4.把上面的账户以及笔试题目的答案发送到 zsp007@gmail.com

附一些技术细节:

KanRSS使用自己Web框架.

用到了
# WSGI (框架接口)
# Mako (网页模板)
# Facebook的Tornado (RPC 和 管理后台 以及 做 wsgi的server )
# 豆瓣的beandb (存放大文本 和 图片 )
# MySQLdb + MySQL
# Xapian (搜索)
# PIL (处理图片)
# WebError (页面调试)
# python-memcached + memcached (缓存)
# beanstalkc + beanstalkd (消息队列)
# postfix (邮件服务)
# nginx (负载均衡 + 图片的反向代理)
# hg 和 svn (版本控制)
# py-yajl (json序列化)
等等