experience
Python中的多进程队列
在Python中进程间共享数据比较常用的方法就是多进程队列multiprocessesing.queues.Queue,官方文档在这里是这么说的: The Queue class is a near clone of Queue.Queue; Queues are thread and process safe.
用Python备份WordPress数据至Google Drive
前段时间因为Google Photos照片传太多把Google Drive空间用完了,就买了三刀一个月的Google会员,然后就发现100G空间似乎一时半会儿还用不完,正好之前一直想着给博客服务器来个自动备份脚本,所以就先把坑填了。
git通过config指定ssh密钥
之前博客里面有记载过通过脚本的方式指定git的ssh密钥,略为复杂,后来从同事那里知道了一种更简单直接的方法。
代码与猫
此生我最痴迷得无法自拔的有两样,一个是代码,一个是猫,即使我现在并不是一个代码高手,也没有养猫。 读过一点村上春树的《猫》,里面对猫的爱之表达真实毫无保留,毫无保留到令人发指,没错我说的就是里面的虐猫描写,我能够理解他们日本人这种习惯将任何情怀发挥到极致,但是对于同样爱猫的我来说,着实不能接受,所以那书我看了一半就丢掉了(只是从我的Kindle Library删除 :p)。不过书中倒是有一个有趣的事实,那就是猫只会在人类面前发出「喵」的叫声,仔细一想还真的是,说是永远不可能被驯服的喵君,无形之中也似乎已为人类所征服,当然这也可能只是我们这些无知人类的意淫。
使用scikit-learn进行KMeans文本聚类
K-Means 算法简介 中文名字叫做K-均值算法,算法的目的是将n个向量分别归属到K个中心点里面去。算法首先会随机选择K个中心向量,然后通过迭代计算以及重新选择K个中心向量,使得n个向量各自被分配到距离最近的K中心点,并且所有向量距离各自中心点的和最小。
Pypy使用Pymongo
据说 Pypy的速度比 CPython 速度要快的多,所以准备换成Pypy试一试,但之前在使用CPython的时候使用pip安装的第三方库(比如pymongo直接给Pypy用的话会报ImortError,这个使用似乎要通过Pypy重新安装一下pip,在Ubuntu下通过apt-get安装Pypy过后执行下列操作:
MongoDB插入对象过后原对象被更改
今天发现了MongoDB中一个很奇怪的设计(或者说是坑。。。) 我在向MongoDB中插入一个对象的时候,不光数据库中新建的Document会自动生成一个Object ID,这个Object ID还会自动插入到原对象里面去,如下所示:
git指定ssh密钥文件
在ssh到服务器上的时候可以可以通过-i参数来指定登录密钥,有的时候git也会有这种需求,但是git本身没有自带-i参数,Google一番过后发现可以用脚本来解决。
Python2.7处理中文utf8 json数据
在Python 2.7里面字符编码似乎是一个很令人烦躁的问题,最近在处理抓取的数据时候碰到了一些问题,在这里记录一下: