Facebook面试题-求硬币概率

无意中看到一个面试题,号称是Facebook出的(出处

You randomly draw a coin from 100 coins — 1 unfair coin (head-head), 99 fair coins (head-tail) and roll it 10 times. If the result is 10 heads, what is the probability that the coin is unfair?

Read More

Nodejs下使用gm圆形裁剪并合成图片

说到Nodejs下的图片处理可能第一想到就是gm,gm底层可以是GraphicsMagic(其实也是gm的由来),也可以是ImageMagick(其实GraphicsMagic本身也是从ImageMagic分割而来,现在独立了)。虽然这两个工具本身都不是js实现,所以需要额外安装,不过此工具非常常见,可能已经预装在linux系统下,而且安装也很方便,所以不用...

Read More

使用flask + uwsgi + supervised 使用虚拟python环境搭建网站

flask是个轻量级的网站框架,如果网站仅仅是几个简单的页面与功能接口的话,使用它比其他诸如django等框架要方便很多。然而当网站构建好后,需要部署到服务器,此时需要另外两个工具:用于让python与网站服务器相连的uwsgi,以及用于自动启动并守护的supervisor。 flask和uwsgi都支持python2和python3,但supervisor...

Read More

信息增益与主成分分析在化学信息学中的应用

摘要:信息增益一般用在数据挖掘中的决策树方法领域,它是指当前熵与两个新群组经加权平均后的熵之间的差值。在化学信息学中,我们可以利用信息增益判断分子指纹的每个子结构对分子活性的影响程度。主成分分析是数理统计中的一种技术,意在降低变量的维度,防止过拟合现象以提高模型的准确度。在化学信息学中,我们可以利用主成分分析技术解决分子描述符太多且可能存在相关性的问题。本...

Read More

在Docker中使用GUI环境,解决cannot connect to X server问题

Docker 因为其部署、迁移方便而广为受到关注。我们使用 DockerFile 进行环境搭建与配置,用户只需要下载 Docker 并安装,下拉镜像docker pull TheImage即可仿佛下载了一个已经配置好的虚拟环境,然后docker run 即可实现程序。可当它处理GUI程序的时候就不那么方便,如果直接执行GUI程序会得到“cannot conn...

Read More

使用Python-RQ 构建前后端分离的任务队列应用

故事的起因是想要做一个有排队任务系统的webserver。初步想的架构是这样,前端用一个web页面用来新建、查看任务,通过php存至MySQL数据库,并向Worker(用Python实现的一个程序)发起一个signal,如果Worker停止工作了,则开启工作,如果已经正在跑任务,则什么事都没有。Worker启动后会跑下一个state为0的任务,完成后将结果保...

Read More

使用Cython实现斐波那契数列并与Python比较

Cython 是用 Python 的语法写C语言,原理其实就是解释器将 python 语言翻译成C语言然后再用编译器(比如 gcc 或者 vc++ )编译成可被 python 调用的动态链接库。是用 Cython 的好处自然就是快。最近想到一个问题,斐波那契数列可以用两种方法实现,一种是用迭代方法,即根据定义当前值等于前两个值的和。另一种是使用数列知识中的求...

Read More

Loopback自动添加ShowDoc文档及API测试

Showdoc API loopback (项目地址:https://coding.net/u/zealseeker/p/showdoc-api-loopback/git )是一款用于 Loopback (基于Express的RESTful 框架)中的 API 测试以及基于 ShowDoc 文档自动上传的工具。通过写测试脚本,用户可以方便的进行有上下文的接口...

Read More

Git clone 失败:Unable to find remote helper for 'https' 解决方法

碰到问题:无论是使用 CentOS 6 自带的 Git 1.7.1 还是自己根据教程安装的 Git 2.2.1 都无法从Coding中以https协议克隆版本库。百度了很多也未能找到合适的解决方法。 原因:该问题是由 git configure 配置时没有设定 –with-curl –with-expat 造成,之所以自动配置时会被忽略是因为检测不到libc...

Read More

初试TensorFlow,学习深度神经学习

前言最近深度学习是比较火的,在theano和tensorflow之间做了个抉择,还是觉得google维护的项目靠谱点。而从另一个角度,theano是个更强大的数学工具,所以对于我们这些门外汉来说,可能更希望直接上手网络的构建和预测,从这个角度来说,TensorFlow兴许更适合。 我在coding中建立了个开源项目,在此处分享自己学习TensorFlow的过...

Read More

Matplotlib 图例与标注

用 Matplotlib 作图相比于使用Origin这种商业软件更为程序化,当熟练了以后还是非常方便的。参考官方文档以及一些教程,不难做出一些比较好看的散点、柱状图等,这些也是在学术研究中比较常见的chart。但是,常常我们需要在柱状图或者散点图上增加一些图例以及标注以增加图表的可读性,那么该怎么做呢?此处介绍两处笔者用到的增加图例与标注的方法: 123...

Read More

我和Coding这两年

上一次冒泡 并不知道这是个活动,无意中得到好多赞,让我有写一篇完整版,发表一篇博文,聊聊不为人知的情结。此文同步到我的博客。 我和码币:刚开始Coding送码币是很凶的,不亚于滴滴打车和百度外卖的那种福利水平。可我知道码币的重要性实在太晚,去年9月才开始有意识赚码币。我知道这种福利绝对不会持续太久,所以几乎天天PUSH代码,天天提交任务,天天冒泡,一切都为了...

Read More

利用docker搭建linux下的apache-mysql-php环境(xampp)

在mac下配置amp环境虽然有简单的xampp,但是仍然会出现一些奇奇怪怪的错误,所以我想到利用docker来下载别人构建的环境,一来省力,而来通过这样的配置以了解对docker的一些了解。以往配置lamp(其实比起apache我更喜欢nginx,感觉更简单),基本上就是百度,然后各种教你如何从源码下载、编译,然后如何配置他们。尽管从中能学到很多东西,可到头...

Read More

在安装Theano, scipy以及jupyter,matplotlib时碰到的问题

安装Theano时出现Memory error(实验虚拟机为Aliyun 1G 1CPU)解决方法是pip --no-cache-dir install Theano 参考 http://stackoverflow.com/questions/29466663/memory-error-while-using-pip-install-matplotliblo...

Read More

解决root用户的vim没有颜色的问题

虽然笔者也不是很清楚vi和vim到底有什么区别和关系,不过可以简单的概括为,vim是vi的一种升级版,vi本身没有颜色高亮的功能而vim有。首先需要下载最新版的vim, apt-get install vim 或者centOS下的yum install vim 都可以将vim升级为最新版的,有些机器因为版本问题或者干脆没有vim导致没有高亮。然后如果whic...

Read More

用Pelican构建静态博客部署于Github Pages

用 Github Pages 部署静态博客已经是很早就比较热门的事情,官方推荐的是Jekyll,与之类似的有Octpress。也有利用Nodejs开发的Hexo。这几个应该算是最火的几个静态博客生产程序了。 除了Jekyll是得到Github支持的外,其他的程序就只能通过自己在本地生成HTML页面然后上传到Github上。由于本人没有学过Ruby,而且早就深...

Read More

Python 实现 Tanimoto 相似性计算并使用 Matplotlib 绘制热图

Tanimoto相似性又称Jaccard系数,可以计算两个二进制向量(也可以计算非二进制)的相似性公式为J=|A∩B|/|A∪B| 比如[0,1,0,1,0]与[1,1,1,0,0] 的交集为[0,1,0,0,0] 长度为1,并集为[1,1,1,1,0]长度为4,所以相似度为0.25 实现方法其实有很多,我的方法是 先将向量转化成set,比如[0,1,0,1...

Read More

简单的Python任务,给入门开始学习的这语言的伙伴训练

许多新手(尤其是没怎么学过编程的新手)刚开始学Python是从一些教程开始的。教程的训练比较枯燥。我觉得最枯燥的地方并非写代码,而是不懂为什么要写这些代码。 所以,我写了一些简单的Python任务(真的很简单~~),希望大家可以在学习的过程中知道编程能做些什么,虚拟的数字变量们是如何描述这个世界中真实存在的东西的。 学编程(往往学习Python的人不是为了写...

Read More

Scrapy使用笔记-如何写爬虫脚本进行网页文本挖掘采集需要的数据

因为课题需求,需要从网站上挖掘一些有用的数据以构建模型。网站虽然提供整合的数据库,但每条数据只给了网址链接,自己从中找具体的数据内容。 网页文本挖掘其实并不是什么新鲜事儿,记得高中的时候就尝试通过“寻找规律法”从网页中获取自己想要的数据,当初还用的是Visual Basic。到了大学,学了一段时间的PHP,并没有用此自己做网页,倒是从中学习了如何用PHP采集...

Read More

用于特征选择的F-Score打分及其Python实现

F-Score(非模型评价打分,区别与 F1_score )是一种衡量特征在两类之间分辨能力的方法,通过此方法可以实现最有效的特征选择。最初是由台湾国立大学的Yi-Wei Chen提出的(参考《Combining SVMs with Various Feature Selection Strategies》),公式如下: 其中i代表第i个特征,即每一个特...

Read More