十一 18

R绘制北京地图,并展示一些有趣的空间数据 - III

这篇博文,我们根据大众点评的北京店铺地理坐标和评论数量画一幅北京吃货地图。 相关博文有: http://www.36dsj.com/archives/23824 北京吃货地图数据可视化和分析 店铺坐标以及店铺评论数 我们使用的是2012年在大众点评抓的一次数据: https://drive.google.com/file/d/0B_b42HS1A9CmZld6MkEwQTM1UXM/view?usp=sharing 数据列包括:店铺ID,经度,纬度,点评数 我们可以通过使用以下命令读入数据: > shop_coord < - dget("shop_coord") > names(shop_coord) [1] "ID" "Lat" "Lng" "sum" > summary(shop_coord) ID Lat Lng sum Min. : 507539 Min. :-1.00 Min. : -1.0 Min. : 1.0 1st Qu.:2664595 … Continue reading

十一 14

R绘制北京地图,并展示一些有趣的空间数据 - II

接上一博文,我们来添加一些基于北京地图的空间数据作为case来展示R的可视化效果。 2013-2015年北京地震数据可视化 在国家地震科学数据共享中心,我们可以通过以下参数来获得北京的地震数据: 得到300+条记录,但是还包含了一些河北,天津,内蒙古的地震记录,我们把这些数据放到excel里根据地震地点筛选出70多条北京范围内的地震记录并且对一些字段的内容稍加修改方便之后的使用。我们要使用的地震记录在如下链接中: https://docs.google.com/spreadsheets/d/1w5CfR05q0YsdUAYx5CEThaRGanC-yemauNm3UlW4Wzc/edit#gid=1859473000

十一 13

R绘制北京地图,并展示一些有趣的空间数据 - I

推荐一个很赞的博文链接,本文在使用R绘制地图相关空间数据时很大程度上参照了这篇博文给出的做法: http://cos.name/2014/08/r-maps-for-china/ 中国地图的GIS数据 在进行基于地图的空间数据可视化前,第一步是导入地图,一个非官方的链接是:http://download.csdn.net/download/wangmingjiazaizhon/4864211 下载后解压缩,可以得到很多格式的地图数据文件,其中CHN_adm0.shp, CHN_adm1.shp, CHN_adm2.shp, CHN_adm3.shp是我们接下来要使用的四个文件,他们都是中国地图数据,但是精度不一样,CHN_adm3.shp精度最细,到县市级别。 原博文中给出的官方地图GIS数据连接我没有打开http://nfgis.nsdi.gov.cn

25

Ubuntu下PDF编辑工具使用经验

最近需要帮别人校对文档,没有拿到原始latex文本,所以得在pdf上直接修改。在Windows系统中,adobe是有编辑功能的,可以在pdf上做很多备注和修改,但是ubuntu系统下只能尝试其他方法。 我搜到比较好的一个中文资料是:http://blog.chinaunix.net/uid-25789104-id-3968982.html ,但里面列举的7个常用pdf编辑器,并不都能很好地满足我自己的使用需求。 在实际使用中,我是结合Inkscape和Pdftk来完成pdf修改的!

07

感知哈希算法 (Perceptual Hashing)

相信很多用户都在Google,Baidu,Bing这些搜索引擎上试验过以图搜图。以图搜图的功能一般是分为两种,一种是只找匹配图片,原图或者原图的主体裁剪或者缩放,另外一种就是返回相似图片,比如女性用户可以查找与大牌款式相近的衣服和手袋,时尚又实惠! 大家有没有想过为何搜索引擎可以非常迅速且高质量地返回以图搜图结果呢?

11

SVD++ Model in Recommender System

It's very interesting to share my recently reading of Koren's paper "Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model", which is well known for Netflix Prize. Actually, my industry experience on Recommender System was APPs Recommendation for Android Chinese … Continue reading

10

Stochastic Gradient Descent (SGD)- Singular Value Decomposition (SVD) Algorithms Notes

In linear algebra, the singular value decomposition (SVD) is a factorization of a real or complex matrix. It has many useful applications in signal processing and statistics. Linear Algebra provides several numerical methods, such as Householder reduction, Golub–Reinsch SVD, High … Continue reading

05

湾区找工作小记

14年7月校招加入微软Bing,原打算满一年后找transfer到总部的机会,但进展不如预期顺利,加之Dora在加州工作并强烈不喜欢西雅图天气,所以15年初我就开始找湾区的工作了。 投出10多份简历,职位都是Software Engineer(有的公司也许title有所不同,但仍然是SE本质),地点大多在Google总部附近。我都是找人内推的,同事、朋友以及linkedin好友,仍然无法阻止接踵而至的拒信。值得一提的是,我很感兴趣Netflix公司,觉得自己的背景比较合适,于是找到比我大两届的师兄帮我投简历。在他们公司的career页面上,我看到最低title是sensior xxx,以为他们公司喜欢把title起得很高,最后发现...人家真的只是招senior,而我简直不能再junior~尽管师兄非常热心地为我推荐了好几个组,我还是被拒了。 简历阶段后,HR理我的只有Google,Facebook, Palantir, RocketFuel.