GitHub的归档是一个大型的软件开发活动和开发商这一切背后有趣的数据源。很多人(包括我自己)开采它来学习什么 […]
2013-10-22
近日,开发商的GitHub上的数据,在我见过的比较有创意的方式之一。GitHub的贡献者的位置,他创造了一个有趣的数据可视化。我必须说,它围绕旋转地球是mesmerizingly乐趣。
奥森他的代码,当然,在GitHub上,这样你就可以抓住它,并用它玩自己。使用Google BigQuery中的查询快照的GitHub的数据从2012年,他得到了1000个地点,他们使用谷歌的地理编码API地理编码,然后重复所有使用 WebGL的地球。
如果你想看到列表生成可视化的,你可以运行自己他的查询BigQuery中:
SELECT actor_attributes.location,
NUM_USERS
从publicdata::samples.github_nested
(IS NOT NULL actor_attributes.location)和
(actor_attributes.location!='')
GROUP BY actor_attributes.location的
有
(COUNT(*)> = 1),
ORDER BY DESC NUM_USERS;
利用这一点,我掏出前100名位置,只是做了一些手动清理(如“西雅图”和“西雅图,华盛顿州”都是同一个地方)。我也忽略了整个国家的位置(像奥森那样),只是他的做法是一致的。做这一切,这里是前20个城市GitHub的贡献者:
加利福尼亚州旧金山
伦敦,英国
法国巴黎
纽约,纽约州
西雅图,华盛顿州
东京都,日本
德国柏林
波特兰,俄勒冈
华盛顿特区
芝加哥,IL
马萨诸塞州的波士顿
北京,中国
洛杉矶,CA
莫斯科,俄罗斯
加拿大多伦多
奥斯汀,德克萨斯州
斯德哥尔摩,瑞典
澳大利亚墨尔本
日本横滨
上海,中国
这是一个相当多样化的名单,遍布全球。那么,跨越半个地球(北半球)居多。我没有看到有任何真正的休克想不出任何明显的城市,我本来期望地看到,没有破解的前20名。