Airbnb开放来源数据 - 科学共享平台
发布时间:2021-11-08 14:09 所属栏目:44 来源:互联网
导读:大多数组织都有很好的审查和共享计算机代码程序。但数据分析怎么样? 重要调查结果通常在一个混合的演示文稿,电子邮件和谷歌文档中持有Airbnb的工程和数据科学团队的两名成员在2月份博客。当组织中的某人想要找到和使用现有的工作时,他们通常必须追踪更新的
大多数组织都有很好的审查和共享计算机代码程序。但数据分析怎么样? 重要调查结果通常在“一个混合的演示文稿,电子邮件和谷歌文档”中持有Airbnb的工程和数据科学团队的两名成员在2月份博客。当组织中的某人想要找到和使用现有的工作时,他们通常必须追踪更新的代码和浪费时间检查并再现早期结果。然后他们通过演示,电子邮件或Google Doc,延伸周期“LL通常分发自己的调查结果”。“ 在考虑如何解决这个问题的各种想法之后,Airbnb创建了一个内部知识回购,结合了Git版本控制和Markdown模板来报告结果。Airbnb最近开辟了知识存储库测试版,寻求贡献者帮助前进的项目。 Git允许同样的对等审查和版本控制,该版本控制器通常用于在代码上协作,而Markdown在单个,易于可重复的文件中提供文本和代码的混合。您可以看到RStudio的教程在R Markdown中获取更多信息,以获取一般可以做的Markdown的更多信息。Markdown适用于Python等其他语言。 Airbnb Framework设置需要Python并以多种格式支持“知识帖子”。 “帖子是用Jupyter笔记本,Rarkndown文件或纯粹的标记编写的,但所有文件(包括查询文件和其他脚本)都已提交。每个文件都以少量的结构化元数据开始,包括作者,标签和TLDR,“根据中柱,Airbnb的缩放知识。“Python脚本验证内容并将帖子转换为具有Markdown语法的纯文本。我们使用GitHub的Pull请求系统进行审阅过程。最后,有一个烧瓶网站应用程序,使repo的内容作为内部博客,按时间,主题或内容组织。 “它为”知识帖子“提供了各种数据商店(和实用程序),用于”知识帖子“,特别关注笔记本电脑(R Markdown和Jupyter / IPython Notebook)以更好地促进可重复的研究,”根据GitHub存储库。“知识存储库是一项正在 (编辑:ASP站长网) |
相关内容
网友评论
推荐文章
热点阅读