wherehows是Linkedin开源的大数据治理框架,提供了元数据管理,数据血缘,数据预览,集成多种数据源的功能,最近在进行调研工作
类似的框架有Netflix的metacat,这个两个开源项目都是坑不少,目前还在踩坑阶段中…由于网上关于这两个项目的文章有价值,本文希望能对你有帮助
其他公司也有很多类似的数据发现系统,参考:Data Discovery Platforms and Their Open Source Solutions
首先的坑是项目文档不统一的问题,项目首页的文档和get-start的文档不一致,get-start的文档比较首页的文档步骤要多不少
1 | https://github.com/linkedin/WhereHows |
1 | https://github.com/linkedin/WhereHows/blob/master/wherehows-docs/getting-started.md |
wherehows提供了VM和quick start版本,我根本就没有去看这个版本,直接尝试了从源码编译
1.官方的guide第一步是让你创建mysql的用户和密码