Databricks
请阅读免责声明。删除百科只是中文维基百科被删除条目的存档。 | 建议删除本条目 |
Databricks, Inc. | |
---|---|
公司類型 | 私有公司 |
成立 | 2013年 |
創辦人 | Ali Ghodsi,Andy Konwinski,Ion Stoica,Patrick Wendell,Reynold Xin,Matei Zaharia,Arsalan Tavakoli |
代表人物 | Lua错误 在Module:WikidataIB的第759行:attempt to index field 'wikibase' (a nil value) |
總部 | 美國旧金山 |
产业 | 電腦軟件 |
營業額 | ▲ $813 Million (2022)[1] |
息税前利润 | Lua错误 在Module:WikidataIB的第759行:attempt to index field 'wikibase' (a nil value) |
净利润 | Lua错误 在Module:WikidataIB的第759行:attempt to index field 'wikibase' (a nil value) |
總資產 | Lua错误 在Module:WikidataIB的第759行:attempt to index field 'wikibase' (a nil value) |
資產淨值 | Lua错误 在Module:WikidataIB的第759行:attempt to index field 'wikibase' (a nil value) |
員工人數 | Lua错误 在Module:WikidataIB的第759行:attempt to index field 'wikibase' (a nil value) |
市值 | Lua错误 在Module:WikidataIB的第759行:attempt to index field 'wikibase' (a nil value) |
网站 | databricks.com |
Databricks是一家美国企业软件公司,由Apache Spark的创建者创立。[2]Databricks 开发了一个基于 Web 的平台,用于与 Spark 一起工作,提供自动化集群管理和IPython风格的笔记本。
历史
Databricks 源于加州大学伯克利分校的AMPLab项目,该项目参与了Apache Spark的制作,一个基于Scala构建的开源分布式计算框架。该公司由Ali Ghodsi 、Andy Konwinski、Arsalan Tavakoli-Shiraji、Ion Stoica、Matei Zaharia、 [3]Patrick Wendell 和Reynold Xin创立。
2017 年 11 月,该公司通过集成 Azure Databricks 被宣布为Microsoft Azure上的官方服务。[4]
该公司开发了开源项目Delta Lake,旨在为机器学习和其他数据科学用例的数据湖带来可靠性。[5]
2020 年 6 月,Databricks 收购了 Redash,一种开源工具,旨在帮助数据科学家和分析师可视化和构建数据的交互式仪表板。[6]
2021 年 2 月,Databricks 与Google Cloud一起提供了与 Google Kubernetes Engine 和 Google BigQuery平台的集成。[7]《财富》将 Databricks 评为 2021 年最佳大型“千禧一代工作场所”之一。[8]当时,该公司表示有超过 5,000 个组织使用其产品。[9]
2021 年 8 月,Databricks 完成了第八轮融资,筹集了 16 亿美元。此後,公司估值为 380 亿美元。[10]
2021 年 10 月,Databricks 对德国无代码公司 8080 Labs 进行了第二次收购。8080 Labs 制作了 bamboolib,这是一种无需编码即可使用的数据探索工具。[11]
资金
系列 | 日期 | 金额(百万美元) | 主要投资者 |
---|---|---|---|
A | 2013 | 13.9[12] | 安德森霍洛维茨 |
B | 2014 | 33[13] | 新企业合伙人 |
C | 2016 年 | 60[14] | 新企业合伙人 |
D | 2017 | 140[15] | 安德森霍洛维茨 |
E | 2019 年 2 月 | 250[16] | 安德森霍洛维茨 |
F | 2019 年 10 月 | 400[17] | 安德森霍洛维茨 |
G | 2021年1月 | 1,000[18] | 富兰克林邓普顿投资 |
H | 2021 年 8 月 | 1,600[19] | 摩根士丹利 |
2013 年 9 月,Databricks 宣布从Andreessen Horowitz筹集了 1390 万美元,并表示它旨在为 Google 的MapReduce系统提供替代方案。 [12] [20]微软是 2019 年 Databricks 的著名投资者,参与了该公司的 E 系列,金额不详。[21][22]该公司已经筹集了 19 亿美元的资金,其中包括由富兰克林邓普顿领投的 10 亿美元 G 轮融资,该轮融资后估值为 2021 年 2 月的 280 亿美元。其他投资者包括Amazon Web Services 、 CapitalG(Alphabet, Inc.旗下的一家成长型股权公司)和 Salesforce Ventures。[9]
产品
Databricks 使用营销术语“lakehouse”开发和销售云数据平台,这是基于术语“数据仓库”(英語:data warehouse)和“数据湖”(英語:data lake)的组合。[23] Databricks 的 Lakehouse 基于开源Apache Spark框架,该框架允许对半结构化数据进行分析查询,而无需传统的数据库模式。 [24]
Databricks 的 Delta Engine 于2020年6月推出,作为一种新的查询引擎,它在 Delta Lake 之上分层以提高查询性能。[25]它与 Apache Spark 和 MLflow 兼容,这也是 Databricks 的开源项目。[26]
2020 年 11 月,Databricks 推出了 Databricks SQL(以前称为 SQL Analytics),用于在数据湖之上运行商业智能和分析报告。分析师可以使用标准 SQL 直接查询数据集,或使用产品连接器直接与Tableau 、 Qlik 、 Looker和ThoughtSpot等商业智能工具集成。[27]
Databricks 还为其他工作负载提供了一个平台,包括机器学习、数据存储和处理、流分析和商业智能。[28]
该公司还创建了跨数据工程、数据科学和机器学习的开源项目 Delta Lake、MLflow 和 Koalas。[29]除了构建 Databricks 平台外,该公司还联合组织了有关 Spark [30]的大规模在线公开课程,并为 Spark 社区举办了名为 Data + AI Summit[31]的会议,前身为 Spark 峰会。
运营
Databricks 总部位于旧金山。[32]它还在加拿大、英国、荷兰、新加坡、澳大利亚、德国、法国、日本、中国、印度和巴西开展业务。
参考來源
- ↑ Databricks reaches $813M ARR. [2022-03-24]. (原始内容存档于2022-03-12).
- ↑ Dwoskin, Elizabeth. This is where the real action in artificial intelligence takes place. Washington Post. 2016-06-09 [2016-08-16]. (原始内容存档于2018-12-17).
- ↑ Zaharia, Matei. Matei Zaharia. [2016-08-16]. (原始内容存档于2021-08-31).
- ↑ Microsoft makes Databricks a first-party service on Azure. TechCrunch. [2021-04-06] (美国英语).
- ↑ Databricks launches Delta Lake, an open source data lake reliability project. VentureBeat. 2019-04-24 [2021-04-06]. (原始内容存档于2022-03-24) (美国英语).
- ↑ Databricks acquires Redash, a visualizations service for data scientists. TechCrunch. [2021-04-06] (美国英语).
- ↑ Databricks brings its lakehouse to Google Cloud. TechCrunch. [2021-02-18] (美国英语).
- ↑ 100 Best Large Workplaces for Millennials. Fortune. 2021-06-16 [2021-07-16]. (原始内容存档于2022-03-24).
- ↑ 9.0 9.1 Konrad, Alex. Databricks Raises $1 Billion At $28 Billion Valuation, With The Cloud's Elite All Buying In. Forbes. 2021-02-02 [2021-07-29]. (原始内容存档于2022-03-24) (英语).
- ↑ Mellor, Chris. Databricks raises data lake of cash at monstrous $38bn valuation. Blocks & Files. 2021-09-01 [2021-09-04]. (原始内容存档于2022-03-24).
- ↑ Eric Rosenbaum. $38 billion software start-up Databricks makes acquisition to leave code behind. CNBC. 2021-10-06 [2022-02-20]. (原始内容存档于2022-03-02).
- ↑ 12.0 12.1 Harris, Derrick. Databricks raises $14M from Andreessen Horowitz, wants to take on MapReduce with Spark. 2013-09-25 [2014-09-28]. (原始内容存档于2022-01-15).
- ↑ Miller, Ron. Databricks Snags $33M In Series B And Debuts Cloud Platform For Processing Big Data. TechCrunch. 2014-06-30 [2014-09-28]. (原始内容存档于2022-01-13).
- ↑ Shieber, Jonathan. Databricks raises $60 million to be big data's next great leap forward. TechCrunch. [2016-12-16]. (原始内容存档于2022-01-13).
- ↑ Databricks Secures $140 Million to Accelerate Analytics and Artificial Intelligence in the Enterprise. Databricks. [2019-05-16]. (原始内容存档于2022-01-13) (美国英语).
- ↑ Databricks' $250 Million Funding Supports Explosive Growth and Global Demand for Unified Analytics; Brings Valuation to $2.75 Billion. Databricks. [2019-02-05]. (原始内容存档于2022-01-15) (美国英语).
- ↑ Databricks announces $400M round on $6.2B valuation as analytics platform continues to grow. TechCrunch. [2019-10-24] (美国英语).
- ↑ Databricks raises $1B at $28B valuation as it reaches $425M ARR. Tech Crunch. [2021-02-14]. (原始内容存档于2022-04-25) (美国英语).
- ↑ Databricks raises $1.6B at $38B valuation as it blasts past $600M ARR. Tech Crunch. [2021-07-01]. (原始内容存档于2022-04-23) (美国英语).
- ↑ Lorica, Ben. Databricks aims to build next-generation analytic tools for Big Data. O'Reilly Media. 2013-09-25 [2014-09-28]. (原始内容存档于2014-07-04).
- ↑ Databricks raises $250M at a $2.75B valuation for its analytics platform. TechCrunch. [2021-04-08] (美国英语).
- ↑ Novet, Jordan. Microsoft used to scare start-ups but is now an 'outstandingly good partner,' says Silicon Valley investor Ben Horowitz. CNBC. 2019-02-05 [2021-04-06]. (原始内容存档于2022-03-24) (英语).
- ↑ Michael, Armbrust; Ghodsi, Ali; Xin, Reynold; Zaharia, Matei. Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics (PDF). Conference on Innovative Data Systems Research. January 2021 [2021-07-29]. (原始内容 (PDF)存档于2022-04-22).
- ↑ With massive $1B infusion, Databricks takes aim at IPO and rival Snowflake. SiliconANGLE. 2021-02-01 [2021-04-08]. (原始内容存档于2022-03-24) (美国英语).
- ↑ Databricks Cranks Delta Lake Performance, Nabs Redash for SQL Viz. Datanami. 2020-06-24 [2021-04-08]. (原始内容存档于2022-03-24).
- ↑ Databricks launches Delta Lake, an open source data lake reliability project. VentureBeat. 2019-04-24 [2021-04-08]. (原始内容存档于2022-03-24) (美国英语).
- ↑ Databricks launches SQL Analytics. TechCrunch. [2021-04-08] (美国英语).
- ↑ Brust, Andrew. Databricks, champion of data "lakehouse" model, closes $1B series G funding round. ZDNet. [2021-04-08]. (原始内容存档于2022-04-08) (英语).
- ↑ The Two Sigma Ventures Open Source Index. Two Sigma Ventures. [2021-04-08]. (原始内容存档于2022-02-14) (英语).
- ↑ Databricks to run two massive online courses on Apache Spark. Databricks. 2014-12-02 [2016-12-16]. (原始内容存档于2022-01-13) (美国英语).
- ↑ Data + AI Summit. Databricks. [2021-04-08]. (原始内容存档于2022-04-23) (美国英语).
- ↑ staff, CNBC com. 36. Databricks. CNBC. 2020-06-16 [2021-04-08]. (原始内容存档于2022-01-13) (英语).