This is an automated email from the ASF dual-hosted git repository. morningman pushed a commit to branch master in repository https://gitbox.apache.org/repos/asf/doris-website.git
The following commit(s) were added to refs/heads/master by this push: new 53b92c92a7 Update term “湖仓一体” / “Data Lakehouse” in docs (#804) 53b92c92a7 is described below commit 53b92c92a71bfcac14297e327c244d529a31c980 Author: lishiqi_amy <amylee9...@163.com> AuthorDate: Sat Jun 29 18:20:42 2024 +0800 Update term “湖仓一体” / “Data Lakehouse” in docs (#804) Co-authored-by: Luzhijing <82810928+luzhij...@users.noreply.github.com> --- docs/faq/lakehouse-faq.md | 2 +- docs/get-starting/what-is-apache-doris.md | 2 +- docs/lakehouse/lakehouse-overview.md | 4 ++-- docs/releasenotes/release-2.1.4.md | 4 ++-- .../current/get-starting/what-is-apache-doris.md | 4 ++-- .../current/releasenotes/release-2.0.0.md | 4 ++-- .../version-1.2/summary/basic-summary.md | 20 ++++++++++---------- .../version-2.0/get-starting/what-is-apache-doris.md | 2 +- .../version-2.0/releasenotes/release-2.0.0.md | 14 +++++++------- .../version-2.1/get-starting/what-is-apache-doris.md | 2 +- 10 files changed, 29 insertions(+), 29 deletions(-) diff --git a/docs/faq/lakehouse-faq.md b/docs/faq/lakehouse-faq.md index a0fbdbd0cd..951c1b9daf 100644 --- a/docs/faq/lakehouse-faq.md +++ b/docs/faq/lakehouse-faq.md @@ -1,6 +1,6 @@ --- { - "title": "Lakehouse FAQ", + "title": "Data Lakehouse FAQ", "language": "en" } --- diff --git a/docs/get-starting/what-is-apache-doris.md b/docs/get-starting/what-is-apache-doris.md index 006f6becbd..43550398a5 100644 --- a/docs/get-starting/what-is-apache-doris.md +++ b/docs/get-starting/what-is-apache-doris.md @@ -40,7 +40,7 @@ The figure below shows what Apache Doris can do in a data pipeline. Data sources - Reports for internal analysts and managers - Customer-facing reports: such as site analysis for website owners and advertising reports for advertisers. Such cases typically require high concurrency (thousands of QPS) and low query latency (measured in milliseconds). For example, the e-commerce giant JD.com uses Apache Doris for ad reporting. It ingests 10 billion rows of data per day and achieves over 10,000 QPS and P99 latency of 150ms. - **Ad-hoc query**: analyst-facing self-service analytics with irregular query patterns and high throughput requirements. For example, Xiaomi builds a Growth Analytics platform based on Apache Doris. Handling 10,000s of SQL queries every day, it delivers an average query latency of 10 seconds and a P95 latency of 30 seconds. -- **Lakehouse**: Apache Doris allows federated queries on external tables in offline data lakehouses such as Hive, Hudi, and Iceberg and achieves outstanding query performance by avoiding data copying. +- **Data Lakehouse**: Apache Doris allows federated queries on external tables in offline data lakehouses such as Hive, Hudi, and Iceberg and achieves outstanding query performance by avoiding data copying. - **Log analysis**: Apache Doris supports inverted index and full-text search since version 2.0. Relying on its highly efficient query and storage engines, Apache Doris enables 10 times higher cost-effectiveness than common log analytic solutions. - **Unified data warehouse**: Apache Doris can work as a unified data processing platform for various analytic workloads, saving users from handling complicated data components and tech stacks. For example, Haidilao, a world-renowned chain restaurant, replaces its old architecture consisting of Spark, Hive, Kudu, HBase, and Phoenix with Apache Doris. diff --git a/docs/lakehouse/lakehouse-overview.md b/docs/lakehouse/lakehouse-overview.md index 96fdcc3d9b..f4c2bea70e 100644 --- a/docs/lakehouse/lakehouse-overview.md +++ b/docs/lakehouse/lakehouse-overview.md @@ -1,6 +1,6 @@ --- { - "title": "Lakehouse Overview", + "title": "Data Lakehouse Overview", "language": "en" } --- @@ -36,7 +36,7 @@ Data warehouses addresses the need for fast data analysis, while data lakes are ## Applicable scenarios -We design the Doris lakehouse solution for the following four applicable scenarios: +We design the Doris Data Lakehouse solution for the following four applicable scenarios: - Lakehouse query acceleration: As a highly efficient OLAP query engine, Doris has excellent MPP-based vectorized distributed query capabilities. Data lake analysis with Doris will benefit from the efficient query engine. diff --git a/docs/releasenotes/release-2.1.4.md b/docs/releasenotes/release-2.1.4.md index d04a8be0cf..3534e2008f 100644 --- a/docs/releasenotes/release-2.1.4.md +++ b/docs/releasenotes/release-2.1.4.md @@ -70,7 +70,7 @@ under the License. - The new optimizer fully supports point query functionality [#36205](https://github.com/apache/doris/pull/36205). -### Lakehouse +### Data Lakehouse - Support native reader of Apache Paimon deletion vector [#35241](https://github.com/apache/doris/pull/35241) @@ -193,7 +193,7 @@ under the License. - Fixed the issue where BE might core dump during clone operations when memory is tight. [#34702](https://github.com/apache/doris/pull/34702) -### Lakehouse +### Data Lakehouse - Fixed the issue where a Hive table could not be created with a fully qualified name such as `ctl.db.tbl` [#34984](https://github.com/apache/doris/pull/34984) diff --git a/i18n/zh-CN/docusaurus-plugin-content-docs/current/get-starting/what-is-apache-doris.md b/i18n/zh-CN/docusaurus-plugin-content-docs/current/get-starting/what-is-apache-doris.md index e45f943a10..ebaf0c91e4 100644 --- a/i18n/zh-CN/docusaurus-plugin-content-docs/current/get-starting/what-is-apache-doris.md +++ b/i18n/zh-CN/docusaurus-plugin-content-docs/current/get-starting/what-is-apache-doris.md @@ -26,7 +26,7 @@ under the License. ## Apache Doris 的发展 -Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型数据库,以高效、简单、统一的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。 +Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型数据库,以高效、简单、统一的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、湖仓一体等使用场景,用户可以在此之上构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。 Apache Doris 最早是诞生于百度广告报表业务的 Palo 项目,2017 年正式对外开源,2018 年 7 月由百度捐赠给 Apache 基金会进行孵化,之后在 Apache 导师的指导下由孵化器项目管理委员会成员进行孵化和运营。2022 年 6 月,Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目(Top-Level Project,TLP)。目前 Apache Doris 社区已经聚集了来自不同行业数百家企业的 600 余位贡献者,并且每月活跃贡献者人数也超过 120 位。 @@ -48,7 +48,7 @@ Apache Doris 如今在中国乃至全球范围内都拥有着广泛的用户群 - 即席查询(Ad-hoc Query):面向分析师的自助分析,查询模式不固定,要求较高的吞吐。小米公司基于 Apache Doris 构建了增长分析平台(Growing Analytics,GA),利用用户行为数据对业务进行增长分析,平均查询延时 10s,95 分位的查询延时 30s 以内,每天的 SQL 查询量为数万条。 -- 湖仓一体(Lakehouse):通过外表的方式联邦分析位于 Hive、Iceberg、Hudi 等离线湖仓中的数据,在避免数据拷贝的前提下,查询性能大幅提升。 +- 湖仓一体(Data Lakehouse):通过外表的方式联邦分析位于 Hive、Iceberg、Hudi 等离线湖仓中的数据,在避免数据拷贝的前提下,查询性能大幅提升。 - 日志检索分析:在 Apache Doris 2.0 版本中,支持了倒排索引和全文检索,能够很好的满足日志检索分析的场景,并且依赖其高效的查询引擎和存储引擎,相比传统的日志检索分析的方案可以有 10 倍性价比的优势。 diff --git a/i18n/zh-CN/docusaurus-plugin-content-docs/current/releasenotes/release-2.0.0.md b/i18n/zh-CN/docusaurus-plugin-content-docs/current/releasenotes/release-2.0.0.md index 0e982adcaa..cedf264806 100644 --- a/i18n/zh-CN/docusaurus-plugin-content-docs/current/releasenotes/release-2.0.0.md +++ b/i18n/zh-CN/docusaurus-plugin-content-docs/current/releasenotes/release-2.0.0.md @@ -26,7 +26,7 @@ under the License. 亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 Release 版本已于 2023 年 8 月 11 日正式发布,有超过 275 位贡献者为 Apache Doris 提交了超过 4100 个优化与修复。 -在 2.0.0 版本中,Apache Doris 在标准 Benchmark 数据集上盲测查询性能得到超过 10 倍的提升、在日志分析和数据湖联邦分析场景能力得到全面加强、数据更新效率和写入效率都更加高效稳定、支持了更加完善的多租户和资源隔离机制、在资源弹性与存算分离方向踏上了新的台阶、增加了一系列面向企业用户的易用性特性。在经过近半年的开发、测试与稳定性调优后,这一版本已经正式稳定可用,欢迎大家下载使用! +在 2.0.0 版本中,Apache Doris 在标准 Benchmark 数据集上盲测查询性能得到超过 10 倍的提升、在日志分析和湖仓一体场景能力得到全面加强、数据更新效率和写入效率都更加高效稳定、支持了更加完善的多租户和资源隔离机制、在资源弹性与存算分离方向踏上了新的台阶、增加了一系列面向企业用户的易用性特性。在经过近半年的开发、测试与稳定性调优后,这一版本已经正式稳定可用,欢迎大家下载使用! > 下载链接:[https://doris.apache.org/download](https://doris.apache.org/download) > @@ -88,7 +88,7 @@ under the License. ### 湖仓一体 -在 Apache Doris 1.2 版本中,我们引入了 Multi-Catalog 功能,支持了多种异构数据源的元数据自动映射与同步,实现了便捷的元数据和数据打通。在 2.0.0 版本中,我们进一步对数据联邦分析能力进行了加强,引入了更多数据源,并针对用户的实际生产环境做了诸多性能优化,在真实工作负载情况下查询性能得到大幅提升。 +在 Apache Doris 1.2 版本中,我们引入了 Multi-Catalog 功能,支持了多种异构数据源的元数据自动映射与同步,实现了便捷的元数据和数据打通。在 2.0.0 版本中,我们进一步对湖仓一体进行了加强,引入了更多数据源,并针对用户的实际生产环境做了诸多性能优化,在真实工作负载情况下查询性能得到大幅提升。 在数据源方面,Apache Doris 2.0.0 版本支持了 Hudi Copy-on-Write 表的 Snapshot Query 以及 Merge-on-Read 表的 Read Optimized Query,截止目前已经支持了 Hive、Hudi、Iceberg、Paimon、MaxCompute、Elasticsearch、Trino、ClickHouse 等数十种数据源,几乎支持了所有开放湖仓格式和 Metastore。同时还支持通过 Apache Range 对 Hive Catalog 进行鉴权,可以无缝对接用户现有的权限系统。同时还支持可扩展的鉴权插件,为任意 Catalog 实现自定义的鉴权方式。 diff --git a/i18n/zh-CN/docusaurus-plugin-content-docs/version-1.2/summary/basic-summary.md b/i18n/zh-CN/docusaurus-plugin-content-docs/version-1.2/summary/basic-summary.md index da04a7d7ff..0cc35d2885 100644 --- a/i18n/zh-CN/docusaurus-plugin-content-docs/version-1.2/summary/basic-summary.md +++ b/i18n/zh-CN/docusaurus-plugin-content-docs/version-1.2/summary/basic-summary.md @@ -26,11 +26,11 @@ under the License. # Doris 介绍 -Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。 +Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、湖仓一体等使用场景,用户可以在此之上构建用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。 -Apache Doris 最早是诞生于百度广告报表业务的 Palo 项目,2017 年正式对外开源,2018 年 7 月由百度捐赠给 Apache 基金会进行孵化,之后在 Apache 导师的指导下由孵化器项目管理委员会成员进行孵化和运营。目前 Apache Doris 社区已经聚集了来自不同行业数百家企业的 400 余位贡献者,并且每月活跃贡献者人数也超过 100 位。 2022 年 6 月,Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目(Top-Level Project,TLP) +Apache Doris 最早是诞生于百度广告报表业务的 Palo 项目,2017 年正式对外开源,2018 年 7 月由百度捐赠给 Apache 基金会进行孵化,之后在 Apache 导师的指导下由孵化器项目管理委员会成员进行孵化和运营。目前 Apache Doris 社区已经聚集了来自不同行业数百家企业的 400 余位贡献者,并且每月活跃贡献者人数也超过 100 位。2022 年 6 月,Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目(Top-Level Project,TLP) -Apache Doris 如今在中国乃至全球范围内都拥有着广泛的用户群体,截止目前, Apache Doris 已经在全球超过 2000 家企业的生产环境中得到应用,在中国市值或估值排行前 50 的互联网公司中,有超过 80% 长期使用 Apache Doris,包括百度、美团、小米、京东、字节跳动、腾讯、网易、快手、微博、贝壳等。同时在一些传统行业如金融、能源、制造、电信等领域也有着丰富的应用。 +Apache Doris 如今在中国乃至全球范围内都拥有着广泛的用户群体,截止目前,Apache Doris 已经在全球超过 2000 家企业的生产环境中得到应用,在中国市值或估值排行前 50 的互联网公司中,有超过 80% 长期使用 Apache Doris,包括百度、美团、小米、京东、字节跳动、腾讯、网易、快手、微博、贝壳等。同时在一些传统行业如金融、能源、制造、电信等领域也有着丰富的应用。 # 使用场景 @@ -39,13 +39,13 @@ Apache Doris 如今在中国乃至全球范围内都拥有着广泛的用户群 - 报表分析 - - 实时看板 (Dashboards) + - 实时看板(Dashboards) - 面向企业内部分析师和管理者的报表 - - 面向用户或者客户的高并发报表分析(Customer Facing Analytics)。比如面向网站主的站点分析、面向广告主的广告报表,并发通常要求成千上万的 QPS ,查询延时要求毫秒级响应。著名的电商公司京东在广告报表中使用 Apache Doris ,每天写入 100 亿行数据,查询并发 QPS 上万,99 分位的查询延时 150ms。 + - 面向用户或者客户的高并发报表分析(Customer Facing Analytics)。比如面向网站主的站点分析、面向广告主的广告报表,并发通常要求成千上万的 QPS,查询延时要求毫秒级响应。著名的电商公司京东在广告报表中使用 Apache Doris,每天写入 100 亿行数据,查询并发 QPS 上万,99 分位的查询延时 150ms。 - 即席查询(Ad-hoc Query):面向分析师的自助分析,查询模式不固定,要求较高的吞吐。小米公司基于 Doris 构建了增长分析平台(Growing Analytics,GA),利用用户行为数据对业务进行增长分析,平均查询延时 10s,95 分位的查询延时 30s 以内,每天的 SQL 查询量为数万条。 -- 统一数仓构建 :一个平台满足统一的数据仓库建设需求,简化繁琐的大数据软件栈。海底捞基于 Doris 构建的统一数仓,替换了原来由 Spark、Hive、Kudu、Hbase、Phoenix 组成的旧架构,架构大大简化。 +- 统一数仓构建:一个平台满足统一的数据仓库建设需求,简化繁琐的大数据软件栈。海底捞基于 Doris 构建的统一数仓,替换了原来由 Spark、Hive、Kudu、Hbase、Phoenix 组成的旧架构,架构大大简化。 - 数据湖联邦查询:通过外表的方式联邦分析位于 Hive、Iceberg、Hudi 中的数据,在避免数据拷贝的前提下,查询性能大幅提升。 @@ -69,13 +69,13 @@ Doris 也支持比较丰富的索引结构,来减少数据的扫描: - Sorted Compound Key Index,可以最多指定三个列组成复合排序键,通过该索引,能够有效进行数据裁剪,从而能够更好支持高并发的报表场景 -- Z-order Index :使用 Z-order 索引,可以高效对数据模型中的任意字段组合进行范围查询 +- Z-order Index:使用 Z-order 索引,可以高效对数据模型中的任意字段组合进行范围查询 -- Min/Max :有效过滤数值类型的等值和范围查询 +- Min/Max:有效过滤数值类型的等值和范围查询 -- Bloom Filter :对高基数列的等值过滤裁剪非常有效 +- Bloom Filter:对高基数列的等值过滤裁剪非常有效 -- Invert Index :能够对任意字段实现快速检索 +- Invert Index:能够对任意字段实现快速检索 在存储模型方面,Doris 支持多种存储模型,针对不同的场景做了针对性的优化: diff --git a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.0/get-starting/what-is-apache-doris.md b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.0/get-starting/what-is-apache-doris.md index c61667c291..dc18face70 100644 --- a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.0/get-starting/what-is-apache-doris.md +++ b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.0/get-starting/what-is-apache-doris.md @@ -48,7 +48,7 @@ Apache Doris 如今在中国乃至全球范围内都拥有着广泛的用户群 - 即席查询(Ad-hoc Query):面向分析师的自助分析,查询模式不固定,要求较高的吞吐。小米公司基于 Doris 构建了增长分析平台(Growing Analytics,GA),利用用户行为数据对业务进行增长分析,平均查询延时 10s,95 分位的查询延时 30s 以内,每天的 SQL 查询量为数万条。 -- 数据湖联邦分析(LakeHouse):通过外表的方式联邦分析位于 Hive、Iceberg、Hudi 等离线湖仓中的数据,在避免数据拷贝的前提下,查询性能大幅提升。 +- 湖仓一体(Data LakeHouse):通过外表的方式联邦分析位于 Hive、Iceberg、Hudi 等离线湖仓中的数据,在避免数据拷贝的前提下,查询性能大幅提升。 - 日志检索分析:在 Apache Doris 2.0 版本中,支持了倒排索引和全文检索,能够很好的满足日志检索分析的场景,并且依赖其高效的查询引擎和存储引擎,相比传统的日志检索分析的方案可以有 10 倍性价比的优势。 diff --git a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.0/releasenotes/release-2.0.0.md b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.0/releasenotes/release-2.0.0.md index 1a40bf998c..99a1ef0828 100644 --- a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.0/releasenotes/release-2.0.0.md +++ b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.0/releasenotes/release-2.0.0.md @@ -26,7 +26,7 @@ under the License. 亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 Release 版本已于 2023 年 8 月 11 日正式发布,有超过 275 位贡献者为 Apache Doris 提交了超过 4100 个优化与修复。 -在 2.0.0 版本中,Apache Doris 在标准 Benchmark 数据集上盲测查询性能得到超过 10 倍的提升、在日志分析和数据湖联邦分析场景能力得到全面加强、数据更新效率和写入效率都更加高效稳定、支持了更加完善的多租户和资源隔离机制、在资源弹性与存算分离方向踏上了新的台阶、增加了一系列面向企业用户的易用性特性。在经过近半年的开发、测试与稳定性调优后,这一版本已经正式稳定可用,欢迎大家下载使用! +在 2.0.0 版本中,Apache Doris 在标准 Benchmark 数据集上盲测查询性能得到超过 10 倍的提升、在日志分析和湖仓一体场景能力得到全面加强、数据更新效率和写入效率都更加高效稳定、支持了更加完善的多租户和资源隔离机制、在资源弹性与存算分离方向踏上了新的台阶、增加了一系列面向企业用户的易用性特性。在经过近半年的开发、测试与稳定性调优后,这一版本已经正式稳定可用,欢迎大家下载使用! > 下载链接:[https://doris.apache.org/download](https://doris.apache.org/download) > @@ -82,13 +82,13 @@ under the License. 而随着用户规模的极速扩张,越来越多用户开始希望通过 Apache Doris 来简化现有的繁重大数据技术栈,减少多套系统带来的使用及运维成本。因此 Apache Doris 也在不断拓展应用场景的边界,从过去的实时报表和 Ad-hoc 等典型 OLAP 场景到湖仓一体、ELT/ETL、日志检索与分析、高并发 Data Serving 等更多业务场景,而日志检索分析、湖仓一体也是我们在 Apache Doris 最新版本中的重要突破。 -### 10倍以上性价比的日志检索分析平台 +### 10 倍以上性价比的日志检索分析平台 在 Apache Doris 2.0.0 版本中,我们提供了原生的半结构化数据支持,在已有的 JSON、Array 基础之上增加了复杂类型 Map,并基于 Light Schema Change 功能实现了 Schema Evolution。与此同时,2.0.0 版本新引入的倒排索引和高性能文本分析算法全面加强了 Apache Doris 在日志检索分析场景的能力,可以支持更高效的任意维度分析和全文检索。结合过去在大规模数据写入和低成本存储等方面的优势,相对于业内常见的日志分析解决方案,基于 Apache Doris 构建的新一代日志检索分析平台实现了 10 倍以上的性价比提升。 ### 湖仓一体 -在 Apache Doris 1.2 版本中,我们引入了 Multi-Catalog 功能,支持了多种异构数据源的元数据自动映射与同步,实现了便捷的元数据和数据打通。在 2.0.0 版本中,我们进一步对数据联邦分析能力进行了加强,引入了更多数据源,并针对用户的实际生产环境做了诸多性能优化,在真实工作负载情况下查询性能得到大幅提升。 +在 Apache Doris 1.2 版本中,我们引入了 Multi-Catalog 功能,支持了多种异构数据源的元数据自动映射与同步,实现了便捷的元数据和数据打通。在 2.0.0 版本中,我们进一步对湖仓一体能力进行了加强,引入了更多数据源,并针对用户的实际生产环境做了诸多性能优化,在真实工作负载情况下查询性能得到大幅提升。 在数据源方面,Apache Doris 2.0.0 版本支持了 Hudi Copy-on-Write 表的 Snapshot Query 以及 Merge-on-Read 表的 Read Optimized Query,截止目前已经支持了 Hive、Hudi、Iceberg、Paimon、MaxCompute、Elasticsearch、Trino、ClickHouse 等数十种数据源,几乎支持了所有开放湖仓格式和 Metastore。同时还支持通过 Apache Range 对 Hive Catalog 进行鉴权,可以无缝对接用户现有的权限系统。同时还支持可扩展的鉴权插件,为任意 Catalog 实现自定义的鉴权方式。 @@ -130,7 +130,7 @@ under the License. ### 数据高频写入更稳定 -在高频数据写入过程中,小文件合并和写放大问题以及随之而来的磁盘 I/O和 CPU 资源开销是制约系统稳定性的关键,因此在 2.0 版本中我们引入了 Vertical Compaction 以及 Segment Compaction,用以彻底解决 Compaction 内存问题以及写入过程中的 Segment 文件过多问题,资源消耗降低 90%,速度提升 50%,内存占用仅为原先的 10%。 +在高频数据写入过程中,小文件合并和写放大问题以及随之而来的磁盘 I/O 和 CPU 资源开销是制约系统稳定性的关键,因此在 2.0 版本中我们引入了 Vertical Compaction 以及 Segment Compaction,用以彻底解决 Compaction 内存问题以及写入过程中的 Segment 文件过多问题,资源消耗降低 90%,速度提升 50%,内存占用仅为原先的 10%。 ### 数据表结构自动同步 @@ -196,8 +196,8 @@ under the License. - 查询优化器开关默认开启 `enable_nereids_planner=true`; - 系统中移除了非向量化代码,所以 `enable_vectorized_engine` 参数将不再生效; - 新增参数 `enable_single_replica_compaction`; -- 默认使用 datev2, datetimev2, decimalv3 来创建表,不支持 datev1,datetimev1, decimalv2 创建表; -- 在 JDBC 和 Iceberg Catalog 中默认使用decimalv3; +- 默认使用 datev2, datetimev2, decimalv3 来创建表,不支持 datev1,datetimev1,decimalv2 创建表; +- 在 JDBC 和 Iceberg Catalog 中默认使用 decimalv3; - date type 新增 AGG_STATE; - backend 表去掉 cluster 列; - 为了与 BI 工具更好兼容,在 show create table 时,将 datev2 和 datetimev2 显示为 date 和 datetime。 @@ -206,7 +206,7 @@ under the License. - 当系统中存在 Multi-Catalog 时,查询 information schema 的数据默认只显示 internal catalog 的数据; - 限制了表达式树的深度,默认为 200; - array string 返回值 单引号变双引号; -- 对 Doris的进程名重命名为 DorisFE 和 DorisBE; +- 对 Doris 的进程名重命名为 DorisFE 和 DorisBE; # 正式踏上 2.0 之旅 diff --git a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/get-starting/what-is-apache-doris.md b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/get-starting/what-is-apache-doris.md index f4f48f3f1a..5b2b709190 100644 --- a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/get-starting/what-is-apache-doris.md +++ b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/get-starting/what-is-apache-doris.md @@ -44,7 +44,7 @@ Apache Doris 如今在中国乃至全球范围内都拥有着广泛的用户群 - 面向用户或者客户的高并发报表分析(Customer Facing Analytics)。比如面向网站主的站点分析、面向广告主的广告报表,并发通常要求成千上万的 QPS,查询延时要求毫秒级响应。著名的电商公司京东在广告报表中使用 Apache Doris,每天写入 100 亿行数据,查询并发 QPS 上万,99 分位的查询延时 150ms。 - 即席查询(Ad-hoc Query):面向分析师的自助分析,查询模式不固定,要求较高的吞吐。小米公司基于 Doris 构建了增长分析平台(Growing Analytics,GA),利用用户行为数据对业务进行增长分析,平均查询延时 10s,95 分位的查询延时 30s 以内,每天的 SQL 查询量为数万条。 -- 湖仓一体(Lakehouse):通过外表的方式联邦分析位于 Hive、Iceberg、Hudi 等离线湖仓中的数据,在避免数据拷贝的前提下,查询性能大幅提升。 +- 湖仓一体(Data Lakehouse):通过外表的方式联邦分析位于 Hive、Iceberg、Hudi 等离线湖仓中的数据,在避免数据拷贝的前提下,查询性能大幅提升。 - 日志检索分析:在 Apache Doris 2.0 版本中,支持了倒排索引和全文检索,能够很好的满足日志检索分析的场景,并且依赖其高效的查询引擎和存储引擎,相比传统的日志检索分析的方案可以有 10 倍性价比的优势。 --------------------------------------------------------------------- To unsubscribe, e-mail: commits-unsubscr...@doris.apache.org For additional commands, e-mail: commits-h...@doris.apache.org