This is an automated email from the ASF dual-hosted git repository. jiafengzheng pushed a commit to branch master in repository https://gitbox.apache.org/repos/asf/doris-website.git
The following commit(s) were added to refs/heads/master by this push: new 044672300ec fix benchmark doc 044672300ec is described below commit 044672300ec64fd262fb54b50ff2703aca77a489 Author: jiafeng.zhang <zhang...@gmail.com> AuthorDate: Sat Nov 19 20:50:09 2022 +0800 fix benchmark doc --- .../current/benchmark/ssb.md | 19 +++++++++++-------- .../current/benchmark/tpch.md | 4 ++-- static/images/image-20220614114351241.png | Bin 81771 -> 81771 bytes static/images/ssb_12_11_015.png | Bin 75967 -> 84078 bytes static/images/ssb_v11_v015_compare.png | Bin 81539 -> 83556 bytes 5 files changed, 13 insertions(+), 10 deletions(-) diff --git a/i18n/zh-CN/docusaurus-plugin-content-docs/current/benchmark/ssb.md b/i18n/zh-CN/docusaurus-plugin-content-docs/current/benchmark/ssb.md index 403feb6c35e..a9c328ab53e 100644 --- a/i18n/zh-CN/docusaurus-plugin-content-docs/current/benchmark/ssb.md +++ b/i18n/zh-CN/docusaurus-plugin-content-docs/current/benchmark/ssb.md @@ -26,13 +26,13 @@ under the License. # Star Schema Benchmark -[Star Schema Benchmark(SSB)](https://www.cs.umb.edu/~poneil/StarSchemaB.PDF) 是一个轻量级的数仓场景下的性能测试集。SSB基于 [TPC-H](http://www.tpc.org/tpch/) 提供了一个简化版的星型模型数据集,主要用于测试在星型模型下,多表关联查询的性能表现。另外,业界内通常也会将SSB打平为宽表模型(以下简称:SSB flat),来测试查询引擎的性能,参考[Clickhouse](https://clickhouse.com/docs/zh/getting-started/example-datasets/star-schema)。 +[Star Schema Benchmark(SSB)](https://www.cs.umb.edu/~poneil/StarSchemaB.PDF) 是一个轻量级的数仓场景下的性能测试集。SSB 基于 [TPC-H](http://www.tpc.org/tpch/) 提供了一个简化版的星型模型数据集,主要用于测试在星型模型下,多表关联查询的性能表现。另外,业界内通常也会将 SSB 打平为宽表模型(以下简称:SSB flat),来测试查询引擎的性能,参考[Clickhouse](https://clickhouse.com/docs/zh/getting-started/example-datasets/star-schema)。 本文档主要介绍Apache Doris 在 SSB 100G 测试集上的性能表现。 -> 注1:包括 SSB 在内的标准测试集通常和实际业务场景差距较大,并且部分测试会针对测试集进行参数调优。所以标准测试集的测试结果仅能反映数据库在特定场景下的性能表现。建议用户使用实际业务数据进行进一步的测试。 +> 注 1:包括 SSB 在内的标准测试集通常和实际业务场景差距较大,并且部分测试会针对测试集进行参数调优。所以标准测试集的测试结果仅能反映数据库在特定场景下的性能表现。建议用户使用实际业务数据进行进一步的测试。 > -> 注2:本文档涉及的操作都在 Ubuntu Server 20.04 环境进行,CentOS 7 也可测试。 +> 注 2:本文档涉及的操作都在 Ubuntu Server 20.04 环境进行,CentOS 7 也可测试。 在 SSB 标准测试数据集上的 13 个查询上,我们基于 Apache Doris 1.2.0-rc01, Apache Doris 1.1.3 及 Apache Doris 0.15.0 RC04 版本进行了对别测试。 @@ -55,7 +55,7 @@ under the License. ## 2. 软件环境 -- Doris部署 3BE 1FE; +- Doris 部署 3BE 1FE; - 内核版本:Linux version 5.4.0-96-generic (buildd@lgw01-amd64-051) - 操作系统版本:Ubuntu Server 20.04 LTS 64位 - Doris 软件版本: Apache Doris 1.2.0-rc01、Apache Doris 1.1.3 及 Apache Doris 0.15.0 RC04 @@ -96,8 +96,8 @@ under the License. **结果说明** -- 测试结果对应的数据集为scale 100, 约6亿条。 -- 测试环境配置为用户常用配置,云服务器4台,16核 64G SSD,1 FE 3 BE 部署。 +- 测试结果对应的数据集为 scale 100, 约 6 亿条。 +- 测试环境配置为用户常用配置,云服务器 4 台,16 核 64G SSD,1 FE 3 BE 部署。 - 选用用户常见配置测试以降低用户选型评估成本,但整个测试过程中不会消耗如此多的硬件资源。 ## 5. 标准 SSB 测试结果 @@ -127,6 +127,7 @@ under the License. - 测试环境配置为用户常用配置,云服务器4台,16核 64G SSD,1 FE 3 BE 部署。 - 选用用户常见配置测试以降低用户选型评估成本,但整个测试过程中不会消耗如此多的硬件资源。 + ## 6. 环境准备 请先参照 [官方文档](../install/install-deploy.md) 进行 Apache Doris 的安装部署,以获得一个正常运行中的 Doris 集群(至少包含 1 FE 1 BE,推荐 1 FE 3 BE)。 @@ -257,11 +258,11 @@ PROPERTIES ( ); ``` - ### 7.4 导入数据 我们使用以下命令完成 SSB 测试集所有数据导入及 SSB FLAT 宽表数据合成并导入到表里。 + ```shell sh bin/load-ssb-data.sh -c 10 ``` @@ -274,6 +275,7 @@ sh bin/load-ssb-data.sh -c 10 > > 2. flat 表数据采用 'INSERT INTO ... SELECT ... ' 的方式导入。 + ### 7.5 检查导入数据 ```sql @@ -300,10 +302,12 @@ select count(*) from lineorder_flat; SSB-FlAT 查询语句 :[ssb-flat-queries](https://github.com/apache/doris/tree/master/tools/ssb-tools/ssb-flat-queries) + 标准 SSB 查询语句 :[ssb-queries](https://github.com/apache/doris/tree/master/tools/ssb-tools/ssb-queries) #### 7.6.1 SSB FLAT 测试 SQL + ```sql --Q1.1 SELECT SUM(LO_EXTENDEDPRICE * LO_DISCOUNT) AS revenue @@ -607,4 +611,3 @@ WHERE GROUP BY d_year, s_city, p_brand ORDER BY d_year, s_city, p_brand; ``` - diff --git a/i18n/zh-CN/docusaurus-plugin-content-docs/current/benchmark/tpch.md b/i18n/zh-CN/docusaurus-plugin-content-docs/current/benchmark/tpch.md index 2ece066ab60..33d4ca138b5 100644 --- a/i18n/zh-CN/docusaurus-plugin-content-docs/current/benchmark/tpch.md +++ b/i18n/zh-CN/docusaurus-plugin-content-docs/current/benchmark/tpch.md @@ -1,6 +1,6 @@ --- { - "title": "TPC-H benchmark", + "title": "TPC-H Benchmark", "language": "zh-CN" } --- @@ -24,7 +24,7 @@ specific language governing permissions and limitations under the License. --> -# TPC-H benchmark +# TPC-H Benchmark TPC-H是一个决策支持基准(Decision Support Benchmark),它由一套面向业务的特别查询和并发数据修改组成。查询和填充数据库的数据具有广泛的行业相关性。这个基准测试演示了检查大量数据、执行高度复杂的查询并回答关键业务问题的决策支持系统。TPC-H报告的性能指标称为TPC-H每小时复合查询性能指标(QphH@Size),反映了系统处理查询能力的多个方面。这些方面包括执行查询时所选择的数据库大小,由单个流提交查询时的查询处理能力,以及由多个并发用户提交查询时的查询吞吐量。 diff --git a/static/images/image-20220614114351241.png b/static/images/image-20220614114351241.png index 1c0db4136db..41cba63a582 100644 Binary files a/static/images/image-20220614114351241.png and b/static/images/image-20220614114351241.png differ diff --git a/static/images/ssb_12_11_015.png b/static/images/ssb_12_11_015.png index a835fcae984..fd5c6117773 100644 Binary files a/static/images/ssb_12_11_015.png and b/static/images/ssb_12_11_015.png differ diff --git a/static/images/ssb_v11_v015_compare.png b/static/images/ssb_v11_v015_compare.png index 1414df824ac..8a6dbc145c5 100644 Binary files a/static/images/ssb_v11_v015_compare.png and b/static/images/ssb_v11_v015_compare.png differ --------------------------------------------------------------------- To unsubscribe, e-mail: commits-unsubscr...@doris.apache.org For additional commands, e-mail: commits-h...@doris.apache.org