This is an automated email from the ASF dual-hosted git repository. kassiez pushed a commit to branch master in repository https://gitbox.apache.org/repos/asf/doris-website.git
The following commit(s) were added to refs/heads/master by this push: new 41e3173edda Update optimizing-table-schema.md (#1354) 41e3173edda is described below commit 41e3173edda61e965354042f13e431a9d6fe9d6c Author: xzj7019 <xiongzhongj...@selectdb.com> AuthorDate: Thu Nov 14 20:17:20 2024 +0800 Update optimizing-table-schema.md (#1354) # Versions - [ ] dev - [ ] 3.0 - [x] 2.1 - [ ] 2.0 # Languages - [x] Chinese - [ ] English --- .../tuning/tuning-plan/optimizing-table-schema.md | 6 ++---- 1 file changed, 2 insertions(+), 4 deletions(-) diff --git a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/query-acceleration/tuning/tuning-plan/optimizing-table-schema.md b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/query-acceleration/tuning/tuning-plan/optimizing-table-schema.md index f076329496e..946da5086d7 100644 --- a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/query-acceleration/tuning/tuning-plan/optimizing-table-schema.md +++ b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/query-acceleration/tuning/tuning-plan/optimizing-table-schema.md @@ -24,7 +24,7 @@ specific language governing permissions and limitations under the License. --> -Schema 设计和调优中,表的 Schema 设计是其中重要的一部分,包括表引擎选择、分区分桶列选择、分区分桶大小设置、key 列和字段类型优化等。缺乏 Schema 设计的系统,有可能会导致数据倾斜等问题,不能充分利用系统并行和排序特性,从而影响 Doris 系统在业务系统中发挥真实的性能优势。 +Schema 设计和调优中,表的 Schema 设计是其中重要的一部分,包括表引擎选择、分区分桶列选择、分区分桶大小设置、key 列和字段类型优化等。缺乏 Schema 设计的系统,有可能会导致数据倾斜等问题,不能充分利用系统并行和排序特性,从而影响 Doris 在业务系统中发挥真实的性能优势。 详细的设计原则可以参考[数据表设计](../../../table-design/overview)章节了解详细信息。本章将从实际案例的角度,展示几种典型场景下因 Schema 设计问题导致的性能瓶颈,并给出优化建议,供业务调优参考。 @@ -113,7 +113,7 @@ PROPERTIES ( 1. 在满足业务系统表达和计算需求的前提下,应优先选择定长类型,避免使用变长类型; -2. 同时,尽量采用低精类型,而非高精类型。具体实践包括:使用 BIGINT 替代 VARCHAR 或 STRING 类型的字段,以及用 FLOAT / INT / BIGINT 替换 DECIMAL 类型的字段等。此类字段类型的合理设计和优化,将极大地提升业务的计算效率,从而增强系统性能。 +2. 尽量采用低精类型,避免高精类型。具体实践包括:使用 BIGINT 替代 VARCHAR 或 STRING 类型的字段,以及用 FLOAT / INT / BIGINT 替换 DECIMAL 类型的字段等。此类字段类型的合理设计和优化,将极大地提升业务的计算效率,从而增强系统性能。 :::tip 优化建议 在定义 Schema 类型时,应遵循定长和低精优先的原则。 @@ -122,5 +122,3 @@ PROPERTIES ( ## 总结 综上所述,一个精心设计的 Schema 能够最大化地利用 Doris 的特性,进而显著提升业务性能。反观未经过调优的 Schema 设计则可能对业务造成全局性的负面影响,例如数据倾斜等问题。因此,前期的 Schema 设计优化工作显得尤为重要。 - -针对性能调优方面,你还可以参考使用 [Colocate Group 优化 Join](../../../query-data/join#colocate-join),该文档将详细介绍如何充分利用 Doris 的特性来进行性能优化,为你的业务性能提升提供有力支持。 \ No newline at end of file --------------------------------------------------------------------- To unsubscribe, e-mail: commits-unsubscr...@doris.apache.org For additional commands, e-mail: commits-h...@doris.apache.org