نرم افزارپیشرفته

راهنمای ساده ایندکس گذاری در PostgreSQL

گر تا به حال از خود پرسیده‌اید چرا برخی از کوئری‌های پایگاه داده کند هستند در حالی که دیگران سریع اجرا می‌شوند، پاسخ معمولاً در ایندکس‌ها نهفته است. این راهنما شما را با مفهوم ایندکس ، انواع آن در PostgreSQL و نحوه استفاده از آنها آشنا می‌کند.

ف
فربد گلشنینویسنده
6 بهمن 1403
راهنمای ساده ایندکس گذاری در PostgreSQL

اگر تا به حال از خود پرسیده‌اید چرا برخی از کوئری‌های پایگاه داده کند هستند در حالی که دیگران سریع اجرا می‌شوند، پاسخ معمولاً در ایندکس‌ها نهفته است. در PostgreSQL، ایندکس‌ها ابزارهایی هستند که بازیابی داده‌ها را سریع‌تر و کارآمدتر می‌کنند. این راهنما شما را با مفهوم ایندکس، انواع آن در PostgreSQL و نحوه استفاده از آنها آشنا می‌کند. این مطلب برای برنامه‌نویسانی طراحی شده که تازه با ایندکس گذاری آشنا شده‌اند.

ایندکس چیست؟

ایندکس یک میانبر برای پایگاه داده شماست. به جای این که تمام ردیف‌های یک جدول برای یافتن داده مورد نظر جستجو شود، PostgreSQL از ایندکس‌ها برای پیدا کردن مستقیم ردیف‌های مرتبط استفاده می‌کند. این کار سرعت کوئری‌ها را افزایش می‌دهد اما معایبی مانند استفاده بیشتر از فضای ذخیره‌سازی و کندتر شدن نوشتن داده‌ها نیز دارد.

ایندکس مانند فهرست مطالب یک کتاب است؛ شما لازم نیست کل کتاب را بخوانید تا یک موضوع خاص را پیدا کنید، فهرست شما را به صفحه مورد نظر هدایت می‌کند.

انواع ایندکس در PostgreSQL

PostgreSQL انواع مختلفی از ایندکس‌ها را برای نیازهای گوناگون کوئری ارائه می‌دهد. در اینجا رایج‌ترین انواع آن معرفی شده است:

1. ایندکس B-tree (پیش‌فرض)

چگونه کار می‌کند: این نوع ایندکس داده‌ها را به صورت درخت مرتب نگه می‌دارد، که جستجوی مقادیر را بسیار سریع می‌کند. درخت B به‌طور مکرر به دو نیم تقسیم می‌شود تا مقدار هدف پیدا شود.

مناسب برای: مقایسه‌هایی مانند =, <, >, BETWEEN.

مثال:

CREATE INDEX idx_name ON users (last_name);

موارد استفاده: یافتن کاربران با نام خانوادگی خاص یا مرتب‌سازی داده‌ها.

2. ایندکس Hash

چگونه کار می‌کند: این نوع ایندکس از تابع هش برای نگاشت مقادیر ستون به موقعیت‌های خاص در ایندکس استفاده می‌کند.

مناسب برای: تطابق دقیق با =.

نکته مهم: در مقایسه با B-tree، این ایندکس تنها برای تطابق دقیق (=) مناسب است و برای مرتب‌سازی یا مقایسه‌های محدوده کارآمد نیست.

مثال:

CREATE INDEX idx_hash ON users (email) USING hash;

موارد استفاده: جستجوی کاربر با ایمیل.

3. ایندکس GIN (Generalized Inverted Index)

مناسب برای: جستجوی متن کامل (Full-Text Search) یا جستجوی مقادیر در آرایه‌ها.

کاربردها:

پیدا کردن اسناد حاوی یک کلمه خاص.

فیلتر کردن داده‌های JSON.

مزایا:

عملکرد عالی برای داده‌های متنی یا آرایه‌ها.

معایب:

فضای ذخیره‌سازی بیشتری نیاز دارد.

مثال:

CREATE INDEX idx_gin ON documents USING gin (content);

4. ایندکس GiST (Generalized Search Tree)

ساختار: انعطاف‌پذیر و مناسب برای انواع داده‌های پیچیده مانند داده‌های مکانی و هندسی.

مناسب برای: داده‌هایی که نیاز به تطابق جغرافیایی یا جستجوی محدوده دارند.

کاربردها:

پیدا کردن نزدیک‌ترین نقاط در نقشه.

جستجو در محدوده‌های عددی یا زمانی.

مزایا:

پشتیبانی از انواع داده سفارشی.

معایب:

سرعت کمتر در مقایسه با B-tree برای داده‌های ساده.

مثال:

CREATE INDEX idx_gist ON locations USING gist (coordinates);

5. ایندکس BRIN (Block Range Index)

ساختار: به جای ذخیره مقادیر دقیق، محدوده‌ای از داده‌ها را ذخیره می‌کند.

مناسب برای: جداول بسیار بزرگ که داده‌ها به صورت ترتیبی ذخیره شده‌اند.

کاربردها:

جستجوی داده‌های مرتب‌شده مانند لاگ‌های زمانی.

مزایا:

فضای ذخیره‌سازی بسیار کم نیاز دارد.

مناسب برای جداول با میلیون‌ها ردیف.

معایب:

برای جستجوهای دقیق مناسب نیست.

مثال:

CREATE INDEX idx_brin ON logs USING brin (timestamp);


چگونه یک ایندکس بسازیم؟

ساختن ایندکس در PostgreSQL ساده است. در اینجا چند مثال رایج آورده شده است:

ایندکس ساده

CREATE INDEX idx_column ON table_name (column_name);

ایندکس یکتا

از مقادیر تکراری در یک ستون جلوگیری می‌کند:

CREATE UNIQUE INDEX idx_unique_email ON users (email);

ایندکس ترکیبی

چندین ستون را پوشش می‌دهد:

CREATE INDEX idx_composite ON orders (customer_id, order_date);

ایندکس جزئی

فقط ردیف‌هایی که شرط خاصی را دارند شامل می‌شود:

CREATE INDEX idx_active_users ON users (last_login) WHERE is_active = true;

ایندکس بر اساس عبارت

نتیجه یک عبارت را ایندکس می‌کند:

CREATE INDEX idx_lower_email ON users (LOWER(email));


چه زمانی باید از ایندکس استفاده کنیم؟

  • ایندکس‌ها زمانی بیشترین کاربرد را دارند که:
  • داده‌ها را فیلتر (WHERE)، join یا مرتب کنید.
  • کوئری‌ها نیاز به یافتن ردیف‌های خاص به سرعت داشته باشند.

چه زمانی نباید از ایندکس استفاده کرد؟

  • برای جداول بسیار کوچک: جستجوی کل جدول ممکن است سریع‌تر باشد.
  • ستون‌هایی با یکتایی کم: به عنوان مثال، ستونی که عمدتاً true یا false است.
  • تعداد زیاد ایندکس‌ها: نگهداری از آنها می‌تواند سرعت نوشتن (INSERT, UPDATE, DELETE) را کاهش دهد.


بررسی استفاده از ایندکس

PostgreSQL به طور خودکار تصمیم می‌گیرد که چه زمانی از ایندکس استفاده کند. برای دیدن این که آیا کوئری شما از ایندکس استفاده می‌کند، از دستور EXPLAIN استفاده کنید:

EXPLAIN SELECT * FROM users WHERE last_name = 'Smith';

اگر از ایندکس استفاده شود، چیزی مانند Index Scan در خروجی خواهید دید.

نکات کلیدی

  • ایندکس‌ها کوئری‌ها را سریع‌تر می‌کنند اما می‌توانند نوشتن داده‌ها را کند کرده و فضای بیشتری اشغال کنند.
  • از نوع مناسب ایندکس برای نیازهای کوئری خود استفاده کنید (مانند B-tree برای مقایسه‌ها، GIN برای جستجوی متن).
  • از ایجاد تعداد زیادی ایندکس خودداری کنید—این کار ممکن است عملکرد را کاهش دهد.
  • با درک و استفاده مؤثر از ایندکس‌ها، می‌توانید عملکرد پایگاه داده PostgreSQL خود را به طور قابل توجهی بهبود دهید.

حال که با ایندکس گذاری در PostgreSQL آشنا شدید، می توانید از دیگر مقالات Evolearn | ایوولرن نیز دیدن کنید.

هنوز نظری ثبت نشده است

نظر خود را بنویسید

نظر شما پس از تایید نمایش داده خواهد شد