Chỉ mục cơ sở dữ liệu: Giới thiệu cho người mới bắt đầu

Chỉ mục cơ sở dữ liệu: Giới thiệu cho người mới bắt đầu

'Chỉ mục Cơ sở dữ liệu' đề cập đến một loại cấu trúc dữ liệu đặc biệt giúp tăng tốc độ truy xuất các bản ghi từ một bảng cơ sở dữ liệu. Chỉ mục cơ sở dữ liệu đảm bảo rằng bạn có thể định vị và truy cập dữ liệu trong bảng cơ sở dữ liệu một cách hiệu quả mà không cần phải tìm kiếm từng hàng mỗi khi truy vấn cơ sở dữ liệu được xử lý.





Chỉ mục cơ sở dữ liệu có thể được ví như chỉ mục của một cuốn sách. Các chỉ mục trong cơ sở dữ liệu trỏ bạn đến bản ghi mà bạn đang tìm kiếm trong cơ sở dữ liệu, giống như trang chỉ mục của cuốn sách hướng bạn đến chủ đề hoặc chương bạn muốn.





Tuy nhiên, trong khi các chỉ số cơ sở dữ liệu là cần thiết để tra cứu và truy cập dữ liệu nhanh chóng và hiệu quả, chúng chiếm thêm dung lượng ghi và bộ nhớ.





Chỉ số là gì?

Chỉ mục cơ sở dữ liệu là bảng tra cứu đặc biệt bao gồm hai cột. Cột đầu tiên là khóa tìm kiếm và cột thứ hai là con trỏ dữ liệu. Các khóa là các giá trị bạn muốn tìm kiếm và truy xuất từ ​​bảng cơ sở dữ liệu của mình và con trỏ hoặc tham chiếu lưu trữ địa chỉ khối đĩa trong cơ sở dữ liệu cho khóa tìm kiếm cụ thể đó. Các trường chính được sắp xếp để tăng tốc hoạt động truy xuất dữ liệu cho tất cả các truy vấn của bạn.

Tại sao sử dụng Lập chỉ mục cơ sở dữ liệu?

Tôi sẽ chỉ cho bạn các chỉ số cơ sở dữ liệu một cách đơn giản ở đây. Giả sử bạn có một bảng cơ sở dữ liệu về tám nhân viên làm việc trong một công ty và bạn muốn tìm kiếm thông tin cho mục nhập cuối cùng của bảng. Bây giờ, để tìm mục nhập trước đó, bạn cần tìm kiếm từng hàng của cơ sở dữ liệu.



Tuy nhiên, giả sử bạn đã sắp xếp bảng theo thứ tự bảng chữ cái dựa trên tên của các nhân viên. Vì vậy, ở đây các khóa lập chỉ mục dựa trên cột tên. Trong trường hợp đó, nếu bạn tìm kiếm mục nhập cuối cùng, Zack , bạn có thể chuyển đến giữa bảng và quyết định xem mục nhập của chúng tôi đến trước hay sau cột.

Như bạn đã biết, nó sẽ đến sau hàng giữa và bạn lại có thể chia đôi các hàng sau hàng giữa và thực hiện một phép so sánh tương tự. Bằng cách này, bạn không cần phải lướt qua từng hàng để tìm mục nhập cuối cùng.





Nếu công ty có 1.000.000 nhân viên và mục nhập cuối cùng là Zack, bạn sẽ phải tìm kiếm 50.000 hàng để tìm tên anh ta. Trong khi đó, với lập chỉ mục theo thứ tự bảng chữ cái, bạn có thể thực hiện nó trong một vài bước. Bây giờ bạn có thể tưởng tượng việc tra cứu và truy cập dữ liệu có thể trở nên nhanh hơn như thế nào với việc lập chỉ mục cơ sở dữ liệu.

Có liên quan: 13 lệnh SQL quan trọng nhất mà bất kỳ lập trình viên nào cũng nên biết





Các phương pháp tổ chức tệp khác nhau cho chỉ mục cơ sở dữ liệu

Việc lập chỉ mục phụ thuộc nhiều vào cơ chế tổ chức tệp được sử dụng. Thông thường, có hai loại phương pháp tổ chức tệp được sử dụng trong lập chỉ mục cơ sở dữ liệu để lưu trữ dữ liệu. Chúng được thảo luận dưới đây:

1. Tệp chỉ mục có thứ tự: Đây là phương pháp lưu trữ dữ liệu chỉ mục truyền thống. Trong phương pháp này, các giá trị khóa được sắp xếp theo một thứ tự cụ thể. Dữ liệu trong tệp chỉ mục có thứ tự có thể được lưu trữ theo hai cách.

  • Chỉ số thưa thớt: Trong kiểu lập chỉ mục này, một mục nhập chỉ mục được tạo cho mỗi bản ghi.
  • Chỉ số dày đặc: Trong lập chỉ mục dày đặc, một mục nhập chỉ mục được tạo cho một số bản ghi. Để tìm bản ghi trong phương pháp này, trước tiên bạn phải tìm giá trị khóa tìm kiếm quan trọng nhất từ ​​các mục nhập chỉ mục nhỏ hơn hoặc bằng giá trị khóa tìm kiếm bạn đang tìm.

2. Tổ chức tệp băm: Trong phương pháp tổ chức tệp này, hàm băm xác định vị trí hoặc khối đĩa nơi lưu trữ bản ghi.

Các loại lập chỉ mục cơ sở dữ liệu

Nói chung có ba phương pháp lập chỉ mục cơ sở dữ liệu. Họ đang:

  • Lập chỉ mục theo cụm
  • Lập chỉ mục không phân cụm
  • Lập chỉ mục đa cấp

1. Lập chỉ mục theo cụm

Trong lập chỉ mục nhóm, một tệp duy nhất có thể lưu trữ nhiều hơn hai bản ghi dữ liệu. Hệ thống giữ dữ liệu thực tế trong lập chỉ mục nhóm hơn là các con trỏ. Tìm kiếm tiết kiệm chi phí với lập chỉ mục theo nhóm vì nó lưu trữ tất cả dữ liệu liên quan ở cùng một nơi.

trang web thú vị khi bạn cảm thấy buồn chán

Chỉ mục phân cụm sử dụng các tệp dữ liệu có thứ tự để xác định chính nó. Ngoài ra, việc kết hợp nhiều bảng cơ sở dữ liệu rất phổ biến với kiểu lập chỉ mục này.

Cũng có thể tạo chỉ mục dựa trên các cột không phải cột chính không phải là duy nhất cho mỗi khóa. Trong những trường hợp như vậy, nó kết hợp nhiều cột để tạo thành các giá trị khóa duy nhất cho các chỉ mục được phân nhóm.

Vì vậy, trong ngắn hạn, chỉ số phân cụm là nơi các kiểu dữ liệu tương tự được nhóm lại và các chỉ số được tạo cho chúng.

Thí dụ: Giả sử có một công ty có hơn 1.000 nhân viên ở 10 phòng ban khác nhau. Trong trường hợp này, công ty nên tạo lập chỉ mục phân cụm trong DBMS của họ để lập chỉ mục các nhân viên làm việc trong cùng một bộ phận.

Mỗi cụm có nhân viên làm việc trong cùng một bộ phận sẽ được xác định là một cụm duy nhất và các con trỏ dữ liệu trong chỉ mục sẽ tham chiếu đến cụm như một thực thể toàn bộ.

Có liên quan: Khóa ngoại trong cơ sở dữ liệu SQL là gì?

2. Lập chỉ mục không phân cụm

Lập chỉ mục không phân cụm đề cập đến kiểu lập chỉ mục trong đó thứ tự của các hàng chỉ mục không giống với cách dữ liệu gốc được lưu trữ vật lý. Thay vào đó, một chỉ mục không phân cụm trỏ đến phần lưu trữ dữ liệu trong cơ sở dữ liệu.

Thí dụ: Lập chỉ mục không phân cụm tương tự như một cuốn sách có trang nội dung được sắp xếp theo thứ tự. Ở đây, con trỏ dữ liệu hoặc tham chiếu là trang nội dung có thứ tự được sắp xếp theo thứ tự bảng chữ cái và dữ liệu thực tế là thông tin trên các trang của cuốn sách. Trang nội dung không lưu trữ thông tin trên các trang của cuốn sách theo thứ tự của chúng.

3. Lập chỉ mục đa cấp

Lập chỉ mục nhiều cấp được sử dụng khi số lượng chỉ mục rất nhiều và nó không thể lưu chỉ mục chính trong bộ nhớ chính. Như bạn có thể biết, chỉ mục cơ sở dữ liệu bao gồm các khóa tìm kiếm và con trỏ dữ liệu. Khi kích thước của cơ sở dữ liệu tăng lên, số lượng các chỉ số cũng tăng lên.

Tuy nhiên, để đảm bảo thao tác tìm kiếm nhanh chóng, cần lưu giữ các bản ghi chỉ mục trong bộ nhớ. Nếu chỉ mục mức đơn được sử dụng khi số chỉ mục cao, thì không có khả năng lưu chỉ mục đó trong bộ nhớ vì kích thước và nhiều truy cập của nó.

Đây là lúc lập chỉ mục đa cấp phát huy tác dụng. Kỹ thuật này chia chỉ mục cấp đơn thành nhiều khối nhỏ hơn. Sau khi bị phá vỡ, khối cấp ngoài trở nên rất nhỏ để có thể dễ dàng lưu trữ trong bộ nhớ chính.

Có liên quan: Cách kết nối với cơ sở dữ liệu MySQL bằng Java

Phân mảnh chỉ mục SQL là gì?

Khi bất kỳ thứ tự nào của các trang chỉ mục không khớp với thứ tự vật lý trong tệp dữ liệu sẽ gây ra phân mảnh chỉ mục SQL. Ban đầu, tất cả các chỉ mục SQL đều không bị phân mảnh, nhưng khi bạn sử dụng cơ sở dữ liệu (dữ liệu Chèn / Xóa / Thay thế) nhiều lần, nó có thể gây ra phân mảnh.

Ngoài phân mảnh cơ sở dữ liệu, cơ sở dữ liệu của bạn cũng có thể gặp phải các vấn đề quan trọng khác như hỏng cơ sở dữ liệu. Nó có thể dẫn đến mất dữ liệu và trang web bị tổn hại. Nếu bạn đang kinh doanh với trang web của mình, nó có thể là một đòn chí mạng đối với bạn.

Đăng lại Đăng lại tiếng riu ríu E-mail Dữ liệu máy chủ SQL bị hỏng? Cố gắng khôi phục nó bằng hộp công cụ phục hồi SQL

Hộp công cụ phục hồi cho SQL Server giúp sửa các tệp MDF bị hỏng của MS SQL Server cho tất cả các phiên bản.

youtube có sử dụng nhiều dữ liệu không
Đọc tiếp Chủ đề liên quan
  • Lập trình
  • SQL
  • Phân tích dữ liệu
  • cơ sở dữ liệu
Giới thiệu về tác giả Zadhid A. Powell(16 bài báo đã xuất bản)

Zadhid Powell là một Kỹ sư máy tính đã từ bỏ việc viết mã để bắt đầu viết! Ngoài ra, anh ấy còn là một Digital Marketer, người đam mê công nghệ, chuyên gia SaaS, người đọc và là người theo sát các xu hướng phần mềm. Thông thường, bạn có thể thấy anh ấy khuấy động các câu lạc bộ ở trung tâm thành phố với cây đàn guitar của anh ấy hoặc kiểm tra hoạt động lặn dưới đáy đại dương.

Xem thêm từ Zadhid A. Powell

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký