Danh mục tài liệu

So sánh phương pháp tiếp cận cơ sở dữ liệu XML

Số trang: 10      Loại file: pdf      Dung lượng: 207.34 KB      Lượt xem: 20      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Sự giống và khác nhau giữa cơ sở dữ liệu XML nguyên gốc và pureXML là gì? Adriaan de Jonge, Kỹ sư phần mềm, 自由职业者 Tóm tắt: Nhu cầu sử dụng XML ngày càng tăng đòi hỏi các hệ thống mà lưu trữ dữ liệu bán cấu trúc mà không cần phải ép nó vào các cấu trúc dữ liệu không phù hợp. Các yêu cầu này đều được đáp ứng bởi cả cơ sở dữ liệu XML nguyên gốc và cơ sở dữ liệu quan hệ hỗ trợ XML. Câu hỏi đặt ra là: Tại sao bạn thích...
Nội dung trích xuất từ tài liệu:
So sánh phương pháp tiếp cận cơ sở dữ liệu XML So sánh các phương pháp tiếp cận cơ sở dữ liệu XMLSự giống và khác nhau giữa cơ sở dữ liệu XML nguyên gốc và pureXML là gì?Adriaan de Jonge, Kỹ sư phần mềm, 自由职业者Tóm tắt: Nhu cầu sử dụng XML ngày càng tăng đòi hỏi các hệ thống mà lưu trữdữ liệu bán cấu trúc mà không cần phải ép nó vào các cấu trúc dữ liệu không phùhợp. Các yêu cầu này đều được đáp ứng bởi cả cơ sở dữ liệu XML nguyên gốc vàcơ sở dữ liệu quan hệ hỗ trợ XML. Câu hỏi đặt ra là: Tại sao bạn thích một cơ sởdữ liệu XML nguyên gốc hơn một cơ sở dữ liệu cổ điển với hỗ trợ XML hoặc cáccách khác? Bài viết này so sánh các phương pháp tiếp cận cho một số các giảipháp khác nhau, bao gồm eXist, Mark Logic, và IBM® DB2® Express-C. Sựkhác biệt của các kiểu cơ sở dữ liệu được so sánh giữa những thuận lợi và khókhăn của chúng.Trong những năm đầu tiên của cơ sở dữ liệu XML, sự khác biệt giữa cái được gọilà cơ sở dữ liệu XML nguyên gốc (native XML database-NXD) và các hệ thốngquản lý cơ sở dữ liệu quan hệ có hỗ trợ XML (relational database managementsystems - RDBMS) là rất lớn. Các NXD được tối ưu hóa để lưu trữ các tài liệuXML. Các bản RDBMS cũ chỉ thêm một số gia vị vào các đối tượng nhị phân lớn(binary large object - BLOB) để chứa XML.Các thuật ngữ hay dùng API: Giao diện lập trình ứng dụng  HTTP: Giao thức truyền siêu văn bản  IT: Công nghệ thông tin  XML: Ngôn ngữ đánh dấu mở rộng Ngày nay, các NXD vẫn là NXD nhưng được cải tiến rất nhiều. Cùng thời điểm,các nhà cung cấp RDBMS đã có thời gian đuổi kịp khi chúng có thể lưu trữ các tàiliệu XML. Các phần XML không còn được lưu trữ trong các BLOBs. Thay vì nhưvậy, chúng được lưu trữ trong các cấu trúc cây (tree-like structure), được tối ưuhóa để chứa các tài liệu có cấu trúc cây, bản chất tự nhiên của một tài liệu XMLchuẩn.Trong thời gian giữa các cài đặt ban đầu và các giải pháp ngày nay, một số sự pháttriển nền tảng đã được thêm vào sự chuẩn hóa của các ngôn ngữ truy vấn trên cáctài liệu XML — đáng chú ý nhất, XQuery 1.0, với hỗ trợ cho Ngôn ngữ Đườngdẫn XML (XML Path Language - XPath) 2.0. Khái niệm của XQuery được pháttriển trong nhiều năm; kết quả cuối cùng có sự tương đồng với các phiên bản trướcđó nhưng hoàn thiện hơn. Giống như Ngôn ngữ Truy vấn Có cấu trúc (StructuredQuery Language - SQL), XQuery đẩy mạnh sự độc lập của nhà cung cấp và tái sửdụng.Tại sao bạn cần cơ sở dữ liệu XML?Các cơ sở dữ liệu thường có thể lưu trữ cả tài liệu không cấu trúc và có cấu trúc.Cả hai đều yêu cầu các cấu trúc dữ liệu mà không thường xuyên thay đổi. Tuynhiên, điểm yếu của các cơ sở dữ liệu quan hệ là việc lưu trữ các tài liệu bán cấutrúc. Không như các dữ liệu có cấu trúc, các tài liệu bán cấu trúc này có thể có rấtnhiều bậc tự do trong trật tự của các thành phần trong tài liệu và cách những thànhphần đó được lồng vào nhau. Không như các tài liệu không có cấu trúc, các thànhphần riêng lẻ có thể được phân loại bằng cách sử dụng các nhãn mô tả.Bạn có thể lưu trữ dữ liệu bán cấu trúc trong các cấu trúc quan hệ không? Tấtnhiên là bạn có thể, nhưng bạn có thế kết thúc bằng một cấu trúc dữ liệu cụ thể màthường xuyên thay đối, một cấu trúc dữ liệu tổng quát hóa mà làm mất mô tả củacác nhãn hoặc một mô hình trừu tượng như là những thứ mà các hệ thống quản lýnội dung sử dụng, trộn dữ liệu với những thứ mà đáng ra là siêu dữ liệu(metadata).Mặt khác, định dạng XML phù hợp với việc mô tả dữ liệu bán cấu trúc. Thêm nữa,bạn có thể duy trì mô hình dữ liệu một cách dễ dàng. Thêm các tên của thành phầnkhông làm thay đổi cấu trúc dữ liệu — nó luôn giữ cấu trúc cây. Nó chỉ liên quanđến một sự thay đổi trong lược đồ XML mô tả cách thức mà các tên của phần tửđược sử dụng và liên kết bên trong cấu trúc cây.Với các tài liệu như là các hồ sơ xin việc, các mô tả sản phẩm, và các đơn hàngcủa khách hàng, XML có lẽ là định dạng phù hợp. Đồng thời, XML có khả năngmô tả cả dữ liệu có cấu trúc và dữ liệu không có cấu trúc.Thế thì, bạn có cần các cơ sở dữ liệu quan hệ nữa không?Khi bạn tạo một giải pháp phần mềm mới, câu trả lời có thể là Không!. Nếu bạncó một giải pháp mà cho phép bạn lưu trữ dữ liệu bán cấu trúc, bạn cũng có thể sửdụng nó để lưu trữ dữ liệu có cấu trúc và không có cấu trúc. Việc có tất cả dữ liệucủa bạn trong một giải pháp lưu trữ đơn lẻ với khả năng tương kết và tạo ra cáctruy vấn mà bao trùm mọi thứ trong một lần thì dễ hơn rất nhiều so với dữ liệu tíchhợp từ nhiều nguồn lưu trữ khác nhau.Tốt hơn, nếu trả lời không với câu hỏi này, bạn nên để phần lớn dữ liệu củamình ở dạng kiểu tài liệu bán cấu trúc. Tuy nhiên, nếu đa phần dữ liệu của bạn phùhợp với mô hình quan hệ có cấu trúc chặt chẽ và ít giống với kiểu tài liệu và quệnchặt với nhau, thì việc chọn một NXD có lẽ không giúp ích gì cho trường hợp củabạn.Vậy thì làm thế nào để xác định bản chất dữ liệu của bạn? Và bạn sẽ phải làm gìnếu khối lượng ...